Rightsizing de pods de Kubernetes
Última actualización: 2026-06-04
El rightsizing de pods de Kubernetes alinea los requests y limits de CPU y memoria de un pod con su uso real y observado. Los equipos suelen definir requests muy por encima de lo que las cargas de trabajo consumen realmente, lo que obliga al scheduler a reservar capacidad que nunca se usa e infla el coste de los nodos. El rightsizing lee el uso real del pipeline de métricas, lo compara con los requests de cada carga de trabajo y recomienda valores que hacen un bin-packing más eficiente, a menudo combinados con el ajuste del Horizontal Pod Autoscaler y cambios de node pool. Como el kube-scheduler ubica los pods en función de los requests, y no del consumo real, los requests inflados dejan los nodos infrautilizados aunque parezcan llenos, así que reducirlos permite que quepan más pods por nodo. Por ejemplo, un deployment que solicita dos cores de CPU pero usa una fracción de uno puede recortarse para ajustarse al pico observado más un margen de seguridad. Es una de las mayores fuentes de ahorro en Kubernetes. LevelFour realiza el rightsizing de pods y nodos a partir del uso real y reduce el coste de Kubernetes hasta en un 50% en los clústeres que analiza.
Preguntas frecuentes
- ¿Cuál es la diferencia entre los requests y los limits de Kubernetes al hacer el rightsizing de pods?
- Un request es la CPU o memoria que el scheduler reserva para un pod y que usa para ubicarlo en un nodo; un limit es el techo que un pod puede consumir antes de sufrir throttling o ser terminado. El rightsizing ajusta ambos: los requests determinan la eficiencia del bin-packing, mientras que los limits evitan la contención por vecinos ruidosos.
- ¿En qué se diferencia el rightsizing de pods del Horizontal Pod Autoscaler?
- El rightsizing de pods ajusta los requests y limits de CPU y memoria por réplica (escalado vertical), de modo que cada pod reserve la cantidad adecuada. El Horizontal Pod Autoscaler, en cambio, cambia el número de réplicas en función de la carga. Son complementarios: el rightsizing fija un dimensionamiento preciso por pod, y el HPA escala el número de réplicas por encima de ello.
Términos relacionados
Véase también
LevelFour automatiza esto en AWS, GCP, Azure y Kubernetes con pull requests automatizados de infraestructura como código.