Rightsizing de pods do Kubernetes
Última atualização em 2026-06-04
O rightsizing de pods do Kubernetes alinha os requests e limits de CPU e memória de um pod ao seu uso real e observado. As equipes costumam definir requests muito acima do que as cargas de trabalho realmente consomem, o que força o scheduler a reservar capacidade que nunca é usada e infla o custo dos nós. O rightsizing lê o uso real do pipeline de métricas, compara com os requests de cada carga de trabalho e recomenda valores que fazem um bin-packing mais eficiente, muitas vezes combinados com o ajuste do Horizontal Pod Autoscaler e mudanças de node pool. Como o kube-scheduler aloca os pods com base nos requests, e não no consumo real, requests inflados deixam os nós subutilizados ainda que pareçam cheios, então reduzi-los permite que mais pods caibam por nó. Por exemplo, um deployment que solicita dois cores de CPU mas usa uma fração de um pode ser cortado para acompanhar o pico observado mais uma margem de segurança. É uma das maiores fontes de economia no Kubernetes. A LevelFour faz o rightsizing de pods e nós a partir do uso real e reduz o custo do Kubernetes em até 50% nos clusters que analisa.
Perguntas frequentes
- Qual é a diferença entre requests e limits do Kubernetes ao fazer o rightsizing de pods?
- Um request é a CPU ou memória que o scheduler reserva para um pod e usa para alocá-lo em um nó; um limit é o teto que um pod pode consumir antes de sofrer throttling ou ser encerrado. O rightsizing ajusta os dois: os requests determinam a eficiência do bin-packing, enquanto os limits evitam a contenção por vizinhos barulhentos.
- Como o rightsizing de pods se diferencia do Horizontal Pod Autoscaler?
- O rightsizing de pods ajusta os requests e limits de CPU e memória por réplica (escalonamento vertical), de modo que cada pod reserve a quantidade certa. Já o Horizontal Pod Autoscaler altera o número de réplicas com base na carga. Eles são complementares: o rightsizing define o dimensionamento preciso por pod, e o HPA escala a contagem de réplicas por cima disso.
Termos relacionados
Veja também
A LevelFour automatiza isso em AWS, GCP, Azure e Kubernetes com pull requests automatizados de infraestrutura como código.