Skip to main content

Rightsizing

Última atualização em 2026-06-04

Rightsizing é a prática de ajustar o tamanho de um recurso de cloud, como uma máquina virtual, um banco de dados ou um container, à demanda real de um workload. Muitos recursos são provisionados para capacidade de pico ou estimada na base do chute, e depois operam bem abaixo disso, pagando por uma folga que nunca é usada. O rightsizing analisa métricas de utilização, normalmente CPU, memória, IOPS e rede, com frequência no percentil P95 para preservar uma margem de segurança, e então recomenda um tipo de instância ou uma solicitação de recurso menor ou mais adequada. Por exemplo, um banco de dados em uma instância grande que raramente ultrapassa uma fração de sua CPU e memória pode ser movido para uma classe menor sem afetar o desempenho. Como a mudança segue o comportamento observado em vez de suposições, é uma das otimizações de custo em cloud de maior impacto e menor risco, e deve ser revisitada à medida que os padrões de uso mudam. A LevelFour faz o rightsizing dos recursos a partir do uso observado e entrega cada mudança como um pull request de infraestrutura como código pronto para revisão.

Perguntas frequentes

Qual a diferença entre rightsizing e autoscaling?
O rightsizing define o tamanho base correto de um recurso com base em sua demanda observada, geralmente CPU, memória, IOPS e rede. O autoscaling ajusta quantas instâncias ficam em execução conforme a carga muda. Eles são complementares: o rightsizing escolhe a unidade certa, e o autoscaling ajusta automaticamente a quantidade dessas unidades.
Quais métricas usar para fazer o rightsizing de um recurso de cloud?
O rightsizing depende de dados reais de utilização, normalmente CPU, memória, IOPS e throughput de rede coletados ao longo de um período representativo. Na prática, costuma-se dimensionar pelo percentil P95 em vez da média, para que o recurso aguente os picos típicos com uma margem de segurança, ignorando picos raros e breves que, de outra forma, forçariam um superprovisionamento permanente.

Termos relacionados

Veja também

A LevelFour automatiza isso em AWS, GCP, Azure e Kubernetes com pull requests automatizados de infraestrutura como código.