Utilização P95
Última atualização em 2026-06-04
A utilização P95 é o 95º percentil do uso de um recurso medido ao longo de um período: o nível abaixo do qual o uso real permanece 95 por cento do tempo. É amplamente usada em rightsizing porque captura a demanda de pico típica enquanto ignora os picos raros e breves que, de outra forma, forçariam um superprovisionamento permanente. Para calculá-la, amostras observadas (CPU, memória, throughput de rede ou IOPS) são coletadas em um intervalo fixo, ordenadas, e lê-se o valor na posição do 95º percentil, de modo que apenas os momentos de maior atividade ficam acima dele. Dimensionar um recurso para seu P95, mais uma margem de segurança, preserva a margem de desempenho enquanto elimina o desperdício de provisionar para o máximo absoluto. As médias, por outro lado, podem ocultar picos reais e levar a um subdimensionamento, já que uma média baixa ainda pode esconder janelas sustentadas de alta demanda. Escolher o P95 em vez do máximo bruto é o que permite ao rightsizing reduzir custos sem arriscar a saturação. A LevelFour baseia suas recomendações de rightsizing no uso por percentil, como o P95, para que elas protejam o desempenho enquanto reduzem o custo.
Perguntas frequentes
- Por que usar a utilização P95 em vez da média ou do máximo?
- A média pode ocultar picos reais de demanda e levar a um subdimensionamento, enquanto o máximo absoluto reflete picos raros e breves e força um superprovisionamento permanente. O P95 fica entre os dois, capturando a demanda de pico típica e ignorando os 5 por cento de momentos de maior atividade, o que equilibra a margem de desempenho com o custo.
- Como a utilização P95 é calculada?
- As amostras de uso de uma métrica (como CPU, memória, throughput de rede ou IOPS) são coletadas em um intervalo fixo ao longo de uma janela escolhida e, em seguida, ordenadas. O valor na posição do 95º percentil é o P95: o nível abaixo do qual o uso permanece 95 por cento do tempo, com apenas os 5 por cento de amostras de maior atividade acima dele.
Termos relacionados
A LevelFour automatiza isso em AWS, GCP, Azure e Kubernetes com pull requests automatizados de infraestrutura como código.