Skip to main content

Utilización P95

Última actualización: 2026-06-04

La utilización P95 es el percentil 95 del uso de un recurso medido a lo largo de un periodo: el nivel por debajo del cual el uso real se mantiene el 95 por ciento del tiempo. Se utiliza ampliamente en el rightsizing porque captura la demanda pico típica al tiempo que ignora los picos raros y breves que, de lo contrario, forzarían un sobreaprovisionamiento permanente. Para calcularla, se recopilan muestras observadas (CPU, memoria, throughput de red o IOPS) a un intervalo fijo, se ordenan y se lee el valor en la posición del percentil 95, de modo que solo los momentos de mayor actividad quedan por encima. Dimensionar un recurso a su P95, más un margen de seguridad, preserva el margen de rendimiento a la vez que elimina el desperdicio de aprovisionar para el máximo absoluto. Las medias, en cambio, pueden ocultar picos reales y llevar a un subdimensionamiento, ya que una media baja todavía puede esconder ventanas sostenidas de alta demanda. Elegir el P95 en lugar del máximo bruto es lo que permite al rightsizing reducir costes sin arriesgar la saturación. LevelFour basa sus recomendaciones de rightsizing en el uso por percentil, como el P95, de modo que protejan el rendimiento mientras reducen el coste.

Preguntas frecuentes

¿Por qué usar la utilización P95 en lugar de la media o el máximo?
La media puede ocultar picos reales de demanda y llevar a un subdimensionamiento, mientras que el máximo absoluto refleja picos raros y breves y fuerza un sobreaprovisionamiento permanente. El P95 se sitúa entre ambos, capturando la demanda pico típica e ignorando el 5 por ciento de momentos de mayor actividad, lo que equilibra el margen de rendimiento frente al coste.
¿Cómo se calcula la utilización P95?
Las muestras de uso de una métrica (como CPU, memoria, throughput de red o IOPS) se recopilan a un intervalo fijo a lo largo de una ventana elegida y, a continuación, se ordenan. El valor en la posición del percentil 95 es el P95: el nivel por debajo del cual el uso se mantiene el 95 por ciento del tiempo, con solo el 5 por ciento de muestras de mayor actividad por encima.

Términos relacionados

LevelFour automatiza esto en AWS, GCP, Azure y Kubernetes con pull requests automatizados de infraestructura como código.