Skip to main content

Rightsizing

Última actualización: 2026-06-04

El rightsizing es la práctica de ajustar el tamaño de un recurso de cloud, como una máquina virtual, una base de datos o un contenedor, a la demanda real de un workload. Muchos recursos se aprovisionan para una capacidad de pico o estimada a ojo y luego operan muy por debajo de ella, pagando por un margen que nunca se utiliza. El rightsizing analiza métricas de utilización, normalmente CPU, memoria, IOPS y red, a menudo en el percentil P95 para preservar un margen de seguridad, y después recomienda un tipo de instancia o una solicitud de recurso más pequeña o más adecuada. Por ejemplo, una base de datos en una instancia grande que rara vez supera una fracción de su CPU y memoria puede trasladarse a una clase menor sin afectar al rendimiento. Como el cambio sigue el comportamiento observado en lugar de conjeturas, es una de las optimizaciones de coste en cloud de mayor impacto y menor riesgo, y conviene revisarla a medida que cambian los patrones de uso. LevelFour aplica el rightsizing a los recursos a partir del uso observado y entrega cada cambio como un pull request de infraestructura como código revisable.

Preguntas frecuentes

¿En qué se diferencia el rightsizing del autoscaling?
El rightsizing establece el tamaño base correcto de un recurso según su demanda observada, normalmente CPU, memoria, IOPS y red. El autoscaling ajusta cuántas instancias se ejecutan a medida que cambia la carga. Son complementarios: el rightsizing elige la unidad adecuada y el autoscaling ajusta automáticamente la cantidad de esas unidades.
¿Qué métricas debes usar para hacer el rightsizing de un recurso de cloud?
El rightsizing se basa en datos reales de utilización, normalmente CPU, memoria, IOPS y throughput de red recopilados durante un periodo representativo. En la práctica suele dimensionarse según el percentil P95 en lugar de la media, de modo que el recurso gestione los picos habituales con un margen de seguridad e ignore los picos raros y breves que, de lo contrario, forzarían un sobreaprovisionamiento permanente.

Términos relacionados

Véase también

LevelFour automatiza esto en AWS, GCP, Azure y Kubernetes con pull requests automatizados de infraestructura como código.