PERF03-BP02 Evalúe las opciones de configuración disponibles para el almacén de datos - AWS Marco Well-Architected

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

PERF03-BP02 Evalúe las opciones de configuración disponibles para el almacén de datos

Estudie y evalúe las diversas características y opciones de configuración disponibles para sus almacenes de datos a fin de optimizar el espacio de almacenamiento y el rendimiento de su carga de trabajo.

Patrones comunes de uso no recomendados:

  • Solo usa un tipo de almacenamiento, como AmazonEBS, para todas las cargas de trabajo.

  • Se utiliza el aprovisionamiento IOPS para todas las cargas de trabajo sin necesidad de realizar pruebas reales en todos los niveles de almacenamiento.

  • No conoce las opciones de configuración de la solución de administración de datos que ha elegido.

  • La única opción que contempla es aumentar el tamaño de las instancias, sin valorar otras opciones de configuración disponibles.

  • No lleva a cabo pruebas en las características de escalado de su almacén de datos.

Beneficios de establecer esta práctica recomendada: si explora y experimenta con las configuraciones de almacenamiento de datos, puede reducir el costo de la infraestructura, mejorar el rendimiento y reducir el esfuerzo necesario para mantener sus cargas de trabajo.

Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio

Guía para la implementación

En una carga de trabajo, puede haber uno o varios almacenamientos de datos que se utilicen en función de los requisitos de almacenamiento y acceso. Para optimizar los costos y la eficiencia del rendimiento, debe evaluar los patrones de acceso a los datos y determinar cuáles son las configuraciones de almacenamiento de datos adecuadas. Cuando explore las opciones de almacenamiento de datos, tenga en cuenta diversos aspectos, como las opciones de almacenamiento, la memoria, los recursos de computación, la réplica de lectura, los requisitos de coherencia, la agrupación de conexiones y las opciones de almacenamiento en caché. Pruebe estas diferentes opciones de configuración para mejorar las métricas de eficiencia del rendimiento.

Pasos para la implementación

  • Estudie las configuraciones actuales (como el tipo de instancia, el tamaño de almacenamiento o la versión del motor de base de datos) de su almacén de datos.

  • Revise AWS la documentación y las prácticas recomendadas para obtener información sobre las opciones de configuración recomendadas que pueden ayudar a mejorar el rendimiento de su almacén de datos. Las principales opciones de almacenamiento de datos que debe tener en cuenta son las siguientes:

    Opción de configuración Ejemplos
    Descarga de lecturas (como réplicas de lectura y almacenamiento en caché)
    • En el caso de las tablas de DynamoDB, puede descargar las lecturas mediante el almacenamiento en caché. DAX

    • Puede crear un clúster de Amazon ElastiCache (RedisOSS) y configurar su aplicación para que lea primero desde la memoria caché y, si el elemento solicitado no está presente, recurra a la base de datos.

    • Las bases de datos relacionales, como Amazon RDS y Aurora, y las SQL bases de datos aprovisionadas, como Neptune y Amazon DocumentDB, admiten la adición de réplicas de lectura para reducir las partes de lectura de la carga de trabajo.

    • Las bases de datos sin servidor, como DynamoDB, se escalarán automáticamente. Asegúrese de tener suficientes unidades de capacidad de lectura () RCU aprovisionadas para gestionar la carga de trabajo.

    Escalado de escrituras (como la fragmentación de claves de partición o la introducción de una cola)
    • En el caso de las bases de datos relacionales, puede aumentar el tamaño de la instancia para adaptarla a una mayor carga de trabajo o aumentar el aprovisionamiento IOPs para aumentar el rendimiento del almacenamiento subyacente.

    • También puede introducir una cola delante de la base de datos en lugar de escribir directamente en la base de datos. Este patrón permite desacoplar la ingesta de la base de datos y controlar el caudal para que la base de datos no se vea desbordada. 

    • Si agrupa las solicitudes de escritura en lugar de crear muchas transacciones de corta duración, puede mejorar el rendimiento de las bases de datos relacionales con un gran volumen de operaciones de escritura.

    • Las bases de datos sin servidor, como DynamoDB, pueden escalar el rendimiento de escritura automáticamente o ajustando las unidades de capacidad de escritura aprovisionadas WCU () en función del modo de capacidad. 

    • Puede tener problemas con las particiones activas si alcanza los límites de rendimiento de una clave de partición determinada. Esto puede mitigarse si se elige una clave de partición distribuida de manera más uniforme o se particiona la escritura en función de la clave de partición. 

    Políticas para administrar el ciclo de vida de los conjuntos de datos
    • Puede usar Amazon S3 Lifecycle para administrar los objetos a lo largo de su ciclo de vida. Si sus patrones de acceso son desconocidos, cambiantes o impredecibles, puede utilizar Amazon S3 Intelligent-Tiering, que supervisa los patrones de acceso y mueve automáticamente los objetos a los que no se ha accedido a niveles de acceso de menor costo. Puede aprovechar las métricas de Lente de almacenamiento de Amazon S3 para identificar las oportunidades de optimización y las brechas en la administración del ciclo de vida.

    • Amazon EFS Lifecycle Management gestiona automáticamente el almacenamiento de archivos de sus sistemas de archivos.

    Administración y agrupación de conexiones
    • Amazon RDS Proxy se puede utilizar con Amazon RDS y Aurora para gestionar las conexiones a la base de datos. 

    • Las bases de datos sin servidor, como DynamoDB, no tienen conexiones asociadas, pero tienen en cuenta la capacidad aprovisionada y las políticas de escalado automático para hacer frente a los picos de carga.

  • Lleve a cabo experimentos y pruebas comparativas en un entorno que no sea de producción para identificar qué opción de computación se ajusta a los requisitos de la carga de trabajo.

  • Una vez hecho esto, planifique la migración y valide las métricas de rendimiento.

  • Utilice herramientas de AWS supervisión (como Amazon CloudWatch) y optimización (como Amazon S3 Storage Lens) para optimizar continuamente su almacén de datos utilizando un patrón de uso real.

Recursos

Documentos relacionados:

Videos relacionados:

Ejemplos relacionados: