SUS04-BP05 Eliminación de datos innecesarios o redundantes - Marco de AWS Well-Architected

SUS04-BP05 Eliminación de datos innecesarios o redundantes

Elimine datos innecesarios o redundantes para minimizar los recursos de almacenamiento necesarios para guardar sus conjuntos de datos.

Patrones comunes de uso no recomendados:

  • Duplica datos que se pueden obtener o recrear fácilmente.

  • Hace una copia de seguridad de todos los datos sin tener en cuenta su criticidad.

  • Elimina solo datos de forma irregular, en eventos operativos o no los elimina en absoluto.

  • Almacena datos de forma redundante independientemente de la durabilidad del servicio de almacenamiento.

  • Activa el control de versiones de Amazon S3 sin ninguna justificación empresarial.

Beneficios de establecer esta práctica recomendada: la eliminación de los datos innecesarios reduce el tamaño de almacenamiento necesario para la carga de trabajo y el impacto medioambiental de la carga de trabajo.

Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio

Guía para la implementación

Al eliminar conjuntos de datos innecesarios y redundantes, puede reducir el coste de almacenamiento y la huella ambiental. Esta práctica también puede hacer que la computación sea más eficiente, ya que los recursos de computación solo procesan datos importantes en lugar de datos innecesarios. Automatice la eliminación de datos innecesarios. Use tecnologías que desdupliquen los datos en el nivel de archivo y de bloque. Utilice las características de los servicios para la replicación y la redundancia de datos nativos.

Pasos para la implementación

  • Evalúe conjunto de datos públicos: evalúe si puede evitar el almacenamiento de datos mediante los conjuntos de datos existentes y disponibles públicamente en AWS Data Exchange y Datos abiertos en AWS.

  • Desduplique datos: use mecanismos que puedan desduplicar los datos en los bloques y objetos. A continuación, se ofrecen algunos ejemplos de cómo desduplicar datos en AWS:

    Servicio de almacenamiento Mecanismo de desduplicación

    Amazon S3

    Use AWS Lake Formation FindMatches para buscar registros coincidentes en un conjunto de datos (incluidos los que no tienen identificadores) con la nueva transformación de ML FindMatches.

    Amazon FSx

    Use la desduplicación de datos en Amazon FSx para Windows.

    Amazon Elastic Block Store snapshots

    Las instantáneas son copias de seguridad incrementales, lo que significa que solo se guardan los bloques que han cambiado en el dispositivo después de la instantánea más reciente.

  • Uso de políticas de ciclo de vida: utilice políticas de ciclo de vida para eliminar automáticamente los activos no utilizados. Utilice las características de los servicios nativos, como Tiempo de vida de Amazon DynamoDB, Amazon S3 Lifecycle o la retención de registros de Amazon CloudWatch para la eliminación.

  • Utilice la virtualización de datos: utilice las capacidades de virtualización de datos en AWS para mantener los datos en su origen y evitar la duplicación de datos.

  • Utilice copias de seguridad incrementales: use una tecnología de copia de seguridad que pueda crear copias incrementales.

  • Utilice la durabilidad nativa: aproveche la durabilidad de Amazon S3 y la replicación de Amazon EBS para cumplir sus objetivos de durabilidad en lugar de utilizar tecnologías autogestionadas (como una matriz redundante de discos independientes [RAID]).

  • Use registros eficientes: centralice los datos de registro y de seguimiento, desduplique las entradas de registro que sean idénticas y establezca mecanismos para ajustar los detalles cuando sea necesario.

  • Utilice un almacenamiento en caché eficiente: Rellene las memorias caché previamente solo en casos justificados.

  • Establezca la supervisión y la automatización de la memoria caché para ajustar el tamaño de esta en consonancia.

  • Quite los recursos de versiones antiguas: quite las implementaciones y los recursos desfasados de los almacenes de objetos y las memorias caché periféricas al introducir nuevas versiones de su carga de trabajo.

Recursos

Documentos relacionados:

Videos relacionados:

Ejemplos relacionados: