Gestión de los procedimientos operativos estándar - AWS Centro de resiliencia

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Gestión de los procedimientos operativos estándar

Un procedimiento operativo estándar (SOP) es un conjunto prescriptivo de pasos diseñado para recuperar la aplicación de manera eficiente en caso de una interrupción o alarma. Prepare, pruebe y mida sus SOP con antelación para garantizar una recuperación oportuna en caso de una interrupción operativa.

En función de los componentes de la aplicación, AWS Resilience Hub recomienda los SOP que debe preparar. AWS Resilience Hub trabaja con Systems Manager para automatizar los pasos de sus SOP proporcionando una serie de documentos SSM que puede utilizar como base para dichos SOP.

Por ejemplo, AWS Resilience Hub puede recomendar un SOP para añadir espacio en disco basándose en un documento de automatización de SSM existente. Para ejecutar este documento SSM, necesita una función de IAM específica con los permisos correctos. AWS Resilience Hub crea metadatos en la aplicación que indican qué documento de automatización de SSM se debe ejecutar en caso de escasez de disco y qué función de IAM se requiere para ejecutar ese documento de SSM. A continuación, estos metadatos se guardan en un parámetro SSM.

Además de configurar la automatización de SSM, también se recomienda probarla con un experimento de AWS FIS . Por lo tanto, AWS Resilience Hub también incluye un AWS FIS experimento denominado documento de automatización SSM. De esta forma, puede probar su aplicación de forma proactiva para asegurarse de que el SOP que ha creado cumple con el objetivo previsto.

AWS Resilience Hub proporciona sus recomendaciones en forma de AWS CloudFormation plantilla que puede añadir a la base de código de la aplicación. Esta plantilla proporciona:

  • El rol de IAM con los permisos necesarios para ejecutar el SOP.

  • Un AWS FIS experimento que puede utilizar para probar el SOP.

  • Un parámetro de SSM que contiene metadatos de la aplicación que indican qué documento SSM y qué rol de IAM se van a ejecutar como SOP y en qué recurso. Por ejemplo: $(DocumentName) for SOP $(HandleCrisisA) on $(ResourceA).

La creación de un SOP puede requerir un poco de prueba y error. Realizar una evaluación de resiliencia en función de tu aplicación y generar una AWS CloudFormation plantilla a partir de las AWS Resilience Hub recomendaciones es un buen comienzo. Utilice la AWS CloudFormation plantilla para generar una AWS CloudFormation pila y, a continuación, utilice los parámetros del SSM y sus valores predeterminados en el SOP. Ejecute el SOP y compruebe qué mejoras necesita realizar.

Como todas las aplicaciones tienen requisitos diferentes, la lista predeterminada de documentos SSM que AWS Resilience Hub proporciona no será suficiente para todas sus necesidades. Sin embargo, puede copiar los documentos SSM predeterminados y utilizarlos como base para crear sus propios documentos personalizados adaptados a su aplicación. También puede crear sus propios documentos SSM completamente nuevos. Si crea sus propios documentos SSM en lugar de modificar los valores predeterminados, debe asociarlos a los parámetros SSM para que se llame al documento SSM correcto cuando se ejecute el SOP.

Cuando haya finalizado el SOP creando los documentos SSM necesarios y actualizando las asociaciones de parámetros y documentos según sea necesario, añada los documentos SSM directamente a su base de código y realice allí los cambios o personalizaciones posteriores. De esta forma, cada vez que despliegues tu aplicación, también desplegarás la mayor parte up-to-date del SOP.