Pruebas de fallos en Amazon EBS
Utilice AWS Fault Injection Service y la acción de pausar la E/S para detener temporalmente la E/S entre un volumen de Amazon EBS y las instancias a las que está asociado para comprobar cómo las cargas de trabajo gestionan las interrupciones de E/S. Con AWS FIS, puede utilizar experimentos controlados para probar su arquitectura y supervisión, como las alarmas de Amazon CloudWatch y las configuraciones de tiempo de espera del sistema operativo, y mejorar la resistencia ante los errores de almacenamiento.
Para obtener más información sobre AWS FIS, consulte la Guía del usuario de AWS Fault Injection Service.
Consideraciones
Tenga en cuenta las siguientes consideraciones para pausar la E/S del volumen:
-
Puede pausar la E/S de todos los tipos de volumen de Amazon EBS que estén asociados a instancias creadas en Nitro System.
-
Puede pausar la E/S del volumen raíz.
-
Puede pausar la E/S de volúmenes habilitados para Multi-Attach. Si pausa la E/S de un volumen habilitado para Multi-Attach, la E/S se pausará entre el volumen y todas las instancias a las que esté asociado.
-
Para probar la configuración de tiempo de espera del sistema operativo, establezca que la duración del experimento sea igual al valor especificado para
nvme_core.io_timeout
, o superior. Para obtener más información, consulte Tiempo de espera de las operaciones de E/S NVMe para los volúmenes de Amazon EBS. -
Si realiza la E/S en un volumen que tiene la E/S en pausa, sucede lo siguiente:
-
El estado del volumen pasa a
impaired
en un plazo de 120 segundos. Para obtener más información, consulte Comprobaciones de estado del volumen de EBS. -
Las métricas de CloudWatch para la longitud de cola (
VolumeQueueLength
) tendrán un valor distinto de cero. Cualquier alarma o supervisión debe monitorearse para detectar una profundidad de cola distinta de cero. Para obtener más información, consulte Métricas para los volúmenes de Amazon EBS. -
Las métricas de CloudWatch para
VolumeReadOps
oVolumeWriteOps
serán0
, lo que indica que el volumen ya no procesa la E/S.
-
Limitaciones
Tenga en cuenta las siguientes limitaciones para pausar la E/S del volumen:
-
No se admiten volúmenes del almacén de instancias.
-
No se admiten tipos de instancia basados en Xen.
-
No puede pausar la E/S de volúmenes creados en un Outpost en AWS Outposts, una zona AWS Wavelength o una zona local.
Puede realizar un experimento básico desde la consola de Amazon EC2, o bien puede realizar experimentos más avanzados con la consola AWS FIS. Para obtener más información sobre cómo realizar experimentos avanzados con la consola AWS FIS, consulte los tutoriales de AWS FIS de la Guía del usuario de AWS Fault Injection Service.
Para realizar un experimento básico con la consola de Amazon EC2
-
Abra la consola de Amazon EC2 en https://console.aws.amazon.com/ec2/
. -
En el panel de navegación, elija Volumes (Volúmenes).
-
Seleccione el volumen para el que quiera pausar la E/S y elija Acciones, Inyección de errores y Pausar operaciones de E/S de volumen.
-
En Duración, ingrese la duración de la pausa de E/S entre el volumen y las instancias. El campo situado junto a la lista desplegable Duración muestra la duración en formato ISO 8601.
-
En la sección Acceso al servicio, seleccione el rol de servicio de IAM para AWS FIS que asumirá para realizar el experimento. Puede utilizar el rol predeterminado o un rol existente que haya creado. Para obtener más información, consulte Creación de un rol de IAM para experimentos de AWS FIS.
-
Elija Pausar operaciones de E/S de volumen. Cuando se le solicite, ingrese
start
en el campo de confirmación y elija Iniciar experimento. -
Supervise el progreso y el impacto de su experimento. Para obtener más información, consulte Supervisión de AWS FIS en la Guía del usuario de AWS FIS.