Solución de problemas de EFS rendimiento de Amazon - Amazon Elastic File System

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Solución de problemas de EFS rendimiento de Amazon

En general, si encuentra problemas con Amazon EFS que tiene problemas para resolver, confirme que está utilizando un núcleo de Linux reciente. Si utiliza una distribución de Linux empresarial, le recomendamos lo siguiente:

  • Amazon Linux 2 con kernel 4.3 o posterior

  • Amazon Linux 2015.09 o posterior

  • RHEL7.3 o posterior

  • Todas las versiones de Ubuntu 16.04

  • Ubuntu 14.04 con kernel 3.13.0-83 o posterior

  • SLES12 Sp2 o posterior

Si utiliza otra distribución o un kernel personalizado, le recomendamos la versión de kernel 4.3 o posterior.

nota

RHELLa versión 6.9 podría no ser óptima para determinadas cargas de trabajo debido a. Rendimiento bajo al abrir muchos archivos en paralelo

No se puede crear un sistema de archivos EFS

Se produce un error al solicitar la creación de un sistema de EFS archivos y aparece el siguiente mensaje:

User: arn:aws:iam::111122223333:user/username is not authorized to perform: elasticfilesystem:CreateFileSystem on the specified resource.
Acción que debe ejecutarse

Compruebe su política AWS Identity and Access Management (IAM) para confirmar que está autorizado a crear sistemas de EFS archivos con las condiciones de recursos especificadas. Para obtener más información, consulte Gestión de identidades y accesos para Amazon EFS.

Acceso denegado a los archivos permitidos en el sistema de NFS archivos

Cuando un usuario al que se han asignado más de 16 grupos de acceso IDs (GIDs) intenta realizar una operación en un sistema de NFS archivos, se le puede denegar el acceso a los archivos permitidos en el sistema de archivos. Este problema se produce porque el NFS protocolo admite un máximo de 16 GIDs por usuario, y los demás GIDs se truncan a partir de la solicitud del NFS cliente, tal y como se define en RFC el artículo 5531.

Acción que debe ejecutarse

Reestructure las asignaciones NFS de usuarios y grupos para que a cada usuario no se le asignen más de 16 grupos de acceso (). GIDs

Errores al acceder a la EFS consola de Amazon

En esta sección se describen los errores que pueden experimentar los usuarios al acceder a la consola EFS de administración de Amazon.

Error al autenticar las credenciales de ec2:DescribeVPCs

Al acceder a la EFS consola de Amazon, aparece el siguiente mensaje de error:

AuthFailure: An error occurred authenticating your credentials for ec2:DescribeVPCs.

Este error indica que tus credenciales de inicio de sesión no se autenticaron correctamente con el EC2 servicio de Amazon. La EFS consola de Amazon llama al EC2 servicio de Amazon en tu nombre al crear los sistemas de EFS archivos VPC que elijas.

Acción que debe ejecutarse

Asegúrese de que la hora en que el cliente accede a la EFS consola de Amazon esté configurada correctamente.

La EC2 instancia de Amazon se bloquea

Una EC2 instancia de Amazon puede bloquearse porque eliminaste un destino de montaje del sistema de archivos sin desmontar primero el sistema de archivos.

Acción que debe ejecutarse

Antes de eliminar un destino de montaje de sistema de archivos, desmonte el sistema de archivos. Para obtener más información sobre cómo desmontar el sistema de EFS archivos de Amazon, consulteDesmontaje de sistemas de archivos.

La aplicación deja de responder al escribir grandes cantidades de datos

Una aplicación que escribe una gran cantidad de datos en Amazon se EFS bloquea y hace que la instancia se reinicie.

Acción que debe ejecutarse

Si una aplicación tarda demasiado en escribir todos sus datos en AmazonEFS, es posible que Linux se reinicie porque parece que el proceso ha dejado de responder. Dos parámetros de configuración de kernel definen este comportamiento, kernel.hung_task_panic y kernel.hung_task_timeout_secs.

En el ejemplo siguiente, el estado del proceso que ha dejado de responder se notifica mediante el comando ps con D antes de reiniciar la instancia, lo que indica que el proceso está a la espera de E/S.

$ ps aux | grep large_io.py root 33253 0.5 0.0 126652 5020 pts/3 D+ 18:22 0:00 python large_io.py /efs/large_file

Para evitar un reinicio, aumente el periodo de tiempo de espera o deshabilite el modo de pánico del kernel cuando detecte una tarea que ha dejado de responder. El siguiente comando deshabilita el modo de pánico de kernel de la tarea que ha dejado de responder en la mayoría de los sistemas de Linux.

$ sudo sysctl -w kernel.hung_task_panic=0

Rendimiento bajo al abrir muchos archivos en paralelo

Las aplicaciones que abren varios archivos en paralelo no experimentan el aumento esperado del rendimiento de paralelización de E/S.

Acción que ejecutar

Este problema se produce en los clientes de la versión 4 (NFSv4) del Network File System y en RHEL 6 clientes que utilizan la versión NFSv4 .1 porque estos NFS clientes se serializan NFS OPEN y CLOSE funcionan. Utilice la versión 4.1 del NFS protocolo y una de las distribuciones de Linux sugeridas que no presente este problema.

Si no puede usar la versión NFSv4 4.1, tenga en cuenta que el cliente Linux NFSv4 2.0 serializa las solicitudes de apertura y cierre por ID de usuario y grupo. IDs Esta serialización sucede incluso si varios procesos o varios subprocesos realizan solicitudes al mismo tiempo. El cliente solo envía una operación de apertura o cierre a un NFS servidor a la vez, cuando todas coinciden. IDs Para solucionar estos problemas, puede realizar cualquiera de las siguientes acciones:

  • Puedes ejecutar cada proceso desde un seudónimo diferente en la misma EC2 instancia de Amazon.

  • Puedes dejar el mismo usuario IDs en todas las solicitudes abiertas y, en IDs su lugar, modificar el conjunto de grupos.

  • Puedes ejecutar cada proceso desde una EC2 instancia de Amazon independiente.

Los NFS ajustes personalizados provocan retrasos en la escritura

Tienes una configuración de NFS cliente personalizada y una EC2 instancia de Amazon tarda hasta tres segundos en ver una operación de escritura realizada en un sistema de archivos desde otra EC2 instancia de Amazon.

Acción que ejecutar

Si detecta este problema, puede resolverlo de una de las siguientes formas:

  • Si el NFS cliente de la EC2 instancia de Amazon que lee los datos tiene activado el almacenamiento en caché de atributos, desmonta el sistema de archivos. A continuación, vuelva a montarlo con la opción noac para deshabilitar el almacenamiento en caché de atributos. El almacenamiento en caché de atributos en NFSv4 .1 está activado de forma predeterminada.

    nota

    Deshabilitar el almacenamiento en caché en el lado del cliente podría reducir el desempeño de la aplicación.

  • También puede borrar la caché de atributos cuando lo desee mediante un lenguaje de programación compatible con los NFS procedimientos. Para ello, puede enviar una solicitud de procedimiento ACCESS inmediatamente antes de una solicitud de lectura.

    Por ejemplo, utilizando el lenguaje de programación Python, puede construir la siguiente llamada.

    # Does an NFS ACCESS procedure request to clear the attribute cache, given a path to the file import os os.access(path, os.W_OK)

La creación de copias de seguridad con Oracle Recovery Manager es lenta

La creación de backup con Oracle Recovery Manager puede ser lenta si Oracle Recovery Manager se detiene durante 120 segundos antes de iniciar un trabajo de backup.

Acción que ejecutar

Si se produce este problema, desactive Oracle DirectNFS, tal y como se describe en la sección Activación y desactivación del control directo de NFS NFS clientes del Centro de Ayuda de Oracle.

nota

Amazon EFS no admite Oracle DirectNFS.