Solução de problemas de montagem do sistema de arquivos - FSx para Lustre

Solução de problemas de montagem do sistema de arquivos

Há várias causas possíveis para a falha no comando de montagem de um sistema de arquivos, conforme descrito nos tópicos a seguir.

A montagem do sistema de arquivos falha imediatamente

O comando de montagem do sistema de arquivos falha imediatamente. O seguinte código mostra um exemplo.

mount.lustre: mount fs-0123456789abcdef0.fsx.us-east-1.aws@tcp:/fsx at /lustre failed: No such file or directory Is the MGS specification correct? Is the filesystem name correct?

Esse erro poderá ocorrer se você não estiver usando o valor mountname correto ao montar um sistema de arquivos persistent ou scratch 2 usando o comando mount. Você pode obter o valor mountname pela resposta do comando describe-file-systems da AWS CLI ou da operação DescribeFileSystems da API.

A montagem do sistema de arquivos trava e depois falha com erro de tempo limite

O comando de montagem do sistema de arquivos trava por um ou dois minutos e, em seguida, falha com um erro de tempo limite.

O seguinte código mostra um exemplo.

sudo mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx [2+ minute wait here] Connection timed out

Esse erro pode ocorrer porque os grupos de segurança da instância do Amazon EC2 ou do sistema de arquivos não estão configurados corretamente.

Medida a ser tomada

Certifique-se de que seus grupos de segurança do sistema de arquivos tenham as regras de entrada especificadas em Grupos de segurança da Amazon VPC.

A montagem automática falha e a instância não responde

Em alguns casos, a montagem automática pode falhar em um sistema de arquivos e a instância do Amazon EC2 pode parar de responder.

Esse problema poderá ocorrer se a opção _netdev não tiver sido declarada. Se _netdev estiver ausente, a instância do Amazon EC2 poderá parar de responder. Isso ocorre porque os sistemas de arquivos de rede precisam ser iniciados depois que a instância de computação inicia suas redes.

Medida a ser tomada

Se esse problema ocorrer, entre em contato com o AWS Support..

A montagem do sistema de arquivos falha durante a inicialização do sistema

A montagem do sistema de arquivos falha durante a inicialização do sistema. A montagem é automatizada usando /etc/fstab. Quando o sistema de arquivos não está montado, o seguinte erro é visto no syslog do período de inicialização da instância.

LNetError: 3135:0:(lib-socket.c:583:lnet_sock_listen()) Can't create socket: port 988 already in use LNetError: 122-1: Can't start acceptor on port 988: port already in use

Esse erro pode ocorrer quando a porta 988 não está disponível. Quando a instância está configurada para montar sistemas de arquivos NFS, é possível que as montagens NFS vinculem a porta do cliente à porta 988

Medida a ser tomada

Você pode contornar esse problema ajustando, quando possível, as opções de montagem noresvport e noauto do cliente NFS.

A montagem do sistema de arquivos usando o nome DNS falha

Nomes DNS configurados incorretamente podem causar falhas na montagem do sistema de arquivos, conforme mostrado nos cenários a seguir.

Cenário 1: uma montagem de sistema de arquivos que está usando um nome DNS falha. O seguinte código mostra um exemplo.

sudo mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx mount.lustre: Can't parse NID 'file_system_dns_name@tcp:/mountname'

Medida a ser tomada

Verifique a configuração da nuvem privada virtual (VPC). Em caso de uso de uma VPC personalizada, verifique se as configurações do DNS estão ativadas. Para obter mais informações, consulte Usar DNS com a VPC, no Guia do usuário da Amazon VPC.

Para especificar um nome DNS no comando mount, faça o seguinte:

  • Certifique-se de que a instância do Amazon EC2 esteja na mesma VPC do sistema de arquivos do Amazon FSx para Lustre.

  • Conecte a instância do Amazon EC2 dentro de uma VPC configurada para usar o servidor DNS fornecido pela Amazon. Para obter mais informações, consulte Conjuntos de Opções de DHCP no Manual do Usuário da Amazon VPC.

  • Certifique-se de que a Amazon VPC da instância de conexão do Amazon EC2 tenha nomes DNS de host habilitados. Para obter mais informações, consulte Atualização do suporte a DNS para sua VPC no Guia do usuário da Amazon VPC.

Cenário 2: uma montagem de sistema de arquivos que está usando um nome DNS falha. O seguinte código mostra um exemplo.

mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx mount.lustre: mount file_system_dns_name@tcp:/mountname at /mnt/fsx failed: Input/output error Is the MGS running?

Medida a ser tomada

Certifique-se de que os grupos de segurança da VPC do cliente tenham as regras corretas de tráfego de saída aplicadas. Essa recomendação é válida especialmente quando você não está usando o grupo de segurança padrão ou quando o modificou. Para obter mais informações, consulte Grupos de segurança da Amazon VPC.