Como solucionar problemas do gateway de arquivos - AWSStorage Gateway

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como solucionar problemas do gateway de arquivos

É possível configurar o gateway de arquivos com um grupo de logs do Amazon CloudWatch ao executar o VMware vSphere High Availability (HA). Se fizer isso, você receberá notificações sobre o status de integridade do gateway de arquivos e sobre erros que o gateway de arquivos encontra. Você pode encontrar informações sobre essas notificações de erros e de integridade no CloudWatch Logs.

Nas seções a seguir, é possível encontrar informações que podem ajudar a entender a causa de cada erro e notificação de integridade e como corrigir problemas.

Erros: InaccessibleStorageClass

Você pode obter umInaccessibleStorageClassErro quando um objeto é movido para fora da classe de armazenamento Amazon S3 Standard.

Aqui, geralmente o gateway de arquivos encontra o erro quando tenta fazer upload do objeto especificado no bucket do S3 ou ler o objeto do bucket do S3. Com esse erro, geralmente o objeto foi movido para o Amazon S3 Glacier e está na classe de armazenamento S3 Glacier ou S3 Glacier Deep Archive.

Para resolver um erro InaccessibleStorageClass

  • Mova o objeto da classe de armazenamento S3 Glacier ou S3 Glacier Deep Archive de volta para o S3.

    Se você mover o objeto para o bucket do S3 para corrigir um erro de upload, acabará sendo feito upload do arquivo. Se você mover o objeto para o bucket do S3 para corrigir um erro de leitura, o cliente SMB ou NFS do gateway de arquivos poderá, então, ler o arquivo.

Erros: S3Accessnegado

Você pode obter umS3AccessDeniedErro para o acesso ao bucket do Amazon S3 de um compartilhamento de arquivosAWS Identity and Access Management(IAM) da função do. Nesse caso, a função do IAM de acesso a bucket do S3 especificada porroleArnNo erro não permite a operação envolvida. A operação não é permitida devido às permissões para os objetos no diretório especificado pelo prefixo do Amazon S3.

Para resolver um erro S3AccessDenied

  • Modifique a política de acesso do Amazon S3 que está anexada aoroleArnNo log de integridade do gateway de arquivos para permitir permissões para a operação do Amazon S3. Verifique se a política de acesso concede permissão para a operação que causou o erro. Além disso, conceda permissão para o diretório especificado no log para prefix. Para obter informações sobre as permissões do Amazon S3, consulteEspecificar permissões em uma políticaemGuia do usuário do Amazon Simple Storage Service.

    Essas operações podem fazer com que ocorra um erro S3AccessDenied.

    • S3HeadObject

    • S3GetObject

    • S3ListObjects

    • S3DeleteObject

    • S3PutObject

Erros: InvalidObjectState

Você pode obter umInvalidObjectStateErro quando um gravador diferente do gateway de arquivos determinado modifica o arquivo especificado no bucket do S3 estabelecido. Como resultado, o estado do arquivo para o gateway de arquivos não corresponde ao seu estado no Amazon S3. Todos os uploads subsequentes do arquivo para o Amazon S3 ou as recuperações do arquivo do Amazon S3 falharão.

Para resolver um erro InvalidObjectState

Se a operação que modifica o arquivo forS3UploadouS3GetObject, faça o seguinte:

  1. Salve a cópia mais recente do arquivo no sistema de arquivos local do cliente SMB ou NFS (você precisa dessa cópia de arquivo na etapa 4). Se a versão do arquivo no Amazon S3 for a mais recente, faça download dessa versão. É possível fazer isso usando o AWS Management Console ou a AWS CLI.

  2. Exclua o arquivo no Amazon S3 usando oAWS Management ConsoleouAWS CLI.

  3. Exclua o arquivo do gateway de arquivos usando o cliente SMB ou NFS.

  4. Copie a versão mais recente do arquivo que você salvou na etapa 1 para o Amazon S3 usando o cliente SMB ou NFS. Faça isso por meio do gateway de arquivos.

Erros: ObjectMissing

Você pode obter umObjectMissingErro quando um gravador diferente do gateway de arquivos determinado exclui o arquivo especificado do bucket do S3. Todos os uploads subsequentes no Amazon S3 ou as recuperações do Amazon S3 para o objeto falharão.

Para resolver um erro ObjectMissing

Se a operação que modifica o arquivo forS3UploadouS3GetObject, faça o seguinte:

  1. Salve a cópia mais recente do arquivo no sistema de arquivos local do cliente SMB ou NFS (você precisa dessa cópia de arquivo na etapa 3).

  2. Exclua o arquivo do gateway de arquivos usando o cliente SMB ou NFS.

  3. Copie a versão mais recente do arquivo que você salvou na etapa 1 usando o cliente SMB ou NFS. Faça isso por meio do gateway de arquivos.

: Notification Reinicializar

É possível obter uma notificação de reinicialização quando a VM do gateway é reiniciada. É possível reiniciar a VM de um gateway usando o console de gerenciamento do VM Hypervisor ou o console do Storage Gateway. Também é possível reiniciar usando o software de gateway durante o ciclo de manutenção do gateway.

Se a hora da reinicialização estiver dentro de 10 minutos da hora de início da manutenção configurada do gateway, essa reinicialização provavelmente será uma ocorrência normal e não um sinal de algum problema. Se a reinicialização ocorreu significativamente fora da janela de manutenção, verifique se o gateway foi reiniciado manualmente.

: Notification HardReboot

Você pode receber uma notificação HardReboot quando a VM do gateway é reiniciada inesperadamente. Essa reinicialização pode ocorrer devido à falta de energia, à uma falha de hardware ou a outro evento. Para gateways do VMware, uma reinicialização pelo Monitoramento de aplicativos do vSphere High Availability pode acionar esse evento.

Quando o gateway for executado nesse ambiente, verifique a presença da notificação HealthCheckFailure e consulte o log de eventos do VMware da VM.

: Notification HealthCheckFailure

Para um gateway no VMware vSphere HA, você pode receber uma notificação HealthCheckFailure quando uma verificação de integridade falha e uma reinicialização da VM é solicitada. Esse evento também ocorre durante um teste para monitorar a disponibilidade, indicado por uma notificação AvailabilityMonitorTest. Nesse caso, a notificação HealthCheckFailure é esperada.

nota

Esta notificação é apenas para gateways do VMware.

Se esse evento ocorrer repetidamente sem uma notificação AvailabilityMonitorTest, verifique se a infraestrutura da VM está com problemas (armazenamento, memória e assim por diante). Se precisar de assistência adicional, entre em contatoAWS Support.

: Notification AvailabilityMonitorTest

Você recebe umAvailabilityMonitorTestnotificação quando vocêexecutar um testedoMonitoramento de disponibilidade e aplicativosSistema em gateways em execução em uma plataforma do VMware vSphere HA.

Erros: RoleTrustRelationshipInvalid

Você recebe esse erro quando a função do IAM para um compartilhamento de arquivos tem uma relação de confiança do IAM configurada incorretamente (isto é, a função do IAM não confia no principal do Storage Gateway chamadostoragegateway.amazonaws.com). Como resultado, o gateway de arquivos não poderia obter as credenciais para executar nenhuma operação no bucket do S3 que ofereça suporte ao compartilhamento de arquivos.

Para resolver um erro RoleTrustRelationshipInvalid

Solução de problemas com métricas do CloudWatch

Você pode encontrar informações a seguir sobre ações para solucionar problemas no uso de métricas do Amazon CloudWatch com o Storage Gateway.

Seu gateway reage lentamente ao navegar em diretórios

Se o gateway de arquivos reage lentamente ao executar olscomandos ou navegar diretórios, verifique oIndexFetcheIndexEvictionMétricas do CloudWatch:

  • Se oIndexFetchmétrica é maior que 0 quando você executa umlsComando ou navegar por diretórios, o gateway de arquivos foi iniciado sem informações sobre o conteúdo do diretório afetado e precisou acessar o Amazon S3. Os esforços subsequentes para listar o conteúdo desse diretório deverão ocorrer com mais rapidez.

  • Se oIndexEvictionA métrica é maior que 0, significa que o gateway de arquivos atingiu o limite do que pode gerenciar em seu cache no momento. Nesse caso, o gateway de arquivos precisa liberar espaço de armazenamento do diretório menos acessado recentemente para listar um novo diretório. Se isso ocorrer com frequência e houver um impacto no desempenho, entre em contatoAWS Support.

    Discutir comAWS SupportO conteúdo do bucket do S3 relacionado e as recomendações para melhorar o desempenho com base no seu caso de uso.

Seu gateway não está respondendo

Se o gateway de arquivos não estiver respondendo, faça o seguinte:

  • Se essa foi uma reinicialização atual ou uma atualização de software, verifique a métrica IOWaitPercent. Essa métrica mostra a porcentagem de tempo que a CPU fica ociosa quando há uma solicitação de E/S de disco pendente. Em alguns casos, isso pode ser alto (10 ou mais) e pode ter aumentado depois que o servidor foi reinicializado ou atualizado. Nesses casos, o gateway de arquivos pode ser afunilado por um disco raiz lento à medida que recria o cache de índice para RAM. É possível resolver esse problema usando um disco físico mais rápido para o disco raiz.

  • Se oMemUsedBytesmétrica é quase igual ou quase a mesma que aMemTotalBytesEm seguida, o gateway de arquivos está ficando sem RAM disponível. Verifique se o gateway de arquivos tem pelo menos a RAM mínima necessária. Se já tiver, considere adicionar mais RAM ao gateway de arquivos com base na carga de trabalho e no caso de uso.

    Se o compartilhamento de arquivos for SMB, o problema também pode ser devido ao número de clientes SMB conectados ao compartilhamento de arquivos. Para ver o número de clientes conectados em determinado momento, verifique a métrica SMBV(1/2/3)Sessions. Se houver muitos clientes conectados, talvez seja necessário adicionar mais RAM ao gateway de arquivos.

Se o gateway estiver transferindo dados lentamente para o Amazon S3

Se o gateway de arquivos estiver transferindo dados lentamente para o Amazon S3, faça o seguinte:

  • Se oCachePercentDirtyA métrica é 80 ou mais, o gateway de arquivos está gravando dados mais rapidamente no disco do que pode fazer upload de dados no Amazon S3. Considere aumentar a largura de banda para upload do gateway de arquivos, adicionar um ou mais discos de cache ou desacelerar as gravações do cliente.

  • Se oCachePercentDirtymétrica é baixa, verifique oIoWaitPercentMétrica do. SeIoWaitPercentÉ maior que 10, o gateway de arquivos pode ser afunilado pela velocidade do disco de cache local. Recomendamos discos de unidade de estado sólido (SSD) local para o cache, de preferência NVM Express (NVMe). Se esses discos não estiverem disponíveis, tente usar vários discos de cache de discos físicos separados para melhorar o desempenho.

  • SeS3PutObjectRequestTime,S3UploadPartRequestTime, ouS3GetObjectRequestTimesão altos, pode haver um gargalo na rede. Tente analisar sua rede para verificar se o gateway tem a largura de banda esperada.

Seu gateway está realizando mais operações do Amazon S3 do que o esperado

Se o gateway de arquivos estiver executando mais operações do Amazon S3 do que o esperado, verifique aFilesRenamedMétrica do. As operações de renomeação são caras para serem executadas no Amazon S3. Otimize seu fluxo de trabalho para minimizar o número de operações de renomeação.

Você não vê arquivos em seu bucket do Amazon S3

Se você notar que os arquivos no gateway não estão refletidos no bucket do Amazon S3, verifique aFilesFailingUploadMétrica do. Se a métrica informar que alguns arquivos estão falhando no upload, verifique suas notificações de integridade. Quando os arquivos falham ao carregar, o gateway gera uma notificação de integridade contendo mais detalhes sobre o problema.

Seu trabalho de backup do gateway falhará ou há erros ao gravar no gateway

Se o trabalho de backup do gateway de arquivos falhar ou houver erros ao gravar no gateway de arquivos, faça o seguinte:

  • Se oCachePercentDirtyA métrica é 90% ou mais, o gateway de arquivos não consegue aceitar novas gravações em disco porque não há espaço disponível suficiente no disco de cache. Para ver a rapidez com que o gateway de arquivos está fazendo upload no Amazon FSx ou no Amazon S3, visualize aCloudBytesUploadedMétrica do. Compare essa métrica com oWriteBytes, que mostra a rapidez com que o cliente está gravando arquivos no gateway de arquivos. Se o gateway de arquivos estiver gravando mais rápido do que pode fazer upload no Amazon FSx ou Amazon S3, adicione mais discos de cache para cobrir, no mínimo, o tamanho do trabalho de backup. Ou aumente a largura de banda de upload.

  • Se um trabalho de backup falhar, mas oCachePercentDirtyA métrica é inferior a 80%, o gateway de arquivos pode estar atingindo um tempo limite de sessão no lado do cliente. Para SMB, é possível aumentar esse tempo limite usando o comando Set-SmbClientConfiguration -SessionTimeout 300 do PowerShell. A execução desse comando define o tempo limite para 300 segundos.

    Para o NFS, verifique se o cliente está montado usando uma montagem rígida em vez de uma montagem flexível.