ファイルゲートウェイ問題のトラブルシューティング - AWSStorage Gateway

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ファイルゲートウェイ問題のトラブルシューティング

VMware vSphere High Availability (HA) を実行するときに、Amazon CloudWatch ロググループを使用してファイルゲートウェイを設定できます。その場合は、ファイルゲートウェイのヘルスステータスと、ファイルゲートウェイで発生したエラーに関する通知が表示されます。これらのエラー通知とヘルス通知については、CloudWatch Logs で確認できます。

以下のセクションでは、各エラーとヘルス通知の原因、およびその問題の修正方法を理解するのに役立つ情報が見つかります。

エラー: InaccessibleStorageClass

おれは手に入れることができるInaccessibleStorageClassオブジェクトが Amazon S3 標準ストレージクラスから移動されていると、エラーが発生します。

ここでは、通常、ファイルゲートウェイが S3 バケットに指定されたオブジェクトをアップロードしようとするか S3 バケットからオブジェクトを読み取ろうとすると、ファイルゲートウェイでエラーが発生します。このエラーの場合、通常、オブジェクトは、S3 Glacier または S3 Glacier Deep Archive ストレージクラスのいずれかにある Amazon S3 Glacier Deep Archive ストレージクラスのいずれかにあります。

InaccessibleStorageClass エラーを解決するには

  • オブジェクトを S3 Glacier または S3 Glacier Deep Archive ストレージクラスから S3 に戻します。

    アップロードエラーを修正するためにオブジェクトを S3 バケットに移動すると、ファイルは最終的にアップロードされます。読み取りエラーを修正するためにオブジェクトを S3 バケットに移動すると、ファイルゲートウェイの SMB または NFS クライアントがファイルを読み取ることができます。

エラー: s3Access拒否

おれは手に入れることができるS3AccessDeniedファイル共有の Amazon S3 バケットアクセスのエラーAWS Identity and Access Management(IAM) ロール。この場合、S3 バケットは、で指定される IAM ロールにアクセスします。roleArnエラーでは、関連する操作は許可されません。オペレーションが許可されないのは、Amazon S3 プレフィックスで指定されたディレクトリ内のオブジェクトに対するアクセス許可のためです。

S3AccessDenied エラーを解決するには

  • にアタッチされている Amazon S3 アクセスポリシーを変更するroleArnファイルゲートウェイヘルスログで、Amazon S3 オペレーションのアクセス権限を付与します。アクセスポリシーで、エラーの原因となったオペレーションに対するアクセス許可を付与されていることを確認します。また、prefix のログで指定されたディレクトリに対するアクセス許可も許可します。Amazon S3 のアクセス許可の詳細については、「」を参照してください。ポリシーでのアクセス許可の指定Amazon Simple Storage Service ユーザーガイド。

    これらのオペレーションにより、S3AccessDenied エラーが発生する可能性があります。

    • S3HeadObject

    • S3GetObject

    • S3ListObjects

    • S3DeleteObject

    • S3PutObject

エラー: InvalidObjectState

おれは手に入れることができるInvalidObjectState指定されたファイルゲートウェイ以外のライターが、指定された S3 バケット内の指定されたファイルを変更すると、エラーが発生します。その結果、ファイルゲートウェイのファイルの状態が Amazon S3 のファイルの状態と一致しません。以降、Amazon S3 へのファイルのアップロードまたは Amazon S3 からのファイルの取得は失敗します。

InvalidObjectState エラーを解決するには

ファイルを変更するオペレーションがS3UploadまたはS3GetObject] で、次の作業を行います。

  1. ファイルの最新のコピーを SMB または NFS クライアントのローカルファイルシステムに保存します (ステップ 4 でこのファイルのコピーが必要です)。Amazon S3 のファイルのバージョンが最新の場合、そのバージョンをダウンロードします。そのためには、AWS Management Console または AWS CLI を使用します。

  2. を使用して、Amazon S3 のファイルを削除します。AWS Management ConsoleまたはAWS CLI。

  3. SMB または NFS クライアントを使用して、ファイルゲートウェイからファイルを削除します。

  4. SMB または NFS クライアントを使用して、ステップ 1 で保存したファイルの最新バージョンを Amazon S3 にコピーします。この操作はファイルゲートウェイを介して行います。

エラー: ObjectMissing

おれは手に入れることができるObjectMissing指定されたファイルゲートウェイ以外のライターが、指定されたファイルを S3 バケットから削除すると、エラーが発生します。以降、Amazon S3 へのオブジェクトのアップロードまたは Amazon S3 からのオブジェクトの取得は失敗します。

ObjectMissing エラーを解決するには

ファイルを変更するオペレーションがS3UploadまたはS3GetObject] で、次の作業を行います。

  1. ファイルの最新のコピーを SMB または NFS クライアントのローカルファイルシステムに保存します (ステップ 3 でこのファイルのコピーが必要です)。

  2. SMB または NFS クライアントを使用して、ファイルゲートウェイからファイルを削除します。

  3. SMB または NFS クライアントを使用して、ステップ 1 で保存したファイルの最新バージョンをコピーします。この操作はファイルゲートウェイを介して行います。

: Notific 再起動

ゲートウェイ VM の再起動時に、再起動通知が表示される場合があります。VM ハイパーバイザー管理コンソールまたは Storage Gateway コンソールを使用して、ゲートウェイ VM を再起動できます。また、ゲートウェイのメンテナンスサイクル中にゲートウェイソフトウェアを使用して再起動することもできます。

再起動の時刻がゲートウェイで設定されたメンテナンス開始時刻から 10 分以内である場合、この再起動の発生はおそらく正常であり、問題の兆候ではありません。メンテナンス期間外に著しく再起動が発生した場合は、ゲートウェイを手動で再起動したかどうかを確認します。

: Notific HardReboot

ゲートウェイ VM が予期せず再起動された場合、HardReboot 通知が表示されることがあります。このような再起動の原因としては、電源の喪失、ハードウェア障害、またはその他のイベントが考えられます。VMware ゲートウェイの場合、vSphere High Availability アプリケーションのモニタリングによるリセットにより、このイベントがトリガーされることがあります。

ゲートウェイがこのような環境で実行されている場合は、HealthCheckFailure 通知の有無を確認し、VM の VMware イベントログを調べます。

: Notific HealthCheckFailure

VMware vSphere HA のゲートウェイでは、ヘルスチェックが不合格になり、VM の再起動が要求されたときに HealthCheckFailure 通知が表示される場合があります。このイベントは、AvailabilityMonitorTest 通知によって示される可用性をモニタリングするためのテスト中にも発生します。この場合、HealthCheckFailure 通知の発生が想定されます。

注記

この通知は VMware ゲートウェイ専用です。

AvailabilityMonitorTest 通知が表示されることなくこのイベントが繰り返し発生する場合は、VM インフラストラクチャに問題 (ストレージ、メモリなど) がないか確認してください。さらにサポートが必要な場合は、AWS Support。

: Notific AvailabilityMonitorTest

あなたが手に入れるAvailabilityMonitorTestあなたがいるときに通知するテストを実行する可用性とアプリケーションの監視VMware vSphere HA プラットフォームで実行されているゲートウェイ上のシステム。

エラー: RoleTrustRelationshipInvalid

このエラーは、ファイル共有の IAM ロールで IAM 信頼関係が正しく設定されていない (つまり、IAM ロールが、という名前のStorage Gateway プリンシパルを信頼していない) 場合に発生します。storagegateway.amazonaws.com). その結果、ファイルゲートウェイは、ファイル共有をバックアップする S3 バケットでオペレーションを実行するための認証情報を取得できなくなります。

RoleTrustRelationshipInvalid エラーを解決するには

CloudWatch メトリクスを使用したトラブルシューティング

ここでは、Storage Gateway で Amazon CloudWatch メトリクスを使用する際の問題に対処するためのアクションについて説明します。

ディレクトリを参照すると、ゲートウェイの反応が遅くなります。

ファイルゲートウェイの反応が遅い場合は、lsコマンドまたはディレクトリを参照する場合は、IndexFetchそしてIndexEvictionCloudWatch メトリクス:

  • そのファイルにIndexFetch実行すると、メトリックが 0 より大きくなります。lsコマンドまたはディレクトリの閲覧を行うと、影響を受けるディレクトリのコンテンツに関する情報なしでファイルゲートウェイが起動し、Amazon S3 にアクセスする必要がありました。今後そのディレクトリの内容をリストする作業の速度は上がるはずです。

  • そのファイルにIndexEvictionメトリクスが 0 より大きい場合、ファイルゲートウェイがその時点でキャッシュで管理できる制限に達したことを意味します。この場合、ファイルゲートウェイは、最近最もアクセスしていないディレクトリから一部のストレージ領域を解放して、新しいディレクトリをリストする必要があります。これが頻繁に発生し、パフォーマンスに影響がある場合は、AWS Support。

    ディスカッション方法AWS Supportユースケースに基づいてパフォーマンスを向上させるために、関連 S3 バケットのコンテンツと推奨事項。

ゲートウェイが応答していません

ファイルゲートウェイが応答しない場合は、次の操作を行います。

  • 最近再起動またはソフトウェアの更新を行った場合は、IOWaitPercent メトリクスを確認します。このメトリクスは、未処理のディスク I/O リクエストがある場合に、CPU がアイドル状態の時間の割合を示します。場合によっては、この値が高く (10 以上)、サーバーの再起動または更新後に増えていることがあります。このような場合、ファイルゲートウェイはインデックスキャッシュを RAM に再構築するため、低速のルートディスクがファイルゲートウェイのボトルネックになる可能性があります。より高速な物理ディスクをルートディスクに使用することにより、この問題に対処できます。

  • そのファイルにMemUsedBytesメトリックは、MemTotalBytesメトリクスを指定すると、ファイルゲートウェイで使用可能な RAM が不足しています。ファイルゲートウェイに最低限必要な RAM があることを確認します。すでにある場合は、ワークロードとユースケースに基づいて、ファイルゲートウェイへの RAM の追加を検討してください。

    ファイル共有が SMB の場合は、ファイル共有に接続されている SMB クライアントの数が原因である可能性もあります。任意の時点で接続しているクライアントの数を確認するには、SMBV(1/2/3)Sessions メトリクスをチェックします。多くのクライアントが接続されている場合は、ファイルゲートウェイへの RAM の追加が必要になることがあります。

ゲートウェイで Amazon S3 へのデータ転送が遅いです

ファイルゲートウェイで Amazon S3 へのデータ転送が遅い場合は、次の操作を行います。

  • そのファイルにCachePercentDirtyメトリクスが 80 以上の場合、ファイルゲートウェイは、データを Amazon S3 にアップロードするよりも高速にデータをディスクに書き込んでいます。ファイルゲートウェイからのアップロードの帯域幅を増やす、1 つ以上のキャッシュディスクを追加する、またはクライアントの書き込み速度を遅くすることを検討してください。

  • そのファイルにCachePercentDirtyメトリクスが低い場合は、IoWaitPercentメトリクス。もしIoWaitPercentが 10 より大きい場合、ファイルゲートウェイでローカルキャッシュディスクの速度がボトルネックになっている可能性があります。キャッシュには、ローカルソリッドステートドライブ (SSD) ディスク (できれば NVM Express (NVMe)) をお勧めします。このようなディスクが使用できない場合は、パフォーマンスを向上させるために、別々の物理ディスクから複数のキャッシュディスクを使用してみてください。

  • もしS3PutObjectRequestTime,S3UploadPartRequestTime, またはS3GetObjectRequestTime高い場合、ネットワークのボトルネックがある可能性があります。ネットワークを分析して、ゲートウェイに予想される帯域幅があることを確認します。

ゲートウェイが予想よりも多くの Amazon S3 オペレーションを実行している

ファイルゲートウェイが予想よりも多くの Amazon S3 オペレーションを実行している場合は、FilesRenamedメトリクス。名前の変更操作は、Amazon S3 で実行するのにコストがかかります。ワークフローを最適化して、名前変更操作の数を最小限に抑えます。

Amazon S3 バケットにはファイルが表示されません

ゲートウェイ上のファイルが Amazon S3 バケットに反映されないことに気付いた場合は、FilesFailingUploadメトリクス。メトリックで一部のファイルがアップロードに失敗していると報告された場合は、ヘルス通知を確認してください。ファイルのアップロードに失敗すると、ゲートウェイは問題の詳細を含むヘルス通知を生成します。

ゲートウェイのバックアップジョブが失敗する、またはゲートウェイへの書き込み時にエラーが発生する

ファイルゲートウェイのバックアップジョブが失敗する、またはファイルゲートウェイへの書き込み時にエラーが発生する場合は、次の操作を行います。

  • そのファイルにCachePercentDirtyメトリクスが 90 パーセント以上の場合、キャッシュディスクに十分な空き領域がないため、ファイルゲートウェイがディスクへの新しい書き込みを受け付けることができません。ファイルゲートウェイが Amazon FSx または Amazon S3 へのアップロード速度を確認するには、CloudBytesUploadedメトリクス。そのメトリックをWriteBytesメトリクス。クライアントによるファイルゲートウェイへのファイルの書き込み度を示します。ファイルゲートウェイが Amazon FSx または Amazon S3 にアップロードできる速度よりも高速に書き込みを行っている場合は、少なくともバックアップジョブのサイズに対応できるキャッシュディスクを追加します。または、アップロード帯域幅を増やします。

  • バックアップジョブが失敗しても、CachePercentDirtyメトリクスが 80 パーセント未満の場合は、ファイルゲートウェイでクライアント側のセッションタイムアウトに達している可能性があります。SMB の場合は、PowerShell コマンド Set-SmbClientConfiguration -SessionTimeout 300 を使用してこのタイムアウトを増やすことができます。このコマンドを実行すると、タイムアウトが 300 秒に設定されます。

    NFS の場合は、クライアントがソフトマウントではなくハードマウントを使用してマウントされていることを確認してください。