Amazon EFSパフォーマンスの問題のトラブルシューティング - Amazon Elastic File System

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon EFSパフォーマンスの問題のトラブルシューティング

一般に、Amazon で解決できない問題が発生した場合EFSは、最新の Linux カーネルを使用していることを確認してください。エンタープライズ Linux ディストリビューションを使用している場合は、以下をお勧めします。

  • Amazon Linux 2 (カーネル 4.3 以降)

  • Amazon Linux 2015.09 以降

  • RHEL 7.3 以降

  • Ubuntu 16.04 のすべてのバージョン

  • カーネル 3.13.0-83 の Ubuntu 14.04 以降

  • SLES 12 Sp2 以降

別のディストリビューションまたはカスタムカーネルを使用している場合は、カーネルバージョン 4.3 以降をお勧めします。

注記

RHEL 6.9 は、 が原因で、特定のワークロードでは最適ではない場合があります多くのファイルを並列に開くとパフォーマンスが低下する

EFS ファイルシステムを作成できません

EFS ファイルシステムを作成するリクエストは、次のメッセージで失敗します。

User: arn:aws:iam::111122223333:user/username is not authorized to perform: elasticfilesystem:CreateFileSystem on the specified resource.
実行するアクション

AWS Identity and Access Management (IAM) ポリシーをチェックして、指定されたリソース条件でEFSファイルシステムを作成する権限があることを確認します。詳細については、「Amazon の ID とアクセスの管理 EFS」を参照してください。

NFS ファイルシステム上の許可されたファイルへのアクセスが拒否されました

16 を超えるアクセスグループ IDs (GIDs) が割り当てられているユーザーがNFSファイルシステムでオペレーションを実行しようとすると、ファイルシステム上の許可されたファイルへのアクセスが拒否される可能性があります。この問題は、NFSプロトコルがユーザーGIDsあたり最大 16 をサポートしており、RFC5531 で定義されているように、クライアントNFSリクエストから追加GIDsが切り捨てられるために発生します。

実行するアクション

NFS ユーザーとグループのマッピングを再構築して、各ユーザーに 16 個以下のアクセスグループ () が割り当てられるようにしますGIDs。

Amazon EFSコンソールへのアクセス時のエラー

このセクションでは、ユーザーが Amazon EFSマネジメントコンソールにアクセスするときに発生する可能性のあるエラーについて説明します。

ec2:DescribeVPCs の認証情報の認証中にエラーが発生しました

Amazon EFSコンソールにアクセスすると、次のエラーメッセージが表示されます。

AuthFailure: An error occurred authenticating your credentials for ec2:DescribeVPCs.

このエラーは、ログイン認証情報が Amazon EC2サービスで正常に認証されなかったことを示します。Amazon EFSコンソールは、選択した でEFSファイルシステムを作成するときに、ユーザーに代わって Amazon EC2サービスを呼び出しVPCます。

実行するアクション

Amazon EFSコンソールにアクセスするクライアントの時刻が正しく設定されていることを確認します。

Amazon EC2インスタンスがハングする

最初にファイルシステムをアンマウントせずにファイルシステムのマウントターゲットを削除したため、Amazon EC2インスタンスがハングする可能性があります。

実行するアクション

ファイルシステムのマウントターゲットを削除する前に、ファイルシステムをアンマウントします。Amazon EFS ファイルシステムのアンマウントの詳細については、「」を参照してくださいファイルシステムをアンマウントする

大量のデータを書き込みしているアプリケーションがハングする

Amazon に大量のデータを書き込むアプリケーションがEFSハングし、インスタンスが再起動します。

実行するアクション

アプリケーションが Amazon にすべてのデータを書き込むのに時間がかかりすぎる場合EFS、プロセスが応答しなくなったように見えるため、Linux が再起動することがあります。この動作は、kernel.hung_task_panickernel.hung_task_timeout_secs という 2 つのカーネルの設定パラメータにより定義されます。

次の例では、停止したプロセスの状態は ps コマンドにより D と共にインスタンスの再起動より前に報告されます。これは、プロセスが I/O で待機していることを示します。

$ ps aux | grep large_io.py root 33253 0.5 0.0 126652 5020 pts/3 D+ 18:22 0:00 python large_io.py /efs/large_file

再起動を避けるには、タイムアウト時間を長くするか、またはハングタスクが検出されたときのカーネルパニックを無効にします。次のコマンドは、ほとんどの Linux システムでタスクがハングしたときのカーネルパニックを無効にします。

$ sudo sysctl -w kernel.hung_task_panic=0

多くのファイルを並列に開くとパフォーマンスが低下する

複数のファイルを並列に開くアプリケーションでは、I/O の並列化のパフォーマンスが期待されるほど向上しません。

実行するアクション

この問題は、ネットワークファイルシステムバージョン 4 (NFSv4) クライアントと .1 RHEL を使用する 6 つのクライアントで発生しますNFSv4。これらのNFSクライアントは NFSOPENおよび CLOSEオペレーションをシリアル化するためです。NFS プロトコルバージョン 4.1 と、この問題がない推奨される Linux ディストリビューションのいずれかを使用します。

NFSv4.1 を使用できない場合は、Linux NFSv4.0 クライアントがユーザー ID とグループ ごとにオープンリクエストとクローズリクエストをシリアル化することにご注意くださいIDs。この直列化は、複数のプロセスまたは複数のスレッドが同時にリクエストを発行した場合でも発生します。クライアントは、すべてのIDs一致時に、一度に 1 つのオープンオペレーションまたはクローズオペレーションのみをNFSサーバーに送信します。これらの問題を回避するには、次のいずれかの操作を実行します。

  • 各プロセスは、同じ Amazon EC2インスタンスで異なるユーザー ID から実行できます。

  • 開いているすべてのリクエストでユーザーをIDs同じままにし、IDs代わりにグループのセットを変更できます。

  • 各プロセスは、個別の Amazon EC2インスタンスから実行できます。

書き込み遅延の原因となるカスタムNFS設定

カスタムNFSクライアント設定があり、Amazon EC2インスタンスが別の Amazon インスタンスからファイルシステムで実行された書き込みオペレーションを表示するまでに最大 3 秒かかりますEC2。

実行するアクション

この問題が発生した場合は、次のいずれかの方法で解決することができます。

  • データを読み取る Amazon EC2インスタンスのNFSクライアントで属性キャッシュが有効になっている場合は、ファイルシステムをアンマウントします。次に、属性のキャッシュを無効にするため、noac オプションを使用して再マウントします。NFSv4.1 の属性キャッシュはデフォルトで有効になっています。

    注記

    クライアント側のキャッシュを無効にすると、アプリケーションのパフォーマンスを低下させる可能性があります。

  • NFS プロシージャと互換性のあるプログラミング言語を使用して、属性キャッシュをオンデマンドでクリアすることもできます。これを行うには、読み込みリクエストの直前に ACCESS プロシージャリクエストを送信します。

    たとえば、Python プログラミング言語を使用して、以下の呼び出しを作成できます。

    # Does an NFS ACCESS procedure request to clear the attribute cache, given a path to the file import os os.access(path, os.W_OK)

Oracle Recovery Manager を使用したバックアップの作成に時間がかかる

バックアップジョブを開始する前に Oracle Recovery Manager が 120 秒間一時停止すると、Oracle Recovery Manager を使用したバックアップの作成が遅くなることがあります。

実行するアクション

この問題が発生した場合は、Oracle ヘルプセンターの「 の直接クライアント制御の有効化と無効化」で説明されているようにNFS、Oracle Direct を無効にします。 NFS NFS

注記

Amazon EFSは Oracle Direct をサポートしていませんNFS。