ファイルシステムのマウントに関する問題のトラブルシューティング - FSx for Lustre

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ファイルシステムのマウントに関する問題のトラブルシューティング

ファイルシステムのマウントコマンドが失敗する場合、次のトピックで説明するように、いくつかの原因が考えられます。

ファイルシステムのマウントがすぐに失敗する

ファイルシステムのマウントコマンドはすぐに失敗します。コードの例を以下に示します。

mount.lustre: mount fs-0123456789abcdef0.fsx.us-east-1.aws@tcp:/fsx at /lustre failed: No such file or directory Is the MGS specification correct? Is the filesystem name correct?

このエラーは、mount コマンドを使用してパーシステントまたはスクラッチ 2 ファイルシステムをマウントするときの正しい mountname 値を使用していない場合に発生する可能性があります。mountname 値は、 describe-file-systems AWS CLI コマンドまたは DescribeFileSystems API オペレーションのレスポンスから取得できます。

ファイルシステムのマウントがハングした後、タイムアウトエラーで失敗する

ファイルシステムのマウントコマンドが 1、2 分間ハングし、タイムアウトエラーで失敗します。

次のコードは例を示しています。

sudo mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx [2+ minute wait here] Connection timed out

このエラーは、Amazon EC2 インスタンスまたはファイルシステムのセキュリティグループが正しく設定されていないために発生する可能性があります。

実行するアクション

ファイルシステムのセキュリティグループに、Amazon VPC セキュリティグループ で指定したインバウンドルールがあることを確認します。

自動マウントが失敗してインスタンスがレスポンスしない

場合によっては、ファイルシステムの自動マウントが失敗し、Amazon EC2 インスタンスがレスポンスしなくなる場合があります。

この問題は、_netdev オプションは宣言されていません。_netdev が見つからない場合、Amazon EC2 インスタンスはレスポンスを停止する可能性があります。この結果は、コンピューティングインスタンスがネットワークを開始後、ネットワークファイルシステムを初期化する必要があるためです。

実行するアクション

この問題が発生した場合は、 にお問い合わせください AWS サポート。

システムのブート中にファイルシステムのマウントが失敗する

ファイルシステムのマウントは、システムのブート中に失敗します。マウントは、/etc/fstab を使用してオートメーション化されています。ファイルシステムがマウントされていない場合、インスタンスの起動時間枠の syslog に次のエラーが表示されます。

LNetError: 3135:0:(lib-socket.c:583:lnet_sock_listen()) Can't create socket: port 988 already in use LNetError: 122-1: Can't start acceptor on port 988: port already in use

このエラーは、ポート 988 が使用できない場合に発生することがあります。インスタンスが NFS ファイルシステムをマウントするように設定されている場合、NFS マウントがクライアントポートをポート 988 にバインドする可能性があります。

実行するアクション

可能な場合は、NFS クライアントの noresvport および noauto マウントオプションをチューニングすることで、この問題を回避できます。

DNS 名を使用したファイルシステムのマウントが失敗する

次のシナリオに示すように、ドメインネームサービス (DNS) 名の設定が間違っていると、ファイルシステムのマウントエラーが発生する可能性があります。

シナリオ 1: ドメインネームサービス (DNS) 名を使用しているファイルシステムのマウントが失敗します。次のコードは例を示しています。

sudo mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx mount.lustre: Can't parse NID 'file_system_dns_name@tcp:/mountname'

実行するアクション

仮想プライベートクラウド (VPC) の設定を確認します。カスタム VPC を使用している場合は、DNS 設定が有効であることを確認します。詳細については、「Amazon VPC ユーザーガイド」の「VPC での DNS の使用」を参照してください。

mount コマンドで DNS 名を指定するには、以下を実行する必要があります。

  • Amazon EC2 インスタンスが Amazon FSx for Lustre ファイルシステムと同じ VPC 内にあることを確認します。

  • Amazon が提供する DNS サーバーを使用するように設定された VPC 内でAmazon EC2 インスタンスを接続します。詳細については、Amazon VPC ユーザーガイド の「DHCP オプション設定」を参照してください。

  • 接続する Amazon EC2 インスタンスの Amazon VPC で、DNS ホスト名が有効であることを確認します。詳細については、Amazon VPC ユーザーガイド の「VPC の DNS サポートを更新する」を参照してください。

シナリオ 2: ドメインネームサービス (DNS) 名を使用しているファイルシステムのマウントが失敗します。次のコードは例を示しています。

mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx mount.lustre: mount file_system_dns_name@tcp:/mountname at /mnt/fsx failed: Input/output error Is the MGS running?

実行するアクション

クライアントの VPC セキュリティグループに、正しいアウトバウンドトラフィックルールが適用されていることを確認します。このレコメンデーションは、特にデフォルトのセキュリティグループを使用していない場合、またはデフォルトのセキュリティグループを変更した場合に当てはまります。詳細については、「Amazon VPC セキュリティグループ」を参照してください。