

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# AWS Batch 統合によるクラスターの問題のトラブルシューティング
<a name="troubleshooting-v3-batch"></a>

このセクションでは、特にヘッドノードの問題、コンピューティングの問題、ジョブの失敗、タイムアウトエラーなど、ス AWS Batch ケジューラ統合を使用するクラスターで考えられるトラブルシューティングのヒントを提供します。

**Topics**
+ [ヘッドノードの問題](#troubleshooting-v3-batch-head-node)
+ [コンピュートの問題](#troubleshooting-v3-batch-compute-nodes)
+ [ジョブの失敗](#troubleshooting-v3-batch-job-fail)
+ [エンドポイント URL の接続タイムアウトエラー](#troubleshooting-v3-batch-connect-timeout)

## ヘッドノードの問題
<a name="troubleshooting-v3-batch-head-node"></a>

ヘッドノードのセットアップに関連する問題は、Slurm クラスターと同様にトラブルシューティングを行うことができます (Slurm 固有のログは除く)。これらの問題を解決する方法の詳細については、「[ヘッドノード](troubleshooting-v3-scaling-issues.md#troubleshooting-v3-node-init.head-node)」を参照してください。

## コンピュートの問題
<a name="troubleshooting-v3-batch-compute-nodes"></a>

AWS Batch は、サービスのスケーリングとコンピューティングの側面を管理します。コンピューティング関連の問題が発生した場合は、 AWS Batch [トラブルシューティング](https://docs.aws.amazon.com/batch/latest/userguide/troubleshooting.html)ドキュメントを参照してください。

## ジョブの失敗
<a name="troubleshooting-v3-batch-job-fail"></a>

ジョブが失敗した場合は、[`awsbout`](awsbatchcli.awsbout-v3.md) コマンドを実行してジョブの出力を取得することができます。また、[`awsbstat`](awsbatchcli.awsbstat-v3.md) コマンドを実行して、Amazon CloudWatch が保存しているジョブログへのリンクを取得することもできます。

## エンドポイント URL の接続タイムアウトエラー
<a name="troubleshooting-v3-batch-connect-timeout"></a>

マルチノード並列ジョブが、エラー `Connect timeout on endpoint URL` で失敗する場合:
+ `awsbout` 出力ログで、出力からジョブがマルチノード並列であることを確認します。`Detected 3/3 compute nodes. Waiting for all compute nodes to start.`
+ コンピューティングノードのサブネットがパブリックかどうかを確認します。

マルチノード並列ジョブは、 AWS Batch で を使用する場合のパブリックサブネットの使用をサポートしていません AWS ParallelCluster。コンピューティングノードとジョブにはプライベートサブネットを使用します。詳細については、「AWS Batch ユーザーガイド**」の「[Compute environment considerations](https://docs.aws.amazon.com/batch/latest/userguide/multi-node-parallel-jobs.html#mnp-ce)」を参照してください。コンピューティングノードにプライベートサブネットを設定するには、「[AWS ParallelCluster ス AWS Batch ケジューラを使用する](network-configuration-v3-batch.md)」を参照してください。