AWS Outposts でローカル Amazon EKS クラスターをトラブルシューティングする
このトピックでは、ローカルクラスターの使用中に表示される可能性がある一般的なエラーとそのトラブルシューティング方法について説明します。ローカルクラスターはクラウド内の Amazon EKS クラスターと似ていますが、Amazon EKS による管理方法にはいくつかの違いがあります。
ローカルクラスターは Amazon EKS API を通して作成されますが、非同期で実行されます。つまり、Amazon EKS API へのリクエストはローカルクラスターに対してすぐに返されます。ただし、これらのリクエストは成功し、入力検証エラーにより迅速に失敗するか、あるいは失敗して説明入りの検証エラーが発生する可能性があります。この動作は、Kubernetes API のと似ています。
ローカルクラスターは FAILED
ステータスに移行しません。Amazon EKS は、クラスターの状態をユーザーが要求した望ましい状態と一致させようと継続的に試みます。その結果、根本的な問題が解決されるまで、長期間にわたってローカルクラスターが CREATING
状態のままになる可能性があります。
describe-cluster Amazon EKS AWS CLI コマンドを使用して、ローカルクラスターの問題を検出できます。ローカルクラスターの問題は、describe-cluster
コマンドの応答の cluster.health
フィールドによって明らかになります。このフィールドに含まれるメッセージには、エラーコード、説明メッセージ、および関連するリソース ID が含まれます。この情報は、Amazon EKS API および AWS CLI のみから利用可能です。次の例では、my-cluster
をローカルクラスターの名前に置き換えます。
aws eks describe-cluster --name my-cluster --query 'cluster.health'
出力例は次のとおりです。
{ "issues": [ { "code": "ConfigurationConflict", "message": "The instance type 'm5.large' is not supported in Outpost 'my-outpost-arn'.", "resourceIds": [ "my-cluster-arn" ] } ] }
問題が修復できない場合は、ローカルクラスターを削除して新しいクラスターを作成する必要がある場合があります。たとえば、Outpost で利用できないインスタンスタイプでクラスターをプロビジョニングしようとしている場合などです。下表は、一般的なヘルス関連のエラーを示しています。
エラーシナリオ | コード | メッセージ | ResourceIds |
---|---|---|---|
指定されたサブネットが見つかりませんでした。 |
|
|
指定されたすべてのサブネット ID |
指定されたサブネットが同じ VPC に属していません。 |
|
|
指定されたすべてのサブネット ID |
指定されたサブネットの一部が、指定された Outpost に属していません。 |
|
|
問題のあるサブネット ID |
指定されたサブネットの中には、どの Outpost にも属していないものがあります。 |
|
|
問題のあるサブネット ID |
指定されたサブネットの中には、コントロールプレーンインスタンス用のエラスティックネットワークインターフェイスを作成するだけの十分な空きアドレスがないものがあります。 |
|
|
問題のあるサブネット ID |
指定されたコントロールプレーンインスタンスタイプは、お使いの Outpost でサポートされていません。 |
|
|
クラスター ARN |
コントロールプレーン Amazon EC2 インスタンスを終了したか、 |
|
|
クラスター ARN |
Outpost の容量が不足しています。これは、クラスターの作成中に Outpost が AWS リージョンから切断された場合にも発生する可能性があります。 |
|
|
クラスター ARN |
アカウントがセキュリティグループの制限を超えています。 |
|
Amazon EC2 API から返されたエラーメッセージ |
ターゲット VPC ID |
アカウントがエラスティックネットワークインターフェイスの制限を超えています。 |
|
Amazon EC2 API から返されたエラーメッセージ |
ターゲットサブネット ID |
AWS Systems Manager を介してコントロールプレーンインスタンスにアクセスできません。解決策については、「AWS Systems Manager を介してコントロールプレーンインスタンスにアクセスできません。」を参照してください。 |
|
Amazon EKS コントロールプレーンインスタンスには SSM 経由ではアクセスできません。SSM とネットワーク設定を確認し、EKS on Outposts のトラブルシューティングドキュメントを参照してください。 |
Amazon EC2 インスタンス ID |
マネージドセキュリティグループまたはエラスティックネットワークインターフェイスの詳細を取得中に、エラーが発生しました。 |
Amazon EC2 クライアントエラーコードに基づきます。 |
Amazon EC2 API から返されたエラーメッセージ |
すべてのマネージドセキュリティグループ ID |
セキュリティグループのイングレスルールを承認または取り消す際にエラーが発生しました。これは、クラスターとコントロールプレーンの両方のセキュリティグループに適用されます。 |
Amazon EC2 クライアントエラーコードに基づきます。 |
Amazon EC2 API から返されたエラーメッセージ |
問題のあるセキュリティグループの ID |
コントロールプレーンインスタンスのエラスティックネットワークインターフェイスの削除中にエラーが発生しました。 |
Amazon EC2 クライアントエラーコードに基づきます。 |
Amazon EC2 API から返されたエラーメッセージ |
問題のあるエラスティックネットワークインターフェイス ID |
次の表は、describe-cluster
応答のヘルスフィールドに表示される他の AWS サービスからのエラーを示しています。
Amazon EC2 エラーコード | クラスターヘルス問題コード | 説明 |
---|---|---|
|
|
このエラーは、さまざまな理由で発生する可能性があります。最も一般的な理由は、サービスにリンクされたロールポリシーの範囲を狭めるためにサービスが使用するタグが、コントロールプレーンインスタンスから誤って削除された場合に発生するのです。この場合、Amazon EKS はこれらの AWS リソースを管理および監視できなくなります。 |
|
|
このエラーは、さまざまな理由で発生する可能性があります。最も一般的な理由は、サービスにリンクされたロールポリシーの範囲を狭めるためにサービスが使用するタグが、コントロールプレーンインスタンスから誤って削除された場合に発生するのです。この場合、Amazon EKS はこれらの AWS リソースを管理および監視できなくなります。 |
|
|
このエラーは、セキュリティグループのイングレスルールのサブネット ID が見つからない場合に発生します。 |
|
|
このエラーは、セキュリティグループのイングレスルールの権限が正しくない場合に発生します。 |
|
|
このエラーは、セキュリティグループのイングレスルールのグループが見つからない場合に発生します。 |
|
|
このエラーは、セキュリティグループのイングレスルールのネットワークインターフェイス ID が見つからない場合に発生します。 |
|
|
このエラーは、サブネットリソースのクォータを超えたときに発生します。 |
|
|
このエラーは、outpost のクォータを超えたときに発生します。 |
|
|
このエラーは、エラスティックネットワークインターフェイスのクォータを超えた場合に発生します。 |
|
|
このエラーは、セキュリティグループのクォータを超えたときに発生します。 |
|
|
Amazon EC2 インスタンスを新規アカウントで作成するときに発生します。エラーは次のようなものになります: 「 |
|
|
Amazon EC2 は、指定されたインスタンスタイプが Outpost でサポートされていない場合、このエラーコードを返します。 |
その他のすべての障害 |
|
[なし] |
ローカルクラスターには、クラウド内にホストされている Amazon EKS クラスターとは異なるアクセス権限とポリシーが必要です。クラスターの作成に失敗し InvalidPermissions
エラーが表示される場合は、使用しているクラスターロールに AmazonEKSLocalOutpostClusterPolicy マネージドポリシーがアタッチされているかどうかをもう一度確認します。その他すべての API 呼び出しには、クラウド内の Amazon EKS クラスターと同じ権限セットが必要です。
ローカルクラスターの作成にかかる時間は、いくつかの要因によって異なります。ネットワーク設定、Outpost の設定、およびクラスターの設定などが要因として考えられます。通常、ローカルクラスターは 15 ~ 20 分以内に作成され、ACTIVE
ステータスに変わります。ローカルクラスターが CREATING
状態を維持する場合は、describe-cluster
を呼び出すと cluster.health
出力フィールドに原因に関する情報が表示されます。
次は、最も一般的な問題を示しています。
-
クラスターが Systems Manager のある AWS リージョンからコントロールプレーンインスタンスに接続できません。地域内の踏み台ホストから
aws ssm start-session --target
を呼び出すことでこれを検証できます。このコマンドがうまくいかない場合は、Systems Manager がコントロールプレーンインスタンスで実行されているかどうかを確認します。または、別の回避策として、クラスターを削除して再度作成することもできます。instance-id
-
Systems Manager のコントロールプレーンインスタンスが、インターネットにアクセスできない可能性があります。クラスターの作成時に指定したサブネットに NAT ゲートウェイとインターネットゲートウェイを備えた VPC があるかどうかを確認します。VPC 到達可能性アナライザーを使用して、コントロールプレーンインスタンスがインターネットゲートウェイに到達できることを確認します。詳細については、「VPC Reachability Analyzer の開始方法」を参照してください。
-
指定したロール ARN にポリシーがありません。AWS マネージドポリシー: AmazonEKSLocalOutpostClusterPolicy がロールから削除されたかどうかを確認します。これは、AWS CloudFormation スタックの設定が間違っている場合にも発生する可能性があります。
-
指定されているすべてのサブネットが同じ Outpost に関連付けられており、相互に到達できる必要があります。クラスターの作成時に複数のサブネットを指定すると、Amazon EKS はコントロールプレーンインスタンスを複数のサブネットに分散させようとします。
-
Amazon EKS マネージド セキュリティグループは、エラスティックネットワークインターフェイスに適用されます。しかしながら、NACL ファイアウォールルールなどの他の設定要素が、エラスティックネットワークインターフェイスのルールと競合する可能性があります。
VPC とサブネット DNS の設定が誤っているか、欠落しています
-
AMI に関する問題:
-
サポートされていない AMI を使用しています。最適化された Amazon Linux AMI を使用してノードを作成する Amazon EKS 最適化 Amazon Linux には v20220620
以降を使用する必要があります。 -
AWS CloudFormation テンプレートを使用してノードを作成した場合、サポートされていない AMI を使用していないことを確認します。
-
-
AWS IAM Authenticator
ConfigMap
が見つからない - 見つからない場合は、作成する必要があります。詳細については、「aws-auth ConfigMap をクラスターに適用する」を参照してください。 -
間違ったセキュリティグループが使用されている - ワーカーノードのセキュリティグループには、必ず
eks-cluster-sg-
を使用してください。スタックが使用されるたびに、選択したセキュリティグループは AWS CloudFormation によって変更され、新しいセキュリティグループを使用できるようになります。cluster-name
-uniqueid
-
予期しないプライベートリンクの VPC 手順に従う - CA データが間違っている (
--b64-cluster-ca
) または API エンドポイント (--apiserver-endpoint
) が渡されました。 -
Pod のセキュリティポリシーの設定ミス:
-
ノードがクラスターに結合して通信できるようにするために、CoreDNS と Amazon VPC CNI plugin for Kubernetes Daemonset はノード上で実行する必要があります。
-
Amazon VPC CNI plugin for Kubernetes を正常に動作するには、いくつかの特権ネットワーク機能が必要です。次のコマンドを使用して特権ネットワーク機能を表示できます:
kubectl describe psp eks.privileged
。
デフォルトのポッドセキュリティポリシーを変更することはお勧めしません。詳細については、「Amazon EKS 作成のポッドセキュリティポリシー (PSP) の説明」を参照してください。
-
Outpost が関連付けられている AWS リージョンから切断された場合でも、Kubernetes クラスターは依然として動作し続ける可能性があります。ただし、クラスターが正常に機能しない場合は、「AWS Outposts でローカル Amazon EKS クラスターを準備して、ネットワークの切断に備える」にあるトラブルシューティング手順に従ってください。他の問題が発生した場合は、AWS サポートにお問い合わせください。AWSサポートからログ収集ツールをダウンロードして実行する方法を説明します。この方法により、Kubernetes クラスターコントロールプレーンインスタンスからログを収集し、詳細な調査のために AWS サポートに送信できます。
Amazon EKS コントロールプレーンインスタンスが AWS Systems Manager (Systems Manager) を通してアクセスでない場合、Amazon EKS はクラスターに対して次のエラーを表示します。
Amazon EKS control plane instances are not reachable through SSM. Please verify your SSM and network configuration, and reference the EKS on Outposts troubleshooting documentation.
この問題を解決するには、VPC とサブネットが「AWS Outposts で Amazon EKS クラスターの VPC とサブネットを作成する」の要件を満たしており、AWS Systems Manager ユーザーガイドの「Session Manager の設定」にある手順が完了していることを確認してください。