翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
クラスターオブザーバビリティ
クラスターリソースの使用率を可視化するには、Amazon CloudWatch Container Insights と Amazon Managed Grafana を設定してメトリクスを抽出し、さまざまなダッシュボードで可視化します。
Amazon CloudWatch Container Insights
Amazon CloudWatch Container Insights を使用して、HyperPod クラスターに関連付けられた EKS クラスター上のコンテナ化されたアプリケーションとマイクロサービスからメトリクスとログを収集、集約、要約します。
Amazon CloudWatch Insights は、CPU、メモリ、ディスク、ネットワークなど、コンピューティングリソースのメトリクスを収集します。Container Insights では、問題の迅速な特定と解決に役立つ、コンテナの再起動失敗などの診断情報も提供されます。また、Container Insights が収集するメトリクスには CloudWatch アラームを設定できます。
メトリクスの完全なリストについては、「Amazon EKS ユーザーガイド」の「Amazon EKS および Kubernetes Container Insights のメトリクス」を参照してください。
CloudWatch Container Insights をインストールする
クラスター管理者ユーザーは、「CloudWatch ユーザーガイド」の「Amazon CloudWatch Observability EKS アドオンまたは Helm チャートを使用して CloudWatch エージェントをインストールする」の手順に従って CloudWatch Container Insights を設定する必要があります。Amazon EKS アドオンの詳細については、「Amazon EKS ユーザーガイド」の「Amazon CloudWatch Observability EKS アドオンのインストール」も参照してください。
インストールが完了したら、CloudWatch Observability アドオンが [Amazon EKS クラスターアドオン] タブに表示されることを確認します。ダッシュボードがロードされるまで、数分かかる場合があります。
注記
SageMaker HyperPod には、CloudWatch Insight v2.0.1-eksbuild.1 以降が必要です。

CloudWatch コンテナインサイトダッシュボードにアクセスする
CloudWatch コンソール (https://console.aws.amazon.com/cloudwatch/
) を開きます。 -
[Insights] を選択し、[Container Insights] を選択します。
-
使用している HyperPod クラスターでセットアップされている EKS クラスターを選択します。
-
ポッド/クラスターレベルのメトリクスを表示します。

CloudWatch コンテナインサイトログにアクセスする
CloudWatch コンソール (https://console.aws.amazon.com/cloudwatch/
) を開きます。 -
[Logs] を選択し、ロググループを選択します。
HyperPod クラスターを Amazon CloudWatch Container Insights と統合すると、関連するロググループに /aws/containerinsights /<eks-cluster-name>/*
の形式でアクセスできます。このロググループ内では、パフォーマンスログ、ホストログ、アプリケーションログ、データプレーンログなど、さまざまなタイプのログを検索および調査できます。
Amazon Managed Grafana ワークスペースを設定する
SageMaker HyperPod を Amazon Managed Grafana および Amazon Managed Service for Prometheus と統合することにより、Kubernetes クラスターモニタリングダッシュボード、NVIDIA DCGM エクスポーターダッシュボード、FSx for Lustre メトリクスダッシュボード、EFA メトリクスダッシュボードなど、さまざまな Grafana ダッシュボードで包括的なクラスターオブザーバビリティと可視化を実現できます。