MSK Connect のモニタリング - Amazon Managed Streaming for Apache Kafka

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

MSK Connect のモニタリング

モニタリングは、MSK Connect およびその他の AWS ソリューションの信頼性、可用性、パフォーマンスを維持する上で重要な部分です。Amazon CloudWatch は、 AWS リソースと AWS で実行しているアプリケーションをリアルタイムでモニタリングします。メトリクスを収集および追跡し、カスタマイズされたダッシュボードを作成し、指定されたメトリクスが指定したしきい値に達したときに通知またはアクションを実行するアラームを設定できます。例えば、CloudWatch でコネクタの CPU 使用率やその他のメトリクスを追跡できるため、必要に応じて容量を増やすことができます。詳細については、「Amazon CloudWatch ユーザーガイド」を参照してください。

次の API オペレーションを使用できます。

  • DescribeConnectorOperation: コネクタの更新オペレーションのステータスをモニタリングします。

  • ListConnectorOperations: コネクタで実行された以前の更新を追跡します。

次の表は、MSK Connect がConnectorName ディメンションで CloudWatch に送信するメトリクスを示しています。MSK Connect は、これらのメトリクスをデフォルトで追加コストなしで提供します。CloudWatch はこれらのメトリクスを 15 か月間保持するため、履歴情報にアクセスして、コネクタのパフォーマンスをより正確に把握できます。また、特定のしきい値を監視するアラームを設定し、それらのしきい値に達したときに通知を送信したり、アクションを実行したりすることもできます。詳細については、「Amazon CloudWatch ユーザーガイド」を参照してください。

MSK Connect メトリクス
メトリクス名 説明
BytesInPerSec コネクタが受信した合計バイト数。
BytesOutPerSec コネクタによって配信された合計バイト数。
CpuUtilization システムおよびユーザーによる CPU 消費のパーセンテージ。
ErroredTaskCount エラーが発生したタスクの数。
MemoryUtilization 現在使用中の Java 仮想マシン (JVM) ヒープメモリだけでなく、ワーカーインスタンスの合計メモリに占める割合。JVM は通常、メモリを運用システムに解放しません。そのため、JVM ヒープサイズ (MemoryUtilization) は通常、最小ヒープサイズから始まり、徐々に増加して約 80 ~ 90% の安定した最大値になります。JVM ヒープ使用量は、コネクタの実際のメモリ使用量の変化に合わせて増減する場合があります。
RebalanceCompletedTotal このコネクタによって完了したリバランスの総数。
RebalanceTimeAvg コネクタがリバランスに費やした平均時間 (ミリ秒単位)。
RebalanceTimeMax コネクタがリバランスに費やした最大時間 (ミリ秒単位)。
RebalanceTimeSinceLast

このコネクタが最新のリバランスを完了してからのミリ秒単位の時間。

RunningTaskCount コネクタで実行中のタスクの数。
SinkRecordReadRate Apache Kafka または Amazon MSK クラスターから読み取られた 1 秒あたりの平均レコード数。
SinkRecordSendRate 変換から出力され、宛先に送信される 1 秒あたりの平均レコード数。この数には、フィルタリングされたレコードは含まれていません。
SourceRecordPollRate 生成またはポーリングされた 1 秒あたりの平均レコード数。
SourceRecordWriteRate 変換から出力され、Apache Kafka または Amazon MSK クラスターに書き込まれる 1 秒あたりの平均レコード数。
TaskStartupAttemptsTotal コネクタが試行したタスクの起動の総数。このメトリクスを使用して、タスクのスタートアップの異常を識別できます。
TaskStartupSuccessPercentage 成功したタスクの平均パーセンテージは、コネクタでスタートされます。このメトリクスを使用して、タスクのスタートアップ試行の異常を識別できます。
WorkerCount コネクタで実行されているワーカーの数。