翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ターゲットクラスターリージョンで https://console.aws.amazon.com/cloudwatch/ReplicationLatency
、MessageLag
、ReplicatorThroughput
のメトリクスを各 Amazon MSK Replicator のトピックレベルと集計レベルで表示できます。メトリクスは、「AWS/Kafka」名前空間の [ReplicatorName] の下に表示されます。また、ReplicatorFailure
、AuthError
、ThrottleTime
メトリクスを参照して、問題がないかを確認することもできます。
MSK コンソールには、各 MSK レプリケーターの CloudWatch メトリクスのサブセットが表示されます。コンソールの [レプリケーター] リストから、レプリケーターの名前を選択し、[モニタリング] タブを選択します。
MSK レプリケーターのメトリクス
次のメトリクスは、MSK レプリケーターのパフォーマンスまたは接続のメトリクスを示しています。
AuthError メトリクスには、トピックレベルの認証エラーは含まれません。MSK レプリケーターのトピックレベルの認証エラーをモニタリングするには、レプリケーターの ReplicationLatency メトリクスとソースクラスターのトピックレベルのメトリクス MessagesInPerSec をモニタリングします。トピックの ReplicationLatency が 0 に低下してもトピックでまだデータが生成されている場合は、レプリケーターにそのトピックに関する認証の問題があることを示しています。レプリケーターのサービス実行 IAM ロールに、トピックにアクセスするための十分なアクセス許可があることを確認してください。
メトリクスのタイプ | メトリクス | 説明 | ディメンション | [単位] | 未加工メトリクスの細分性 | 未加工メトリクスの集計統計 |
---|---|---|---|---|---|---|
パフォーマンス | ReplicationLatency | ソースクラスターからターゲットクラスターにレコードをレプリケートするのにかかる時間。ソースでレコードが作成されてからターゲットにレプリケートされるまでの時間。ReplicationLatency が増加した場合は、クラスターにレプリケーションをサポートするのに十分なパーティションがあるかどうかを確認してください。パーティション数が少なすぎて高スループットに対応できない場合、レプリケーションのレイテンシーが高くなる可能性があります。 | ReplicatorName | ミリ秒 | パーティション | 最大値 |
ReplicatorName、Topic | ミリ秒 | パーティション | 最大値 | |||
パフォーマンス | MessageLag | MSK レプリケーターとソースクラスター間の同期をモニタリングします。MessageLag は、ソースクラスターに生成されたメッセージとレプリケーターによって消費されたメッセージ間の遅延を示します。ソースクラスターとターゲットクラスター間の遅延ではありません。ソースクラスターが使用不可または中断された場合でも、レプリケーターはターゲットクラスターへの消費したメッセージの書き込みを完了させます。停止後、MessageLag は増加して、レプリケーターがソースクラスターに対して遅れているメッセージ数を示します。これは、メッセージ数が 0 になる (レプリケーターがソースクラスターにキャッチアップしたことを示す) までモニタリングできます。 | ReplicatorName | カウント | パーティション | 合計 |
ReplicatorName、Topic | カウント | パーティション | 合計 | |||
パフォーマンス | ReplicatorBytesInPerSec | 1 秒あたりのレプリケーターによって処理された平均バイト数。MSK Replicator によって処理されるデータは、MSK Replicator が受け取るすべてのデータで構成されます。これには、ターゲットクラスターにレプリケートされたデータと、データが元の同じトピックにコピーされないように MSK Replicator によってフィルタリングされたデータ (レプリケーターが同一トピック名設定で設定されている場合のみ) が含まれます。レプリケーターが「プレフィクス付き」トピック名設定で設定されている場合、MSK Replicator によってデータがフィルタリングされないため、ReplicatorBytesInPerSec と ReplicatorThroughput メトリクスの両方が同じ値になります。 |
ReplicatorName | BytesPerSecond | ReplicatorName | 合計 |
パフォーマンス | ReplicatorThroughput | 1 秒あたりのレプリケートされた平均バイト数。トピックの ReplicatorThroughput が低下した場合は、KafkaClusterPingSuccessCount と AuthError メトリクスをチェックして、レプリケーターがクラスターと通信できることを確認してから、クラスターメトリクスをチェックしてクラスターがダウンしていないことを確認します。 | ReplicatorName | BytesPerSecond | パーティション | 合計 |
ReplicatorName、Topic | BytesPerSecond | パーティション | 合計 | |||
デバッグ | AuthError | 1 秒あたりの認証に失敗した接続の数。このメトリクスが 0 より大きい場合は、レプリケーターのサービス実行ロールポリシーが有効かどうかを確認し、クラスターのアクセス許可に対して拒否アクセス許可が設定されていないことを確認できます。clusterAlias ディメンションに基づいて、ソースクラスターまたはターゲットクラスターで認証エラーが発生しているかどうかを識別できます。 | ReplicatorName、ClusterAlias | カウント | ワーカー | 合計 |
デバッグ | ThrottleTime | クラスター上でブローカーによってリクエストがスロットリングされた平均時間 (ミリ秒単位)。MSK レプリケーターがクラスターを圧迫しないように、スロットリングを設定します。このメトリクスが 0 で、replicationLatency が高くなく、replicatorThroughput が期待どおりであれば、スロットリングは期待どおりに機能しています。このメトリクスが 0 より大きい場合は、それに応じてスロットリングを調整できます。 | ReplicatorName、ClusterAlias | ミリ秒 | ワーカー | 最大値 |
デバッグ | ReplicatorFailure | レプリケーターで発生している障害の数。 | ReplicatorName | カウント | 合計 | |
デバッグ | KafkaClusterPingSuccessCount |
Kafka クラスターへのレプリケーター接続の正常性を示します。この値が 1 の場合、接続は正常です。値が 0 またはデータポイントがない場合、接続は異常です。値が 0 の場合は、Kafka クラスターのネットワークまたは IAM アクセス許可設定を確認してください。ClusterAlias ディメンションに基づいて、このメトリクスがソースクラスター用かターゲットクラスター用かを識別できます。 |
ReplicatorName、ClusterAlias | カウント | 合計 |