Amazon Managed Service for Apache Flink は、以前は Amazon Kinesis Data Analytics for Apache Flink と呼ばれていました。
翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データスキュー機能
Flink アプリケーションはクラスター上で分散的に実行されます。Flink は複数のノードにスケールアウトするために、キー付きストリームの概念を採用しています。つまり、ストリームのイベントは、顧客 ID などの特定のキーに従って分割され、Flink はノードごとに異なるパーティションを処理できるということです。その後、「キー付きウィンドウ
パーティションキーの選択は、ビジネスロジックによって決まることがよくあります。同時に、「DynamoDB
パーティションキーのカーディナリティを高く保つこと
パーティション間のイベントボリュームの偏りを回避
Flink ダッシュボードでサブタスク (つまり、同じオペレータのインスタンス) の送受信レコードを比較することで、パーティション内のスキューを特定できます。さらに、Apache Flink 用 Managed Service モニタリングでは、numRecordsIn/Out
と numRecordsInPerSecond/OutPerSecond
のメトリクスをサブタスク・レベルでも公開するように設定できます。