Amazon Managed Service for Apache Flink の使用を開始する (DataStream API) - Managed Service for Apache Flink

Amazon Managed Service for Apache Flink は、以前は Amazon Kinesis Data Analytics for Apache Flink と呼ばれていました。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Managed Service for Apache Flink の使用を開始する (DataStream API)

このセクションでは、Managed Service for Apache Flink の基本概念と、 を使用して Java にアプリケーションを実装する方法について説明します DataStream API。アプリケーションの作成とテストに使用できるオプションについて説明します。また、このガイドのチュートリアルを完了し、初めてアプリケーションを作成するのに必要なツールのインストール方法についても説明します。

Managed Service for Apache Flink アプリケーションのコンポーネントを確認する

注記

Amazon Managed Service for Apache Flink は、すべての Apache Flink APIsと、場合によってはすべてのJVM言語をサポートしています。詳細については、「Flink のAPIs」を参照してください。

API 選択した に応じて、アプリケーションの構造と実装は若干異なります。この入門チュートリアルでは、Java での DataStream APIを使用したアプリケーションの実装について説明します。

Managed Service for Apache Flink アプリケーションは、データを処理するために、入力を処理し、Apache Flink ランタイムを使用して出力を生成する Java アプリケーションを使用します。

一般的な Managed Service for Apache Flink アプリケーションには、次のコンポーネントがあります。

  • ランタイムプロパティ: ランタイムプロパティを使用して、コードを変更および再発行することなく、設定パラメータをアプリケーションに渡すことで変更することができます。

  • ソース: アプリケーションは 1 つ以上のソース からのデータを消費します。ソースはコネクタを使用して、Kinesis データストリームや Kafka バケットなどの外部システムからデータを読み込みます。詳細については、「ストリーミングデータソースを追加する」を参照してください。

  • オペレータ:」アプリケーションは 1 つ以上の「オペレータ」を使用してデータを処理します。オペレータはデータを変換、強化、または集約できます。詳細については、「演算子」を参照してください。

  • シンク: アプリケーションはシンク を介して外部ソースにデータを送信します。シンクはコネクタ v を使用して、Kinesis データストリーム、Kafka トピック、Amazon S3、またはリレーショナルデータベースにデータを送信します。また、特別なコネクタを使用して、開発のみを目的として出力を印刷することもできます。詳細については、「シンクを使用してデータを書き込む」を参照してください。

アプリケーションには、アプリケーションが使用する Flink コネクタや、場合によっては Java ライブラリなど、いくつかの外部依存関係 が必要です。Amazon Managed Service for Apache Flink で を実行するには、アプリケーションを fat-jar の依存関係とともにパッケージ化し、Amazon S3 バケットにアップロードする必要があります。次に、Apache Flink アプリケーション用 Managed Serviceを作成します。コードパッケージの場所を、他のランタイム設定パラメータとともに渡します。

このチュートリアルでは、Apache Maven を使用してアプリケーションをパッケージ化し、IDE選択した でアプリケーションをローカルで実行する方法について説明します。

演習を完了するための前提条件を満たす

このガイドの手順を完了するには、以下が必要です。

  • Git クライアント。まだインストールしていない場合は、Git クライアントをインストールします。

  • Java 開発キット (JDK) バージョン 11 。Java JDK 11 をインストールし、JDKインストール場所を指すようにJAVA_HOME環境変数を設定します。JDK 11 がない場合は、Amazon Coretto 11 または他のJDK任意の標準を使用できます。

    • が正しくJDKインストールされていることを確認するには、次のコマンドを実行します。Amazon Corretto JDK以外の を使用している場合、出力は異なります。バージョンが 11.x であることを確認します。

      $ java --version openjdk 11.0.23 2024-04-16 LTS OpenJDK Runtime Environment Corretto-11.0.23.9.1 (build 11.0.23+9-LTS) OpenJDK 64-Bit Server VM Corretto-11.0.23.9.1 (build 11.0.23+9-LTS, mixed mode)
  • Apache Maven。まだインストールしていない場合は、Apache Maven をインストールします。インストール方法については、「Apache Maven のインストール」を参照してください。

    • Apache Maven のインストールをテストするには、次のように入力します。

    $ mvn -version
  • IDE ローカル開発用。Eclipse Java Neon IntelliJ IDEA などの開発環境を使用して、アプリケーションを開発およびコンパイルすることをお勧めします。

    • Apache Maven のインストールをテストするには、次のように入力します。

    $ mvn -version

開始するには、AWS アカウントを設定し、管理者ユーザーを作成するに進みます。