インタラクティブセッションで AWS Glue ジョブを構築する
データエンジニアは AWS Glue のインタラクティブセッションを使用して、以前よりも迅速かつ簡単に AWS Glue のジョブをオーサリングできます。
トピック
AWS Glue インタラクティブセッションの概要
AWS Glue のインタラクティブセッションでは、データ準備および分析アプリケーションの構築、テスト、実行を迅速に行うことができます。インタラクティブセッションは、データ準備のための抽出、変換、ロード (ETL) スクリプトを構築してテストするためのプログラムおよびビジュアルインターフェイスを提供します。インタラクティブセッションでは Apache Spark 分析アプリケーションが実行され、リモートの Spark ランタイム環境にオンデマンドでアクセスできます。AWS Glue はこれらのインタラクティブセッションのサーバーレス Spark を透過的に管理します。
インタラクティブセッションには柔軟性が備わっているため、お好みの環境からアプリケーションを構築し、テストできます。インタラクティブセッションは、AWS Command Line Interface とAPIを介して作成、操作することができます。Jupyter と互換性のあるノートブックを使用して、ノートブックスクリプトを視覚的に作成し、テストできます。インタラクティブセッションは、PyCharm、IntelliJ、VS Code などの IDE との統合を含め、Jupyter が統合するほぼすべてと統合できるオープンソースの Jupyter カーネルを提供します。これにより、ローカル環境でコードをオーサリングし、インタラクティブセッションのバックエンドでシームレスに実行できます。
インタラクティブセッション API を使用すると、Spark インフラストラクチャを管理する必要なく Apache Spark 分析を使用するアプリケーションをプログラムで実行できます。単一のインタラクティブセッション内で 1 つ以上の Spark ステートメントを実行できます。
したがって、インタラクティブセッションは、より速く、安価で、柔軟にデータ準備および分析アプリケーションを構築して実行することができます。インタラクティブセッションの使用方法については、このセクションのドキュメントを参照してください。AWS Glue がサポートするマジック
制約事項
-
ジョブのブックマークは、インタラクティブセッションではサポートされていません。
-
AWS Command Line Interface を使用したノートブックの作成はサポートされていません。
-
AWS Glue Studio ノートブックは Scala をサポートしていません。