ノートブックの使用の概要
AWS Glue Studio は、Jupyter Notebooks に基づいて、ノートブックインターフェイス中でジョブをインタラクティブにオーサリングできるようにします。AWS Glue Studio 中のノートブックを通じて、完全なジョブを実行せずにジョブスクリプトを編集して出力を表示できます。また、完全なジョブを実行せずにデータ統合コードを編集して出力を表示できます。また、マークダウンを追加してノートブックを [.ipynb] ファイルとジョブスクリプトとして保存できます。ソフトウェアをローカルにインストールしたり、サーバーを管理したりすることなく、ノートブックを起動できます。コードに満足したら、ボタンをクリックするだけで、AWS Glue Studio はノートブックを Glue ジョブに変換できます。
ノートブックを使用する利点のいくつかを以下に示します:
-
プロビジョニングまたは管理するクラスターがない
-
支払うべきアイドルクラスターがない
-
事前設定は不要
-
Jupyter Notebook のインストールは不要
-
AWS Glue の ETL と同じランタイム/プラットフォーム
AWS Glue Studio を通してスルーノートブックを起動すると、ほんの数秒後にデータを調査し、ジョブスクリプトの開発を開始できるように、すべての設定手順が実行されます。AWS Glue Studio は、AWS Glue Jupyter カーネルによって Jupyter Notebook を設定します。このノートブックを使用するために VPC、ネットワーク接続、または開発エンドポイントを構成する必要はありません。
ノートブックインターフェイスを使用してジョブを作成するには、次の手順を実行します:
-
必要な IAM 許可を設定します。
-
ノートブックセッションを開始してジョブを作成します
-
ノートブックのセルにコードを記述します。
-
コードを実行してテストし、出力を表示します。
-
ジョブを保存します。
ノートブックを保存すると、ノートブックは満杯の AWS Glue のジョブ です。スケジュールジョブの実行、の設定、ジョブパラメータの設定、およびノートブックのすぐ横にあるジョブ実行履歴の表示など、ジョブのすべての側面を管理できます。