AWS Glue Studio の中のノートブックを使用した ETL ジョブの作成
AWS Glue Studio のコンソール中でノートブックの使用を開始するには
-
AWS Identity and Access Management のポリシーを AWS Glue Studio ユーザーにアタッチし、ETL ジョブとノートブックの IAM ロールを作成します。
-
IAM ロールに対するアクセス許可の付与 の説明に従って、ノートブックに追加の IAM セキュリティを設定します。
-
https://console.aws.amazon.com/gluestudio/
で AWS Glue Studio コンソールを開きます。 注記
ブラウザがサードパーティの Cookie をブロックしていないことを確認してください。ブラウザのデフォルトまたはユーザーの設定でサードパーティのCookieをブロックしている場合、ノートブックは起動しません。Cookie の管理の詳細については、以下を参照してください。
-
ナビゲーションメニューの左側の [ジョブ] リンクを選択します。
-
[Jupyter notebook] を選択し、[Create] をクリックして、新しいノートブックセッションを開始します。
-
[Create job in Jupyter notebook] (Jupyter Notebook でジョブを作成する) ページで、ジョブ名を指定して、使用する IAM ロールを選択します。[ジョブの作成]を選択します。
短時間経過後に、ノートブックエディタが表示されます。
-
コードを追加したら、セルを実行してセッションを開始します。セルを実行するには複数の方法があります。
再生ボタンを押します。
-
キーボードショートカットを使用します。
-
MacOS では、Command + Enter キーでセルを実行します。
-
Windows では、Shift + Enter キーでセルを実行します。
-
Jupyter ノートブックインターフェースを使用したコードの記述については、「 The Jupyter Notebook User Documentation
」を参照してください。 -
スクリプトをテストするには、スクリプト全体、または個々のセルを実行します。コマンド出力は、セルの下の領域に表示されます。
-
スクリプトの開発が完了したら、ジョブを保存して実行できます。スクリプトは、[Script] (スクリプト) タブにあります。ノートブックに追加したマジックはすべて取り除かれ、生成された AWS Glue ジョブのスクリプトの一部として保存されません。AWS Glue Studioは、ノートブックの内容から生成されたスクリプトの最後に
job.commit()
を自動的に追加します。ジョブの実行のさらなる詳細については、「ジョブの実行の開始」を参照してください。