使用 AWS Glue Studio 中的筆記本建立 ETL 任務 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 AWS Glue Studio 中的筆記本建立 ETL 任務

開始在 AWS Glue Studio 主控台中使用筆記本
  1. 連接 AWS Identity and Access Management 政策至 AWS Glue Studio 使用者,並為您的 ETL 任務和筆記本建立 IAM 角色。

  2. 授與IAM角色的權限 中所述,為筆記本設定其他 IAM 安全性。

  3. 開啟位於 https://console.aws.amazon.com/gluestudio/ 的 AWS Glue Studio 主控台。

    注意

    檢查您的瀏覽器是否未封鎖第三方 Cookie。任何因預設或使用者啟用設定而封鎖第三方 Cookie 的瀏覽器,將使筆記本無法啟動。如需管理 Cookie 的詳細資訊,請參閱:

  4. 選擇左側導覽選單中的 Jobs (任務) 連結。

  5. 選擇 Jupyter 筆記本,然後選擇 Create (建立) 開始新的筆記本工作階段。

  6. Create job in Jupyter notebook (在 Jupyter 筆記本中建立任務) 頁面上,提供任務名稱並選擇要使用的 IAM 角色。選擇 Create job (建立任務)。

    短時間後,會出現筆記本編輯器。

  7. 新增程式碼後,必須執行儲存格以啟動工作階段。可透過多種方式執行儲存格:

    • 按下執行按鈕。

    • 使用鍵盤快速鍵:

      • 在 MacOS 上,使用 Command + Enter 來執行儲存格。

      • 在 Windows 上,使用 Shift + Enter 來執行儲存格。

    如需使用 Jupyter 筆記本介面撰寫程式碼的相關資訊,請參閱 Jupyter 筆記本使用者文件

  8. 若要測試指令碼,請執行整個指令碼或個別儲存格。任何命令輸出將顯示在儲存格下方的區域中。

  9. 在您完成開發筆記本之後,您可以儲存任務,然後執行任務。您可以在 Script (指令碼) 索引標籤中找到指令碼。您新增至筆記本的任何魔術命令都會遭到去除,且不會儲存為已產生之 AWS Glue 任務指令碼的一部分。AWS Glue Studio 會將 job.commit() 自動新增至已從筆記本內容產生之指令碼的末尾。

    如需有關執行任務的詳細資訊,請參閱 開始任務執行