本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
指令碼包含從來源擷取資料、轉換資料的程式碼,並將其載入 target。當指令碼啟動任務時, 會 AWS Glue 執行指令碼。
AWS Glue ETL 指令碼可以在 Python 或 Scala 中編碼。Python 指令碼使用的語言是 PySpark Python 方言的延伸,用於擷取、轉換和載入 (ETL) 任務。指令碼包含處理 ETL 轉換的延伸建構。當您針對任務自動產生原始程式碼邏輯時,指令碼也會隨之產生。您可以編輯此指令碼,也可以提供自己的指令碼來處理 ETL 工作。
如需有關在 中定義和編輯指令碼的資訊 AWS Glue,請參閱AWS Glue 程式設計指南。
其他程式庫或檔案
如果指令碼需要其他程式庫或檔案,您可加以指定,如下所示:
- Python library path (Python 程式庫路徑)
-
以逗號分隔的 Amazon Simple Storage Service (Amazon S3) 路徑,連接至您指令碼所需的 Python 程式庫。
注意
只有純 Python 程式庫才可使用。目前尚未支援使用 C 延伸模組的程式庫 (例如 pandas Python 資料分析程式庫)。
- Dependent jars path (相依的 jar 路徑)
-
指令碼所需的 JAR 檔案的逗號分隔 Amazon S3 路徑。
注意
目前只有純 Java 或 Scala (2.11) 程式庫才可使用。
- 參考檔案路徑
-
以逗號分隔的 Amazon S3 路徑,連接至指令碼所需的其他檔案 (例如組態檔案)。