本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
藍圖範例
AWS Glue 藍圖 Github 儲存庫
範例專案的標題如下:
-
壓縮:此藍圖會建立任務,根據所需的檔案大小,將輸入檔案壓縮成較大的區塊。
-
轉換:此藍圖會將各種標準檔案格式的輸入檔案轉換為 Apache Prquet 格式,並針對分析工作負載進行最佳化。
-
網路爬取 Amazon S3 位置:此藍圖會網路爬取多個 Amazon S3 位置,以將中繼資料表新增至 Data Catalog 。
-
與 Data Catalog 的自訂連線:此藍圖使用 AWS Glue 自訂連接器存取資料存放區、讀取記錄,並根據記錄結構描述在 AWS Glue Data Catalog 中填入資料表定義。
-
編碼:此藍圖會將非 UTF 檔案轉換為 UTF 編碼檔案。
-
分割:此藍圖會建立分割任務,根據特定分割索引鍵將輸出檔案放置到分割區。
-
將 Amazon S3 資料匯入到 DynamoDB 資料表:此藍圖會將資料從 Amazon S3 匯入到 DynamoDB 資料表。
-
要管控的標準資料表:此藍圖會將 AWS Glue Data Catalog 資料表匯入 Lake Formation 資料表。