AWS Glue DataBrew - AWS 規範指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AWS Glue DataBrew

AWS Glue DataBrew 是一種全受管視覺化資料準備服務,用於清理、標準化和轉換資料。它與 AWS Glue ETL 不同,因為您沒有編寫程式碼來使用它。DataBrew 提供超過 250 個內建轉換,並具有視覺化point-and-click式界面,可用於建立和管理資料轉換任務。

DataBrew 可在單獨的主控台檢視中使用 AWS Glue。它與數個 AWS 服務原生整合,並支援許多不同的檔案格式。如需詳細資訊,請參閱產品和服務整合

DataBrew 以下列六個核心概念為基礎:

  • 專案 – DataBrew 中的整個資料準備工作區

  • 資料集 – 結構化或半結構化資料的集合

  • 配方 – 一組資料轉換步驟;每個步驟可以包含許多動作

  • 任務 – 執行配方或資料描述檔任務的一組指示 

  • 資料譜系 – 追蹤視覺化界面中的資料,以識別其原始伺服器

  • 資料描述檔 – 資料形狀的摘要檢視

AWS Glue DataBrew 已與 整合 AWS Glue Studio,因此您可以在 AWS Glue ETL 任務和工作流程中協調 DataBrew 配方。DataBrew 配方也可以利用 AWS Glue 任務書籤、自動重試和自動擴展等功能。若要開始使用 DataBrew,請使用AWS Glue DataBrew 範例專案教學課程。