本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon DataZone 術語和概念
Amazon DataZone 是一項資料管理服務,可讓您更快速、更輕鬆地編製、探索、共用和管理跨 AWS、內部部署和第三方來源存放的資料。透過 Amazon DataZone,負責監督組織資料資產的管理員和資料管理員可以使用精細控制來管理和管理對資料的存取。這些控制項旨在確保具有適當層級的權限和內容的存取。Amazon DataZone 可讓工程師、資料科學家、產品管理員、分析師和商業使用者更輕鬆地存取整個組織的資料,以便他們探索、使用和協作,以衍生資料驅動的洞察。
當您開始使用 Amazon 時 DataZone,請務必了解其關鍵概念、術語和元件。
主題
Amazon DataZone 元件
Amazon DataZone 包含下列四個主要元件:
-
業務資料目錄 - 您可以使用此元件,透過業務內容為整個組織的資料編製目錄,從而讓組織中的每個人快速尋找和了解資料。
-
發佈和訂閱工作流程 - 您可以使用這些自動化工作流程,以自助方式保護生產者和消費者之間的資料,並確保組織中的每個人都能夠存取正確的資料,以達成正確的目的。
-
專案和環境
-
在 Amazon DataZone 專案中, 是以商業使用案例為基礎的人員、資產 (資料) 和工具群組,用於簡化對 AWS 分析的存取。專案提供專案成員可以協作、交換資料和共用資產的區域。根據預設,專案會設定為只有明確新增至專案的專案才能存取其中的資料和分析工具。Projects 管理根據專案政策產生的資產所有權,供資料取用者存取。
-
在 Amazon DataZone 專案中,環境是零個或更多已設定資源的集合 (例如,Amazon S3 儲存貯體、 AWS Glue 資料庫或 Amazon Athena 工作群組),指定IAM主體集 (例如,具有貢獻者許可的使用者) 可在其中操作。
-
-
資料入口網站 ( AWS 在管理主控台之外) - 這是瀏覽器型 Web 應用程式,可讓不同的使用者可以以自助方式編製目錄、探索、管理、共用和分析資料。資料入口網站透過 使用來自您身分提供者的IAM憑證或現有憑證來驗證使用者 AWS IAM Identity Center。
什麼是 Amazon DataZone 網域?
您可以使用 Amazon DataZone 網域來組織資產、使用者及其專案。透過將其他 AWS 帳戶與 Amazon DataZone 網域建立關聯,您可以將資料來源集合在一起。然後,您可以使用中繼資料表單和詞彙表,將資產從這些資料來源發佈到網域的目錄,以改善中繼資料完整性和品質。您也可以搜尋和瀏覽這些資產,以查看在網域中發佈的資料。此外,您可以加入專案與其他使用者合作、訂閱資產,並使用專案環境來存取分析工具,包括 Amazon Athena 和 Amazon Redshift。Amazon DataZone 網域可讓您靈活地反映組織結構的資料和分析需求,無論是為企業建立單一 Amazon DataZone 網域,還是為不同業務單位建立多個 Amazon DataZone 網域。
什麼是 Amazon DataZone 專案和環境?
Amazon 透過建立以使用案例為基礎的團隊、工具和資料群組, DataZone 讓團隊和分析使用者在專案上協作。
-
在 Amazon 中 DataZone,專案可讓一組使用者在涉及發佈、探索、訂閱和使用 Amazon DataZone 目錄中資料的各種商業使用案例中進行協作。專案成員會耗用 Amazon DataZone 目錄中的資產,並使用一或多個分析工作流程產生新的資產。專案支援資料入口網站中的下列活動:
-
專案擁有者可以新增具有擁有者、貢獻者、取用者、管理者和檢視器許可的成員
-
專案成員可以是SSO使用者、SSO群組和IAM使用者
-
專案成員可以請求訂閱資料目錄中的資產
訂閱核准會提供給專案
建立/刪除專案
建立/刪除專案設定檔 建立/刪除環境設定檔 建立/刪除環境 新增/刪除專案的成員 搜尋和探索 Create/delete metadata forms/glossaries 建立資料來源執行和擷取資料 發佈資料 請求訂閱 核准/拒絕訂閱請求 從 Amazon Athena 和 Amazon Redshift 讀取訂閱的資料 Owner 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 是 是 是 是 是 是 是 是 作者群 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 否 是 是 是 是 是 是 是 消費者 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 否
是
否
否
否
是
否
是
觀眾 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 否
是
否
否
否
否
否
是
管理員 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 否
是
是
是
是
否
是
是
-
-
在 Amazon DataZone 專案中,環境是零個或更多已設定資源的集合 (例如 Amazon S3、 AWS Glue 資料庫或 Amazon Athena 工作群組),具有可在這些資源上操作的一組指定IAM主體。環境是透過使用環境設定檔來建立,這些設定檔是預先設定的資源和藍圖集,可提供可重複使用的範本來建立環境。環境設定檔定義設定,例如部署環境的 AWS 帳戶 或 區域。
什麼是 Amazon DataZone 藍圖?
建立環境的藍圖會定義環境所屬專案的哪些 AWS 工具和服務 (例如, AWS Glue 或 Amazon Redshift) 成員可以在使用 Amazon DataZone 目錄中的資產時使用。
在目前版本的 Amazon 中 DataZone,支援下列預設藍圖:
藍圖名稱 | 描述 | 已建立資源 |
---|---|---|
Data Lake 藍圖 |
讓 Amazon DataZone 專案成員在 環境中啟動 Data Lake 生產者和消費者服務。 作為消費者 ,它可讓 Amazon DataZone 專案成員直接在 Amazon Athena 和其他 Lake Formation 支援的查詢引擎中存取「唯讀」的 Lake Formation 受管資產副本。 作為生產者,它可讓 Amazon DataZone 專案成員使用 Amazon Athena 建立新的 LakeFormation受管資料表,並將它們發佈到 Amazon DataZone 目錄。 |
讓使用者能夠使用 Amazon Athena 建立和查詢 Lake Formation 資料表。Amazon Athena 工作群組、具有「唯讀」 Lake Formation 許可的 AWS Glue 資料庫、「唯讀」IAM許可,以及具有標記的 Amazon S3 存取權。具有「建立」和「授予」 Lake Formation 許可的 AWS Glue 資料庫、「讀取」和「寫入」IAM許可、 AWS Glue ETL(擷取、轉換和載入)。 |
Data Warehouse 藍圖 |
身為消費者 ,此藍圖可讓 Amazon DataZone 專案成員連線到自己的 Amazon Redshift 叢集,以查詢遠端資料存放區,並建立和存放新的資料集。 身為生產者 ,此藍圖可讓 Amazon DataZone 專案成員連線到自己的 Amazon Redshift 叢集,以查詢遠端資料存放區、建立新資料集,以及將資料集發佈至 Amazon DataZone 目錄。 |
存取 Amazon Redshift 查詢編輯器、從 Amazon DataZone 目錄對訂閱資料來源的 'read' 存取、在已設定的 Amazon Redshift 叢集中建立本機資產的能力。存取 Amazon Redshift 查詢編輯器、從 Amazon DataZone 目錄對訂閱資料來源的「讀取」存取權、從已設定的 Amazon Redshift 叢集建立和發佈資產的能力。 |
Amazon Sagemaker 藍圖 |
此藍圖可協助資料生產者和消費者無縫切換至 Amazon SageMaker ,以在機器學習 (ML) 專案上協作,同時強制執行對資料和 ML 資產的存取管理。透過 Amazon DataZone 和 Amazon 之間的新內建整合 SageMaker,資料消費者和生產者可以簡化跨基礎設施設定的 ML 管理、進行業務計畫的協作,以及輕鬆管理資料和 ML 資產。 |
您可以建立可在 Amazon 中搜尋、訂閱和發佈資料和 ML 資產的 Amazon SageMaker 網域 DataZone。也可以依設定訂閱和發佈至 AWS Glue 資料庫和湖形成。 |
什麼是 Amazon DataZone 清查和發佈工作流程?
建立專案庫存資產
若要使用 Amazon DataZone 為您的資料編製目錄,您必須先將資料 (資產) 作為 Amazon 中專案的庫存 DataZone。為專案建立庫存,讓資產僅可供該專案的成員探索。除非明確發佈,否則專案庫存資產無法供搜尋/瀏覽中的所有網域使用者使用。在 Amazon 的目前版本中 DataZone,您可以透過下列方式將資產新增至專案庫存:
-
透過資料入口網站或使用 Amazon 建立和執行資料來源 DataZone APIs。在目前版本的 Amazon 中 DataZone,您可以建立和執行 AWS Glue 和 Amazon Redshift 的資料來源。透過建立和執行 AWS Glue 或 Amazon Redshift 資料來源,您可以在選取的專案庫存中建立資產,並將技術中繼資料從來源資料庫資料表或資料倉儲匯入 Amazon DataZone。
-
使用 APIs,您可以從可用的系統資產類型 (AWS Glue、Amazon Redshift、Amazon S3 物件) 或自訂資產類型建立資產。
-
使用 Amazon 在專案庫存中建立自訂資產類型 DataZone APIs。自訂資產類型可以包括 ML 模型、儀表板、內部部署資料表等。
-
使用 Amazon 從這些自訂資產類型建立資產 DataZone APIs。
-
-
使用 Amazon DataZone 資料入口網站手動建立 S3 物件的資產。
規劃專案庫存資產 - 建立專案庫存後,資料擁有者可以透過新增或更新商業名稱 (資產和結構描述)、描述 (資產和結構描述)、讀我檔案、詞彙表術語 (資產和結構描述) 和中繼資料表單,來使用所需的商業中繼資料來規劃庫存資產。您可以透過資料入口網站或使用 Amazon 來執行此操作 DataZone APIs。每次編輯資產都會建立新的庫存版本。
將專案庫存資產發佈至 Amazon DataZone 目錄
使用 Amazon DataZone 為資料編製目錄的下一個步驟,是讓網域使用者可探索專案的庫存資產。您可以將庫存資產發佈至 Amazon DataZone 目錄來執行此操作。只有最新版本的庫存資產可以發佈至 目錄,且探索目錄中只有最新版本處於作用中狀態。如果庫存資產在發佈至 Amazon DataZone 目錄後更新,您必須再次明確發佈,才能讓最新版本出現在探索目錄中。在目前版本的 Amazon 中 DataZone,您可以透過下列方式將專案庫存資產發佈至 Amazon DataZone 目錄:
-
透過資料入口網站或使用 Amazon 將專案庫存資產手動發佈至 Amazon DataZone 目錄 DataZone APIs。
-
建立或編輯資料來源時,請啟用選用的將您的 AWS Glue 資產發佈至目錄,或將您的 Amazon Redshift 資產發佈至排程或自動資料來源執行期間要使用的目錄設定。啟用此設定時,資料來源執行會將資產新增至專案的庫存,然後將庫存資產發佈至 Amazon DataZone 目錄。請注意,如果您直接發佈,資產可能沒有任何業務中繼資料,並且將可直接讓所有網域使用者探索。您可以透過資料入口網站或使用 Amazon ,在資料來源上使用此設定 DataZone APIs。
什麼是 Amazon DataZone 訂閱和履行工作流程?
將資產發佈至 Amazon DataZone 目錄後,網域使用者可以探索這些資產、請求和存取這些資產,並繼續使用 Amazon DataZone 來管理、共用和分析這些資產。
使用者代表專案訂閱該資產來請求存取資產。建立訂閱請求後,資產擁有者會收到通知,並可檢閱訂閱請求,並決定是否要核准或拒絕。如果訂閱請求獲得資料擁有者的核准,訂閱專案會獲得該資產的存取權。
一旦訂閱請求獲得核准,Amazon 會 DataZone 開始訂閱履行工作流程,透過在 AWS Lake Formation 或 Amazon Redshift 中建立必要的授予,將資產自動新增至專案內的所有適用環境。這可讓訂閱專案成員使用其環境中的其中一個查詢工具 (Amazon Athena 或 Amazon Redshift 查詢編輯器) 來查詢資產。
Amazon 只能針對受管資產 (包括 AWS Glue 資料表和 Amazon Redshift 資料表和檢視) DataZone 觸發此自動化履行邏輯。對於所有其他資產類型 (未受管資產),Amazon DataZone 無法自動觸發履行,而是在 Amazon Eventbridge 中發佈事件,並在事件承載中包含所有必要的詳細資訊,以便您可以在 Amazon 之外建立必要的授予 DataZone。Amazon DataZone 還提供 updateSubscriptionStatus
API,可讓您在 Amazon 外部完成訂閱後更新訂閱狀態, DataZone 以便 Amazon DataZone 可以通知專案成員他們可以開始耗用資產。
Amazon 的使用者角色 DataZone
以下是主要 Amazon DataZone 使用者角色:
-
擁有將 Amazon 設定為其組織的 DataZone 分析平台的網域管理員。
在 Amazon 的背景下 DataZone,網域管理員 DataZone 會在 AWS 帳戶中安裝 Amazon、建立 Amazon DataZone 網域,以及設定與 Amazon DataZone 網域相關聯的 AWS 帳戶關聯和身分提供者。網域管理員也會使用其他 AWS 服務主控台,例如 AWS Organization and Service Catalog 來設定 Amazon DataZone。
-
作為 Amazon DataZone (資產發行者和訂閱者) 分析和機器學習任務主要使用者的資料使用者。
資料使用者包括資料分析工作者、資料科學家,以及生產和使用資料資產的系統使用者。在 Amazon 的背景下 DataZone,資料使用者會建立並加入專案和環境、使用預先設定的分析或機器學習工具來訂閱和使用資料資產,並將輸出資料資產發佈回 Amazon DataZone 網域目錄,以便與其他人共用。
-
建立自訂基礎設施範本,並將 Amazon DataZone 與內部目錄或生產系統整合的系統開發人員。
在 Amazon 的背景下 DataZone,系統開發人員會建置環境藍圖 (基礎設施範本) 或 Infrastructure-As-Code CI/CD 管道做為環境提供者、跨環境提升資料資產的資料管道、目錄同步和訂閱授予履行轉接器,以與內部目錄整合,或視需要整合 Amazon DataZone APIs與內部使用者介面或生產系統。
-
擁有組織安全、隱私權和其他合規政策的定義和風險,並確保 DataZone 在其組織中使用 Amazon 的資料治理主管遵循這些定義。
Amazon DataZone 術語
- 網域
-
Amazon DataZone 網域是組織實體,用於將您的資產、使用者及其專案連接在一起。透過 Amazon DataZone 網域,您可以靈活地反映組織結構的資料和分析需求,無論是為企業建立單一 Amazon DataZone 網域還是為多個資料區域建立網域,還是為不同的業務單位或團隊建立網域。
- 網域單位
-
網域單位可讓您輕鬆組織特定業務單位和團隊下的資產和其他網域實體。若要在組織業務單位內和跨業務單位設定安全有效的資料共用,您可以在 Amazon 內建立網域單位 DataZone ,並讓每個業務單位內選取的使用者登入並共用其資產至目錄。網域單位也可以用來讓資源擁有者,例如 AWS 帳戶擁有者,在其資源上設定 Amazon DataZone 授權許可。網域單位提供從帳戶擁有者到網域單位擁有者的委派授權,他們可以代表帳戶擁有者設定環境設定檔 (使用藍圖組態建立) 的授權許可。如需詳細資訊,請參閱Amazon 中的網域單位和授權政策 DataZone。
- 授權政策
-
Amazon DataZone 授權政策是 Amazon 內的一組控制項, DataZone 適用於專案、藍圖、環境、詞彙表和中繼資料表單等實體。這些政策會定義誰可以在 Amazon DataZone 入口網站中建立這些實體並管理其生命週期。
在 Amazon DataZone 網域單位中,您可以將下列授權政策指派給您的使用者和群組,以授予他們特定許可:
-
網域單位建立政策
-
專案建立政策
-
專案成員政策
-
網域單位擁有權假設政策
-
專案所有權假設政策
如需詳細資訊,請參閱將授權政策指派給 Amazon DataZone 網域單位內的使用者和群組。
在 Amazon DataZone 網域單位中,您可以將下列授權政策指派給您的專案,以授予其特定許可:
-
詞彙表建立政策
-
中繼資料表單建立政策
-
自訂資產類型建立政策
如需詳細資訊,請參閱將授權政策指派給 Amazon DataZone 網域單位內的專案。
在特定藍圖組態中,您可以將下列授權政策指派給專案和網域單位擁有者:
-
使用此藍圖建立環境設定檔 - 此政策可指派給 Amazon DataZone 專案,並授權他們使用此藍圖建立環境設定檔。
-
授予許可以使用此藍圖建立環境設定檔 - 此政策可指派給網域單位擁有者,並授權其授予許可給專案,以使用此藍圖建立環境設定檔。
如需詳細資訊,請參閱在 Amazon DataZone 藍圖組態中指派授權政策。
-
- 關聯帳戶
-
將 AWS 帳戶與 Amazon DataZone 網域建立關聯可讓您將來自這些 AWS 帳戶的資料發佈至 Amazon DataZone 目錄,並建立 Amazon DataZone 專案,以便在多個 AWS 帳戶中使用您的資料。帳戶關聯請求只能在擁有 Amazon DataZone 網域的 AWS 帳戶中啟動。只有受邀帳戶的管理使用者才能接受 AWS 帳戶關聯請求。一旦 AWS 帳戶與 Amazon DataZone 網域建立關聯,您就可以在此帳戶中註冊資料來源,例如 AWS Glue 目錄和 Amazon Redshift 到此網域。建立關聯也可讓 AWS 帳戶建立 Amazon DataZone 專案和環境。
AWS 帳戶 可與一或多個 Amazon DataZone 網域相關聯。
- 資料來源
-
在 Amazon 中 DataZone,您可以使用資料來源,將資產 (資料) 的技術中繼資料從來源資料庫或資料倉儲匯入 Amazon DataZone。在目前版本的 Amazon 中 DataZone,您可以建立和執行 AWS Glue 和 Amazon Redshift 的資料來源。透過建立資料來源,您可以在 Amazon DataZone 與來源 (AWS Glue Data Catalog 或 Amazon Redshift Warehouse) 之間建立連線,以便讀取技術中繼資料,包括資料表名稱、資料欄名稱和資料類型。透過建立資料來源,您也會開始初始資料來源執行,以建立新的資產或更新 Amazon 中的現有資產 DataZone。在建立資料來源時或成功建立資料來源之後,您也可以選擇指定資料來源執行的排程。
- 資料來源執行
-
在 Amazon 中 DataZone,資料來源執行是 Amazon DataZone 執行的任務,目的是在專案庫存中建立資產,也可以選擇性地將專案庫存資產發佈至 Amazon DataZone 目錄。資料來源執行可以自動化 (最初建立資料來源時啟動) 或排程或手動。資料選擇條件可讓您微調要擷取至專案庫存或 Amazon DataZone 目錄的現有和未來資料集,以及這些庫存或目錄資產的中繼資料更新頻率。
- 訂閱目標
-
在 Amazon 中 DataZone,訂閱目標可讓您存取您在專案中訂閱的資料。訂閱目標指定 Amazon DataZone 可用來建立與來源資料連線,以及建立必要授予的位置 (例如資料庫或結構描述) 和必要的許可 (例如IAM角色),以便 Amazon DataZone 專案的成員可以開始查詢其訂閱的資料。
- 訂閱請求
-
在 Amazon 中 DataZone,訂閱請求是 Amazon DataZone 專案必須遵循的程序,才能授予特定資產的存取權。訂閱請求可以核准、拒絕、撤銷或授予。
- 資產
-
在 Amazon 中 DataZone,資產是呈現單一實體資料物件 (例如資料表、儀表板、檔案) 或虛擬資料物件 (例如檢視) 的實體。
- 資產類型設定
-
資產類型定義資產在 Amazon DataZone 目錄中的表示方式。資產類型定義特定類型資產的結構描述。建立資產時,會根據其資產類型定義的結構描述進行驗證 (預設為最新版本)。發生資產更新時,Amazon DataZone 會建立新的資產版本,並讓 Amazon DataZone 使用者在所有資產版本上操作。
- 業務詞彙表
-
在 Amazon 中 DataZone,商業詞彙表是可能與資產相關聯的商業術語集合。業務詞彙表有助於確保在整個組織的各種資料分析任務中使用相同的術語和定義。
業務詞彙表中的術語可以新增至資產和資料欄,以在搜尋期間分類或增強這些屬性的識別。可以選取術語表作為與資產相關聯的中繼資料形式之欄位的值類型。選取特定詞彙作為資產中繼資料表單欄位的值時,使用者可以搜尋業務詞彙表詞彙並尋找相關聯的資產。
- 中繼資料表單類型
-
中繼資料表單類型是範本,定義當資產建立為庫存或在 Amazon DataZone 網域中發佈時收集和儲存的中繼資料。中繼資料表單類型可以與資料資產建立關聯。中繼資料表單類型可協助網域管理員定義該網域所需的中繼資料表單,例如合規資訊、法規資訊或分類。它可讓網域管理員自訂其資產的其他中繼資料。Amazon DataZone 具有系統中繼資料表單類型,例如 asset-common-details-form-type、 column-business-metadata-form-type glue-table-form-type、 glue-view-form-type、 redshift-table-form-type、 redshift-view-form-type、s3- object-collection-form-type subscription-terms-form-type和 suggestion-form-type。
- 中繼資料表單
-
在 Amazon 中 DataZone,中繼資料表單會定義當資產建立為庫存或在 Amazon DataZone 網域中發佈時收集和儲存的中繼資料。中繼資料表單定義由網域管理員在目錄網域中建立。中繼資料表單定義由一或多個欄位定義組成,支援布林值、日期、小數、整數、字串和業務詞彙表欄位值資料類型。
網域管理員透過將中繼資料表單新增至其網域,將中繼資料表單套用至其網域中的資產。然後,資產發行者會在中繼資料表單中提供任何選用和必要欄位值。
- 專案
-
在 Amazon 中 DataZone,專案可讓一組使用者協作處理各種業務使用案例,這些案例涉及在專案庫存中建立資產,進而讓所有專案成員都能探索,然後在 Amazon DataZone 目錄中發佈、探索、訂閱和使用資產。專案成員會使用 Amazon DataZone 目錄中的資產,並使用一或多個分析工作流程產生新的資產。專案成員可以是擁有者、參與者、消費者、管理員和檢視器。
建立/刪除專案
建立/刪除專案設定檔 建立/刪除環境設定檔 建立/刪除環境 新增/刪除專案的成員 搜尋和探索 Create/delete metadata forms/glossaries 建立資料來源執行和擷取資料 發佈資料 請求訂閱 核准/拒絕訂閱請求 從 Amazon Athena 和 Amazon Redshift 讀取訂閱的資料 Owner 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 是 是 是 是 是 是 是 是 作者群 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 否 是 是 是 是 是 是 是 消費者 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 否
是
否
否
否
是
否
是
觀眾 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 否
是
否
否
否
否
否
是
管理員 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 由網域單位成員管理 否
是
是
是
是
否
是
是
專案擁有者可以將其他使用者新增或移除為擁有者或貢獻者,而且他們可以修改或刪除專案。其他對貢獻者的限制可以透過 政策來定義。當使用者建立專案時,他們就會成為該專案的第一個擁有者。
- 環境
-
環境是已設定資源 (例如 Amazon S3 儲存貯體、 AWS Glue 資料庫或 Amazon Athena 工作群組) 的集合,其中指定一組IAM主體 (具有指派的貢獻者許可) 可在這些資源上操作。每個環境也可能有使用者主體,他們有權存取 資源,並透過訂閱和履行存取資料。環境旨在將可操作的連結存放到 AWS 服務以及外部IDEs和主控台。專案的成員可以透過環境中設定的深層連結存取 Amazon Athena 主控台等服務。SSO 專案的使用者和IAM使用者可以進一步縮小範圍,以使用/存取特定環境。
- 環境設定檔
-
在 Amazon 中 DataZone,環境設定檔是可用來建立環境的範本。使用藍圖建立環境設定檔。
透過環境設定檔,網域管理員可以使用預先設定的參數包裝藍圖,然後資料工作者可以透過選取現有環境設定檔並指定新環境的名稱,快速建立新的環境數目。這可讓資料工作者有效地管理其專案和環境,同時確保他們滿足網域管理員強制執行的資料治理政策。
- 藍圖
-
建立環境的藍圖會定義環境所屬專案的哪些 AWS 工具和服務 (例如, AWS Glue 或 Amazon Redshift) 成員可以使用,因為這些成員使用 Amazon DataZone 目錄中的資產。
在 Amazon 的目前版本 DataZone 中,支援下列預設藍圖:
-
資料湖藍圖
-
資料倉儲藍圖
-
Amazon Sagemaker 藍圖
-
- 使用者設定檔
-
使用者設定檔代表 Amazon DataZone 使用者。Amazon SSO DataZone 支援IAM角色和身分,以便基於不同目的與 Amazon DataZone 管理主控台和資料入口網站互動。網域管理員使用 IAM 角色在 Amazon DataZone 管理主控台中執行初始管理網域相關工作,包括建立新的 Amazon DataZone 網域、設定中繼資料表單類型和實作政策。資料工作者會透過 Identity Center 使用其SSO公司身分登入 Amazon DataZone Data Portal,並存取他們擁有成員資格的專案。
- 群組設定檔
-
群組設定檔代表 Amazon DataZone 使用者群組。群組可以手動建立,或對應至企業客戶的 Active Directory 群組。在 Amazon 中 DataZone,群組有兩個目的。首先,群組可以在組織圖表中映射到使用者團隊,因此當有新員工加入或離開團隊時,可減少 Amazon DataZone 專案擁有者的管理工作。其次,企業管理員使用 Active Directory 群組來管理和更新使用者狀態,因此 Amazon DataZone 網域管理員可以使用這些群組成員資格來實作 Amazon DataZone 網域政策。
- 網域管理員
-
在 Amazon 中 DataZone,建立 Amazon DataZone 網域的IAM主體是該網域的預設網域管理員。Amazon 中的網域管理員會 DataZone 執行網域的金鑰功能,包括建立網域、指派其他網域管理員、新增資料來源和訂閱目標、建立專案和環境,以及指派專案擁有者。
- 發行者
-
在 Amazon 中 DataZone,發佈者會將資產發佈至 Amazon DataZone 目錄,並可以編輯其發佈的資產中繼資料。如果授予此授權,發佈者可以核准或拒絕其在 Amazon DataZone 目錄中發佈之資產的訂閱請求。
- Subscriber
-
在 Amazon 中 DataZone,訂閱者是想要尋找、存取和使用 Amazon DataZone 目錄中資產的 Amazon DataZone 專案。
- AWS 帳戶 owner
-
在 Amazon 中 DataZone, AWS 帳戶 擁有者在其 中建立角色、政策和許可 AWS 帳戶 ,讓這些角色、政策和許可能夠與 Amazon DataZone 網域 AWS 帳戶 相關聯。