在 主控台中使用 Amazon SageMaker Feature Store - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 主控台中使用 Amazon SageMaker Feature Store

重要

允許 Amazon SageMaker Studio 或 Amazon SageMaker Studio Classic 建立 Amazon SageMaker 資源的自訂 IAM 政策也必須授予許可,才能將標籤新增至這些資源。需要將標籤新增至資源的許可,因為 Studio 和 Studio Classic 會自動標記他們建立的任何資源。如果 IAM 政策允許 Studio 和 Studio Classic 建立資源,但不允許標記,則嘗試建立資源時可能會發生「AccessDenied」錯誤。如需詳細資訊,請參閱提供標記 SageMaker AI 資源的許可

AWS Amazon SageMaker AI 的 受管政策 提供建立 SageMaker 資源的許可,已包含建立這些資源時新增標籤的許可。

您可以在 主控台上使用 Amazon SageMaker Feature Store 來建立、檢視、更新和監控功能群組。本指南中的監控包括檢視管道執行和特徵群組的譜系。本指南提供如何從 主控台實現這些任務的說明。

如需使用 Amazon SageMaker APIs 和 的功能存放區範例和資源 AWS SDK for Python (Boto3),請參閱 Amazon SageMaker Feature Store 資源

從主控台建立功能群組

建立功能群組過程有四個步驟:

  1. 輸入功能群組資訊。

  2. 輸入功能定義。

  3. 輸入所需的功能。

  4. 輸入功能群組標籤。

考慮下列哪些選項符合您的使用案例:

  • 建立線上儲存、離線儲存或兩者。如需線上和離線存放區差異的詳細資訊,請參閱功能儲存概念

  • 使用預設 AWS Key Management Service 金鑰或您自己的 KMS 金鑰。預設金鑰為AWS KMS 金鑰 (SSE-KMS)。您可以在離線存放區 Amazon S3 儲存貯體上設定 Amazon S3 儲存貯體金鑰的使用,以降低 AWS KMS 請求成本。必須先啟用 Amazon S3 儲存貯體金鑰,才能將儲存貯體用於功能群組。如需使用 Amazon S3 儲存貯體金鑰降低成本的詳細資訊,請參閱使用 Amazon S3 儲存貯體金鑰降低 SSE-KMS 的成本

    您可以在線上和離線儲存中使用相同的金鑰,也可以為每個儲存使用唯一的金鑰。如需 的詳細資訊 AWS KMS,請參閱 AWS Key Management Service

  • 如果您建立離線儲存:

    • 決定是要建立 Amazon S3 儲存貯體還是使用現有儲存貯體。使用現有的儲存貯體時,您必須知道 Amazon S3 儲存貯體 URL 或 Amazon S3 儲存貯體名稱和資料集目錄名稱,如適用。

    • 選擇要用來指定 IAM 角色的 Amazon Resource Name (ARN)。如需如何尋找角色和連接政策的詳細資訊,請參閱 將政策新增至您的 IAM 角色

    • 決定是否使用 AWS Glue (預設) 或 Apache Iceberg 資料表格式。在大多數使用案例中,您會使用 Apache Iceberg 資料表格式。如需資料表格式的詳細資訊,請參閱 搭配適用 SDK for Python (Boto3) 使用功能存放區

您可以使用 主控台來檢視特徵群組的譜系。在 主控台上使用 Feature Store 的指示,取決於您是否已啟用 Amazon SageMaker StudioAmazon SageMaker Studio Classic做為預設體驗。

  1. 依照 中的指示開啟 Studio 主控台啟動 Amazon SageMaker Studio

  2. 從左側導覽窗格中選擇資料以展開下拉式清單。

  3. 從下拉式清單中,選擇特徵商店

  4. 選擇建立特徵群組

  5. 特徵群組詳細資訊之下,輸入特徵群組名稱。

  6. (選用) 輸入特徵群組說明。

  7. 特徵群組儲存組態下,從下拉式清單中選擇儲存組態。如需儲存組態的相關資訊,請參閱 特徵商店儲存組態

  8. 如果您已選擇啟用線上儲存:

    1. 如果您啟用線上儲存,您可以從下拉式清單中選擇儲存類型。如需線上儲存體儲存類型的相關資訊,請參閱線上儲存

    2. (選用) 透過切換切換切換到開啟並指定存留時間持續時間值和單位,將時間套用至存留 (TTL)建立特徵群組後,這將加入至功能群組的所有記錄的預設 TTL 持續時間。如需 TTL 的詳細資訊,請參閱 存留時間 (TTL) 記錄持續時間

  9. 如果您已選擇啟用離線儲存:

    1. Amazon S3 儲存貯體名稱下,手動輸入新的儲存貯體名稱,或輸入現有的儲存貯體 URL。

    2. 資料表格式下拉式清單中,選擇資料表格式。在大多數使用案例中,您應該使用 Apache Iceberg 資料表格式。如需資料表格式的詳細資訊,請參閱 搭配適用 SDK for Python (Boto3) 使用功能存放區

    3. IAM 角色 ARN 下,選擇要附加到此特徵群組的 IAM 角色 ARN。如需如何尋找角色和連接政策的詳細資訊,請參閱將政策新增至您的 IAM 角色

    4. 如果您已選擇啟用離線儲存資料表格式和 AWS Glue (預設) 資料表格式,您可以在資料目錄下選擇下列兩個選項之一:

      • 為您的 使用預設值 AWS Glue Data Catalog

      • 提供現有的 Data Catalog 名稱、資料表名稱和資料庫名稱,以擴展現有的 AWS Glue Data Catalog。

  10. 線上儲存加密金鑰離線儲存加密金鑰下拉式清單下,選擇下列其中一個選項:

    • 使用 AWS Managed AWS KMS key (預設)

    • 輸入 AWS KMS key ARN,然後在離線存放區加密 AWS KMS 金鑰 ARN 下輸入您的金鑰 ARN。 如需詳細資訊 AWS KMS,請參閱AWS 金鑰管理服務

  11. 如果適用,您可以選擇您的輸送量模式,這會影響您的收費方式。在輸送量模式下,從下拉式清單中選擇模式,並在可用時輸入讀取和寫入容量。如需有關輸送量模式的資訊,例如何時可以套用模式和容量單位,請參閱輸送量模式

  12. 指定所有必要資訊後,繼續按鈕會顯示為可用。選擇 繼續

  13. 指定功能定義下,您有兩個選項可為功能提供結構定義:JSON 編輯器或資料表編輯器。

    • JSON 編輯器:在 JSON 索引標籤中,以 JSON 格式輸入或複製並貼上您的功能定義。

    • 資料表編輯器:在資料表索引標籤中,輸入功能功能名稱,並為功能群組中的每個功能選擇對應的資料類型。選擇+ 新增功能定義以包含更多功能。請注意,您無法從功能群組中移除功能定義。不過,您可以在功能群組建立後新增和更新功能定義。

    功能群組中必須至少有兩個代表記錄識別符和事件時間的功能:

    • 記錄功能類型可以是字串、分數或積分。

    • 事件時間特徵類型必須是字串或分數。不過,如果您選擇Iceberg資料表格式,事件時間必須是字串。

  14. 包含所有功能後,選擇繼續

  15. 選取必要功能下,您必須指定記錄識別符和事件時間功能。方法是分別在記錄識別符功能名稱和事件時間功能名稱下拉式清單下選擇功能名稱

  16. 選擇記錄識別符和事件時間功能後,選擇繼續

  17. (選用) 若要為功能群組新增標籤,請選擇新增標籤。然後分別在金鑰和值下輸入標籤金鑰和對應的

  18. 選擇 繼續

  19. 檢閱特徵群組下,檢閱功能群組資訊。若要編輯任何步驟,請選擇與該步驟對應的編輯按鈕。這將帶您進入相應的編輯步驟。若要返回步驟 5,請選擇繼續,直到返回步驟 5。

  20. 完成功能群組的設定後,請選擇建立功能群組

    如果在設定期間發生問題,頁面底部會顯示快顯提醒訊息,其中包含解決問題的秘訣。您可以透過選擇編輯具有衝突的步驟,返回先前的步驟來修正問題。

    成功建立功能群組後,頁面底部會出現綠色快顯訊息。新的功能群組也會出現在您的功能群組目錄中。

從主控台檢視功能群組詳細資訊

在特徵存放區中成功建立特徵群組之後,您可以檢視特徵群組的詳細資訊。

您可以使用 主控台或 Amazon SageMaker Feature Store API 來檢視您的功能群組詳細資訊。透過主控台使用 Feature Store 的指示取決於您是否已啟用 Amazon SageMaker StudioAmazon SageMaker Studio Classic作為預設體驗。

  1. 依照 中的指示開啟 Studio 主控台啟動 Amazon SageMaker Studio

  2. 在左側導覽窗格中選擇資料,以展開下拉式清單。

  3. 從下拉式清單中,選擇 Feature Store

  4. (選用) 若要檢視您的功能群組,請選擇我的帳戶。若要檢視共用功能群組,請選擇跨帳戶

  5. 特徵群組目錄標籤下,從清單中選擇您的特徵群組名稱。這會開啟功能群組頁面。

  6. 功能選項卡上,您可以找到所有功能的清單。使用篩選條件來精簡您的清單。選擇一個功能來檢視其詳細資訊。

  7. 詳細資訊索引標籤和資訊子索引標籤下,您可以檢閱功能群組資訊。這包括最新執行離線儲存設定線上儲存設定等。

  8. 詳細資訊索引標籤和標籤子索引標籤下,您可以檢閱功能群組標籤。選擇新增標籤以新增標籤,或選擇移除以移除標籤。

  9. 管道執行索引標籤下,您可以檢視功能群組的相關管道或管道執行。

  10. 系列索引標籤下,您可以檢視功能群組的系列。

從主控台更新功能群組

您可以在功能存放區中成功建立功能群組後更新功能群組。

您可以使用 主控台或 Amazon SageMaker Feature Store API 來更新功能群組。透過主控台使用 Feature Store 的指示取決於您是否已啟用 Amazon SageMaker StudioAmazon SageMaker Studio Classic作為預設體驗。

  1. 依照 中的指示開啟 Studio 主控台啟動 Amazon SageMaker Studio

  2. 在左側導覽窗格中選擇資料,以展開下拉式清單。

  3. 從下拉式清單中,選擇 Feature Store

  4. (選用) 若要檢視您的功能群組,請選擇我的帳戶。若要檢視共用功能群組,請選擇跨帳戶

  5. 特徵群組目錄標籤下,搜尋並從清單中選擇您的特徵群組名稱。這會開啟功能群組頁面。

  6. 選擇更新特徵群組

  7. (選用) 如果適用,您可以變更輸送量模式,這會影響您的收費方式。在輸送量模式下,從下拉式清單中選擇模式,並在可用時輸入讀取和寫入容量。如需有關輸送量模式的資訊,例如何時可以套用模式和容量單位,請參閱輸送量模式

  8. (選擇性) 如果您的特徵群組使用線上儲存,您可以更新預設的存留時間 (TTL)。如果特徵群組尚未啟用 TTL,請將 存留時間 (TTL) 下的切換按鈕切換為 開啟。在存留時間持續時間下,您可以指定 TTL 值和單位。更新功能群組更新後,這將加入至特徵群組的所有記錄的預設 TTL 持續時間。

  9. (選擇性) 您可以將功能定義新增至功能群組,但請注意,您無法從功能群組中移除功能定義。若要新增功能定義,請選擇 + 新增功能定義,然後在名稱欄下指定新的功能定義名稱,然後在功能類型欄下選取功能類型

  10. 選擇 Save changes (儲存變更)。

  11. 若要確認您的變更,請選擇確認

從主控台檢視管道執行

您可以在管道執行下檢視特徵或特徵群組的最新管道執行資訊。您也可以取得管道、執行、程式碼和其他有用執行資訊的連結。

您可以使用 主控台來檢視管道執行。透過主控台使用 Feature Store 的指示取決於您是否已啟用 Amazon SageMaker StudioAmazon SageMaker Studio Classic作為預設體驗。

  1. 依照 中的指示開啟 Studio 主控台啟動 Amazon SageMaker Studio

  2. 在左側導覽窗格中選擇資料,以展開下拉式清單。

  3. 從下拉式清單中,選擇 Feature Store

  4. (選用) 若要檢視您的功能群組,請選擇我的帳戶。若要檢視共用功能群組,請選擇跨帳戶

  5. 選擇功能群組或功能以檢視其管道執行。

  6. 選擇管道執行標籤。

  7. 選取一個管道下拉式清單搜尋管道。

  8. 您可以檢視管道、執行和程式碼詳細資訊的連結。您也可以檢視執行擁有者、狀態、日期和持續時間。

從主控台檢視譜系

您可以檢視功能群組的歷程。歷程包括功能處理工作流程的執行程式碼、使用的資料來源以及它們如何擷取至功能群組或功能的資訊。

您可以使用 主控台來檢視特徵群組的系列。透過主控台使用 Feature Store 的指示取決於您是否已啟用 Amazon SageMaker StudioAmazon SageMaker Studio Classic作為預設體驗。

  1. 依照 中的指示開啟 Studio 主控台啟動 Amazon SageMaker Studio

  2. 從左側導覽窗格中選擇資料以展開下拉式清單。

  3. 從下拉式清單中,選擇 Feature Store

  4. (選用) 若要檢視您的功能群組,請選擇我的帳戶。若要檢視共用功能群組,請選擇跨帳戶

  5. 選擇功能群組或功能以檢視其系列詳細資訊。

  6. 選擇歷程頁標。

  7. 選擇功能群組或配管節點以展開節點。其中包含有關功能群組或管道的詳細資訊。

  8. 您可以使用畫面左下方的按鈕來放大、縮小或置中歷程圖表。

  9. 您可以在選擇和拖曳畫面時,在譜系映射中移動。若要使用節點做為焦點來移動譜系圖,您可以按 TabShift+Tab 在節點之間切換。

  10. 如果適用,您可以瀏覽上游 (左、舊) 或下游 (右、最新) 的譜系。透過選擇節點,然後選擇查詢上游譜系查詢下游譜系來執行此操作。