在主控台中使用 Amazon SageMaker Feature Store - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在主控台中使用 Amazon SageMaker Feature Store

重要

允許 Amazon SageMaker Studio 或 Amazon SageMaker Studio Classic 建立 Amazon SageMaker 資源的自訂IAM政策也必須授予許可,才能將標籤新增至這些資源。需要將標籤新增至資源的許可,因為 Studio 和 Studio Classic 會自動標記他們建立的任何資源。如果IAM政策允許 Studio 和 Studio Classic 建立資源,但不允許標記,則嘗試建立資源時可能會發生「AccessDenied」錯誤。如需詳細資訊,請參閱提供標記 SageMaker資源的許可

AWS Amazon 的受管政策 SageMaker 提供建立 SageMaker 資源的許可,已包含在建立這些資源時新增標籤的許可。

您可以在主控台上使用 Amazon SageMaker Feature Store 來建立、檢視、更新和監控您的功能群組。本指南中的監控包括檢視功能群組的管道執行和譜系。本指南提供如何從主控台實現這些任務的說明。

如需使用 Amazon SageMaker APIs 和 的 Feature Store 範例和資源 AWS SDK for Python (Boto3),請參閱 Amazon SageMaker Feature Store 資源

從主控台建立功能群組

建立功能群組過程有四個步驟:

  1. 輸入功能群組資訊。

  2. 輸入功能定義。

  3. 輸入所需的功能。

  4. 輸入功能群組標籤。

考慮下列哪些選項適合您使用案例:

  • 建立線上儲存、離線儲存或兩者。如需線上和離線存放區差異的詳細資訊,請參閱 功能儲存概念

  • 使用預設 AWS Key Management Service 金鑰或您自己的KMS金鑰。預設金鑰是AWS KMS 金鑰 (SSE-KMS)。您可以在離線存放區 Amazon S3 儲存貯體上設定 Amazon S3 儲存貯體金鑰的使用,以降低 AWS KMS 請求成本。必須先啟用 Amazon S3 儲存貯體金鑰,才能將儲存貯體用於功能群組。如需使用 Amazon S3 儲存貯體金鑰降低成本的詳細資訊,請參閱使用 Amazon S3 儲存貯體金鑰降低 SSE-KMS 的成本

    您可以在線上和離線儲存中使用相同的金鑰,也可以為每個儲存使用唯一的金鑰。如需 的詳細資訊 AWS KMS,請參閱 AWS Key Management Service

  • 如果您建立離線儲存:

    • 決定是要建立 Amazon S3 儲存貯體還是使用現有儲存貯體。使用現有儲存貯體時,您必須知道 Amazon S3 儲存貯體URL或 Amazon S3 儲存貯體名稱和資料集目錄名稱,如適用。

    • 選擇要用來指定IAM角色的 Amazon Resource Name (ARN)。如需如何尋找角色和連接政策的詳細資訊,請參閱 將政策新增至您的IAM角色

    • 決定是否使用 AWS Glue (預設) 或 Apache Iceberg 資料表格式。在大多數使用案例中,您可以使用 Apache Iceberg 資料表格式。如需資料表格式的詳細資訊,請參閱 將 Feature Store 與 SDK for Python (Boto3) 搭配使用

您可以使用 主控台來檢視特徵群組的譜系。在主控台上使用 Feature Store 的指示會因您是否啟用Amazon SageMaker StudioAmazon SageMaker Studio Classic作為預設體驗而有所不同。

  1. 按照 中的指示開啟 Studio 主控台推出 Amazon SageMaker 工作

  2. 從左側導覽窗格中選擇資料以展開下拉式清單。

  3. 從下拉式清單中,選擇特徵商店

  4. 選擇建立特徵群組

  5. 特徵群組詳細資訊之下,輸入特徵群組名稱。

  6. (選用) 輸入特徵群組說明。

  7. 特徵群組儲存組態 下,從下拉式清單中選擇儲存組態。如需有關儲存組態的資訊,請參閱 特徵商店儲存組態

  8. 如果您已選擇啟用線上儲存體:

    1. 如果您啟用線上儲存,您可以從下拉式清單中選擇儲存類型。如需線上儲存體儲存類型的相關資訊,請參閱 線上儲存

    2. (選用) 將時間套用至即時 (TTL),方法是將開關切換為開啟,並指定時間至即時持續時間值和單位。這將更新功能群組建立後新增至功能群組的所有記錄的預設TTL持續時間。 如需 的詳細資訊TTL,請參閱 記錄的存留時間 (TTL) 持續時間

  9. 如果您已選擇啟用離線儲存體:

    1. Amazon S3 儲存貯體名稱 下,URL手動輸入新的儲存貯體名稱,或手動輸入現有的儲存貯體 。

    2. 資料表格式下拉式清單中,選擇資料表格式。在大多數使用案例中,您應該使用 Apache Iceberg 資料表格式。如需資料表格式的詳細資訊,請參閱 將 Feature Store 與 SDK for Python (Boto3) 搭配使用

    3. IAM角色 ARN下,選擇ARN您要連接至此功能群組IAM的角色。如需如何尋找角色和連接政策的詳細資訊,請參閱 將政策新增至您的IAM角色

    4. 如果您已選擇啟用離線儲存資料表格式和 AWS Glue (預設) 資料表格式 ,您可以在資料目錄 下選擇下列兩個選項之一:

      • 使用 的預設值 AWS Glue Data Catalog

      • 提供現有的 Data Catalog 名稱、資料表名稱和資料庫名稱,以擴展現有的 AWS Glue Data Catalog。

  10. 線上儲存加密金鑰離線儲存加密金鑰下拉式清單下,選擇下列其中一個選項:

    • 使用 AWS 受管 AWS KMS key (預設)

    • 在 AWS KMS key ARN離線儲存加密 AWS KMS 金鑰 ARN下輸入 和 金鑰。 ARN如需 的詳細資訊 AWS KMS,請參閱 AWS Key Management Service

  11. 如果適用,您可以選擇輸送量模式,這會影響您的收費方式。在輸送量模式 下,從下拉式清單中選擇模式,並在可用時輸入讀取和寫入容量。如需有關輸送量模式的資訊,例如何時可以套用模式和容量單位,請參閱 輸送量模式

  12. 指定所有必要資訊後,繼續按鈕會顯示為可用。選擇繼續

  13. 指定功能定義 下,您有兩個選項可為您的功能提供結構描述:JSON編輯器或資料表編輯器。

    • JSON 編輯器:在 JSON 索引標籤中,以 JSON 格式輸入或複製並貼上您的功能定義。

    • 資料表編輯器:在資料表索引標籤中,輸入功能功能名稱,並為功能群組中的每個功能選擇對應的資料類型。選擇+ 新增功能定義以包含更多功能。請注意,您無法從功能群組中移除功能定義。不過,您可以在功能群組建立後新增和更新功能定義。

    功能群組中必須至少有兩個代表記錄識別符和事件時間的功能:

    • 記錄功能類型可以是字串、分數或積分。

    • 事件時間特徵類型必須是字串或分數。不過,如果您選擇 Iceberg 資料表格式,事件時間必須是字串。

  14. 包含所有功能後,選擇繼續

  15. 選取必要的功能 下,您必須指定記錄識別符和事件時間功能。方法是分別在記錄識別符功能名稱事件時間功能名稱下拉式清單下選擇功能名稱。

  16. 選擇記錄識別符和事件時間功能後,請選擇繼續

  17. (選用) 若要為功能群組新增標籤,請選擇新增標籤 。然後分別在金鑰和值 下輸入標籤金鑰對應的值

  18. 選擇 繼續

  19. 檢閱特徵群組下,檢閱功能群組資訊。若要編輯任何步驟,請選擇與該步驟對應的編輯按鈕。這將帶您進入相應的編輯步驟。若要返回步驟 5,請選擇繼續,直到返回步驟 5。

  20. 完成功能群組的設定後,請選擇建立功能群組

    如果在設定期間發生問題,頁面底部會顯示快顯警示訊息,其中包含解決問題的秘訣。您可以透過為具有衝突的步驟選擇編輯,返回先前的步驟來修正問題。

    成功建立功能群組後,頁面底部會出現綠色快顯訊息。新功能群組也會出現在您的功能群組目錄中。

從主控台檢視功能群組詳細資訊

在特徵存放區成功建立特徵群組之後,您可以檢視特徵群組的詳細資訊。

您可以使用 主控台或 Amazon SageMaker Feature Store API 來檢視您的功能群組詳細資訊。透過主控台使用 Feature Store 的指示取決於您是否已啟用 Amazon SageMaker StudioAmazon SageMaker Studio Classic作為預設體驗。

  1. 按照 中的指示開啟 Studio 主控台推出 Amazon SageMaker 工作

  2. 在左側導覽窗格中選擇資料,展開下拉式清單。

  3. 從下拉式清單中,選擇 Feature Store

  4. (選用) 若要檢視您的功能群組,請選擇我的帳戶 。若要檢視共用功能群組,請選擇跨帳戶

  5. 特徵群組目錄標籤下,從清單中選擇您的特徵群組名稱。這會開啟功能群組頁面。

  6. 功能選項卡上,您可以找到所有功能的清單。使用篩選條件來精簡您的清單。選擇一個功能來檢視其詳細資訊。

  7. 詳細資訊索引標籤和資訊子索引標籤下,您可以檢閱功能群組資訊。這包括最新執行 離線儲存設定 線上儲存設定 等。

  8. 詳細資訊索引標籤和標籤子索引標籤下,您可以檢閱功能群組標籤。選擇新增標籤以新增標籤,或選擇移除以移除標籤。

  9. 管道執行索引標籤下,您可以檢視功能群組的相關管道或管道執行。

  10. 系列索引標籤下,您可以檢視功能群組的系列。

從主控台更新功能群組

您可以在功能存放區成功建立功能群組後更新功能群組。

您可以使用主控台或 Amazon SageMaker Feature Store API 來更新功能群組。透過主控台使用 Feature Store 的指示取決於您是否已啟用 Amazon SageMaker StudioAmazon SageMaker Studio Classic作為預設體驗。

  1. 按照 中的指示開啟 Studio 主控台推出 Amazon SageMaker 工作

  2. 在左側導覽窗格中選擇資料,以展開下拉式清單。

  3. 從下拉式清單中,選擇 Feature Store

  4. (選用) 若要檢視功能群組,請選擇我的帳戶 。若要檢視共用功能群組,請選擇跨帳戶

  5. 特徵群組目錄標籤下,搜尋並從清單中選擇您的特徵群組名稱。這會開啟功能群組頁面。

  6. 選擇更新特徵群組

  7. (選用) 如果適用,您可以變更輸送量模式,這會影響您的收費方式。在輸送量模式 下,從下拉式清單中選擇模式,並在可用時輸入讀取和寫入容量。如需有關輸送量模式的資訊,例如何時可以套用模式和容量單位,請參閱 輸送量模式

  8. (選用) 如果您的功能群組使用線上存放區,您可以更新預設存留時間 (TTL)。如果TTL尚未為功能群組啟用 ,請將存留時間 (TTL) 下的切換按鈕切換為開啟 。您可以在存留時間持續時間 下指定TTL值和單位。這將在功能群組更新 後,更新新增至功能群組的所有記錄的預設TTL持續時間。

  9. (選擇性) 您可以將功能定義新增至功能群組,但請注意,您無法從功能群組中移除功能定義。若要新增功能定義,請選擇 + 新增功能定義,然後在名稱欄下指定新的功能定義名稱,然後在功能類型欄下選取功能類型

  10. 選擇 Save changes (儲存變更)。

  11. 若要確認您的變更,請選擇確認

從主控台檢視管道執行

您可以在管道執行 下檢視特徵或特徵群組的最新管道執行資訊。您也可以取得管道、執行、程式碼和其他有用執行資訊的連結。

您可以使用 主控台來檢視管道執行。透過主控台使用 Feature Store 的指示取決於您是否已啟用 Amazon SageMaker StudioAmazon SageMaker Studio Classic作為預設體驗。

  1. 按照 中的指示開啟 Studio 主控台推出 Amazon SageMaker 工作

  2. 在左側導覽窗格中選擇資料,以展開下拉式清單。

  3. 從下拉式清單中,選擇 Feature Store

  4. (選用) 若要檢視您的功能群組,請選擇我的帳戶 。若要檢視共用功能群組,請選擇跨帳戶

  5. 選擇功能群組或功能以檢視其管道執行。

  6. 選擇管道執行標籤。

  7. 選取一個管道下拉式清單搜尋管道。

  8. 您可以檢視管道、執行和程式碼詳細資訊的連結。您也可以檢視執行擁有者、狀態、日期和持續時間。

從主控台檢視譜系

您可以檢視功能群組的歷程。歷程包括功能處理工作流程的執行程式碼、使用的資料來源以及它們如何擷取至功能群組或功能的資訊。

您可以使用 主控台來檢視特徵群組的譜系。透過主控台使用 Feature Store 的指示取決於您是否已啟用 Amazon SageMaker StudioAmazon SageMaker Studio Classic作為預設體驗。

  1. 按照 中的指示開啟 Studio 主控台推出 Amazon SageMaker 工作

  2. 從左側導覽窗格中選擇資料以展開下拉式清單。

  3. 從下拉式清單中,選擇 Feature Store

  4. (選用) 若要檢視您的功能群組,請選擇我的帳戶 。若要檢視共用功能群組,請選擇跨帳戶

  5. 選擇功能群組或功能以檢視其譜系詳細資訊。

  6. 選擇歷程頁標。

  7. 選擇功能群組或配管節點以展開節點。其中包含有關功能群組或管道的詳細資訊。

  8. 您可以使用畫面左下方的按鈕來放大、縮小或置中歷程圖表。

  9. 當您選擇並拖曳畫面時,可以在譜系圖中移動。若要使用節點作為焦點來移動譜系圖,您可以按 TabShift+Tab 在節點之間切換。

  10. 如果適用,您可以瀏覽上游 (左、舊) 或下游 (右、最近) 的譜系。透過選擇節點,然後選擇查詢上游譜系查詢下游譜系 來執行此操作。