使用 AWS Clean Rooms ML - AWS Clean Rooms

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 AWS Clean Rooms ML

相似模型是訓練資料提供者資料的模型,可讓種子資料提供者建立與其種子資料最相似的訓練資料提供者資料的相似區段。若要建立可用於協同作業的相似模型,您必須匯入訓練資料、建立相似模型、設定該相似模型,然後將其與協同合作產生關聯。

訓練資料提供者建立 ML 模型後,種子資料提供者可以建立和匯出種子區段。

使用相似模型 (訓練資料提供者)

匯入訓練資料

在建立相似模型之前,您必須指定 AWS Glue 包含訓練資料的表格。無塵室 ML 不會儲存此資料的副本,只會儲存允許其存取資料的中繼資料。

若要匯入訓練資料 AWS Clean Rooms
  1. 登入 AWS Management Console 並打開 AWS Clean Rooms與您的控制台 AWS 帳戶 (如果你還沒有這樣做)。

  2. 在左側導覽窗格中,選擇 [ML 模型]。

  3. 訓練資料集索引標籤上,選擇建立訓練資料集

  4. 在 [建立訓練資料集] 頁面上,針對訓練資料集詳細資料,輸入名稱和選用說明

  5. 從下拉式清單中選取要設定的「資料」和「表格」,以選擇「訓練」資料來源。

    注意

    若要確認此表格是否正確,請執行下列任一項作業:

    • 選擇「檢視於」 AWS Glue.

    • 開啟 [檢視結構描述] 以檢視結構描述。

  6. 對於訓練詳細資訊,請從下拉式清單中選擇使用者識別碼欄、項目識別碼欄和時間戳記欄。訓練資料必須包含這三個欄位。您也可以選取要包含在訓練資料中的任何其他欄。

    「時間戳記」欄中的資料必須是 Unix 紀元時間 (以秒為單位)。

  7. (選擇性) 如果您有任何要訓練的其他欄,請從下拉式清單中選擇「欄名稱」 和「類型」。

  8. 服務存取中,您必須指定可存取資料的服務角色,並在資料已加密時提供KMS金鑰。選擇 [建立並使用新的服務角色],Clean Rooms ML 就會自動建立服務角色並新增必要的權限原則。如果您有要使用的特定服務角色,請選擇 [使用現有服務角色],然後在 [服務角色名稱] 欄位中輸入該角色。

    如果您的數據已加KMS密,請在 AWS KMS key欄位,或按一下 [建立] AWS KMS key以產生新的KMS金鑰。

  9. 如果您想要啟用訓練資料集的,請選擇 [新增標籤],然後輸入 [金鑰] 和 [] 配對。

  10. 選擇建立訓練資料集

如需相應的API動作,請參閱CreateTrainingDataset

建立相似模型

建立訓練資料集之後,就可以建立相似模型了。您可以從單一訓練資料集建立許多相似模型。

您必須在 AWS Glue Data Catalog 或在提供的角色中包含glue:createDatabase權限。

若要在中建立相似模型 AWS Clean Rooms
  1. 登入 AWS Management Console 並打開 AWS Clean Rooms與您的控制台 AWS 帳戶 (如果你還沒有這樣做)。

  2. 在左側導覽窗格中,選擇 [ML 模型]。

  3. 在「相似模型」標籤上,選擇「建立相似模型」。

  4. 在「建立相似模型」頁面上,針對相似模型詳細資料,輸入「名稱」和選用「說明」。

    1. 從下拉式清單中選擇您要建立模型的訓練資料集

      注意

      若要確認這是正確的訓練資料集,請開啟 [顯示訓練資料集詳細資料] 以檢視詳細資料。

      若要建立新的訓練資料集,請選擇 [建立訓練資料集]。

    2. (選擇性) 輸入訓練視窗

  5. 如果您要啟用相似模型的自訂加密設定,請選擇 [自訂加密設定],然後輸入KMS金鑰。

  6. 如果您要為相似模型啟用「」,請選擇「新增標籤」,然後輸入「金鑰」和「」配對。

  7. 選擇「建立相似模型」。

    注意

    模型訓練可能需要幾個小時到 2 天。

如需相應的API動作,請參閱CreateAudienceModel

設定相似模型

建立相似模型之後,您就可以將其設定為在協同作業中使用。您可以從單一相似模型建立多個已設定的相似模型。

若要在中設定相似模型 AWS Clean Rooms
  1. 登入 AWS Management Console 並打開 AWS Clean Rooms與您的控制台 AWS 帳戶 (如果你還沒有這樣做)。

  2. 在左側導覽窗格中,選擇 [ML 模型]。

  3. 在「已設定的相似模型」標籤中,選擇「設定相似模型」。

  4. [設定相似模型] 頁面上,對於 [已設定的相似模型詳細資料],輸入 [名稱] 和 [選擇性說明]。

    1. 從下拉列表中選擇要配置的相似模型

      注意

      若要確認這是正確的相似模型,請開啟「顯示相似模型詳細資料」以檢視詳細資料

      若要建立新的相似模型,請選擇「建立相似模型」。

    2. 選擇您想要的最小匹配種子大小。這是種子資料提供者資料中與訓練資料中使用者重疊的最小使用者數目。此值必須大於 0。

  5. 對於要與其他成員共用的指標,請選擇是否要讓共同作業中的種子資料提供者接收模型指標,包括相關性分數。

  6. 對於相似區段目的地位置,請輸入要匯出相似區段的 Amazon S3 儲存貯體。此值區必須與其他資源位於相同的區域。

  7. 對於服務存取,請選擇將用於存取此表格的現有服務角色名稱

  8. 對於「進階資料桶大小」設定,請將「對象」大小類型指定為「絕對數字」或「百分比」。

  9. 如果要為已配置的表格資源啟用標,請選擇 [新增標記],然後輸入 [索引鍵] 和 [] 配對。

  10. 選擇配置相似模型。

如需相應的API動作,請參閱CreateConfiguredAudienceModel

關聯已設定的相似模型

設定完相似模型之後,您可以將其與協同合作產生關聯。

將已設定的相似模型關聯於 AWS Clean Rooms
  1. 登入 AWS Management Console 並打開 AWS Clean Rooms與您的控制台 AWS 帳戶 (如果你還沒有這樣做)。

  2. 在左側導覽窗格中,選擇「合作」。

  3. 在 [具有使用中成員資格] 索引標籤上,選擇合作。

  4. 在 [ML 建模] 索引標籤的 [R eady-to-use 相似模型] 下,選擇 [關聯相似模型]。

  5. 在「關聯已設定的相似模型」頁面上,針對已設定的相似模型關聯詳細資訊:

    1. 為關聯的已設定對象模型輸入「名稱」。

    2. 輸入表格的「摘要」。

      此描述有助於區分具有相似名稱的其他關聯已設定對象模型。

  6. 對於「已設定的相似模型」,請從下拉式清單中選擇已設定的相似模型。

  7. 選擇關聯

如需相應的API動作,請參閱CreateConfiguredAudienceModelAssociation

更新已設定的相似模型

將設定的相似模型與共同作業相關聯後,您可以更新該模型以變更名稱、要共用的指標或輸出 Amazon S3 位置等資訊。

若要在中更新關聯的已設定相似模型 AWS Clean Rooms
  1. 登入 AWS Management Console 並打開 AWS Clean Rooms與您的控制台 AWS 帳戶 (如果你還沒有這樣做)。

  2. 在左側導覽窗格中,選擇 [ML 模型]。

  3. 在 [已設定的相似模型] 索引標籤的 [R eady-to-use 相似模型] 下,選擇已設定的相似模型,然後選取 [編輯]。

  4. 「編輯」 頁面上,對於「已設定的相似模型」關聯詳細資訊

    1. 更新「名」和選擇性「說明」。

    2. 從下拉列表中選擇要配置的相似模型

    3. 選擇您想要的最小匹配種子大小。這是種子資料提供者資料中與訓練資料中使用者重疊的最小使用者數目。此值必須大於 0。

  5. 對於要與其他成員共用的指標,請選擇是否要讓共同作業中的種子資料提供者接收模型指標,包括相關性分數。

  6. 對於相似區段目的地位置,請輸入要匯出相似區段的 Amazon S3 儲存貯體。此值區必須與其他資源位於相同的區域。

  7. 對於服務存取,請選擇將用於存取此表格的現有服務角色名稱

  8. 對於「進階資料桶大小」設定,請選擇您要如何設定對象資料匣大小。

  9. 選擇 Save changes (儲存變更)。

如需相應的API動作,請參閱UpdateConfiguredAudienceModel

使用相似區段 (種子資料提供者)

建立相似區段

相似區段是訓練資料的子集,最接近種子資料。

若要在中建立相似區段 AWS Clean Rooms
  1. 登入 AWS Management Console 並打開 AWS Clean Rooms與您的控制台 AWS 帳戶 (如果你還沒有這樣做)。

  2. 在左側導覽窗格中,選擇「合作」。

  3. 在 [具有使用中成員資格] 索引標籤上,選擇合作。

  4. 在 [ML 塑型] 索引標籤上,選擇 [建立相似區段]。

  5. 在「建立相似區段」頁面上,針對「關聯」設定的相似模型,選擇要用於此相似區段的關聯設定相似模型。

  6. 若為相似區段詳細資訊,請輸入「名稱」與選擇性「說明

  7. 對於種子設定檔,請選取一個選項,然後採取建議的動作來選擇您的種子方法

    選項 建議的動作
    Amazon S3 輸入源
    1. 選擇一個 Amazon S3 位置。

    2. (選擇性) 選擇在輸出中包含種子描述檔

    SQL查詢 編寫SQL查詢並使用其結果作為種子數據,
    分析範本 從下拉式清單中選擇分析範本,並使用分析範本建立的結果。
  8. 對於服務存取,請選擇將用於存取此表格的現有服務角色名稱

  9. 如果您想要啟用訓練資料集的,請選擇 [新增標籤],然後輸入 [金鑰] 和 [] 配對。

  10. 選擇「建立相似區段」。

如需相應的API動作,請參閱StartAudienceGenerationJob

匯出相似區段

建立相似區段後,您可以將該資料匯出到 Amazon S3 儲存貯體。

若要匯出相似區段 AWS Clean Rooms
  1. 登入 AWS Management Console 並打開 AWS Clean Rooms 控制台與您的 AWS 帳戶 (如果你還沒有這樣做)。

  2. 在左側導覽窗格中,選擇「合作」。

  3. 在 [具有使用中成員資格] 索引標籤上,選擇合作。

  4. 在 [ML 模型] 索引標籤的 [相似區段] 下,選取相似區段,然後選擇 [匯出]。

  5. 對於「匯出相似模型」,對於「匯出相似模型」,請輸入「名稱」和「描述」。

  6. 在「區段大小」中,選擇匯出區段所要的大小。

  7. 選擇 Export (匯出)。

如需相應的API動作,請參閱StartAudienceExportJob

現在,您已經建立了相似模型並匯出種子區段,就可以在 S3 中檢視匯出的資料了。