在 Amazon SNS 訊息中指定重複資料刪除金鑰和 ID - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 Amazon SNS 訊息中指定重複資料刪除金鑰和 ID

當您使用 Amazon SNS 訊息將資料物件傳送至串流標籤任務時,您可以選擇以下列其中一種方式指定重複資料刪除金鑰和重複資料刪除 ID。在所有這些情況,請使用 dataset-objectid-attribute-name 識別您的重複刪除金鑰。

使用自有重複刪除金鑰與 ID

透過設定您的 Amazon SNS 訊息,建立您自己的重複資料刪除金鑰和重複資料刪除 ID,如下所示。請以您的金鑰取代 byo-key,並以該資料物件的重複刪除 ID 取代 UniqueId

{ "source-ref":"s3://bucket/prefix/object1", "dataset-objectid-attribute-name":"byo-key", "byo-key":"UniqueId" }

您的重複刪除金鑰長度上限為 140 個字元。支援的模式包含:"^[$a-zA-Z0-9](-*[a-zA-Z0-9])*"

您的重複刪除 ID 長度上限為 1,024 個字元。支援的模式包含:^(https|s3)://([^/]+)/?(.*)$

使用現有金鑰作為重複刪除金鑰

您可以使用訊息的現有金鑰做為重複刪除金鑰。在執行此操作時,關聯該金鑰的值會用作重複刪除 ID。

例如,您可以將訊息格式化,指定使用 source-ref 金鑰作為重複刪除金鑰,如下所示:

{ "source-ref":"s3://bucket/prefix/object1", "dataset-objectid-attribute-name":"source-ref" }

在此範例,Ground Truth 採用 "s3://bucket/prefix/object1" 作為重複刪除 ID。