擷取資料 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

擷取資料

若要將端點的輸入和從部署模型的推論輸出記錄到 Amazon S3,您可以啟用名為資料擷取的功能。資料擷取通常用來記錄可用於訓練、偵錯和監控的資訊。Amazon SageMaker 模型監視器會自動剖析此擷取的資料,並將此資料中的指標與您為模型建立的基準進行比較。如需有關模型監控的更多相關資訊,請參閱使用 Amazon 模型監控器監控資料和 SageMaker 模型品質

您可以使用以下方法,針對即時和批次模型監視模式實作資料擷取 AWS SDK for Python (Boto) 或 SageMaker Python SDK。如果是即時端點,您將在建立端點時指定資料擷取組態。由於即時端點的持續性質,您可以設定額外選項以在特定時間開啟或關閉資料擷取,或變更取樣頻率。您也可以選擇加密推論資料。

對於批次轉換工作,如果您想要針對一般、定期的批次轉換工作執行排程模型監控或持續模型監控,則可以啟用資料擷取。您將在建立批次轉換工作時指定資料擷取組態。在此組態中,您可以選擇開啟加密或在輸出中產生推論 ID,以協助您將擷取的資料與 Ground Truth 資料比對。