Amazon SageMaker Processing 如何設定處理容器的輸入和輸出 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SageMaker Processing 如何設定處理容器的輸入和輸出

當您使用 CreateProcessingJob 操作建立處理任務時,您可以指定多個 ProcessingInputProcessingOutput 值。

您可以使用 ProcessingInput 參數來指定 Amazon Simple Storage Service (Amazon S3) URI 來從處理容器下載資料,以及要下載資料的路徑。ProcessingOutput 參數會在處理容器中設定要從中上傳資料的路徑,以及要在 Amazon S3 中上傳資料的位置。對於 ProcessingInputProcessingOutput,Processing 容器中的路徑必須以 /opt/ml/processing/ 開頭。

例如,您建立的處理任務可能使用一個 ProcessingInput 參數將資料從 s3://your-data-bucket/path/to/input/csv/data 下載到處理容器中的 /opt/ml/processing/csv,並使用 ProcessingOutput 參數將資料從 /opt/ml/processing/processed_csv 上傳到 s3://your-data-bucket/path/to/output/csv/data。您的處理任務將讀取輸入資料,並將輸出資料寫入 /opt/ml/processing/processed_csv。然後它將寫入此路徑的資料上傳到指定的 Amazon S3 輸出位置。

重要

符號連結 (symlinks) 無法用來將輸出資料上傳到 Amazon S3。上傳輸出資料時不會遵循符號連結。