本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
SageMaker 環境變數和訓練儲存位置的預設路徑
下表摘要說明訓練 SageMaker 平台所管理的訓練資料集、檢查點、模型成品和輸出的輸入和輸出路徑。
SageMaker 訓練執行個體中的本機路徑 | SageMaker 環境變數 | 用途 | 啟動期間從 S3 讀取 | 重新啟動 Spot 期間從 S3 讀取 | 在訓練期間寫入 S3 | 終止任務時寫入 S3 |
---|---|---|---|---|---|---|
|
SM_CHANNEL_ |
從透過 SageMaker Python SDK 估算器 |
是 | 是 | 否 | 否 |
|
SM_OUTPUT_DIR |
儲存輸出,例如損失、準確度、中層、權重、梯度、偏差和 TensorBoard相容的輸出。您也可以儲存您想要使用此路徑的任何任意輸出。請注意,這個路徑與儲存最終模型成品 |
否 | 否 | 否 | 是 |
|
SM_MODEL_DIR |
儲存最終模型成品。這也是在 SageMaker 託管中部署模型成品以進行即時推論的路徑。 |
否 | 否 | 否 | 是 |
|
- |
儲存模型檢查點 (模型的狀態) 以從特定時間點恢復訓練,並從非預期或受管 Spot 訓練中斷中復原。 |
是 | 是 | 是 | 否 |
|
SAGEMAKER_SUBMIT_DIRECTORY |
複製訓練指令碼、其他程式庫和相依性。 |
是 | 是 | 否 | 否 |
|
- |
讀取或寫入 |
否 | 否 | 否 | 否 |
1 channel_name
是指定訓練資料輸入之使用者定義通道名稱的位置。每個訓練任務都可以包含多個資料輸入通道。您可以指定每個訓練任務最多不超過 20 個訓練輸入通道。請注意,從資料通道下載資料的時間將計入應計費時間。如需資料輸入路徑的詳細資訊,請參閱 Amazon SageMaker 如何提供訓練資訊 。此外,有三種類型的資料輸入模式 SageMaker 支援:檔案 FastFile和管道模式。若要進一步了解 中訓練的資料輸入模式 SageMaker,請參閱存取訓練資料 。
2 SageMaker 壓縮訓練成品並將其寫入TAR檔案 (tar.gz
)。壓縮和上傳時間會計入應計費時間。如需詳細資訊,請參閱 Amazon 如何處理 SageMaker 訓練輸出。
3 SageMaker 壓縮最終模型成品並將其寫入TAR檔案 (tar.gz
)。壓縮和上傳時間會計入應計費時間。如需詳細資訊,請參閱 Amazon 如何處理 SageMaker 訓練輸出。
4 在訓練期間與 Amazon S3 同步。寫入時不會壓縮至TAR檔案。如需詳細資訊,請參閱在 Amazon 中使用檢查點。 SageMaker