SageMaker 環境變數和訓練儲存位置的預設路徑 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

SageMaker 環境變數和訓練儲存位置的預設路徑

下表摘要說明訓練 SageMaker 平台所管理的訓練資料集、檢查點、模型成品和輸出的輸入和輸出路徑。

SageMaker 訓練執行個體中的本機路徑 SageMaker 環境變數 用途 啟動期間從 S3 讀取 重新啟動 Spot 期間從 S3 讀取 在訓練期間寫入 S3 終止任務時寫入 S3

/opt/ml/input/data/channel_name1

SM_CHANNEL_CHANNEL_NAME

從透過 SageMaker Python SDK 估算器類別或 CreateTrainingJobAPI操作指定的輸入通道讀取訓練資料。如需如何使用 SageMaker Python 在您的訓練指令碼中指定指令碼的詳細資訊SDK,請參閱準備訓練指令碼

/opt/ml/output/data2

SM_OUTPUT_DIR

儲存輸出,例如損失、準確度、中層、權重、梯度、偏差和 TensorBoard相容的輸出。您也可以儲存您想要使用此路徑的任何任意輸出。請注意,這個路徑與儲存最終模型成品 /opt/ml/model/ 的路徑不同。

/opt/ml/model3

SM_MODEL_DIR

儲存最終模型成品。這也是在 SageMaker 託管中部署模型成品以進行即時推論的路徑。

/opt/ml/checkpoints4

-

儲存模型檢查點 (模型的狀態) 以從特定時間點恢復訓練,並從非預期或受管 Spot 訓練中斷中復原。

/opt/ml/code

SAGEMAKER_SUBMIT_DIRECTORY

複製訓練指令碼、其他程式庫和相依性。

/tmp

-

讀取或寫入 /tmp 做為暫存空間。

1 channel_name 是指定訓練資料輸入之使用者定義通道名稱的位置。每個訓練任務都可以包含多個資料輸入通道。您可以指定每個訓練任務最多不超過 20 個訓練輸入通道。請注意,從資料通道下載資料的時間將計入應計費時間。如需資料輸入路徑的詳細資訊,請參閱 Amazon SageMaker 如何提供訓練資訊 。此外,有三種類型的資料輸入模式 SageMaker 支援:檔案 FastFile和管道模式。若要進一步了解 中訓練的資料輸入模式 SageMaker,請參閱存取訓練資料

2 SageMaker 壓縮訓練成品並將其寫入TAR檔案 (tar.gz)。壓縮和上傳時間會計入應計費時間。如需詳細資訊,請參閱 Amazon 如何處理 SageMaker 訓練輸出。

3 SageMaker 壓縮最終模型成品並將其寫入TAR檔案 (tar.gz)。壓縮和上傳時間會計入應計費時間。如需詳細資訊,請參閱 Amazon 如何處理 SageMaker 訓練輸出。

4 在訓練期間與 Amazon S3 同步。寫入時不會壓縮至TAR檔案。如需詳細資訊,請參閱在 Amazon 中使用檢查點。 SageMaker