SageMaker variabili di ambiente e percorsi predefiniti per l'addestramento delle posizioni di archiviazione - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

SageMaker variabili di ambiente e percorsi predefiniti per l'addestramento delle posizioni di archiviazione

La tabella seguente riassume i percorsi di input e output per set di dati di addestramento, checkpoint, artefatti del modello e output, gestiti dalla piattaforma di formazione. SageMaker

Percorso locale nell'istanza di formazione SageMaker SageMaker variabile d'ambiente Scopo Legge da S3 durante l'avvio Legge da S3 durante il riavvio tramite SPOT Scrive su S3 durante l'addestramento Scrive su S3 quando il processo viene terminato

/opt/ml/input/data/channel_name1

SM_ _ CHANNELCHANNEL_NAME

Lettura dei dati di addestramento dai canali di input specificati tramite la classe SageMaker Python SDK Estimator o l'operazione. CreateTrainingJobAPI Per ulteriori informazioni su come specificarlo nello script di addestramento utilizzando SageMaker PythonSDK, vedere Preparare uno script di addestramento.

No No

/opt/ml/output/data2

SM_ _ OUTPUT DIR

Salvataggio di risultati quali perdita, precisione, strati intermedi, pesi, gradienti, polarizzazione e uscite compatibili. TensorBoard Puoi anche salvare qualsiasi output arbitrario che desideri utilizzando questo percorso. Nota che questo è un percorso diverso da quello per l’archiviazione dell'artefatto finale del modello /opt/ml/model/.

No No No

/opt/ml/model3

SM_ _ MODEL DIR

Archiviazione dell'artefatto finale del modello. Questo è anche il percorso da cui viene distribuito l'artefatto del modello per l'inferenza in tempo reale nell'hosting. SageMaker

No No No

/opt/ml/checkpoints4

-

Salvataggio dei checkpoint del modello (lo stato del modello) per riprendere l'addestramento da un determinato punto e riprendersi da interruzioni di Addestramento spot gestite o impreviste.

No

/opt/ml/code

SAGEMAKER_SUBMIT_DIRECTORY

Copiare script di addestramento, librerie aggiuntive e dipendenze.

No No

/tmp

-

Lettura o scrittura su /tmp come spazio da zero.

No No No No

1 channel_name è il posto in cui specificare i nomi dei canali definiti dall'utente per l'input dei dati di addestramento. Ogni processo di addestramento può contenere diversi canali di immissione dei dati. Puoi specificare fino a un massimo di 20 canali di input di addestramento per ciascun processo di addestramento. Tieni presente che il tempo di download dei dati dai canali di dati viene conteggiato per il tempo fatturabile. Per ulteriori informazioni sui percorsi di immissione dei dati, consulta How Amazon SageMaker Provides Training Information. Inoltre, sono SageMaker supportati tre tipi di modalità di immissione dei dati: modalità file e modalità pipe. FastFile Per ulteriori informazioni sulle modalità di immissione dei dati per l'addestramento SageMaker, consulta Access Training Data.

2 SageMaker comprime e scrive gli artefatti di addestramento su TAR file (). tar.gz Il tempo di compressione e caricamento viene conteggiato nel tempo fatturabile. Per ulteriori informazioni, consulta How Amazon SageMaker Processes Training Output.

3 SageMaker comprime e scrive l'elemento finale del modello in un TAR file (). tar.gz Il tempo di compressione e caricamento viene conteggiato nel tempo fatturabile. Per ulteriori informazioni, consulta How Amazon SageMaker Processes Training Output.

4 Sincronizzazione con Amazon S3 durante l'addestramento. Scrivi così com'è senza comprimere TAR i file. Per ulteriori informazioni, consulta Usare i checkpoint in Amazon SageMaker.