SageMaker las variables de entorno y las rutas predeterminadas para el entrenamiento: ubicaciones de almacenamiento - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

SageMaker las variables de entorno y las rutas predeterminadas para el entrenamiento: ubicaciones de almacenamiento

En la siguiente tabla se resumen las rutas de entrada y salida de los conjuntos de datos de entrenamiento, los puntos de control, los artefactos del modelo y las salidas, gestionados por la plataforma de formación. SageMaker

Ruta local en la instancia de entrenamiento SageMaker SageMaker variable de entorno Finalidad Lectura desde S3 durante el inicio Lectura desde S3 durante reinicio puntual Escritura en S3 durante el entrenamiento Escritura en S3 cuando finaliza el trabajo

/opt/ml/input/data/channel_name1

SM_ _ CHANNELCHANNEL_NAME

Leer los datos de entrenamiento de los canales de entrada especificados mediante la clase SageMaker Python SDK Estimator o la CreateTrainingJobAPIoperación. Para obtener más información sobre cómo especificarlo en el script de entrenamiento mediante SageMaker PythonSDK, consulte Preparar un script de entrenamiento.

No No

/opt/ml/output/data2

SM_ _ OUTPUT DIR

Ahorra resultados como pérdidas, precisión, capas intermedias, pesos, gradientes, polarización y salidas TensorBoard compatibles. También puede guardar cualquier salida arbitraria que desee utilizando esta ruta. Tenga en cuenta que esta es una ruta diferente a la que se usa para almacenar el artefacto /opt/ml/model/ final del modelo.

No No No

/opt/ml/model3

SM_ _ MODEL DIR

Almacenamiento del artefacto final del modelo. Esta es también la ruta desde la que se despliega el artefacto modelo para la inferencia en tiempo real en Hosting. SageMaker

No No No

/opt/ml/checkpoints4

-

Guardado de los puntos de control del modelo (el estado del modelo) para reanudar el entrenamiento a partir de un punto determinado y recuperarse de interrupciones inesperadas o de entrenamiento de spot administrado.

No

/opt/ml/code

SAGEMAKER_SUBMIT_DIRECTORY

Copia de scripts de entrenamiento, bibliotecas adicionales y dependencias.

No No

/tmp

-

Lectura o escritura /tmp como espacio temporal.

No No No No

1 channel_name es el lugar donde se especifican nombres de canales definidos por el usuario para las entradas de datos de entrenamiento. Cada trabajo de entrenamiento puede contener varios canales de entrada de datos. Puede especificar hasta 20 canales de entrada de entrenamiento por trabajo. Tenga en cuenta que el tiempo de descarga de datos desde los canales de datos se incluye en el tiempo facturable. Para obtener más información sobre las rutas de entrada de datos, consulta Cómo Amazon SageMaker proporciona información de formación. Además, se SageMaker admiten tres tipos de modos de entrada de datos: el modo de archivo y el modo vertical. FastFile Para obtener más información sobre los modos de entrada de datos para el entrenamiento SageMaker, consulta Acceder a los datos de entrenamiento.

2 SageMaker comprime y escribe los artefactos de entrenamiento en TAR archivos (tar.gz). El tiempo de compresión y carga se incluye en el tiempo facturable. Para obtener más información, consulta Cómo SageMaker procesa Amazon los resultados de la formación.

3 SageMaker comprime y escribe el artefacto final del modelo en un TAR archivo ()tar.gz. El tiempo de compresión y carga se incluye en el tiempo facturable. Para obtener más información, consulta Cómo SageMaker procesa Amazon los resultados de la formación.

4 Sincronice con Amazon S3 durante el entrenamiento. Escribe tal cual sin comprimirlo en TAR archivos. Para obtener más información, consulta Cómo usar puntos de control en Amazon SageMaker.