SageMaker les variables d'environnement et les chemins par défaut pour les emplacements de stockage des formations - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

SageMaker les variables d'environnement et les chemins par défaut pour les emplacements de stockage des formations

Le tableau suivant récapitule les chemins d'entrée et de sortie pour les ensembles de données d'entraînement, les points de contrôle, les artefacts du modèle et les sorties, gérés par la SageMaker plateforme de formation.

Parcours local dans l'instance SageMaker de formation SageMaker variable d'environnement Objectif Lire à partir de S3 pendant le démarrage Lecture à partir de S3 lors d'un redémarrage ponctuel Écrit sur S3 pendant l'entraînement Écriture sur S3 lorsque la tâche est terminée

/opt/ml/input/data/channel_name1

SM__ CHANNELCHANNEL_NAME

Lecture des données d'entraînement à partir des canaux d'entrée spécifiés par le biais de la classe SageMaker Python SDK Estimator ou de l'CreateTrainingJobAPIopération. Pour plus d'informations sur la façon de le spécifier dans votre script d'entraînement à l'aide de SageMaker PythonSDK, voir Préparer un script d'entraînement.

Oui Oui Non Non

/opt/ml/output/data2

SM__ OUTPUT DIR

Sauvegarde des sorties telles que la perte, la précision, les couches intermédiaires, les poids, les dégradés, le biais et les sorties TensorBoard compatibles. Vous pouvez également enregistrer n'importe quelle sortie arbitraire en utilisant ce chemin. Notez qu'il s'agit d'un chemin différent de celui utilisé pour stocker l'artefact du modèle final /opt/ml/model/.

Non Non Non Oui

/opt/ml/model3

SM__ MODEL DIR

Stockage de l'artefact du modèle final. C'est également le chemin à partir duquel l'artefact du modèle est déployé pour une inférence en temps réel dans SageMaker Hosting.

Non Non Non Oui

/opt/ml/checkpoints4

-

Enregistrement des points de contrôle du modèle (l'état du modèle) pour reprendre l'entraînement à partir d'un certain point et récupérer après un événement imprévu ou des interruptions d'Entraînement ponctuel géré.

Oui Oui Oui Non

/opt/ml/code

SAGEMAKER_SUBMIT_DIRECTORY

Copie de scripts d'entraînement, de bibliothèques supplémentaires et de dépendances.

Oui Oui Non Non

/tmp

-

Lecture ou écriture dans /tmp comme espace auxiliaire.

Non Non Non Non

1 channel_name permet de spécifier les noms de canal définis par l'utilisateur pour les entrées de données d'entraînement. Chaque tâche d'entraînement peut contenir plusieurs canaux d'entrée de données. Vous pouvez spécifier jusqu'à 20 canaux d'entrée par tâche d'entaînement. Notez que le temps de téléchargement des données à partir des canaux de données est compté dans le temps facturable. Pour plus d'informations sur les chemins de saisie des données, consultez Comment Amazon SageMaker fournit des informations de formation. En outre, trois types de modes de saisie de données sont pris SageMaker en charge : le mode fichier et le mode tube. FastFile Pour en savoir plus sur les modes de saisie de données utilisés pour l'entraînement SageMaker, consultez la section Accès aux données d'entraînement.

2 SageMaker compresse et écrit les artefacts d'entraînement dans TAR des fichiers (tar.gz). Le temps de compression et de téléchargement est compté dans le temps facturable. Pour plus d'informations, consultez Comment Amazon SageMaker traite les résultats de formation.

3 SageMaker compresse et écrit l'artefact du modèle final dans un TAR fichier (tar.gz). Le temps de compression et de téléchargement est compté dans le temps facturable. Pour plus d'informations, consultez Comment Amazon SageMaker traite les résultats de formation.

4 Synchronisation avec Amazon S3 pendant l'entraînement. Écrivez tel quel sans compresser dans TAR des fichiers. Pour plus d'informations, consultez Utiliser les points de contrôle sur Amazon SageMaker.