SageMaker les variables d'environnement et les chemins par défaut pour les emplacements de stockage des formations

Le tableau suivant récapitule les chemins d'entrée et de sortie pour les ensembles de données d'entraînement, les points de contrôle, les artefacts du modèle et les sorties, gérés par la SageMaker plateforme de formation.

Parcours local dans l'instance SageMaker de formation	SageMaker variable d'environnement	Objectif	Lire à partir de S3 pendant le démarrage	Lecture à partir de S3 lors d'un redémarrage ponctuel	Écrit sur S3 pendant l'entraînement	Écriture sur S3 lorsque la tâche est terminée
`/opt/ml/input/data/channel_name`¹	SM__ CHANNEL`CHANNEL_NAME`	Lecture des données d'entraînement à partir des canaux d'entrée spécifiés par le biais de la classe SageMaker Python SDK Estimator ou de l'CreateTrainingJobAPIopération. Pour plus d'informations sur la façon de le spécifier dans votre script d'entraînement à l'aide de SageMaker PythonSDK, voir Préparer un script d'entraînement.	Oui	Oui	Non	Non
`/opt/ml/output/data`²	SM__ OUTPUT DIR	Sauvegarde des sorties telles que la perte, la précision, les couches intermédiaires, les poids, les dégradés, le biais et les sorties TensorBoard compatibles. Vous pouvez également enregistrer n'importe quelle sortie arbitraire en utilisant ce chemin. Notez qu'il s'agit d'un chemin différent de celui utilisé pour stocker l'artefact du modèle final `/opt/ml/model/`.	Non	Non	Non	Oui
`/opt/ml/model`³	SM__ MODEL DIR	Stockage de l'artefact du modèle final. C'est également le chemin à partir duquel l'artefact du modèle est déployé pour une inférence en temps réel dans SageMaker Hosting.	Non	Non	Non	Oui
`/opt/ml/checkpoints`⁴	-	Enregistrement des points de contrôle du modèle (l'état du modèle) pour reprendre l'entraînement à partir d'un certain point et récupérer après un événement imprévu ou des interruptions d'Entraînement ponctuel géré.	Oui	Oui	Oui	Non
`/opt/ml/code`	SAGEMAKER_SUBMIT_DIRECTORY	Copie de scripts d'entraînement, de bibliothèques supplémentaires et de dépendances.	Oui	Oui	Non	Non
`/tmp`	-	Lecture ou écriture dans `/tmp` comme espace auxiliaire.	Non	Non	Non	Non

¹ channel_name permet de spécifier les noms de canal définis par l'utilisateur pour les entrées de données d'entraînement. Chaque tâche d'entraînement peut contenir plusieurs canaux d'entrée de données. Vous pouvez spécifier jusqu'à 20 canaux d'entrée par tâche d'entaînement. Notez que le temps de téléchargement des données à partir des canaux de données est compté dans le temps facturable. Pour plus d'informations sur les chemins de saisie des données, consultez Comment Amazon SageMaker fournit des informations de formation. En outre, trois types de modes de saisie de données sont pris SageMaker en charge : le mode fichier et le mode tube. FastFile Pour en savoir plus sur les modes de saisie de données utilisés pour l'entraînement SageMaker, consultez la section Accès aux données d'entraînement.

² SageMaker compresse et écrit les artefacts d'entraînement dans TAR des fichiers (tar.gz). Le temps de compression et de téléchargement est compté dans le temps facturable. Pour plus d'informations, consultez Comment Amazon SageMaker traite les résultats de formation.

³ SageMaker compresse et écrit l'artefact du modèle final dans un TAR fichier (tar.gz). Le temps de compression et de téléchargement est compté dans le temps facturable. Pour plus d'informations, consultez Comment Amazon SageMaker traite les résultats de formation.

⁴ Synchronisation avec Amazon S3 pendant l'entraînement. Écrivez tel quel sans compresser dans TAR des fichiers. Pour plus d'informations, consultez Utiliser les points de contrôle sur Amazon SageMaker.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Gestion des chemins de stockage pour différents types de stockage local d'instance

Clusters hétérogènes