Présentation des entités - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Présentation des entités

Amazon crée SageMaker automatiquement des entités de suivi pour les SageMaker tâches, les modèles, les packages de modèles et les points de terminaison si les données sont disponibles. Pour un flux de travail de base, supposons que vous entraîniez un modèle à l'aide d'un jeu de données. SageMaker génère automatiquement un graphe de lignage avec trois entités :

  • Ensemble de données : type d'artefact, qui est une entité représentant un objet ou des données URI adressables. Un artefact est généralement une entrée ou une sortie d'un composant d'essai ou d'une action.

  • TrainingJob: Type de composant d'essai, qui est une entité représentant le traitement, la formation et la transformation des tâches.

  • Model (Modèle) : autre type d'artefact. Tout comme l'artefact Dataset, un modèle est un objet URI adressable. Dans ce cas, il s'agit d'une sortie du composant TrainingJobd'essai.

Le graphe de lignage de votre modèle s'étend rapidement si vous ajoutez des étapes supplémentaires à votre flux de travail, telles que le prétraitement ou le post-traitement des données, si vous déployez votre modèle sur un point de terminaison ou si vous incluez votre modèle dans un package de modèles, entre autres possibilités. Pour la liste complète des SageMaker entités, voirSuivi du lignage Amazon SageMaker ML.

Propriétés de l'entité

Chaque nœud du graphique affiche le type d'entité, mais vous pouvez sélectionner les points de suspension verticaux situés à droite du type d'entité pour afficher des détails spécifiques liés à votre flux de travail. Dans notre précédent graphique de lignage simplifié, vous pouvez choisir les points de suspension verticaux DataSetà côté pour voir les valeurs spécifiques des propriétés suivantes (communes à toutes les entités d'artefacts) :

  • Name (Nom) : nom de votre jeu de données.

  • Source URI : emplacement de votre ensemble de données sur Amazon S3.

Pour l'entité TrainingJob, vous pouvez voir les valeurs spécifiques des propriétés suivantes (communes à toutes les entités TrialComponent) :

  • Name (Nom) : nom de la tâche d'entraînement.

  • Job ARN : le nom de la ressource Amazon (ARN) de votre poste de formation.

Pour l'entité Model, vous voyez les mêmes propriétés que celles répertoriées, DataSetcar il s'agit toutes deux d'entités d'artefact. Pour obtenir la liste des entités et de leurs propriétés associées, veuillez consulter Entités de suivi de lignée.

Requêtes d'entités

Amazon génère SageMaker automatiquement des graphiques des entités de lignage lorsque vous les utilisez. Toutefois, si vous effectuez de nombreuses itérations d'une expérience et que vous ne souhaitez pas afficher tous les graphes de lignage, cela AWS SDK peut vous aider à effectuer des requêtes dans tous vos flux de travail. Par exemple, vous pouvez interroger vos entités de lignée pour toutes les tâches de traitement qui utilisent un point de terminaison. Vous pouvez également voir tous les journaux de suivi en aval qui utilisent un artefact. Pour obtenir la liste de toutes les requêtes que vous pouvez exécuter, veuillez consulter Interrogation d'entités de lignée.