Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Introducción a las entidades
Amazon crea SageMaker automáticamente entidades de seguimiento para SageMaker trabajos, modelos, paquetes de modelos y puntos de conexión si los datos están disponibles. Para un flujo de trabajo básico, supongamos que entrenas un modelo con un conjunto de datos. SageMaker genera automáticamente un gráfico de linaje con tres entidades:
-
Conjunto de datos: tipo de artefacto, que es una entidad que representa un objeto o dato URI direccionable. Por lo general, un artefacto es una entrada o una salida de un componente o acción de prueba.
-
TrainingJob: Un tipo de componente de prueba, que es una entidad que representa los trabajos de procesamiento, formación y transformación.
-
Model: otro tipo de artefacto. Al igual que el artefacto del conjunto de datos, un modelo es un objeto URI direccionable. En este caso, es una salida del componente de TrainingJobprueba.
El gráfico de linaje del modelo se amplía rápidamente si se agregan pasos adicionales al flujo de trabajo, como el preprocesamiento o postprocesamiento de datos, si se implementa el modelo en un punto de conexión o si se incluye el modelo en un paquete de modelos, entre muchas otras posibilidades. Para ver la lista completa de SageMaker entidades, consulteSeguimiento del linaje de Amazon SageMaker ML.
Propiedades de la entidad
Cada nodo del gráfico muestra el tipo de entidad, pero puede elegir los puntos suspensivos verticales situados a la derecha del tipo de entidad para ver detalles específicos relacionados con su flujo de trabajo. En nuestro gráfico básico de linaje anterior, puedes elegir los puntos suspensivos verticales situados junto DataSeta ellos para ver los valores específicos de las siguientes propiedades (comunes a todas las entidades de artefactos):
-
Nombre: el nombre del conjunto de datos.
-
Fuente URI: la ubicación en Amazon S3 de su conjunto de datos.
Para la entidad TrainingJob
, puede ver los valores específicos de las siguientes propiedades (comunes a todas las entidades TrialComponent
):
-
Nombre: el nombre del trabajo de entrenamiento.
-
Trabajo ARN: el nombre del recurso de Amazon (ARN) de tu trabajo de formación.
En el caso de la entidad modelo, verá las mismas propiedades que aparecen en la lista, DataSetya que ambas son entidades de artefactos. Para obtener una lista de las entidades y sus propiedades asociadas, consulte Entidades de seguimiento de linaje.
Consultas de entidades
Amazon genera SageMaker automáticamente gráficos de entidades de linaje a medida que los utilizas. Sin embargo, si estás realizando muchas iteraciones de un experimento y no quieres ver todos los gráficos de linaje, esto AWS SDK puede ayudarte a realizar consultas en todos tus flujos de trabajo. Por ejemplo, puede consultar las entidades de linaje para ver todos los trabajos de procesamiento que utilizan un punto de conexión. O bien, puede ver todos los registros posteriores que utilizan un artefacto. Para obtener una lista de todas las consultas que puede realizar, consulte Consulta de entidades de linaje.