Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Selección de los datos para el etiquetado

Modo de enfoque
Selección de los datos para el etiquetado - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Puede usar la consola Amazon SageMaker AI para seleccionar una parte del conjunto de datos para el etiquetado. Los datos tienen que estar almacenados en un bucket de Amazon S3. Tiene tres opciones:

  • Utilizar el conjunto de datos completo.

  • Elegir una muestra seleccionada al azar del conjunto de datos.

  • Especificar un subconjunto del conjunto de datos mediante una consulta.

Las siguientes opciones están disponibles en la sección Trabajos de etiquetado de la consola de SageMaker IA después de seleccionar Crear trabajo de etiquetado. Para obtener información sobre cómo crear un trabajo de etiquetado en la consola, consulte Introducción: creación de un trabajo de etiquetado mediante cuadros delimitadores con Ground Truth. Para configurar el conjunto de datos que utiliza para el etiquetado, en la sección Job overview (Descripción general del trabajo), elija Additional configuration (Configuración adicional).

Usar el conjunto de datos completo

Si elige Conjunto de datos completo, debe proporcionar un archivo de manifiesto para los objetos de datos. Puede proporcionar la ruta del bucket de Amazon S3 que contiene el archivo de manifiesto o utilizar la consola SageMaker AI para crear el archivo. Para obtener información sobre cómo crear un archivo de manifiesto mediante la consola, consulte Automatización de la configuración de datos para los trabajos de etiquetado.

Elegir una muestra aleatoria

Cuando desee etiquetar un subconjunto aleatorio de sus datos, seleccione Random sample (Muestra aleatoria). El conjunto de datos se almacena en el bucket de Amazon S3 especificado en el campo Ubicación del conjunto de datos de entrada.

Una vez que haya especificado el porcentaje de objetos de datos que desea incluir en la muestra, elija Crear subconjunto. SageMaker La IA selecciona aleatoriamente los objetos de datos para su trabajo de etiquetado. Una vez que haya seleccionado los objetos, elija Use this subset (Usar este subconjunto).

SageMaker La IA crea un archivo de manifiesto para los objetos de datos seleccionados. También modifica el valor en el campo Input dataset location (Ubicación del conjunto de datos de entrada) para apuntar al nuevo archivo de manifiesto.

Especificar un subconjunto

Amazon S3 Select

Amazon S3 Select ya no está disponible para los nuevos clientes. Los clientes actuales de Amazon S3 Select pueden seguir utilizando la característica de la forma habitual. Para obtener más información, consulte How to optimize querying your data in Amazon S3.

Puede especificar un subconjunto de objetos de datos mediante una consulta SELECT de Amazon S3 en los nombres de archivos de objeto.

La instrucción SELECT de la consulta SQL la define el usuario. Tiene que proporcionar la cláusula WHERE para especificar qué objetos de datos se deben devolver.

Para obtener más información acerca de la instrucción SELECT de Amazon S3, consulte Selección de contenido de los objetos.

Seleccione Create subset (Crear subconjunto) para iniciar la selección y, a continuación, elija Use this subset (Utilizar este subconjunto) para utilizar los datos seleccionados.

SageMaker AI crea un archivo de manifiesto para los objetos de datos seleccionados. También actualiza el valor en el campo Input dataset location (Ubicación del conjunto de datos de entrada) para que apunte al nuevo archivo de manifiesto.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.