Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Automatización de la configuración de datos para los trabajos de etiquetado
Puede utilizar la configuración de datos automatizada para crear archivos de manifiesto para sus trabajos de etiquetado en la consola de Ground Truth con imágenes, vídeos, fotogramas de vídeo, archivos de texto (.txt) y archivos de valores separados por comas (.csv) almacenados en Amazon S3. Cuando utiliza la configuración de datos automatizada, especifica una ubicación de Amazon S3 en la que se almacenan los datos de entrada y el tipo de datos de entrada, y Ground Truth busca los archivos que coincidan con ese tipo en la ubicación que especifique.
nota
Ground Truth no utiliza una AWS KMS clave para acceder a los datos de entrada ni para escribir el archivo de manifiesto de entrada en la ubicación de Amazon S3 que especifique. El usuario o rol que crea el trabajo de etiquetado debe tener permisos para acceder a los objetos de datos de entrada en Amazon S3.
Antes de utilizar el siguiente procedimiento, asegúrese de que las imágenes o los archivos de entrada tengan el formato correcto:
-
Archivos de imagen: los archivos de imagen deben ajustarse a los límites de tamaño y resolución que se indican en las tablas que se encuentran en Cuota de tamaño de archivo de entrada.
-
Archivos de texto: los datos de texto se pueden almacenar en uno o más archivos .txt. Cada elemento que desee etiquetar debe estar separado por un salto de línea estándar.
-
Archivos CSV: los datos de texto se pueden almacenar en uno o más archivos .csv. Cada elemento que desee etiquetar debe estar en una fila separada.
-
Vídeos: los archivos de vídeo pueden tener cualquiera de los siguientes formatos: .mp4, .ogg y .webm. Si desea extraer fotogramas de vídeo de sus archivos de vídeo para detectar o rastrear objetos, consulte Proporcione archivos de vídeo.
-
Fotogramas de vídeo: los fotogramas de vídeo son imágenes extraídas de un vídeo. Todas las imágenes extraídas de un único vídeo se denominan secuencia de fotogramas de vídeo. Cada secuencia de fotogramas de vídeo debe tener claves de prefijo únicas en Amazon S3. Consulte Proporcione fotogramas de vídeo. Para este tipo de datos, consulte Configuración automatizada de datos de entrada de fotogramas de vídeo
importante
Para trabajos de etiquetado con detección de objetos en fotogramas de vídeo y seguimiento de objetos en fotogramas de vídeo, consulte Configuración automatizada de datos de entrada de fotogramas de vídeo para aprender a utilizar la configuración de datos automatizada.
Siga estas instrucciones para configurar automáticamente la conexión del conjunto de datos de entrada con Ground Truth.
Conecte automáticamente los datos en Amazon S3 con Ground Truth
-
Diríjase a la página Crear trabajo de etiquetado en la consola de Amazon SageMaker AI en https://console.aws.amazon.com/sagemaker/
. Este enlace lo ubica en la región de Virginia del Norte ( AWS us-east-1). Si los datos de entrada se encuentran en un bucket de Amazon S3 de otra región, cámbiese a esa región. Para cambiar su AWS región, en la barra de navegación, elija el nombre de la región que se muestra actualmente.
-
Seleccione Crear trabajo de etiquetado.
-
Ingrese un Job name (Nombre de trabajo).
-
En la sección Configuración de datos de entrada, seleccione Configuración de datos automatizada.
-
Introduzca un URI de Amazon S3 en la Ubicación de S3 para los conjuntos de datos de entrada.
-
Especifique su Ubicación de S3 para los conjuntos de datos de salida. Aquí es donde se almacenarán los datos de salida.
-
Elija el Tipo de datos en la lista desplegable.
-
Utilice el menú desplegable Rol de IAM para seleccionar un rol de ejecución. Si selecciona Crear un rol nuevo, especifique los buckets de Amazon S3 a los que quiere conceder permiso de acceso a este rol. Este rol debe tener permiso para acceder a los buckets de S3 que especificó en los pasos 5 y 6.
-
Seleccione Configuración de datos completa.
Se crea un manifiesto de entrada en la ubicación de Amazon S3 para los conjuntos de datos de entrada que especificó en el paso 5. Si va a crear un trabajo de etiquetado mediante la SageMaker API o un AWS SDK AWS CLI, utilice el URI de Amazon S3 para este archivo de manifiesto de entrada como entrada al parámetroManifestS3Uri
.
El siguiente GIF muestra cómo utilizar la configuración de datos automatizada para los datos de imagen. Con este ejemplo, se crea un archivo, dataset-
en el bucket de Amazon S3 YYMMDDTHHMMSS
.manifestexample-groundtruth-images
, donde
indica el año (YYMMDDTHHmmSS
YY
), el mes (MM
), el día (DD
) y la hora en horas (HH
), minutos (mm
) y segundos (ss
) en que se creó el archivo de manifiesto de entrada.
