Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de conjuntos de datos de entrenamiento y prueba
Puede empezar con un proyecto que tenga un único conjunto de datos o un proyecto que tenga conjuntos de datos de entrenamiento y de prueba independientes. Si empieza con un único conjunto de datos, Etiquetas personalizadas de Amazon Rekognition lo divide durante el entrenamiento para crear un conjunto de datos de entrenamiento (80 %) y un conjunto de datos de prueba (20 %) para su proyecto. Comience con un único conjunto de datos si quiere que Etiquetas personalizadas de Amazon Rekognition decida dónde se utilizan las imágenes para el entrenamiento y las pruebas. Para tener un control total sobre el entrenamiento, las pruebas y el nivel de rendimiento, le recomendamos que inicie el proyecto con conjuntos de datos de entrenamiento y prueba independientes.
Puede crear conjuntos de datos de entrenamiento y prueba para un proyecto importando imágenes a través de una de las siguientes ubicaciones:
Si comienza su proyecto con conjuntos de datos de entrenamiento y prueba separados, podrá usar diferentes ubicaciones de origen para cada conjunto de datos.
Según el lugar desde el que importe las imágenes, es posible que no estén etiquetadas. Por ejemplo, las imágenes importadas de un ordenador local no están etiquetadas. Las imágenes importadas de un archivo de manifiesto de Amazon SageMaker AI Ground Truth están etiquetadas. Puede utilizar la consola de Etiquetas personalizadas de Amazon Rekognition para agregar, cambiar y asignar etiquetas. Para obtener más información, consulte Etiquetado de imágenes.
Si las imágenes se cargan con errores, faltan imágenes o faltan etiquetas en las imágenes, lea Depuración de un modelo de entrenamiento con errores.
Para obtener más información sobre los conjuntos de datos, consulte Administración de conjuntos de datos.
Crear conjuntos de datos de entrenamiento y prueba (SDK)
Puede usar el AWS SDK para crear conjuntos de datos de entrenamiento y prueba.
La operación CreateDataset
le permite especificar etiquetas de forma opcional al crear un nuevo conjunto de datos con el fin de categorizar y administrar sus recursos.
Conjunto de datos de entrenamiento
Puedes usar el AWS SDK para crear un conjunto de datos de entrenamiento de las siguientes maneras.
-
CreateDatasetUtilícelo con un archivo de manifiesto en formato Amazon Sagemaker que proporcione. Para obtener más información, consulte Creación de un archivo de manifiesto. Para ver el código de ejemplo, consulte Creación de un conjunto de datos con un archivo de manifiesto (SDK) de SageMaker AI Ground Truth.
-
Use
CreateDataset
para copiar un conjunto de datos existente de Etiquetas personalizadas de Amazon Rekognition. Para ver el código de ejemplo, consulte Creación de un conjunto de datos mediante un conjunto de datos existente (SDK). -
Cree un conjunto de datos vacío con
CreateDataset
y agregue entradas del conjunto de datos más adelante con UpdateDatasetEntries. Para crear un conjunto de datos vacío, consulte Agregar un conjunto de datos a un proyecto. Para agregar imágenes a un conjunto de datos, consulte Agregar más imágenes (SDK). Debe agregar las entradas del conjunto de datos antes de poder entrenar un modelo.
Conjunto de datos de prueba
Puede usar el AWS SDK para crear un conjunto de datos de prueba de las siguientes maneras:
-
CreateDatasetUtilícelo con un archivo de manifiesto en formato Amazon Sagemaker que proporcione. Para obtener más información, consulte Creación de un archivo de manifiesto. Para ver el código de ejemplo, consulte Creación de un conjunto de datos con un archivo de manifiesto (SDK) de SageMaker AI Ground Truth.
-
Use
CreateDataset
para copiar un conjunto de datos existente de Etiquetas personalizadas de Amazon Rekognition. Para ver el código de ejemplo, consulte Creación de un conjunto de datos mediante un conjunto de datos existente (SDK). -
Cree un conjunto de datos vacío con
CreateDataset
y agregue entradas del conjunto de datos más adelante conUpdateDatasetEntries
. Para crear un conjunto de datos vacío, consulte Agregar un conjunto de datos a un proyecto. Para agregar imágenes a un conjunto de datos, consulte Agregar más imágenes (SDK). Debe agregar las entradas del conjunto de datos antes de poder entrenar un modelo. -
Divida el conjunto de datos de entrenamiento en conjuntos de datos de entrenamiento y prueba independientes. En primer lugar, cree un conjunto de datos de prueba vacío con
CreateDataset
. A continuación, mueva el 20% de las entradas del conjunto de datos de entrenamiento al conjunto de datos de prueba mediante una llamada DistributeDatasetEntries. Para crear un conjunto de datos vacío, consulte Agregar un conjunto de datos a un proyecto (SDK). Para dividir el conjunto de datos de entrenamiento, consulte Distribución de un conjunto de datos de entrenamiento (SDK).