Validación de datos - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Validación de datos

Antes de crear el modelo, SageMaker Canvas comprueba el conjunto de datos en busca de problemas que puedan provocar un error en la compilación. Si SageMaker Canvas encuentra algún problema, te avisará en la página de compilación antes de que intentes crear un modelo.

Puede elegir Validar datos para ver una lista de los problemas de su conjunto de datos. Luego, puede usar las funciones de preparación de datos de SageMaker Canvas Data Wrangler, o sus propias herramientas, para corregir su conjunto de datos antes de comenzar una compilación. Si no soluciona los problemas del conjunto de datos, la compilación fallará.

Si realiza cambios en su conjunto de datos para solucionar los problemas, tendrá la opción de volver a validarlo antes de intentar compilarlo. Se recomienda volver a validar el conjunto de datos antes de compilarlo.

La siguiente tabla muestra los problemas que SageMaker Canvas comprueba en tu conjunto de datos y cómo resolverlos.

Problema Resolución

El tipo de modelo de sus datos es incorrecto

Pruebe con otro tipo de modelo o utilice un conjunto de datos diferente.

Faltan valores en la columna de destino

Reemplace los valores faltantes, elimine filas con valores faltantes o use un conjunto de datos diferente.

Hay demasiadas etiquetas únicas en la columna de destino

Compruebe que ha utilizado la columna correcta para la columna de destino o utilice un conjunto de datos diferente.

Hay demasiados valores no numéricos en la columna de destino

Elija una columna de destino diferente, seleccione otro tipo de modelo o utilice un conjunto de datos diferente.

Los nombres de una o más columnas contienen guiones bajos dobles

Cambie el nombre de las columnas para eliminar los guiones bajos dobles e inténtelo de nuevo.

Ninguna de las filas del conjunto de datos está completa

Reemplace los valores faltantes o use un conjunto de datos diferente.

Demasiadas etiquetas únicas para el número de filas de los datos

Compruebe que esté usando la columna de destino correcta, aumente el número de filas de su conjunto de datos, consolide etiquetas similares o use un conjunto de datos diferente.