Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Prueba de los datos de entrenamiento

Modo de enfoque
Prueba de los datos de entrenamiento - Amazon Comprehend

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Tras entrenar el modelo, Amazon Comprehend prueba el modelo de clasificador personalizado. Si no proporciona un conjunto de datos de prueba, Amazon Comprehend entrena el modelo con el 90 % de los datos de entrenamiento. Reserva el 10 % de los datos de entrenamiento para usarlos en las pruebas. Si proporciona un conjunto de datos de prueba, los datos de la prueba deben incluir; al menos, un ejemplo para cada etiqueta única del conjunto de datos de entrenamiento.

Probar el modelo le proporciona métricas que puede usar para estimar la precisión del modelo. La consola muestra las métricas en la sección Rendimiento del clasificador de la página Detalles del clasificador de la consola. También se devuelven en los Metrics campos devueltos por la DescribeDocumentClassifieroperación.

En el siguiente ejemplo de datos de entrenamiento, hay cinco etiquetas: DOCUMENTAL, DOCUMENTAL, CIENCIA_FICCIÓN, DOCUMENTAL y COMEDIA_ROMÁNTICA. Hay tres clases únicas: DOCUMENTAL, CIENCIA_FICCIÓN y COMEDIA_ROMÁNTICA.

Columna 1 Columna 2
DOCUMENTAL texto del documento 1
DOCUMENTAL texto del documento 2
CIENCIA_FICCIÓN texto del documento 3
DOCUMENTAL texto del documento 4
COMEDIA_ROMÁNTICA texto del documento 5

En el caso de la división automática (en la que Amazon Comprehend reserva el 10 % de los datos de entrenamiento para utilizarlos en las pruebas), si los datos de entrenamiento contienen ejemplos limitados de una etiqueta específica, es posible que el conjunto de datos de prueba no contenga ningún ejemplo de esa etiqueta. Por ejemplo, si el conjunto de datos de entrenamiento contiene 1000 instancias de la clase DOCUMENTAL, 900 instancias de CIENCIA_FICCIÓN y una sola instancia de la clase COMEDIA_ROMÁNTICA, el conjunto de datos de prueba puede contener 100 instancias de DOCUMENTAL y 90 de CIENCIA_FICCIÓN, pero no instancias de COMEDIA_ROMÁNTICA, ya que hay un solo ejemplo disponible.

Al terminar de entrenar su modelo, las métricas de entrenamiento le proporcionarán información que podrá usar para decidir si el modelo es lo suficientemente preciso para sus necesidades.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.