Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Clasificación de textos para la evaluación de modelos en Amazon Bedrock
Para clasificar texto en categorías predefinidas, se utiliza la clasificación de texto. Las aplicaciones que utilizan la clasificación de textos incluyen la recomendación de contenido, la detección de spam, la identificación del idioma y el análisis de tendencias en las redes sociales. Las clases desequilibradas, los datos ambiguos, los datos ruidosos y los sesgos en el etiquetado son algunos de los problemas que pueden provocar errores en la clasificación del texto.
importante
En cuanto a la clasificación de textos, existe un problema conocido en el sistema que impide que los modelos Cohere completen correctamente la evaluación de toxicidad.
Se recomienda utilizar los siguientes conjuntos de datos integrados con el tipo de tarea de clasificación de texto.
- Women's E-Commerce Clothing Reviews
-
Women's E-Commerce Clothing Reviews es un conjunto de datos que contiene reseñas de ropa escritas por clientes. Este conjunto de datos se utiliza en tareas de clasificación de textos.
La siguiente tabla resume las métricas calculadas y los conjuntos de datos integrados recomendados. Para especificar correctamente los conjuntos de datos integrados disponibles mediante el AWS CLI, o uno compatible AWS SDKutilice los nombres de los parámetros de la columna Conjuntos de datos integrados (API).
Tipo de tarea | Métrica | Conjuntos de datos integrados (consola) | Conjuntos de datos integrados () API | Métrica computada |
---|---|---|---|---|
Clasificación de textos | Precisión | Women's Ecommerce Clothing Reviews |
Builtin.WomensEcommerceClothingBoolQ |
Precisión (precisión binaria de classification_accuracy_score) |
Robustez | Women's Ecommerce Clothing Reviews |
Builtin.WomensEcommerceClothingBoolQ |
classification_accuracy_score y delta_classification_accuracy_score |
Para obtener más información sobre cómo se calcula la métrica computada para cada conjunto de datos integrado, consulte Revise los informes y las métricas de los trabajos de evaluación de modelos en Amazon Bedrock