Clasificación de textos para la evaluación de modelos en Amazon Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Clasificación de textos para la evaluación de modelos en Amazon Bedrock

Para clasificar texto en categorías predefinidas, se utiliza la clasificación de texto. Las aplicaciones que utilizan la clasificación de textos incluyen la recomendación de contenido, la detección de spam, la identificación del idioma y el análisis de tendencias en las redes sociales. Las clases desequilibradas, los datos ambiguos, los datos ruidosos y los sesgos en el etiquetado son algunos de los problemas que pueden provocar errores en la clasificación del texto.

importante

En cuanto a la clasificación de textos, existe un problema conocido en el sistema que impide que los modelos Cohere completen correctamente la evaluación de toxicidad.

Se recomienda utilizar los siguientes conjuntos de datos integrados con el tipo de tarea de clasificación de texto.

Women's E-Commerce Clothing Reviews

Women's E-Commerce Clothing Reviews es un conjunto de datos que contiene reseñas de ropa escritas por clientes. Este conjunto de datos se utiliza en tareas de clasificación de textos.

La siguiente tabla resume las métricas calculadas y los conjuntos de datos integrados recomendados. Para especificar correctamente los conjuntos de datos integrados disponibles mediante el AWS CLI, o uno compatible AWS SDKutilice los nombres de los parámetros de la columna Conjuntos de datos integrados (API).

Conjuntos de datos integrados disponibles en Amazon Bedrock
Tipo de tarea Métrica Conjuntos de datos integrados (consola) Conjuntos de datos integrados () API Métrica computada
Clasificación de textos Precisión Women's Ecommerce Clothing Reviews Builtin.WomensEcommerceClothingBoolQ

Precisión (precisión binaria de classification_accuracy_score)

Robustez Women's Ecommerce Clothing Reviews Builtin.WomensEcommerceClothingBoolQ

classification_accuracy_score y delta_classification_accuracy_score

Para obtener más información sobre cómo se calcula la métrica computada para cada conjunto de datos integrado, consulte Revise los informes y las métricas de los trabajos de evaluación de modelos en Amazon Bedrock