Classification du texte pour l'évaluation des modèles dans Amazon Bedrock - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Classification du texte pour l'évaluation des modèles dans Amazon Bedrock

La classification de texte sert à classer le texte dans des catégories prédéfinies. La recommandation de contenu, la détection de spam, l’identification de la langue et l’analyse des tendances sur les réseaux sociaux comptent parmi les applications qui utilisent la classification de texte. Les classes déséquilibrées, les données ambiguës, les données bruyantes et le biais d’étiquetage sont quelques-uns des problèmes qui peuvent entraîner des erreurs dans la classification de texte.

Important

En ce qui concerne la classification du texte, il existe un problème connu du système qui empêche les modèles Cohere de mener à bien l'évaluation de la toxicité.

Avec les tâches de type classification de texte, il est recommandé d’utiliser les jeux de données intégrés suivants.

Women’s E-Commerce Clothing Reviews

Women’s E-Commerce Clothing Reviews est un jeu de données qui contient les avis de clientes sur des articles vestimentaires. Ce jeu de données est utilisé dans les tâches de classification de texte.

Le tableau suivant offre un résumé des métriques calculées et des jeux de données intégrés recommandés. Pour spécifier correctement les ensembles de données intégrés disponibles à l'aide du AWS CLI, ou un support AWS SDKutilisez les noms des paramètres dans la colonne Ensembles de données intégrés (API).

Jeux de données intégrés disponibles dans Amazon Bedrock
Type de tâche Métrique Ensembles de données intégrés (console) Ensembles de données intégrés () API Métrique calculée
Classification de texte Précision Women’s Ecommerce Clothing Reviews Builtin.WomensEcommerceClothingBoolQ

Précision (précision binaire résultant de classification_accuracy_score)

Robustesse Women’s Ecommerce Clothing Reviews Builtin.WomensEcommerceClothingBoolQ

classification_accuracy_score et delta_classification_accuracy_score

Pour en savoir plus sur le mode de calcul de la métrique pour chaque jeu de données intégré, consultez Consultez les rapports de travail et les statistiques d'évaluation des modèles dans Amazon Bedrock