Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Évaluez les performances des modèles dans Amazon Bedrock
Utilisez les évaluations de modèles pour évaluer les performances et l'efficacité des modèles Amazon Bedrock. Vous pouvez créer des tâches de modélisation automatiques pour afficher les indicateurs de performance tels que la robustesse sémantique d'un modèle. Vous pouvez également faire appel à une équipe de travailleurs humains pour évaluer et apporter leur contribution à l'évaluation.
Les évaluations automatiques produisent des scores et des indicateurs calculés qui vous aident à évaluer l'efficacité d'un modèle. Les évaluations basées sur l'humain font appel à une équipe de personnes qui fournissent leurs notes et leurs préférences par rapport à certains indicateurs.
Pour créer une tâche d'évaluation de modèle, vous devez avoir accès à au moins un modèle Amazon Bedrock. Les tâches d'évaluation de modèles prennent en charge l'utilisation de modèles de base, de modèles de base personnalisés et de modèles pour lesquels vous avez acheté Provisioned Throughput.