Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
L’inférence désigne le processus de génération d’une sortie à partir d’une entrée fournie à un modèle.
Amazon Bedrock propose une suite de modèles de base que vous pouvez utiliser pour générer des résultats selon les modalités suivantes. Pour voir la modalité de soutien par modèle de fondation, reportez-vous àModèles de fondation pris en charge dans Amazon Bedrock.
Modalité de sortie | Description | Exemples de cas d’utilisation |
---|---|---|
Texte | Fournir une saisie de texte et générer différents types de texte | Chat, brainstorming question-and-answering, synthèse, génération de code, création de tableaux, formatage des données, réécriture |
Image | Fournissez du texte ou saisissez des images et générez ou modifiez des images | Génération d'images, retouche d'image, variation d'image |
Intégrations | Fournissez du texte, des images ou à la fois du texte et des images et générez un vecteur de valeurs numériques représentant l'entrée. Le vecteur de sortie peut être comparé à d'autres vecteurs d'intégration afin de déterminer la similitude sémantique (pour le texte) ou la similitude visuelle (pour les images). | Recherche de texte et d'images, requête, catégorisation, recommandations, personnalisation, création de base de connaissances |
Vous pouvez exécuter directement l'inférence de modèle de la manière suivante :
-
Dans le AWS Management Console, utilisez l'un des terrains de jeu Amazon Bedrock pour effectuer des inférences dans une interface graphique conviviale.
Utilisez la Converse ou l'ConverseStreamAPI pour implémenter des applications conversationnelles.
-
Utilisez l'InvokeModelWithResponseStreamAPI InvokeModelor pour envoyer une seule invite.
-
Préparez un jeu de données d’invites avec les configurations souhaitées et exécutez une inférence par lots avec une demande CreateModelInvocationJob.
Les fonctionnalités Amazon Bedrock suivantes utilisent également l'inférence de modèles comme étape d'un flux de travail plus vaste :
-
L'évaluation des modèles utilise le processus d'invocation des modèles pour évaluer les performances des différents modèles une fois que vous avez soumis une CreateEvaluationJobdemande.
-
Les bases de connaissances utilisent l'invocation de modèles lors de l'utilisation du RetrieveAndGenerateAPI pour générer une réponse basée sur les résultats extraits d'une base de connaissances.
-
Les agents utilisent un modèle d'invocation pour générer des réponses à différentes étapes au cours d'une InvokeAgent de la demande.
-
Les flux incluent les ressources Amazon Bedrock, telles que les invites, les bases de connaissances et les agents, qui utilisent l'invocation de modèles.
Après avoir testé différents modèles de base avec des instructions et des paramètres d'inférence différents, vous pouvez configurer votre application pour qu'elle les appelle APIs avec les spécifications souhaitées.
Rubriques
Influencez la génération de réponses à l'aide de paramètres d'inférence
Régions et modèles pris en charge pour exécuter l'inférence de modèles
Conditions préalables à l'exécution de l'inférence de modèles
Générez des réponses dans la console à l'aide des terrains de jeu
Améliorez les réponses des modèles grâce au raisonnement modélisé
Soumettre des invites et générer des réponses à l'aide de l'API
Utiliser un outil pour compléter une réponse du modèle Amazon Bedrock
Utiliser un outil informatique pour compléter une réponse du modèle Amazon Bedrock
Mise en cache rapide pour une inférence de modèle plus rapide