Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Incluez un garde-corps avec Converse API
Vous pouvez utiliser un garde-corps pour protéger les applications conversationnelles que vous créez avec les Converse. API Par exemple, si vous créez une application de chat avec ConverseAPI, vous pouvez utiliser un garde-fou pour bloquer le contenu inapproprié saisi par l'utilisateur et le contenu inapproprié généré par le modèle. Pour plus d'informations sur les ConverseAPI, consultezMener une conversation avec les opérations de Converse API.
Rubriques
Appelez les Converse API avec des rambardes
Pour utiliser un garde-corps, vous devez inclure les informations de configuration du garde-corps dans les appels aux Converse ou ConverseStream(pour les réponses en streaming) dans les opérations. Vous pouvez éventuellement sélectionner un contenu spécifique dans le message que vous souhaitez que le garde-corps évalue. Pour plus d'informations sur les modèles que vous pouvez utiliser avec les garde-corps et les ConverseAPI, consultez. Modèles pris en charge et caractéristiques des modèles
Rubriques
Configuration du garde-corps pour qu'il fonctionne avec Converse API
Vous spécifiez les informations de configuration du garde-corps dans le paramètre guardrailConfig
d'entrée. La configuration inclut l'ID et la version du garde-corps que vous souhaitez utiliser. Vous pouvez également activer le suivi du garde-corps, qui fournit des informations sur le contenu bloqué par le garde-corps.
Avec l'Converse
opération, guardrailConfig
c'est un GuardrailConfigurationobjet, comme indiqué dans l'exemple suivant.
{ "guardrailIdentifier": "
Guardrail ID
", "guardrailVersion": "Guardrail version
", "trace": "enabled" }
Si vous utilisezConverseStream
, vous transmettez un GuardrailStreamConfigurationobjet. Vous pouvez éventuellement utiliser le streamProcessingMode
champ pour spécifier que vous souhaitez que le modèle termine l'évaluation du garde-corps, avant de renvoyer des segments de réponse au streaming. Vous pouvez également faire en sorte que le modèle réponde de manière asynchrone pendant que le garde-corps poursuit son évaluation en arrière-plan. Pour de plus amples informations, veuillez consulter Configurer le comportement de réponse au streaming pour filtrer le contenu.
Protection d'un message pour évaluer le contenu préjudiciable en utilisant APIs
Lorsque vous transmettez un message (Message) à un modèle, le garde-corps évalue le contenu du message. Vous pouvez éventuellement protéger le contenu sélectionné dans le message en spécifiant le champ guardContent
(GuardrailConverseContentBlock). Le garde-corps évalue uniquement le contenu du guardContent
champ et non le reste du message. Cela est utile pour que le garde-corps n'évalue que le plus grand nombre de messages d'une conversation, comme le montre l'exemple suivant.
[ { "role": "user", "content": [ { "text": "Create a playlist of 2 pop songs." } ] }, { "role": "assistant", "content": [ { "text": " Sure! Here are two pop songs:\n1. \"Bad Habits\" by Ed Sheeran\n2. \"All Of The Lights\" by Kanye West\n\nWould you like to add any more songs to this playlist? " } ] }, { "role": "user", "content": [ { "guardContent": { "text": { "text": "Create a playlist of 2 heavy metal songs." } } } ] } ]
Une autre utilisation consiste à fournir un contexte supplémentaire à un message, sans que le garde-corps n'évalue ce contexte supplémentaire.
[ { "role": "user", "content": [ { "text": "Only answer with a list of songs." }, { "guardContent": { "text": { "text": "Create a playlist of heavy metal songs." } } } ] } ]
Note
L'utilisation du guardContent
champ est analogue à l'utilisation de balises de saisie avec InvokeModelet InvokeModelWithResponseStream. Pour de plus amples informations, veuillez consulter Appliquer des balises aux entrées utilisateur pour filtrer le contenu.
Protection d'une invite système envoyée à la Converse API
Vous pouvez utiliser des rambardes avec les instructions du système que vous envoyez aux Converse. API Pour protéger une invite système, spécifiez le champ guardContent
(SystemContentBlock) dans l'invite système que vous transmettez àAPI, comme indiqué dans l'exemple suivant.
[ { "guardContent": { "text": { "text": "Only respond with Welsh heavy metal songs." } } } ]
Si vous ne fournissez pas le guardContent
champ, le garde-corps n'évalue pas le message d'invite du système.
Le message et le système indiquent le comportement de la rambarde
La façon dont le garde-corps évalue le guardContent
champ se comporte différemment entre les invites du système et les messages que vous transmettez dans le message.
L'invite du système contient un bloc de garde-corps | L'invite du système ne contient pas de bloc Guardrail | |
---|---|---|
Les messages sont bloqués par Guardrail |
Système : Guardrail examine le contenu du bloc Guardrail Messages : Guardrail examine le contenu du bloc Guardrail |
Système : Guardrail n'enquête sur rien Messages : Guardrail examine le contenu du bloc Guardrail |
Les messages ne sont pas bloqués par Guardrail |
Système : Guardrail examine le contenu du bloc Guardrail Messages : Guardrail enquête sur tout |
Système : Guardrail n'enquête sur rien Messages : Guardrail enquête sur tout |
Traitement de la réponse lors de l'utilisation de la Converse API
Lorsque vous appelez l'opération Converse, le garde-corps évalue le message que vous envoyez. Si le garde-corps détecte un contenu bloqué, voici ce qui se passe.
Le
stopReason
champ de la réponse est défini surguardrail_intervened
.-
Si vous avez activé le suivi, celui-ci est disponible dans le champ
trace
(ConverseTrace). AvecConverseStream
, la trace se trouve dans les métadonnées (ConverseStreamMetadataEvent) renvoyées par l'opération. -
Le texte du contenu bloqué que vous avez configuré dans le garde-corps est renvoyé dans le champ
output
(ConverseOutput). AvecConverseStream
le contenu bloqué, le texte se trouve dans le message diffusé en continu.
La réponse partielle suivante montre le texte du contenu bloqué et la trace de l'évaluation du garde-corps. Le garde-corps a bloqué le terme « heavy metal » dans le message.
{ "output": { "message": { "role": "assistant", "content": [ { "text": "Sorry, I can't answer questions about heavy metal music." } ] } }, "stopReason": "guardrail_intervened", "usage": { "inputTokens": 0, "outputTokens": 0, "totalTokens": 0 }, "metrics": { "latencyMs": 721 }, "trace": { "guardrail": { "inputAssessment": { "3o06191495ze": { "topicPolicy": { "topics": [ { "name": "Heavy metal", "type": "DENY", "action": "BLOCKED" } ] }, "invocationMetrics": { "guardrailProcessingLatency": 240, "usage": { "topicPolicyUnits": 1, "contentPolicyUnits": 0, "wordPolicyUnits": 0, "sensitiveInformationPolicyUnits": 0, "sensitiveInformationPolicyFreeUnits": 0, "contextualGroundingPolicyUnits": 0 }, "guardrailCoverage": { "textCharacters": { "guarded": 39, "total": 72 } } } } } } } }
Exemple de code pour utiliser Converse API avec des rambardes
Cet exemple montre comment protéger une conversation à l'aide des ConverseStream
opérations Converse
et. L'exemple montre comment empêcher un mannequin de créer une liste de lecture contenant des chansons du genre heavy metal.
Pour protéger une conversation
-
Créez un garde-corps en suivant les instructions de. Créez un garde-corps À l'étape 6a, entrez les informations suivantes pour créer un sujet refusé :
-
Nom — Entrez Heavy Metal.
-
Définition du sujet — Entrez Évitez de mentionner des chansons issues du genre heavy metal.
-
Ajouter des exemples de phrases — Entrez Créez une playlist de chansons de heavy metal.
À l'étape 9, entrez les informations suivantes :
-
Message affiché pour les invites bloquées — Entrez Désolé, je ne peux pas répondre aux questions sur la musique heavy metal.
-
Messagerie pour les réponses bloquées — Entrez Désolé, le modèle a généré une réponse mentionnant la musique heavy metal.
Vous pouvez configurer d'autres options de garde-corps, mais cela n'est pas obligatoire dans cet exemple.
-
-
Créez une version du garde-corps en suivant les instructions de. Création d'une version d'un garde-corps
-
Dans les exemples de code suivants (Converse et ConverseStream), définissez les variables suivantes :
guardrail_id
— L'identifiant du garde-corps que vous avez créé à l'étape 1.guardrail_version
— La version du garde-corps que vous avez créée à l'étape 2.text
— UtilisationCreate a playlist of heavy metal songs.
-
Exécutez les exemples de code. La sortie doit afficher l'évaluation du garde-corps et le message de sortie.
Text: Sorry, I can't answer questions about heavy metal music.
L'évaluation des entrées du garde-corps montre que le modèle a détecté le terme « métal lourd » dans le message d'entrée. -
(Facultatif) Vérifiez que le garde-corps bloque le texte inapproprié généré par le modèle en modifiant la valeur de
text
pour répertorier tous les genres de musique rock. . Réexécutez les exemples. Vous devriez voir une évaluation des résultats dans la réponse.