AI21 LabsJurassic-2modèles - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

AI21 LabsJurassic-2modèles

Cette section fournit des paramètres d'inférence et un exemple de code pour l'utilisation de AI21 Labs AI21 Labs Jurassic-2 modèles.

Paramètres d’inférence

Les AI21 Labs Jurassic-2 modèles prennent en charge les paramètres d'inférence suivants.

Caractère aléatoire et diversité

Les AI21 Labs Jurassic-2 modèles prennent en charge les paramètres suivants pour contrôler le caractère aléatoire et la diversité de la réponse.

  • Température (temperature) : utilisez une valeur inférieure pour réduire le caractère aléatoire de la réponse.

  • Top P (topP) : utilisez une valeur inférieure pour ignorer les options les moins probables.

Longueur

Les AI21 Labs Jurassic-2 modèles prennent en charge les paramètres suivants pour contrôler la durée de la réponse générée.

  • Longueur maximale de complétion (maxTokens) : spécifiez le nombre maximum de jetons à utiliser dans la réponse générée.

  • Séquences d’arrêt (stopSequences) : configurez les séquences d’arrêt que le modèle reconnaît et après lesquelles il arrêtera de générer d’autres jetons. Appuyez sur la touche Entrée pour insérer un caractère de nouvelle ligne dans une séquence d’arrêt. Utilisez la touche de tabulation pour terminer l’insertion d’une séquence d’arrêt.

Répétitions

Les AI21 Labs Jurassic-2 modèles prennent en charge les paramètres suivants pour contrôler la répétition de la réponse générée.

  • Pénalité de présence (presencePenalty) : utilisez une valeur élevée pour réduire la probabilité de la génération de nouveaux jetons qui apparaissent déjà au moins une fois dans l’invite ou dans la complétion.

  • Pénalité de décompte (countPenalty) : utilisez une valeur élevée pour réduire la probabilité de la génération de nouveaux jetons qui apparaissent déjà au moins une fois dans l’invite ou dans la complétion. Proportionnelle au nombre d’apparitions.

  • Pénalité de fréquence (frequencyPenalty) : utilisez une valeur élevée pour réduire la probabilité de la génération de nouveaux jetons qui apparaissent déjà au moins une fois dans l’invite ou dans la complétion. Cette valeur est proportionnelle à la fréquence d’apparition des jetons (normalisée en fonction de la longueur du texte).

  • Pénaliser les jetons spéciaux : réduisez la probabilité de la répétition de caractères spéciaux. Les valeurs par défaut sont true.

    • Espaces blancs (applyToWhitespaces) : une valeur true applique la pénalité aux espaces blancs et aux nouvelles lignes.

    • Ponctuation (applyToPunctuation) : une valeur true applique la pénalité à la ponctuation.

    • Nombres (applyToNumbers) : une valeur true applique la pénalité aux nombres.

    • Mots vides (applyToStopwords) : une valeur true applique la pénalité aux mots vides.

    • Emojis (applyToEmojis) : une valeur true exclut les emojis de la pénalité.

Champ body de la demande d’invocation du modèle

Lorsque vous effectuez un InvokeModelWithResponseStreamappel InvokeModelou à l'aide d'un AI21 Labs modèle, remplissez le body champ avec un objet JSON conforme à celui ci-dessous. Entrez l'invite dans le champ prompt.

{ "prompt": string, "temperature": float, "topP": float, "maxTokens": int, "stopSequences": [string], "countPenalty": { "scale": float }, "presencePenalty": { "scale": float }, "frequencyPenalty": { "scale": float } }

Pour pénaliser des jetons spéciaux, ajoutez ces champs à n’importe quel objet de pénalité. Par exemple, vous pouvez modifier le champ countPenalty comme suit.

"countPenalty": { "scale": float, "applyToWhitespaces": boolean, "applyToPunctuations": boolean, "applyToNumbers": boolean, "applyToStopwords": boolean, "applyToEmojis": boolean }

Le tableau suivant indique les valeurs minimales, maximales et par défaut des paramètres numériques.

Catégorie Paramètre Format d'objet JSON Minimum Maximum Par défaut
Caractère aléatoire et diversité Température temperature 0 1 0.5
Top P topP 0 1 0.5
Longueur Nombre maximum de jetons (modèles moyens, ultra et grands) maxTokens 0 8 191 200
Nombre maximum de jetons (autres modèles) 0 2 048 200
Répétitions Pénalité de présence presencePenalty 0 5 0
Pénalité de décompte countPenalty 0 1 0
Pénalité de fréquence frequencyPenalty 0 500 0

Champ body de la réponse à l’invocation du modèle

Pour plus d’informations sur le format du champ body dans la réponse, consultez https://docs.ai21.com/reference/j2-complete-ref.

Note

Amazon Bedrock renvoie l'identifiant de réponse (id) sous forme de valeur entière.

Exemple de code

Cet exemple montre comment appeler le AI21 Labs Jurassic-2 Mid modèle A2I.

import boto3 import json brt = boto3.client(service_name='bedrock-runtime') body = json.dumps({ "prompt": "Translate to spanish: 'Amazon Bedrock is the easiest way to build and scale generative AI applications with base models (FMs)'.", "maxTokens": 200, "temperature": 0.5, "topP": 0.5 }) modelId = 'ai21.j2-mid-v1' accept = 'application/json' contentType = 'application/json' response = brt.invoke_model( body=body, modelId=modelId, accept=accept, contentType=contentType ) response_body = json.loads(response.get('body').read()) # text print(response_body.get('completions')[0].get('data').get('text'))