Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
AI21 LabsJurassic-2modèles
Cette section fournit des paramètres d'inférence et un exemple de code pour l'utilisation de AI21 Labs AI21 Labs Jurassic-2 modèles.
Paramètres d’inférence
Les AI21 Labs Jurassic-2 modèles prennent en charge les paramètres d'inférence suivants.
Rubriques
Caractère aléatoire et diversité
Les AI21 Labs Jurassic-2 modèles prennent en charge les paramètres suivants pour contrôler le caractère aléatoire et la diversité de la réponse.
-
Température (
temperature
) : utilisez une valeur inférieure pour réduire le caractère aléatoire de la réponse. -
Top P (
topP
) : utilisez une valeur inférieure pour ignorer les options les moins probables.
Longueur
Les AI21 Labs Jurassic-2 modèles prennent en charge les paramètres suivants pour contrôler la durée de la réponse générée.
-
Longueur maximale de complétion (
maxTokens
) : spécifiez le nombre maximum de jetons à utiliser dans la réponse générée. -
Séquences d’arrêt (
stopSequences
) : configurez les séquences d’arrêt que le modèle reconnaît et après lesquelles il arrêtera de générer d’autres jetons. Appuyez sur la touche Entrée pour insérer un caractère de nouvelle ligne dans une séquence d’arrêt. Utilisez la touche de tabulation pour terminer l’insertion d’une séquence d’arrêt.
Répétitions
Les AI21 Labs Jurassic-2 modèles prennent en charge les paramètres suivants pour contrôler la répétition de la réponse générée.
-
Pénalité de présence (
presencePenalty
) : utilisez une valeur élevée pour réduire la probabilité de la génération de nouveaux jetons qui apparaissent déjà au moins une fois dans l’invite ou dans la complétion. -
Pénalité de décompte (
countPenalty
) : utilisez une valeur élevée pour réduire la probabilité de la génération de nouveaux jetons qui apparaissent déjà au moins une fois dans l’invite ou dans la complétion. Proportionnelle au nombre d’apparitions. -
Pénalité de fréquence (
frequencyPenalty
) : utilisez une valeur élevée pour réduire la probabilité de la génération de nouveaux jetons qui apparaissent déjà au moins une fois dans l’invite ou dans la complétion. Cette valeur est proportionnelle à la fréquence d’apparition des jetons (normalisée en fonction de la longueur du texte). -
Pénaliser les jetons spéciaux : réduisez la probabilité de la répétition de caractères spéciaux. Les valeurs par défaut sont
true
.-
Espaces blancs (
applyToWhitespaces
) : une valeurtrue
applique la pénalité aux espaces blancs et aux nouvelles lignes. -
Ponctuation (
applyToPunctuation
) : une valeurtrue
applique la pénalité à la ponctuation. -
Nombres (
applyToNumbers
) : une valeurtrue
applique la pénalité aux nombres. -
Mots vides (
applyToStopwords
) : une valeurtrue
applique la pénalité aux mots vides. -
Emojis (
applyToEmojis
) : une valeurtrue
exclut les emojis de la pénalité.
-
Champ body de la demande d’invocation du modèle
Lorsque vous effectuez un InvokeModelWithResponseStreamappel InvokeModelou à l'aide d'un AI21 Labs modèle, remplissez le body
champ avec un objet JSON conforme à celui ci-dessous. Entrez l'invite dans le champ prompt
.
{ "prompt": string, "temperature": float, "topP": float, "maxTokens": int, "stopSequences": [string], "countPenalty": { "scale": float }, "presencePenalty": { "scale": float }, "frequencyPenalty": { "scale": float } }
Pour pénaliser des jetons spéciaux, ajoutez ces champs à n’importe quel objet de pénalité. Par exemple, vous pouvez modifier le champ countPenalty
comme suit.
"countPenalty": { "scale": float, "applyToWhitespaces": boolean, "applyToPunctuations": boolean, "applyToNumbers": boolean, "applyToStopwords": boolean, "applyToEmojis": boolean }
Le tableau suivant indique les valeurs minimales, maximales et par défaut des paramètres numériques.
Catégorie | Paramètre | Format d'objet JSON | Minimum | Maximum | Par défaut |
---|---|---|---|---|---|
Caractère aléatoire et diversité | Température | temperature | 0 | 1 | 0.5 |
Top P | topP | 0 | 1 | 0.5 | |
Longueur | Nombre maximum de jetons (modèles moyens, ultra et grands) | maxTokens | 0 | 8 191 | 200 |
Nombre maximum de jetons (autres modèles) | 0 | 2 048 | 200 | ||
Répétitions | Pénalité de présence | presencePenalty | 0 | 5 | 0 |
Pénalité de décompte | countPenalty | 0 | 1 | 0 | |
Pénalité de fréquence | frequencyPenalty | 0 | 500 | 0 |
Champ body de la réponse à l’invocation du modèle
Pour plus d’informations sur le format du champ body
dans la réponse, consultez https://docs.ai21.com/reference/j2-complete-ref
Note
Amazon Bedrock renvoie l'identifiant de réponse (id
) sous forme de valeur entière.
Exemple de code
Cet exemple montre comment appeler le AI21 Labs Jurassic-2 Mid modèle A2I.
import boto3 import json brt = boto3.client(service_name='bedrock-runtime') body = json.dumps({ "prompt": "Translate to spanish: 'Amazon Bedrock is the easiest way to build and scale generative AI applications with base models (FMs)'.", "maxTokens": 200, "temperature": 0.5, "topP": 0.5 }) modelId = 'ai21.j2-mid-v1' accept = 'application/json' contentType = 'application/json' response = brt.invoke_model( body=body, modelId=modelId, accept=accept, contentType=contentType ) response_body = json.loads(response.get('body').read()) # text print(response_body.get('completions')[0].get('data').get('text'))