Création d’un profil d’inférence d’application

Vous pouvez créer un profil d’inférence d’application avec une ou plusieurs régions pour suivre l’utilisation et les coûts lorsque vous invoquez un modèle.

Pour créer un profil d’inférence d’application pour une région, spécifiez un modèle de fondation. L’utilisation et les coûts des demandes adressées à cette région à l’aide de ce modèle feront l’objet d’un suivi.
Pour créer un profil d’inférence d’application pour plusieurs régions, spécifiez un profil d’inférence inter-régions (défini par le système). Le profil d’inférence acheminera les demandes vers les régions définies dans le profil d’inférence interrégional (défini par le système) que vous choisissez. L’utilisation et les coûts des demandes adressées aux régions dans le profil d’inférence feront l’objet d’un suivi.

Vous pouvez créer un profil d'inférence d'application à l'aide de la console Amazon Bedrock ou de l'API Amazon Bedrock.

Pour créer un profil d'inférence à l'aide de l'API, envoyez une CreateInferenceProfiledemande avec un point de terminaison du plan de contrôle Amazon Bedrock.

Les champs suivants sont obligatoires :

Champ	Cas d’utilisation
inférence ProfileName	Pour spécifier un nom pour le profil d’inférence.
modelSource	Pour spécifier le modèle de fondation ou le profil d’inférence interrégional (défini par le système) qui définit le modèle et les régions pour lesquels vous souhaitez suivre les coûts et l’utilisation.

Les champs suivants sont facultatifs :

Champ	Cas d’utilisation
description	Pour fournir une description du profil d’inférence.
tags	Pour associer des balises au profil d’inférence. Pour plus d'informations, voir Organisation Balisage des ressources Amazon Bedrock et suivi des coûts à l'aide des balises de répartition des AWS coûts.
client RequestToken	Pour garantir que la demande d’API n’est exécutée qu’une seule fois. Pour plus d’informations, consultez Garantie de l’idempotence.

La réponse renvoie un inferenceProfileArn qui peut être utilisé dans d’autres actions liées au profil d’inférence et qui peut être utilisé avec l’invocation de modèles et les ressources Amazon Bedrock.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Conditions préalables

Modification des balises d’un profil d’inférence d’application