Création d'un profil d'inférence d'application - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d'un profil d'inférence d'application

Vous pouvez créer un profil d'inférence d'application avec une ou plusieurs régions pour suivre l'utilisation et les coûts lorsque vous invoquez un modèle.

  • Pour créer un profil d'inférence d'application pour une région, spécifiez un modèle de base. L'utilisation et les coûts des demandes adressées à cette région à l'aide de ce modèle feront l'objet d'un suivi.

  • Pour créer un profil d'inférence d'application pour plusieurs régions, spécifiez un profil d'inférence entre régions (défini par le système). Le profil d'inférence acheminera les demandes vers les régions définies dans le profil d'inférence interrégional (défini par le système) que vous choisissez. L'utilisation et les coûts des demandes adressées aux régions dans le profil d'inférence feront l'objet d'un suivi.

Actuellement, vous ne pouvez créer un profil d'inférence qu'à l'aide d'Amazon API Bedrock.

Pour créer un profil d'inférence, envoyez une CreateInferenceProfiledemande avec un point de terminaison du plan de contrôle Amazon Bedrock.

Les champs suivants sont obligatoires :

Champ Cas d’utilisation
inferenceProfileName Pour spécifier un nom pour le profil d'inférence.
modelSource Spécifier le modèle de base ou le profil d'inférence interrégional (défini par le système) qui définit le modèle et les régions pour lesquels vous souhaitez suivre les coûts et l'utilisation.

Les champs suivants sont facultatifs :

Champ Cas d’utilisation
description Pour fournir une description du profil d'inférence.
balises Pour associer des balises au profil d'inférence. Pour plus d'informations, voir Organisation Marquer les ressources Amazon Bedrock et suivi des coûts à l'aide des balises de répartition des AWS coûts.
clientRequestToken Pour garantir que la API demande ne soit traitée qu'une seule fois. Pour plus d'informations, consultez la section Garantir l'idempuissance.

La réponse renvoie un inferenceProfileArn qui peut être utilisé dans d'autres actions liées au profil d'inférence et qui peut être utilisé avec l'invocation de modèles et les ressources Amazon Bedrock.