Erstellen Sie ein Anwendungs-Inferenzprofil

Sie können ein Anwendungs-Inferenzprofil mit einer oder mehreren Regionen erstellen, um Nutzung und Kosten beim Aufrufen eines Modells nachzuverfolgen.

Um ein Anwendungs-Inferenzprofil für eine Region zu erstellen, geben Sie ein Basismodell an. Nutzung und Kosten für Anfragen, die mit diesem Modell an diese Region gestellt werden, werden nachverfolgt.
Um ein Anwendungs-Inferenzprofil für mehrere Regionen zu erstellen, geben Sie ein regionsübergreifendes (systemdefiniertes) Inferenzprofil an. Das Inferenzprofil leitet Anfragen an die Regionen weiter, die in dem von Ihnen ausgewählten regionsübergreifenden (systemdefinierten) Inferenzprofil definiert sind. Nutzung und Kosten für Anfragen an die Regionen im Inferenzprofil werden nachverfolgt.

Derzeit können Sie nur mit der Amazon Bedrock API ein Inferenzprofil erstellen.

Um ein Inferenzprofil zu erstellen, senden Sie eine CreateInferenceProfileAnfrage mit einem Endpunkt der Amazon Bedrock-Steuerebene.

Die folgenden Felder sind erforderlich:

Feld	Anwendungsfall
inferenceProfileName	Um einen Namen für das Inferenzprofil anzugeben.
ModelSource	Um das Basismodell oder das regionsübergreifende (systemdefinierte) Inferenzprofil anzugeben, das das Modell und die Regionen definiert, für die Sie Kosten und Nutzung verfolgen möchten.

Die folgenden Felder sind optional:

Feld	Anwendungsfall
description	Um eine Beschreibung für das Inferenzprofil bereitzustellen.
tags	Um Tags an das Inferenzprofil anzuhängen. Weitere Informationen finden Sie unter Taggen von Amazon Bedrock-Ressourcen und Organisieren und Verfolgen von Kosten mithilfe von AWS Kostenzuordnungs-Tags.
clientRequestToken	Um sicherzustellen, dass die API-Anfrage nur einmal abgeschlossen wird. Weitere Informationen finden Sie unter Sicherstellung der Idempotenz.

Die Antwort gibt ein zurückinferenceProfileArn, das in anderen Aktionen im Zusammenhang mit Inferenzprofilen verwendet werden kann und das mit Modellaufrufen und Amazon Bedrock-Ressourcen verwendet werden kann.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Voraussetzungen

Ändern Sie die Tags für ein Anwendungs-Inferenzprofil