Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erstellen Sie ein Anwendungs-Inferenzprofil
Sie können ein Anwendungs-Inferenzprofil mit einer oder mehreren Regionen erstellen, um Nutzung und Kosten beim Aufrufen eines Modells nachzuverfolgen.
-
Um ein Anwendungs-Inferenzprofil für eine Region zu erstellen, geben Sie ein Basismodell an. Nutzung und Kosten für Anfragen, die mit diesem Modell an diese Region gestellt werden, werden nachverfolgt.
-
Um ein Anwendungs-Inferenzprofil für mehrere Regionen zu erstellen, geben Sie ein regionsübergreifendes (systemdefiniertes) Inferenzprofil an. Das Inferenzprofil leitet Anfragen an die Regionen weiter, die in dem von Ihnen ausgewählten regionsübergreifenden (systemdefinierten) Inferenzprofil definiert sind. Nutzung und Kosten für Anfragen an die Regionen im Inferenzprofil werden nachverfolgt.
Derzeit können Sie nur mit der Amazon Bedrock API ein Inferenzprofil erstellen.
Um ein Inferenzprofil zu erstellen, senden Sie eine CreateInferenceProfileAnfrage mit einem Endpunkt der Amazon Bedrock-Steuerebene.
Die folgenden Felder sind erforderlich:
Feld | Anwendungsfall |
---|---|
inferenceProfileName | Um einen Namen für das Inferenzprofil anzugeben. |
ModelSource | Um das Basismodell oder das regionsübergreifende (systemdefinierte) Inferenzprofil anzugeben, das das Modell und die Regionen definiert, für die Sie Kosten und Nutzung verfolgen möchten. |
Die folgenden Felder sind optional:
Feld | Anwendungsfall |
---|---|
description | Um eine Beschreibung für das Inferenzprofil bereitzustellen. |
tags | Um Tags an das Inferenzprofil anzuhängen. Weitere Informationen finden Sie unter Taggen von Amazon Bedrock-Ressourcen und Organisieren und Verfolgen von Kosten mithilfe von AWS Kostenzuordnungs-Tags. |
clientRequestToken | Um sicherzustellen, dass die API-Anfrage nur einmal abgeschlossen wird. Weitere Informationen finden Sie unter Sicherstellung der Idempotenz. |
Die Antwort gibt ein zurückinferenceProfileArn
, das in anderen Aktionen im Zusammenhang mit Inferenzprofilen verwendet werden kann und das mit Modellaufrufen und Amazon Bedrock-Ressourcen verwendet werden kann.