Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Unterstützte Regionen und Modelle für Inferenzprofile
Eine Liste der in Amazon Bedrock unterstützten Regionscodes und Endpunkte finden Sie unter Endpunkte und Kontingente von Amazon Bedrock. In diesem Thema werden vordefinierte Inferenzprofile beschrieben, die Sie verwenden können, sowie die Regionen und Modelle, die Anwendungsinferenzprofile unterstützen.
Themen
Unterstützte regionsübergreifende Inferenzprofile
Sie können eine regionsübergreifende Inferenz mit regionsübergreifenden (systemdefinierten) Inferenzprofilen durchführen. Mit regionsübergreifender Inferenz können Sie ungeplante Datenverkehrsspitzen nahtlos verwalten, indem Sie Rechenleistung auf verschiedene Arten nutzen. AWS-Regionen Mit regionsübergreifender Inferenz können Sie den Datenverkehr auf mehrere AWS-Regionen verteilen.
Regionenübergreifende (systemdefinierte) Inferenzprofile werden nach dem Modell benannt, das sie unterstützen, und durch die Regionen definiert, die sie unterstützen. Um zu verstehen, wie ein regionenübergreifendes Inferenzprofil Ihre Anforderungen verarbeitet, lesen Sie die folgenden Definitionen:
-
Quellregion – Die Region, aus der Sie die API-Anfrage stellen, die das Inferenzprofil spezifiziert.
-
Zielregion – Eine Region, an die der Amazon-Bedrock-Service die Anforderung aus der Quellregion weiterleiten kann.
Wenn Sie ein regionenübergreifendes Inferenzprofil in Amazon Bedrock aufrufen, stammt Ihre Anforderung aus einer Quellregion und wird automatisch an eine der in diesem Profil definierten Zielregionen weitergeleitet, wodurch die Leistung optimiert wird. Die Zielregionen für globale regionenübergreifende Inferenzprofile umfassen alle kommerziellen Regionen.
Anmerkung
Die Zielregionen in einem regionsübergreifenden Inferenzprofil können Opt-in-Regionen enthalten. Dabei handelt es sich um Regionen, die Sie auf oder Organisationsebene explizit aktivieren müssen. AWS-Konto Weitere Informationen finden Sie unter AWS-Regionen In Ihrem Konto aktivieren oder deaktivieren. Bei Verwendung eines regionsübergreifenden Inferenzprofils kann Ihre Inferenzanforderung an eine der Zielregionen im Profil weitergeleitet werden, auch wenn Sie sich in Ihrem Konto nicht für solche Regionen angemeldet haben.
Die Richtlinien zur Servicesteuerung AWS Identity and Access Management (SCPs) und (IAM) steuern zusammen, wo regionsübergreifende Inferenzen zulässig sind. Mithilfe können Sie steuern SCPs, welche Regionen Amazon Bedrock für Inferenzen verwenden kann, und mithilfe von IAM-Richtlinien können Sie definieren, welche Benutzer oder Rollen berechtigt sind, Inferenzen auszuführen. Wenn eine Zielregion in einem regionsübergreifenden Inferenzprofil in Ihrem blockiert ist, schlägt die Anfrage fehl SCPs, auch wenn andere Regionen weiterhin zugelassen sind. Um einen effizienten Betrieb mit regionsübergreifender Inferenz zu gewährleisten, können Sie Ihre Richtlinien SCPs und Ihre IAM-Richtlinien so aktualisieren, dass alle erforderlichen Amazon Bedrock-Inferenzaktionen (z. B. bedrock:InvokeModel* oderbedrock:CreateModelInvocationJob) in allen Zielregionen zulässig sind, die in Ihrem ausgewählten Inferenzprofil enthalten sind. Weitere Informationen finden Sie unter Aktivieren der regionsübergreifenden Amazon-Bedrock-Inferenz in Umgebungen mit mehreren Konten
Anmerkung
Einige Inferenzprofile werden an unterschiedliche Zielregionen weitergeleitet, je nachdem, aus welcher Quellregion Sie sie aufrufen. Wenn Sie beispielsweise us.anthropic.claude-3-haiku-20240307-v1:0 von USA Ost (Ohio) aus aufrufen, können Anforderungen an us-east-1, us-east-2 oder us-west-2 weitergeleitet werden. Wenn Sie den Parameter jedoch von USA West (Oregon) aus aufrufen, können Anforderungen nur an us-east-1 und us-west-2 weitergeleitet werden.
Um die Quell- und Zielregionen für ein Inferenzprofil zu überprüfen, können Sie einen der folgenden Schritte ausführen:
-
Erweitern Sie den entsprechenden Abschnitt in der Liste der unterstützten regionsübergreifenden Inferenzprofile.
-
Senden Sie eine GetInferenceProfileAnfrage mit einem Endpunkt der Amazon Bedrock-Steuerebene aus einer Quellregion und geben Sie den Amazon-Ressourcennamen (ARN) oder die ID des Inferenzprofils in das
inferenceProfileIdentifierFeld ein. DasmodelsFeld in der Antwort ist einer Modellliste zugeordnet ARNs, in der Sie jede Zielregion identifizieren können.
Anmerkung
Das globale regionsübergreifende Inferenzprofil für ein bestimmtes Modell kann sich im Laufe der Zeit ändern, da weitere kommerzielle Regionen AWS hinzugefügt werden, in denen Ihre Anfragen bearbeitet werden können. Wenn ein Inferenzprofil jedoch an eine Region gebunden ist (z. B. USA, EU oder APAC), ändert sich die Liste der Zielregionen nicht. AWS könnte neue Inferenzprofile erstellen, die neue Regionen einbeziehen. Sie können Ihre Systeme so aktualisieren, dass sie diese Inferenzprofile verwenden, indem Sie sie IDs in Ihrem Setup auf die neuen ändern.
Das globale regionenübergreifende Inferenzprofil wird derzeit nur für das Anthropic Claude Sonnet 4-Modell für die folgenden Quellregionen unterstützt: USA West (Oregon), USA Ost (Nord-Virginia), USA Ost (Ohio), Europa (Irland) und Asien-Pazifik (Tokio). Die Zielregionen für das globale Inferenzprofil umfassen alle kommerziellen AWS-Regionen.
Um zu sehen, welche Modelle Geo- und Global-Inferenzprofile unterstützen, besuchen Sie bitte Modelle auf einen Blick und wählen Sie das Modell aus, an dem Sie interessiert sind.
Unterstützte Regionen und Modelle für Anwendungsinferenzprofile
Anwendungs-Inferenzprofile können im Folgenden für alle Modelle erstellt werden: AWS-Regionen
-
ap-northeast-1
-
ap-northeast-2
-
ap-south-1
-
ap-southeast-1
-
ap-southeast-2
-
ca-central-1
-
eu-central-1
-
eu-west-1
-
eu-west-2
-
eu-west-3
-
sa-east-1
-
us-east-1
-
us-east-2
-
us-gov-east-1
-
us-west-2
Anwendungs-Inferenzprofile können aus den meisten in Amazon Bedrock unterstützten Modellen erstellt werden. Einige Modelle, wie z. B. das Einbetten von Modellen, unterstützen keine Inferenzprofile. Um zu überprüfen, ob ein bestimmtes Modell Inferenzprofile unterstützt, sehen Sie sich Modelle auf einen Blick an.