Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Unterstützte Regionen und Modelle für Amazon Bedrock-Wissensdatenbanken
Die Wissensdatenbanken von Amazon Bedrock werden in Regionen in Amerika, Asien und Europa unterstützt. Bestimmte Modelle von Amazon, Cohere und Anthropic werden für Wissensdatenbanken unterstützt. Sie verwenden ein Modell für die Umwandlung Ihrer Daten in Vektoreinbettungen und ein Modell für den Informationsabruf und die Generierung von Antworten.
Sie müssen den Modellzugriff aktivieren, um ein Modell verwenden zu können, das für Wissensdatenbanken unterstützt wird.
Wenn Sie Amazon Bedrock verwendenAPI, notieren Sie sich Ihr Modell Amazon Resource Name (ARN), das für die Konvertierung Ihrer Daten in Vektoreinbettungen und für den Abruf und die Generierung von Wissensdatenbanken erforderlich ist. Kopieren Sie die Modell-ID für das von Ihnen gewählte Modell für Wissensdatenbanken und erstellen Sie das Modell ARN anhand der Modell- (Ressourcen-) ID. Folgen Sie dabei den bereitgestellten ARNBeispielen für Ihren Modellressourcentyp.
Wenn Sie die Amazon Bedrock-Konsole verwenden, müssen Sie kein Modell erstellenARN, da Sie im Rahmen der Schritte zur Erstellung einer Wissensdatenbank ein verfügbares Modell auswählen können.
Amazon Bedrock-Wissensdatenbanken werden in den folgenden Regionen unterstützt:
Anmerkung
Amazon Titan Text Premier ist derzeit nur in der us-east-1
Region verfügbar.
Region |
---|
USA Ost (Nord-Virginia) |
USA West (Oregon) |
Kanada (Zentral) |
Asien-Pazifik (Mumbai) |
Asien-Pazifik (Singapur) (beschränkter Zugang) |
Asien-Pazifik (Sydney) |
Asien-Pazifik (Tokio) |
Europa (Frankfurt) |
Europa (London) |
Europa (Paris) |
Europa (Irland) (beschränkter Zugang) |
Südamerika (São Paulo) |
AWS GovCloud (US-West) |
Sie können die folgenden Modelle verwenden, um Ihre Daten in Vektorgrafiken umzuwandeln:
Anmerkung
Sie können mit Amazon keinen neuen Vector Store mehr erstellen Titan Embeddings G1 - Text. Zuvor mit Amazon erstellte Vector Stores Titan Embeddings G1 - Text werden weiterhin unterstützt.
Modellname | Modell-ID |
---|---|
Amazon Titan Embeddings G1 - Text | Amazon. titan-embed-text-v1 |
Amazon Titan Texteinbettungen V2 | Amazon. titan-embed-text-v2:0 |
Cohere Embed (Englisch) | kohärent. embed-english-v3 |
Cohere Embed (Mehrsprachig) | kohärent. embed-multilingual-v3 |
Sie können die folgenden Modelle mit dem verwenden RetrieveAndGenerateAPIOperation zum Generieren von Antworten nach dem Abrufen von Informationen aus Wissensdatenbanken:
Anmerkung
Das RetrieveAndGenerateAPIfragt die Wissensdatenbank ab und verwendet unterstützte Amazon Bedrock-Wissensdatenbankmodelle, um Antworten aus den abgerufenen Informationen zu generieren. Mit Retrieve wird API nur die Wissensdatenbank abgefragt; es werden keine Antworten generiert. Daher können Sie nach dem Abrufen der Ergebnisse mit dem die Retrieve
API Ergebnisse in einer InvokeModel
Anfrage mit einem beliebigen Amazon Bedrock oder SageMaker Modell verwenden, um Antworten zu generieren.
Modell | Modell-ID |
---|---|
Amazon Titan Text Premier | Amazonas. titan-text-premier-v1:0 |
Anthropic Claude v2.0 | anthropic.claude-v2 |
Anthropic Claude v2.1 | anthropic.claude-v 2:1 |
Anthropic Claude 3 Sonnet v1 | anthropic.claude-3-Sonett 20240229-v 1:0 |
Anthropic Claude 3.5 Sonett | anthropic.claude-3-5-Sonett 20240620-v 1:0 |
Anthropic Claude 3 Haiku v1 | anthropic.claude-3-haiku-20240307-v 1:0 |
Anthropic Claude Instant v1 | anthropisch. claude-instant-v1 |
Meta Llama 3.1 8B Instruct | meta.lama3-1-8 1:0 b-instruct-v |
Meta Llama 3.1 70B Instruct | meta.lama3-1-70 1:0 b-instruct-v |
Meta Llama 3.1 405B Instruct | meta.lama3-1-405 1:0 b-instruct-v |
Die RetrieveAndGenerateAPIOperation unterstützt die folgenden Durchsatzarten:
-
Auf Anfrage — Sendet Anfragen zur Modellinferenz an Ihre aktuelle Region. Die Rate oder das Volumen Ihrer Anfragen können bei Spitzenauslastung begrenzt sein. Wählen Sie in der Konsole den On-Demand-Durchsatz oder geben Sie die Modell-ID in einem RetrieveAndGenerate request.
-
Regionsübergreifende Inferenz — Verteilt Modellinferenzanfragen auf eine Reihe von Regionen, um einen höheren Durchsatz zu ermöglichen und die Ausfallsicherheit zu erhöhen. Geben Sie ein Inferenzprofil an, das regionale Endpunkte definiert, an die Modellaufrufanforderungen gesendet werden sollen, in einem RetrieveAndGenerate oder CreateDataSource Anforderung. Weitere Informationen finden Sie unter Verbessern Sie die Widerstandsfähigkeit durch regionsübergreifende Inferenz.
Wichtig
Wenn Sie regionsübergreifende Inferenz verwenden, können Ihre Daten regionsübergreifend gemeinsam genutzt werden.