Unterstützte Regionen und Modelle für Amazon Bedrock-Wissensdatenbanken - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Unterstützte Regionen und Modelle für Amazon Bedrock-Wissensdatenbanken

Die Wissensdatenbanken von Amazon Bedrock werden in Regionen in Amerika, Asien und Europa unterstützt. Bestimmte Modelle von Amazon, Cohere und Anthropic werden für Wissensdatenbanken unterstützt. Sie verwenden ein Modell für die Umwandlung Ihrer Daten in Vektoreinbettungen und ein Modell für den Informationsabruf und die Generierung von Antworten.

Sie müssen den Modellzugriff aktivieren, um ein Modell verwenden zu können, das für Wissensdatenbanken unterstützt wird.

Wenn Sie Amazon Bedrock verwendenAPI, notieren Sie sich Ihr Modell Amazon Resource Name (ARN), das für die Konvertierung Ihrer Daten in Vektoreinbettungen und für den Abruf und die Generierung von Wissensdatenbanken erforderlich ist. Kopieren Sie die Modell-ID für das von Ihnen gewählte Modell für Wissensdatenbanken und erstellen Sie das Modell ARN anhand der Modell- (Ressourcen-) ID. Folgen Sie dabei den bereitgestellten ARNBeispielen für Ihren Modellressourcentyp.

Wenn Sie die Amazon Bedrock-Konsole verwenden, müssen Sie kein Modell erstellenARN, da Sie im Rahmen der Schritte zur Erstellung einer Wissensdatenbank ein verfügbares Modell auswählen können.

Amazon Bedrock-Wissensdatenbanken werden in den folgenden Regionen unterstützt:

Anmerkung

Amazon Titan Text Premier ist derzeit nur in der us-east-1 Region verfügbar.

Region
USA Ost (Nord-Virginia)
USA West (Oregon)
Kanada (Zentral)
Asien-Pazifik (Mumbai)
Asien-Pazifik (Singapur) (beschränkter Zugang)
Asien-Pazifik (Sydney)
Asien-Pazifik (Tokio)
Europa (Frankfurt)
Europa (London)
Europa (Paris)
Europa (Irland) (beschränkter Zugang)
Südamerika (São Paulo)
AWS GovCloud (US-West)

Sie können die folgenden Modelle verwenden, um Ihre Daten in Vektorgrafiken umzuwandeln:

Anmerkung

Sie können mit Amazon keinen neuen Vector Store mehr erstellen Titan Embeddings G1 - Text. Zuvor mit Amazon erstellte Vector Stores Titan Embeddings G1 - Text werden weiterhin unterstützt.

Modellname Modell-ID
Amazon Titan Embeddings G1 - Text Amazon. titan-embed-text-v1
Amazon Titan Texteinbettungen V2 Amazon. titan-embed-text-v2:0
Cohere Embed (Englisch) kohärent. embed-english-v3
Cohere Embed (Mehrsprachig) kohärent. embed-multilingual-v3

Sie können die folgenden Modelle mit dem verwenden RetrieveAndGenerateAPIOperation zum Generieren von Antworten nach dem Abrufen von Informationen aus Wissensdatenbanken:

Anmerkung

Das RetrieveAndGenerateAPIfragt die Wissensdatenbank ab und verwendet unterstützte Amazon Bedrock-Wissensdatenbankmodelle, um Antworten aus den abgerufenen Informationen zu generieren. Mit Retrieve wird API nur die Wissensdatenbank abgefragt; es werden keine Antworten generiert. Daher können Sie nach dem Abrufen der Ergebnisse mit dem die Retrieve API Ergebnisse in einer InvokeModel Anfrage mit einem beliebigen Amazon Bedrock oder SageMaker Modell verwenden, um Antworten zu generieren.

Modell Modell-ID
Amazon Titan Text Premier Amazonas. titan-text-premier-v1:0
Anthropic Claude v2.0 anthropic.claude-v2
Anthropic Claude v2.1 anthropic.claude-v 2:1
Anthropic Claude 3 Sonnet v1 anthropic.claude-3-Sonett 20240229-v 1:0
Anthropic Claude 3.5 Sonett anthropic.claude-3-5-Sonett 20240620-v 1:0
Anthropic Claude 3 Haiku v1 anthropic.claude-3-haiku-20240307-v 1:0
Anthropic Claude Instant v1 anthropisch. claude-instant-v1
Meta Llama 3.1 8B Instruct meta.lama3-1-8 1:0 b-instruct-v
Meta Llama 3.1 70B Instruct meta.lama3-1-70 1:0 b-instruct-v
Meta Llama 3.1 405B Instruct meta.lama3-1-405 1:0 b-instruct-v

Die RetrieveAndGenerateAPIOperation unterstützt die folgenden Durchsatzarten:

  • Auf Anfrage — Sendet Anfragen zur Modellinferenz an Ihre aktuelle Region. Die Rate oder das Volumen Ihrer Anfragen können bei Spitzenauslastung begrenzt sein. Wählen Sie in der Konsole den On-Demand-Durchsatz oder geben Sie die Modell-ID in einem RetrieveAndGenerate request.

  • Regionsübergreifende Inferenz — Verteilt Modellinferenzanfragen auf eine Reihe von Regionen, um einen höheren Durchsatz zu ermöglichen und die Ausfallsicherheit zu erhöhen. Geben Sie ein Inferenzprofil an, das regionale Endpunkte definiert, an die Modellaufrufanforderungen gesendet werden sollen, in einem RetrieveAndGenerate oder CreateDataSource Anforderung. Weitere Informationen finden Sie unter Verbessern Sie die Widerstandsfähigkeit durch regionsübergreifende Inferenz.

    Wichtig

    Wenn Sie regionsübergreifende Inferenz verwenden, können Ihre Daten regionsübergreifend gemeinsam genutzt werden.