As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Regiões e modelos compatíveis com as bases de conhecimento do Amazon Bedrock
As bases de conhecimento do Amazon Bedrock são suportadas em regiões das Américas, Ásia e Europa. Alguns modelos fornecidos pela Amazon, Cohere e Anthropic são compatíveis com bases de conhecimento. Você usa um modelo para converter seus dados em incorporações vetoriais e um modelo para recuperação de informações e geração de respostas.
Você deve habilitar o acesso ao modelo para usar um modelo compatível com bases de conhecimento.
Se você usa o Amazon BedrockAPI, anote seu modelo Amazon Resource Name (ARN) que é necessário para converter seus dados em incorporações vetoriais e para recuperação e geração da base de conhecimento. Copie o ID do modelo escolhido para bases de conhecimento e construa o modelo ARN usando o ID do modelo (recurso), seguindo os ARNexemplos fornecidos para o tipo de recurso do modelo.
Se você usa o console Amazon Bedrock, não é necessário criar um modeloARN, pois você pode selecionar um modelo disponível como parte das etapas para criar uma base de conhecimento.
As bases de conhecimento do Amazon Bedrock são suportadas nas seguintes regiões:
nota
Amazon Titan No momento, o Text Premier está disponível apenas na us-east-1
região.
Região |
---|
Leste dos EUA (Norte da Virgínia) |
Oeste dos EUA (Oregon) |
Canadá (Central) |
Ásia-Pacífico (Mumbai) |
Ásia-Pacífico (Cingapura) (acesso fechado) |
Ásia-Pacífico (Sydney) |
Ásia-Pacífico (Tóquio) |
Europa (Frankfurt) |
Europa (Londres) |
Europa (Paris) |
Europa (Irlanda) (acesso fechado) |
América do Sul (São Paulo) |
AWS GovCloud (Oeste dos EUA) |
Você pode usar os seguintes modelos para converter seus dados em uma representação vetorial dos dados por incorporação:
nota
Você não pode mais criar uma nova loja de vetores com a Amazon Titan Embeddings G1 - Text. Lojas vetoriais criadas anteriormente usando a Amazon Titan Embeddings G1 - Text ainda são suportados.
Nome do modelo | ID do modelo |
---|---|
Amazon Titan Embeddings G1 - Text | amazônia. titan-embed-text-v1 |
Incorporações de texto Amazon Titan V2 | amazônia. titan-embed-text-v2:0 |
Cohere Embed (Inglês) | coerente. embed-english-v3 |
Cohere Embed (Multilíngue) | coerente. embed-multilingual-v3 |
Você pode usar os seguintes modelos com o RetrieveAndGenerateAPIoperação para gerar respostas após recuperar informações de bases de conhecimento:
nota
Ele RetrieveAndGenerateAPIconsulta a base de conhecimento e usa modelos de base de conhecimento compatíveis do Amazon Bedrock para gerar respostas a partir das informações que recupera. O Retrieve consulta API apenas a base de conhecimento; ele não gera respostas. Portanto, depois de recuperar os resultados com o Retrieve
API, você pode usar os resultados em uma InvokeModel
solicitação com qualquer Amazon Bedrock ou SageMaker modelo para gerar respostas.
Modelo | ID do modelo |
---|---|
Amazon Titan Text Premier | amazônia. titan-text-premier-v1:0 |
Anthropic Claude v2.0 | anthropic.claude-v2 |
Anthropic Claude v2.1 | antropic.claude-v 2:1 |
Anthropic Claude 3 Sonnet v1 | anthropic.claude-3-sonnet-20240229-v 1:0 |
Anthropic Claude 3.5 Soneto | anthropic.claude-3-5-sonnet-20240620-v 1:0 |
Anthropic Claude 3 Haiku v1 | anthropic.claude-3-haiku-20240307-v 1:0 |
Anthropic Claude Instant v1 | antrópico. claude-instant-v1 |
Meta Llama 3.1 8B Instruct | meta.llama3-1-8 1:0 b-instruct-v |
Meta Llama 3.1 70B Instruct | meta.llama3-1-70 1:0 b-instruct-v |
Meta Llama 3.1 405B Instruct | meta.llama3-1-405 1:0 b-instruct-v |
A RetrieveAndGenerateAPIA operação suporta os seguintes tipos de taxa de transferência:
-
Sob demanda — envia solicitações de inferência de modelo para sua região atual. A taxa ou o volume de suas solicitações podem ser limitados durante picos de utilização. Escolha a taxa de transferência sob demanda no console ou especifique a ID do modelo em um RetrieveAndGenerate solicitação.
-
Inferência entre regiões — distribui as solicitações de inferência do modelo em um conjunto de regiões para permitir maior produtividade e facilitar maior resiliência. Especifique um perfil de inferência, que define endpoints regionais para os quais enviar solicitações de invocação de modelo, em um RetrieveAndGenerate ou CreateDataSource. Para obter mais informações, consulte Melhore a resiliência com inferência entre regiões.
Importante
Se você usa inferência entre regiões, seus dados podem ser compartilhados entre regiões.