Regiões e modelos compatíveis com as bases de conhecimento do Amazon Bedrock - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Regiões e modelos compatíveis com as bases de conhecimento do Amazon Bedrock

As bases de conhecimento do Amazon Bedrock são suportadas em regiões das Américas, Ásia e Europa. Alguns modelos fornecidos pela Amazon, Cohere e Anthropic são compatíveis com bases de conhecimento. Você usa um modelo para converter seus dados em incorporações vetoriais e um modelo para recuperação de informações e geração de respostas.

Você deve habilitar o acesso ao modelo para usar um modelo compatível com bases de conhecimento.

Se você usa o Amazon BedrockAPI, anote seu modelo Amazon Resource Name (ARN) que é necessário para converter seus dados em incorporações vetoriais e para recuperação e geração da base de conhecimento. Copie o ID do modelo escolhido para bases de conhecimento e construa o modelo ARN usando o ID do modelo (recurso), seguindo os ARNexemplos fornecidos para o tipo de recurso do modelo.

Se você usa o console Amazon Bedrock, não é necessário criar um modeloARN, pois você pode selecionar um modelo disponível como parte das etapas para criar uma base de conhecimento.

As bases de conhecimento do Amazon Bedrock são suportadas nas seguintes regiões:

nota

Amazon Titan No momento, o Text Premier está disponível apenas na us-east-1 região.

Região
Leste dos EUA (Norte da Virgínia)
Oeste dos EUA (Oregon)
Canadá (Central)
Ásia-Pacífico (Mumbai)
Ásia-Pacífico (Cingapura) (acesso fechado)
Ásia-Pacífico (Sydney)
Ásia-Pacífico (Tóquio)
Europa (Frankfurt)
Europa (Londres)
Europa (Paris)
Europa (Irlanda) (acesso fechado)
América do Sul (São Paulo)
AWS GovCloud (Oeste dos EUA)

Você pode usar os seguintes modelos para converter seus dados em uma representação vetorial dos dados por incorporação:

nota

Você não pode mais criar uma nova loja de vetores com a Amazon Titan Embeddings G1 - Text. Lojas vetoriais criadas anteriormente usando a Amazon Titan Embeddings G1 - Text ainda são suportados.

Nome do modelo ID do modelo
Amazon Titan Embeddings G1 - Text amazônia. titan-embed-text-v1
Incorporações de texto Amazon Titan V2 amazônia. titan-embed-text-v2:0
Cohere Embed (Inglês) coerente. embed-english-v3
Cohere Embed (Multilíngue) coerente. embed-multilingual-v3

Você pode usar os seguintes modelos com o RetrieveAndGenerateAPIoperação para gerar respostas após recuperar informações de bases de conhecimento:

nota

Ele RetrieveAndGenerateAPIconsulta a base de conhecimento e usa modelos de base de conhecimento compatíveis do Amazon Bedrock para gerar respostas a partir das informações que recupera. O Retrieve consulta API apenas a base de conhecimento; ele não gera respostas. Portanto, depois de recuperar os resultados com o RetrieveAPI, você pode usar os resultados em uma InvokeModel solicitação com qualquer Amazon Bedrock ou SageMaker modelo para gerar respostas.

Modelo ID do modelo
Amazon Titan Text Premier amazônia. titan-text-premier-v1:0
Anthropic Claude v2.0 anthropic.claude-v2
Anthropic Claude v2.1 antropic.claude-v 2:1
Anthropic Claude 3 Sonnet v1 anthropic.claude-3-sonnet-20240229-v 1:0
Anthropic Claude 3.5 Soneto anthropic.claude-3-5-sonnet-20240620-v 1:0
Anthropic Claude 3 Haiku v1 anthropic.claude-3-haiku-20240307-v 1:0
Anthropic Claude Instant v1 antrópico. claude-instant-v1
Meta Llama 3.1 8B Instruct meta.llama3-1-8 1:0 b-instruct-v
Meta Llama 3.1 70B Instruct meta.llama3-1-70 1:0 b-instruct-v
Meta Llama 3.1 405B Instruct meta.llama3-1-405 1:0 b-instruct-v

A RetrieveAndGenerateAPIA operação suporta os seguintes tipos de taxa de transferência:

  • Sob demanda — envia solicitações de inferência de modelo para sua região atual. A taxa ou o volume de suas solicitações podem ser limitados durante picos de utilização. Escolha a taxa de transferência sob demanda no console ou especifique a ID do modelo em um RetrieveAndGenerate solicitação.

  • Inferência entre regiões — distribui as solicitações de inferência do modelo em um conjunto de regiões para permitir maior produtividade e facilitar maior resiliência. Especifique um perfil de inferência, que define endpoints regionais para os quais enviar solicitações de invocação de modelo, em um RetrieveAndGenerate ou CreateDataSource. Para obter mais informações, consulte Melhore a resiliência com inferência entre regiões.

    Importante

    Se você usa inferência entre regiões, seus dados podem ser compartilhados entre regiões.