As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
IDs de modelo Amazon Bedrock
Muitas operações da API Amazon Bedrock exigem o uso de um ID de modelo. Consulte a tabela a seguir para determinar onde encontrar a ID do modelo que você precisa usar.
Caso de uso | Como encontrar o ID do modelo |
---|---|
Use um modelo básico | Procure o ID no gráfico de IDs do modelo básico |
Compre taxa de transferência provisionada para um modelo básico | Procure a ID no gráfico de IDs do modelo para a taxa de transferência provisionada e use-a como modelId na solicitação. CreateProvisionedModelThroughput |
Compre taxa de transferência provisionada para um modelo personalizado | Use o nome do modelo personalizado ou seu ARN como modelId na CreateProvisionedModelThroughputsolicitação. |
Use um modelo provisionado | Depois de criar uma taxa de transferência provisionada, ela retorna a. provisionedModelArn Esse ARN é o ID do modelo. |
Use um modelo personalizado | Compre a taxa de transferência provisionada para o modelo personalizado e use a devolvida provisionedModelArn como ID do modelo. |
Tópicos
IDs do modelo básico do Amazon Bedrock (taxa de transferência sob demanda)
A seguir está uma lista de IDs de modelo para os modelos de base atualmente disponíveis. Você usa um ID de modelo por meio da API para identificar o modelo básico que deseja usar com taxa de transferência sob demanda, como em uma InvokeModelsolicitação, ou que deseja personalizar, como em uma CreateModelCustomizationJobsolicitação.
nota
Você deve verificar regularmente a Ciclo de vida do modelo página para obter informações sobre a suspensão de uso do modelo e atualizar os IDs do modelo conforme necessário. Depois que um modelo chega end-of-life, o ID do modelo não funciona mais.
Provedor | Nome do modelo | Version (Versão) | ID do modelo |
---|---|---|---|
Amazon | Titan Text G1 - Express | 1.x | amazônia. titan-text-express-v1 |
Amazon | Titan Text G1 - Lite | 1.x | amazônia. titan-text-lite-v1 |
Amazon | Titan Text Premier | 1.x | amazônia. titan-text-premier-v1:0 |
Amazon | Titan Embeddings G1 - Text | 1.x | amazônia. titan-embed-text-v1 |
Amazon | Texto de incorporação Titan v2 | 1.x | amazônia. titan-embed-text-v2:0 |
Amazon | Titan Multimodal Embeddings G1 | 1.x | amazônia. titan-embed-image-v1 |
Amazon | Titan Image Generator G1 | 1.x | amazônia. titan-image-generator-v1 |
Anthropic | Claude | 2,0 | anthropic.claude-v2 |
Anthropic | Claude | 2.1 | antropic.claude-v 2:1 |
Anthropic | Claude 3 Sonnet | 1,0 | anthropic.claude-3-sonnet-20240229-v 1:0 |
Anthropic | Claude 3 Haiku | 1,0 | anthropic.claude-3-haiku-20240307-v 1:0 |
Anthropic | Claude 3 Opus | 1,0 | anthropic.claude-3-opus-20240229-v 1:0 |
Anthropic | Claude Instant | 1.x | antrópico. claude-instant-v1 |
AI21 Labs | Jurassic-2 Mid | 1.x | ai21.j2-mid-v1 |
AI21 Labs | Jurassic-2 Ultra | 1.x | ai21.j2-ultra-v1 |
Cohere | Command | 14.x | coerente. command-text-v14 |
Cohere | Command Light | 15.x | coerente. command-light-text-v14 |
Cohere | Command R | 1.x | coerente. command-r-v1:0 |
Cohere | Command R+ | 1.x | coerente. command-r-plus-v1:0 |
Cohere | Embedinglês | 3.x | coerente. embed-english-v3 |
Cohere | EmbedMultilíngue | 3.x | coerente. embed-multilingual-v3 |
Meta | Llama 2 Chat13B | 1.x | meta.llama2-13 1 b-chat-v |
Meta | Llama 2 Chat70B | 1.x | meta.llama2-70 1 b-chat-v |
Meta | Llama 3 8b Instruct | 1.x | meta.llama3-8 1:0 b-instruct-v |
Meta | Llama 3 70b Instruct | 1.x | meta.llama3-70 1:0 b-instruct-v |
Mistral AI | Mistral 7B Instruct | 0.x | mistral.mistral-7 0:2 b-instruct-v |
Mistral AI | Mixtral 8X7B Instruct | 0.x | b-instruct-vmistral.mixtral-8x7 0:1 |
Mistral AI | Mistral Large | 1.x | mistral.mistral-large-2402-v 1:0 |
Mistral AI | Mistral Small | 1.x | mistral.mistral-small-2402-v 1:0 |
Stability AI | Stable Diffusion XL | 0.x | estabilidade. stable-diffusion-xl-v0 |
Stability AI | Stable Diffusion XL | 1.x | estabilidade. stable-diffusion-xl-v1 |
IDs do modelo básico do Amazon Bedrock para compra de taxa de transferência provisionada
Para comprar o Provisioned Throughput por meio da API, use o ID do modelo correspondente ao provisionar o modelo com uma solicitação. CreateProvisionedModelThroughput A taxa de transferência provisionada está disponível para os seguintes modelos:
nota
Alguns modelos têm várias versões contextuais cuja disponibilidade difere por região. Para ter mais informações, consulte Suporte de modelo por AWS região.
Nome do modelo | Compra sem compromisso suportada para o modelo básico | ID do modelo para taxa de transferência provisionada |
---|---|---|
Amazon Titan Text G1 - Express | Sim | amazônia. titan-text-express-v1:0:8 k |
Amazon Titan Text G1 - Lite | Sim | amazônia. titan-text-lite-v1:0:4 k |
Amazon Titan Text Premier (versão prévia) | Sim | amazônia. titan-text-premier-v1:0:32 K |
Amazon Titan Embeddings G1 - Text | Sim | amazônia. titan-embed-text-v1:2:8 k |
Amazon Titan Embeddings G1 - Text v2 | Sim | amazônia. titan-embed-text-v2:0:8 k |
Amazon Titan Multimodal Embeddings G1 | Sim | amazônia. titan-embed-image-v1:0 |
Amazon Titan Image Generator G1 | Não | amazônia. titan-image-generator-v1:0 |
AnthropicClaudev2 18K | Sim | anthropic.claude-v2:0:18k |
AnthropicClaudev2 100K | Sim | anthropic.claude-v2:0:100k |
AnthropicClaudev2.1 18K | Sim | anthropic.claude-v2:1:18k |
AnthropicClaudev2.1 200K | Sim | anthropic.claude-v 2:1:200 k |
AnthropicClaude 3 Sonnet28K | Sim | anthropic.claude-3-sonnet-20240229-v 1:0:28 k |
AnthropicClaude 3 Sonnet200K | Sim | anthropic.claude-3-sonnet-20240229-v 1:0:200 k |
AnthropicClaude 3 Haiku48K | Sim | anthropic.claude-3-haiku-20240307-v 1:0:48 k |
AnthropicClaude 3 Haiku200K | Sim | anthropic.claude-3-haiku-20240307-v 1:0:200 k |
AnthropicClaude Instantv1 100K | Sim | antrópico. claude-instant-v1:2:100 k |
AI21 Labs Jurassic-2 Ultra | Sim | ai21.j2-ultra-v 1:0:8 k |
Cohere Command | Sim | coerente. command-text-v14:7:44 k |
Cohere Command Light | Sim | coerente. command-light-text-v14:7:44 k |
CohereEmbedinglês | Sim | coerente. embed-english-v3:0:512 |
CohereEmbedMultilíngue | Sim | coerente. embed-multilingual-v3:0:512 |
Stable Diffusion XL 1.0 | Não | estabilidade. stable-diffusion-xl-v1:0 |
MetaLlama 2 Chat13B | Não | b-chat-vmeta.llama2-13 1:0:44 k |
MetaLlama 213B | Não | (veja a nota abaixo) |
MetaLlama 270B | Não | (veja a nota abaixo) |
nota
Os modelos Meta Llama 2 (sem chat) só podem ser usados após serem personalizados e após a compra do Provisioned Throughput para eles.
A CreateProvisionedModelThroughputresposta retorna umprovisionedModelArn
. Você pode usar esse ARN ou o nome do modelo provisionado nas operações suportadas do Amazon Bedrock. Para obter mais informações sobre a taxa de transferência provisionada, consulte. Taxa de transferência provisionada para Amazon Bedrock