Modelos Incorporador de Texto do Amazon Titan

Os modelos Incorporador do Titan v2 incluem o Incorporador de Texto do Amazon Titan v2 e o Incorporador de Texto do Titan G1.

nota

Os modelos incorporados no Amazon Bedrock são limitados por solicitações por minuto (RPM), não por tokens por minuto (TPM). Ao planejar a capacidade ou solicitar aumentos de cota para modelos de incorporação, use a cota de RPM. Para obter mais informações, consulte Cotas do Amazon Bedrock.

As incorporações de texto representam vetores significativos de texto não estruturado, como documentos, parágrafos e frases. Você insere um corpo de texto e a saída é um vetor (1 x n). É possível usar vetores de incorporação para uma ampla variedade de aplicações.

O modelo Incorporador de Texto do Amazon Titan v2 (amazon.titan-embed-text-v2:0) pode ingerir até 8.192 tokens ou 50 mil caracteres e gerar um vetor de saída de 1.024 dimensões. O modelo é otimizado para tarefas de recuperação de texto, mas também pode ser usado para tarefas adicionais, como similaridade semântica e agrupamento.

Os modelos de incorporação do Amazon Titan geram uma representação semântica significativa de documentos, parágrafos e frases. O Incorporador de Texto do Amazon Titan usa como entrada um corpo de texto e gera um vetor (1 x n). O Amazon Titan Text Embeddings é oferecido por meio de invocação de endpoint com latência otimizada para gerar vetores com baixa latência (recomendado durante a etapa de recuperação), bem como trabalhos em lote com taxa de transferência otimizada para indexação mais rápida. O cálculo e a recuperação de similaridade reais são realizados pelo seu banco de dados vetoriais, não pelo modelo de incorporação. O Incorporador de Texto do Amazon Titan v2 também é compatível com documentos longos. No entanto, para tarefas de recuperação, é recomendável segmentar documentos em segmentos lógicos, como parágrafos ou seções.

nota

O modelo Incorporador de Texto do Amazon Titan v2 e o modelo Incorporador de Texto do Titan v1 não aceitam parâmetros de inferência, como maxTokenCount ou topP.

Modelo Incorporador de Texto do Amazon Titan v2

ID de modelo: amazon.titan-embed-text-v2:0
Número máximo de tokens de texto de entrada: 8.192
Máximo de caracteres de entrada: 50 mil caracteres
Idiomas: inglês (mais de 100 idiomas em versão prévia)
Tamanho do vetor de saída — 1.024 (padrão), 512, 256
Tipos de inferência — On-Demand, taxa de transferência provisionada
Casos de uso compatíveis: RAG, pesquisa de documentos, reclassificação, classificação etc.

nota

O Incorporador de Texto do Titan v2 usa como entrada uma string não vazia com até 8.192 tokens ou 50 mil caracteres. A proporção de caracteres por token em inglês é de 4,7 caracteres por token, em média. Embora o Incorporador de Texto do Titan v1 e o Incorporador de Texto do Titan v2 possam acomodar até 8.192 tokens, é recomendável segmentar documentos em segmentos lógicos (como parágrafos ou seções).

O modelo Amazon Titan Embedding Text v2 é otimizado para inglês, com suporte multilíngue para os seguintes idiomas. Cross-language consultas (como fornecer uma base de conhecimento em coreano e consultá-la em alemão) retornarão resultados abaixo do ideal.

Africâner
Albanês
Amárico
Árabe
Armênio
Assamês
Azerbaijana
Bashkir
Basco
Bielorrusso
Bengali
Bósnio
Bretão
Búlgaro
Birmanesa
Catalão
Cebuano
Chinesa
Corso
Croata
Tcheco
Dinamarquesa
Divehi
Holandesa
Inglês
Esperanto
Estoniano
Feroês
Finlandesa
Francesa
Galego
Georgiano
Alemã
Gujarati
Haitiano
Hauçá
Hebraico
Hindi
Húngara
Islandês
Indonésia
Irlandês
Italiana
Japonesa
Javanês
Kannada
Cazaque
Khmer
Quiniaruanda
Quirguiz
Coreana
Curdo
Laosiano
Latim
Letão
Lituano
Luxemburguês
Macedônio
Malgaxe
Malaio
Malaiala
Maltês
maori
Marathi
Grego moderno
Mongol
Nepalês
Norueguesa
Norueguês nynorsk
Occitano
Oriá
Panjabi
Persa
Polonesa
Portuguesa
Pastó
Romena
Tomanche
Russa
Sânscrito
Gaélico escocês
Sérvio
Sindi
Cingalês
Eslovaco
Esloveno
Somali
Espanhola
Sudanês
Suaíli
Sueca
Tagalo
Tadjique
Tâmil
Tatárico
Telugo
Tailandesa
Tibetano
Turca
Turcomano
Uigur
Ucraniana
Urdu
Uzbeque
Vietnamita
Waray
Galês
Frísio
Xhosa
Iídiche
Iorubá
Zulu

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Modelos Amazon Titan

Embutimentos multimodais G1