Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Adicionar sinônimos personalizados a um índice

Modo de foco
Adicionar sinônimos personalizados a um índice - Amazon Kendra

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Para adicionar sinônimos personalizados a um índice, você os especifica em um arquivo de dicionário de sinônimos. Você pode incluir termos específicos ou especializados da empresa ao Amazon Kendra usar sinônimos. Sinônimos genéricos em inglês, comoleader, head, são incorporados Amazon Kendra e não devem ser incluídos em um arquivo de dicionário de sinônimos, incluindo sinônimos genéricos que usam hífens. Amazon Kendra suporta sinônimos para todos os tipos de resposta, que incluem tipos de DOCUMENT resposta QUESTION_ANSWER e/ou tipos de ANSWER resposta. Amazon Kendra atualmente não suporta a adição de sinônimos marcados como palavras irrelevantes. Esse sinalizador será incluído em um release futuro.

Amazon Kendra faz correlações entre sinônimos. Por exemplo, usando o par sinônimoDynamo, Amazon DynamoDB, Amazon Kendra correlaciona o Dynamo com. Amazon DynamoDB A consulta “O que é dínamo?” em seguida, retorna um documento como “O que é Amazon DynamoDB?”. Com sinônimos, Amazon Kendra é mais fácil captar a correlação.

O arquivo de dicionário de sinônimos é um arquivo de texto armazenado em um Amazon S3 bucket. Consulte Adicionar um dicionário de sinônimos a um índice.

O arquivo de dicionário de sinônimos usa o formato de sinônimo Solr. Amazon Kendra tem um limite no número de dicionários de sinônimos por índice. Consulte Cotas.

Os sinônimos podem ser úteis nos seguintes cenários:

  • Termos especializados que não são sinônimos tradicionais do idioma inglês, como NLP, Natural Language Processing.

  • Substantivos próprios com associações semânticas complexas. Esses são substantivos que são improváveis que o público em geral entenda como, por exemplo, no machine learning, cost, loss, model performance.

  • Diferentes formas de nomes de produtos como, por exemplo, Elastic Compute Cloud, EC2.

  • Termos específicos do domínio ou da empresa, como nomes de produtos. Por exemplo, Route53, DNS.

Não use sinônimos nos seguintes cenários:

  • Sinônimos genéricos do idioma inglês, como leader, head. Esses sinônimos não são específicos do domínio, e o uso de sinônimos nesses cenários pode ter efeitos indesejados.

  • Erros tipográficos, como teh => the.

  • Variantes morfológicas como os plurais e os possessivos dos substantivos, a forma comparativa e superlativa dos adjetivos e o pretérito, o particípio passado e a forma progressiva dos verbos. Um exemplo de adjetivos comparativos e superlativos é good, better, best.

  • Unigram (palavra única) interrompe palavras como WHO. Palavras-limite do Unigram não são permitidas no dicionário de sinônimos e são excluídas da pesquisa. Por exemplo, WHO => World Health Organization é rejeitado. No entanto, você pode usar W.H.O. como um termo sinônimo e pode usar palavras irregulares como parte de um sinônimo de várias palavras. Por exemplo, of não é permitido, mas United States of America é.

Os sinônimos personalizados facilitam a compreensão Amazon Kendra da terminologia específica da sua empresa, expandindo suas consultas para abranger os sinônimos específicos da sua empresa. Embora os sinônimos possam melhorar a precisão da pesquisa, é importante entender como os sinônimos afetam a latência para que você possa otimizar isso.

Uma regra geral para sinônimos é: quanto mais termos em sua consulta forem combinados e expandidos com sinônimos, maior será o impacto potencial na latência. Outros fatores que afetam a latência incluem o tamanho médio dos documentos indexados, o tamanho do seu índice, qualquer filtragem nos resultados da pesquisa e a carga geral do seu índice. Amazon Kendra As consultas que não correspondem a nenhum sinônimo não são afetadas.

Uma diretriz geral sobre como os sinônimos afetam a latência:

Caso de uso Aumento na latência*
Consultas típicas de linguagem natural ou palavra-chave de 3 a 5 palavras cada Menor que 15%
Um termo de consulta se expande para 3 sinônimos
Índice de cerca de 500 mil documentos (média de 10,48 KB de texto extraído por documento) ou 30 mil pares de perguntas frequentes/perguntas

*O desempenho varia com base no uso específico de sinônimos e configurações no índice. É melhor testar o desempenho da pesquisa para obter referências mais precisas para o caso de uso específico.

Se o dicionário de sinônimos for grande, tiver uma alta taxa de expansão de prazo e o aumento de latência não estiver dentro dos limites aceitáveis, você pode tentar uma ou as duas opções a seguir:

  • Corte o dicionário de sinônimos para reduzir a taxa de expansão (número de sinônimos por termo).

  • Reduza a cobertura geral dos termos (número de linhas no dicionário de sinônimos).

Como alternativa, você pode aumentar a capacidade de provisionamento (unidades de armazenamento virtual) para compensar o aumento da latência.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.