Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Criar um conector de fonte de dados - Amazon Kendra

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criar um conector de fonte de dados

Você pode criar um conector de fonte de dados Amazon Kendra para se conectar e indexar seus documentos. Amazon Kendra pode se conectar à Microsoft SharePoint, ao Google Drive e a muitos outros provedores. Ao criar um conector de fonte de dados, você fornece Amazon Kendra as informações de configuração necessárias para se conectar ao seu repositório de origem. Ao contrário de adicionar documentos diretamente em um índice, digitalize periodicamente a fonte de dados para atualizar o índice.

Por exemplo, digamos que você tenha um repositório de documentos fiscais armazenados em um Amazon S3 bucket. De tempos em tempos, os documentos existentes são alterados e novos documentos são adicionados ao repositório. Se você adicionar o repositório Amazon Kendra como fonte de dados, poderá manter seu índice atualizado configurando sincronizações periódicas entre a fonte de dados e o índice.

Você pode optar por atualizar um índice manualmente usando o console ou a StartDataSourceSyncJobAPI. Caso contrário, configure uma agenda para atualizar um índice e sincronizá-lo com a fonte de dados.

Um índice pode ter mais de uma fonte de dados. Cada fonte de dados pode ter seu próprio cronograma de atualização. Por exemplo, atualize o índice dos documentos de trabalho diariamente, ou até mesmo de hora em hora, enquanto atualiza os documentos arquivados manualmente sempre que o arquivo for alterado.

Se você quiser alterar os metadados ou os atributos e o conteúdo do documento durante o processo de absorção do documento, consulte Enriquecimento personalizado de documentos no Amazon Kendra.

nota

Cada ID de documento deve ser exclusiva por índice. Você não pode criar uma fonte de dados para indexar seus documentos com seus documentos exclusivos IDs e depois usar a BatchPutDocument API para indexar os mesmos documentos ou vice-versa. Você pode criar uma fonte de dados e depois usar a API BatchPutDocument para indexar os mesmos documentos ou vice-versa. Usar o BatchPutDocument e BatchDeleteDocument APIs em combinação com um conector de fonte de Amazon Kendra dados para o mesmo conjunto de documentos pode causar inconsistências com seus dados. Em vez disso, recomendamos usar o conector de fonte de dados personalizado do Amazon Kendra.

nota

Os arquivos adicionados ao índice devem estar em um fluxo de bytes codificado UTF-8. Para obter mais informações sobre documentos em Amazon Kendra, consulte Documentos.

Definindo um cronograma de atualização

Configure a fonte de dados para ser atualizada periodicamente com o console ou usando o parâmetro Schedule ao criar ou atualizar uma fonte de dados. O conteúdo do parâmetro é uma string que contém uma string de agendamento em formato cron ou uma string vazia para indicar que o índice é atualizado sob demanda. Para o formato de uma expressão cron, consulte Programar expressões para regras no Guia do Amazon CloudWatch Events usuário. Amazon Kendra suporta somente expressões cron. Ele não suporta expressões rate.

Configurações de idioma

Você pode indexar todos os documentos em uma fonte de dados em um idioma compatível. Você especifica o código do idioma para todos os seus documentos em sua fonte de dados ao ligar CreateDataSource. Se um documento não tiver um código de idioma especificado em um campo de metadados, o documento será indexado usando o código de idioma especificado para todos os documentos no nível da fonte de dados. Se você não especificar um idioma, o Amazon Kendra indexa documentos em uma fonte de dados em inglês por padrão. Para obter mais informações sobre os idiomas suportados, incluindo os códigos, consulte Adicionar documentos em outros idiomas além do inglês.

Você pode indexar todos os documentos em uma fonte de dados em um idioma compatível. Acesse Fontes de dados e edite a fonte de dados ou Adicione a fonte de dados se estiver adicionando uma nova fonte de dados. Na página Especificar detalhes da fonte de dados, escolha um idioma no menu suspenso Idioma. Selecione a opção Atualizar ou continue inserindo as informações de configuração para se conectar à sua fonte de dados.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.