As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Criar um conector de fonte de dados
Você pode criar um conector de fonte de dados Amazon Kendra para se conectar e indexar seus documentos. Amazon Kendra pode se conectar à Microsoft SharePoint, ao Google Drive e a muitos outros provedores. Ao criar um conector de fonte de dados, você fornece Amazon Kendra as informações de configuração necessárias para se conectar ao seu repositório de origem. Ao contrário de adicionar documentos diretamente em um índice, digitalize periodicamente a fonte de dados para atualizar o índice.
Por exemplo, digamos que você tenha um repositório de documentos fiscais armazenados em um Amazon S3 bucket. De tempos em tempos, os documentos existentes são alterados e novos documentos são adicionados ao repositório. Se você adicionar o repositório Amazon Kendra como fonte de dados, poderá manter seu índice atualizado configurando sincronizações periódicas entre a fonte de dados e o índice.
Você pode optar por atualizar um índice manualmente usando o console ou a StartDataSourceSyncJobAPI. Caso contrário, configure uma agenda para atualizar um índice e sincronizá-lo com a fonte de dados.
Um índice pode ter mais de uma fonte de dados. Cada fonte de dados pode ter seu próprio cronograma de atualização. Por exemplo, atualize o índice dos documentos de trabalho diariamente, ou até mesmo de hora em hora, enquanto atualiza os documentos arquivados manualmente sempre que o arquivo for alterado.
Se você quiser alterar os metadados ou os atributos e o conteúdo do documento durante o processo de absorção do documento, consulte Enriquecimento personalizado de documentos no Amazon Kendra.
nota
Cada ID de documento deve ser exclusiva por índice. Você não pode criar uma fonte de dados para indexar seus documentos com seus documentos exclusivos IDs e depois usar a BatchPutDocument
API para indexar os mesmos documentos ou vice-versa. Você pode criar uma fonte de dados e depois usar a API BatchPutDocument
para indexar os mesmos documentos ou vice-versa. Usar o BatchPutDocument
e BatchDeleteDocument
APIs em combinação com um conector de fonte de Amazon Kendra dados para o mesmo conjunto de documentos pode causar inconsistências com seus dados. Em vez disso, recomendamos usar o conector de fonte de dados personalizado do Amazon Kendra.
nota
Os arquivos adicionados ao índice devem estar em um fluxo de bytes codificado UTF-8. Para obter mais informações sobre documentos em Amazon Kendra, consulte Documentos.
Definindo um cronograma de atualização
Configure a fonte de dados para ser atualizada periodicamente com o console ou usando o parâmetro Schedule
ao criar ou atualizar uma fonte de dados. O conteúdo do parâmetro é uma string que contém uma string de agendamento em formato cron
ou uma string vazia para indicar que o índice é atualizado sob demanda. Para o formato de uma expressão cron, consulte Programar expressões para regras no Guia do Amazon CloudWatch Events usuário. Amazon Kendra suporta somente expressões cron. Ele não suporta expressões rate.
Configurações de idioma
Você pode indexar todos os documentos em uma fonte de dados em um idioma compatível. Você especifica o código do idioma para todos os seus documentos em sua fonte de dados ao ligar CreateDataSource. Se um documento não tiver um código de idioma especificado em um campo de metadados, o documento será indexado usando o código de idioma especificado para todos os documentos no nível da fonte de dados. Se você não especificar um idioma, o Amazon Kendra indexa documentos em uma fonte de dados em inglês por padrão. Para obter mais informações sobre os idiomas suportados, incluindo os códigos, consulte Adicionar documentos em outros idiomas além do inglês.
Você pode indexar todos os documentos em uma fonte de dados em um idioma compatível. Acesse Fontes de dados e edite a fonte de dados ou Adicione a fonte de dados se estiver adicionando uma nova fonte de dados. Na página Especificar detalhes da fonte de dados, escolha um idioma no menu suspenso Idioma. Selecione a opção Atualizar ou continue inserindo as informações de configuração para se conectar à sua fonte de dados.