As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Solucionar problemas de origens de dados
Esta seção pode ajudá-lo a resolver problemas comuns ao configurar e usar Amazon Kendra conectores de fonte de dados.
Meus documentos não foram indexados
Quando você sincroniza seu Amazon Kendra Ao indexar com uma fonte de dados, você pode ter problemas que impedem que os documentos sejam indexados. A indexação é um processo em duas etapas. Primeiro, a fonte de dados é verificada em busca de documentos novos e atualizados para indexar e para encontrar documentos a serem removidos do índice. Segundo, no nível do documento, cada documento é acessado e indexado.
Um erro pode ocorrer em qualquer uma dessas etapas. Os erros no nível da fonte de dados são relatados no console na seção Histórico de execução da sincronização da página de detalhes da fonte de dados. O status da tarefa de sincronização pode ser Bem-sucedido, Incompleto ou Falha. Visualize também o número de documentos indexados e excluídos durante o trabalho. Se o status for Falha, uma mensagem será exibida na coluna Detalhes.
Os erros no nível do documento são relatados em Amazon CloudWatch Logs. Você pode ver os erros usando o CloudWatch console.
Para gerar um relatório de status de sincronização de documentos, consulte Quero gerar um relatório de status de sincronização para meus documentos.
Meu trabalho de sincronização falhou
Normalmente, um trabalho de sincronização falha quando há um erro de configuração no índice ou na fonte de dados. No console, encontre a mensagem de erro na seção Histórico de execução da sincronização da página de detalhes da fonte de dados, na coluna Detalhes. Os erros no nível do documento são relatados em Amazon CloudWatch Logs. A mensagem de erro fornece informações sobre o que deu errado. O problema geralmente é que o índice ou a fonte de dados não tem a fonte adequada IAM permissões. A mensagem de erro descreve as permissões ausentes. Aqui estão algumas das mensagens de erro que você poderá receber:
Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.
Se sua função de índice não tiver permissão para usar CloudWatch, a fonte de dados não será capaz de criar um CloudWatch tronco. Se você receber esse erro, deverá adicionar CloudWatch permissões para a função de índice.
Failed to access Amazon S3 file prefix (
bucket
name
) while trying to crawl your metadata files. Please make
sure the IAM role (ARN
) provided has
sufficient permissions.
Quando você está usando um Amazon S3 fonte de dados, Amazon Kendra deve ter permissão para acessar o bucket que contém os documentos. Você precisa adicionar permissão para Amazon Kendra para ler o bucket na fonte de dados IAM papel.
The provided IAM role (
ARN
) could
not be assumed. Please make sure Amazon Kendra is a trusted entity that is
allowed to assume the role.
Amazon Kendra precisa de permissão para assumir o índice e a fonte de dados IAM papéis. Adicione uma política de confiança às funções com permissão para a ação de sts:AssumeRole
.
Para o IAM políticas que Amazon Kendra precisa indexar uma fonte de dados, consulte IAM papéis.
Para gerar um relatório de status de sincronização de documentos, consulte Quero gerar um relatório de status de sincronização para meus documentos.
Meu trabalho de sincronização está incompleto
Os trabalhos geralmente ficam incompletos quando concluem o processo no nível da fonte de dados, mas apresentam alguns erros durante o processo no nível do documento. Quando um trabalho está incompleto, alguns dos documentos podem não ter sido indexados com êxito. Para um Amazon S3 fonte de dados, um trabalho incompleto geralmente é causado por:
-
Os metadados de um ou mais documentos eram inválidos.
-
Quando os documentos são enviados para indexação, mas pelo menos um documento não foi enviado.
-
Quando os documentos são enviados para exclusão do índice, mas pelo menos um documento não foi enviado.
Para solucionar um trabalho de sincronização incompleto, consulte primeiro seu CloudWatch troncos.
-
Na coluna de detalhes, escolha Exibir detalhes em CloudWatch.
-
Examine as mensagens de erro para visualizar o que causou a falha do documento.
Para gerar um relatório de status de sincronização de documentos, consulte Quero gerar um relatório de status de sincronização para meus documentos.
Meu trabalho de sincronização foi bem-sucedido, mas não há documentos indexados
Ocasionalmente, a execução de uma tarefa de sincronização de índice será marcada como bem-sucedida, mas não há documentos novos ou atualizados indexados conforme o esperado. Os possíveis motivos incluem:
-
Verificar CloudWatch
DocumentsSubmittedForIndexingFailed
métrica para ver se algum documento falhou na sincronização. Verifique seu CloudWatch registros para obter detalhes. -
Para um Amazon S3 fonte de dados, você pode ter fornecido Amazon Kendra o nome ou prefixo incorreto do bucket. Certifique-se de que o balde que Amazon Kendra está usando é aquele que contém os documentos a serem indexados.
-
Ao reindexar um documento que não foi indexado em um trabalho anterior, Amazon Kendra não o indexará, a menos que você tenha alterado o documento ou o arquivo de metadados associado.
Para gerar um relatório de status de sincronização de documentos, consulte Quero gerar um relatório de status de sincronização para meus documentos.
Estou enfrentando problemas de formato de arquivo ao sincronizar minha fonte de dados
Se você tiver problemas de formato de arquivo ao adicionar arquivos à sua fonte de dados ou sincronizar sua fonte de dados, verifique se os tipos de documentos são Amazon Kendra suportado. Para obter uma lista dos tipos de documentos suportados pelo Amazon Kendra consulte Tipos ou formatos de documentos.
Se você estiver usando o BatchPutDocument
API com arquivos de texto sem formatação, especifique PLAIN_TEXT
como tipo de conteúdo.
Quero gerar um relatório de status de sincronização para meus documentos
Você pode visualizar um relatório do histórico de execução de sincronização em nível de documento CloudWatch para sua tarefa de sincronização de fonte de dados selecionando Exibir relatório. Um relatório do histórico de execução de sincronização terá detalhes sobre o progresso e o status de cada documento na tarefa de sincronização. Mostra se um documento foi bem-sucedido, falhou ou foi ignorado durante os estágios de rastreamento, sincronização e indexação. Você também encontrará mensagens de erro relacionadas a documentos falhados ou ignorados. Se o relatório não mostrar resultados de um trabalho de sincronização em andamento, talvez os registros ainda não estejam disponíveis. Verifique novamente mais tarde, pois os dados são emitidos para o relatório à medida que os eventos ocorrem durante o processo de sincronização.
Para acessar seu relatório de histórico de execução de sincronização, siga as seguintes etapas:
-
Abra o console Amazon Kendra em. https://console.aws.amazon.com/kendra/
-
No menu de navegação à esquerda, em Gerenciamento de dados, escolha Fontes de dados e escolha sua fonte de dados.
-
Na página de resumo da fonte de dados, role para baixo e selecione a guia Histórico de sincronização.
-
Em Histórico de execução da sincronização, selecione Ações.
-
Em Ações, selecione Exibir relatório. Você será redirecionado para o CloudWatch console onde poderá acessar seu relatório.
nota
Um histórico de execução de sincronização registra se um documento foi indexado com sucesso durante a ingestão, incluindo anexos ACLs e metadados, para todos os conectores compatíveis com o Amazon Kendra.
Se você estiver usando o conector Amazon S3:
Além de visualizar o relatório de histórico de execução de sincronização em nível de documento em CloudWatch, você pode gerar relatórios de histórico de sincronização para cada documento em sua fonte de dados do Amazon S3 e copiá-los para um Amazon S3 balde. Durante esse processo, seus dados são criptografados usando AWS KMS teclas e só podem ser vistas por você. O status do documento relatado pode ser um dos seguintes: Falha, Concluído ou Bem-sucedido com erros. Antes de gerar relatórios de status de sincronização para o Amazon S3, você deve fazer o seguinte:
-
Adicione o seguinte Amazon Kendra principal de serviço para o seu Amazon S3 política de acesso padrão
{ “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
-
Crie um Amazon S3 bucket com permissões de acesso a Amazon Kendra
Se você usa o console, para gerar um relatório de histórico de sincronização para o Amazon S3, escolha ativar a opção Gerar relatórios na seção Relatórios de histórico de sincronização — opcional na página de detalhes da fonte de dados. Em seguida, insira o Amazon S3 localização do bucket e escolha entre as opções de configuração disponíveis. Os relatórios serão gerados na próxima sincronização depois que você ativar a geração de relatórios.
Se você excluir o Amazon S3 bucket, você perderá seus dados de log e precisará configurar um novo bucket para armazenar novos relatórios de sincronização.
nota
Um relatório de histórico de sincronização fornece informações somente sobre se um conector Amazon S3 rastreou e ingeriu dados com sucesso.
Quanto tempo demora a sincronização de uma fonte de dados?
Se não houver atualizações nos documentos, sincronize o horário de Amazon Kendra o índice aumenta em proporção linear ao número de documentos. Por exemplo, 1.000 documentos sem nenhuma atualização levariam cerca de cinco minutos para serem sincronizados e 2.000 documentos sem nenhuma atualização levariam cerca de 10 minutos. Se houver alguma atualização nos documentos, o tempo de sincronização aumentará com base no número de documentos atualizados.
Qual é a cobrança pela sincronização de uma fonte de dados?
Quando você sincroniza seu índice, leva dois minutos para aquecer e ativar Amazon EC2 para estabelecer as conexões necessárias. Você não é cobrado durante esse processo. Seu medidor de uso começa somente após o início da tarefa de sincronização. Para obter mais informações sobre as Amazon Kendra preços, consulte Amazon Kendra
preços
Estou recebendo um Amazon EC2 erro de autorização
Se um Amazon EC2 ocorre um erro de operação não autorizada durante uma sincronização com uma fonte de dados de nuvem privada virtual (VPC). É provável que seu VPC IAM a função não tem as permissões necessárias. Verifique se o IAM a função que você usa para sua fonte de dados tem as permissões anexadas. Para obter mais informações, consulte Nuvem privada virtual IAM papel.
Não consigo usar os links do índice de pesquisa para abrir meu Amazon S3 objects
Suas Amazon Kendra index só pode acessar arquivos que um Amazon S3 a fonte de dados concede a ela permissões de acesso. Por exemplo, Amazon Kendra não é possível modificar o Amazon S3 permissões que determinam se um objeto deve ser público ou criptografado. Amazon Kendra também não tem as permissões padrão para criar ou devolver um link assinado para Amazon S3 objetos. Se você quiser ativar a vinculação assinada para Amazon S3 objetos em um Amazon Kendra index, você tem duas opções:
-
Assine os resultados da consulta de índice com o objeto URI de origem antes de retornar o resultado à página de pesquisa. Para ver um step-by-step passo a passo desse processo, consulte Compartilhamento de objetos usando objetos pré-assinados. URLs
-
Você pode substituir o Amazon S3 URL de origem de metadados do objeto e disponibilize seu serviço por meio de um CloudFront rede de distribuição de conteúdo (CDN) conectada a um Amazon S3 balde. Ou você pode usar um API Gateway endpoint de proxy que retorna um preassinado URL e redireciona para ele.
Estou recebendo uma mensagem de erro AccessDenied Ao usar o arquivo de SSL certificado
Se você estiver recebendo um erro de acesso negado ao usar um SSL certificado com sua fonte de dados, certifique-se de que IAM role tem a permissão para acessar o arquivo de SSL certificado em seu local especificado. Se o certificado estiver criptografado com um AWS KMS chave, sua IAM a função também deve ter permissão para descriptografar usando o AWS KMS chave. Para obter mais informações, consulte Autenticação e controle de acesso para AWS KMS.
Estou recebendo um erro de autorização ao usar uma fonte SharePoint de dados
Se você estiver recebendo um erro de autorização ao sincronizar seu índice com uma fonte de SharePoint dados, confirme se você tem uma função de administrador do site atribuída a você em SharePoint.
Meu índice não rastreia documentos da minha fonte de dados do Confluence
Se suas receitas Amazon Kendra O index não está rastreando documentos da sua fonte de dados do Confluence durante o processo de sincronização. Confirme se você faz parte dos grupos de administradores no Confluence.