Solución de problemas con los orígenes de datos - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Solución de problemas con los orígenes de datos

Esta sección puede ayudarle a resolver problemas comunes al configurar y utilizar Amazon Kendra los conectores de fuentes de datos.

No se han indexado mis documentos

Al sincronizar el Amazon Kendra índice con una fuente de datos, es posible que se produzcan problemas que impidan la indexación de los documentos. La indexación es un proceso que consta de dos pasos. En primer lugar, se comprueba el origen de datos para ver si hay documentos nuevos y actualizados que se deben indexar y se buscan documentos que se deben eliminar del índice. En segundo lugar, en el nivel del documento, se accede a cada documento y se indexa.

Se puede producir un error en cualquiera de estos pasos. Los errores de origen de datos se indican en la consola, en la sección Historial de ejecuciones de sincronización de la página de detalles del origen de datos. El estado del trabajo de sincronización puede ser correcto, incompleto o erróneo. También puede ver el número de documentos indexados y eliminados durante el trabajo. Si el estado es erróneo, se muestra un mensaje en la columna Detalles.

Los errores a nivel de documento se notifican en. Amazon CloudWatch Logs Puede ver los errores en la CloudWatch consola.

Para generar un informe de estado de sincronización de documentos, consulte Deseo generar un informe de estado de sincronización para mis documentos.

Ha fallado mi trabajo de sincronización

Un trabajo de sincronización suele fallar cuando hay un error de configuración en el índice o en el origen de datos. En la consola, encontrará el mensaje de error en la sección Historial de ejecuciones de sincronización de la página de detalles del origen de datos, en la columna Detalles. Los errores de documento se indican en Amazon CloudWatch Logs. El mensaje de error proporciona información sobre lo que ha fallado. El problema suele ser que el índice o la fuente de datos no tienen los IAM permisos adecuados. El mensaje de error describe los permisos que faltan. A continuación se muestran algunos de los mensajes de error que puede recibir:

Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.

Si su función de índice no tiene permiso de uso CloudWatch, la fuente de datos no podrá crear un CloudWatch registro. Si recibe este error, debe añadir CloudWatch permisos al rol de índice.

Failed to access Amazon S3 file prefix (bucket name) while trying to crawl your metadata files. Please make sure the IAM role (ARN) provided has sufficient permissions.

Si utiliza una fuente de Amazon S3 datos, Amazon Kendra debe tener permiso para acceder al depósito que contiene los documentos. Debe añadir permiso para leer el depósito Amazon Kendra a la IAM función de fuente de datos.

The provided IAM role (ARN) could not be assumed. Please make sure Amazon Kendra is a trusted entity that is allowed to assume the role.

Amazon Kendra necesita permiso para asumir las IAM funciones de índice y fuente de datos. Debe añadir una política de confianza a los roles con permiso para la acción sts:AssumeRole.

Para conocer las IAM políticas que Amazon Kendra deben indexar una fuente de datos, consulte IAM las funciones.

Para generar un informe de estado de sincronización de documentos, consulte Deseo generar un informe de estado de sincronización para mis documentos.

Mi trabajo de sincronización está incompleto

Por lo general, los trabajos quedan incompletos cuando han finalizado el proceso de origen de datos, pero se produce algún error durante el proceso a nivel de documento. Cuando un trabajo está incompleto, es posible que algunos de los documentos no se hayan indexado correctamente. En el caso de un origen de datos de Amazon S3 , las causas por las que un trabajo está incompleto son:

  • Los metadatos de uno o más documentos no eran válidos.

  • Cuando se envían documentos para su indexación pero no se ha enviado al menos un documento.

  • Cuando se envían documentos para su eliminación del índice pero no se ha enviado al menos un documento.

Para solucionar problemas relacionados con un trabajo de sincronización incompleto, consulte primero los CloudWatch registros.

  1. En la columna de detalles, selecciona Ver detalles en CloudWatch.

  2. Revise los mensajes de error para ver qué causó el error en el documento.

Para generar un informe de estado de sincronización de documentos, consulte Deseo generar un informe de estado de sincronización para mis documentos.

Mi trabajo de sincronización se ha realizado correctamente, pero no hay documentos indexados

En algunas ocasiones, la ejecución de un trabajo de sincronización de índices se marca como correcto, pero no hay ningún documento nuevo o actualizado indexado en el momento esperado. Algunas de las causas posibles son:

  • Comprueba la CloudWatch DocumentsSubmittedForIndexingFailed métrica para ver si algún documento no se ha sincronizado. Comprueba tus CloudWatch registros para obtener más información.

  • En el caso de una fuente de Amazon S3 datos, es posible que hayas introducido un nombre Amazon Kendra de depósito o un prefijo incorrectos. Asegúrese de que el depósito que Amazon Kendra está utilizando es el que contiene los documentos que se van a indexar.

  • Al volver a indexar un documento que no se pudo indexar en un trabajo anterior, Amazon Kendra no lo indexará a menos que haya cambiado el documento o el archivo de metadatos asociado.

Para generar un informe de estado de sincronización de documentos, consulte Deseo generar un informe de estado de sincronización para mis documentos.

Tengo problemas con el formato de los archivos al sincronizar mi origen de datos

Si tiene problemas con el formato de los archivos al añadir archivos al origen de datos o al sincronizar el origen de datos, asegúrese de que los tipos de documento sean compatibles con Amazon Kendra . Para obtener una lista de los tipos de documentos compatibles, Amazon Kendra consulte Tipos o formatos de documentos.

Si utiliza la API BatchPutDocument con archivos de texto sin formato, especifique PLAIN_TEXT como el tipo de contenido.

Quiero generar un informe del historial de sincronización de mis documentos

Al sincronizar el conector de la fuente de Amazon Kendra datos, Amazon Kendra puede generar informes de estado de sincronización para cada documento de la fuente de datos y copiarlos en un Amazon S3 depósito. Durante este proceso, los datos se cifran mediante claves de AWS KMS y solo usted puede verlos. El estado del documento del que se ha informado puede ser uno de los siguientes: erróneo, completado o satisfactorio con errores.

Antes de poder generar informes de estado de sincronización, debe hacer lo siguiente:

  • Añada el siguiente principio Amazon Kendra de servicio a su política de Amazon S3 acceso

    { “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
  • Cree un Amazon S3 depósito con permisos de acceso a Amazon Kendra

Si utiliza la consola, para generar un informe de estado de sincronización, elija activar la opción de generación del historial de sincronización en la página de detalles del origen de datos. A continuación, introduzca la ubicación del Amazon S3 depósito y elija entre las opciones de configuración disponibles. Los informes se generarán a partir de la siguiente sincronización, una vez que haya activado la opción de generar informes.

Si eliminas el Amazon S3 depósito, perderás tus datos de registro y tendrás que configurar uno nuevo para almacenar los nuevos informes de sincronización.

Actualmente, solo se admite el estado de generación de informes de sincronización para el conector de Amazon S3.

¿Cuánto tiempo lleva sincronizar un origen de datos?

Si no hay actualizaciones en los documentos, el tiempo de sincronización de un Amazon Kendra índice aumenta en proporción lineal al número de documentos. Por ejemplo, 1000 documentos sin ninguna actualización tardarían unos cinco minutos en sincronizarse y 2000 documentos sin ninguna actualización tardarían unos 10 minutos. Si hay actualizaciones en los documentos, el tiempo de sincronización aumentará en función del número de documentos actualizados.

¿Cuánto cuesta sincronizar un origen de datos?

Al sincronizar el índice, tarda dos minutos en calentarse y activarse Amazon EC2 para establecer las conexiones necesarias. No se le cobrará nada durante este proceso. El medidor de uso solo comienza después de que se inicie el trabajo de sincronización. Para obtener más información sobre Amazon Kendra los precios, consulta Amazon Kendra los precios.

Recibo un error Amazon EC2 de autorización

Si se produce un error de operación Amazon EC2 no autorizada durante la sincronización de una fuente de datos de nube privada virtual (VPC), es probable que su IAM función de VPC carezca de los permisos necesarios. Compruebe que la IAM función que utiliza para la fuente de datos tenga los permisos adjuntos. Para obtener más información, consulte IAM Función de nube privada virtual.

Su Amazon Kendra índice solo puede acceder a los archivos a los que una fuente de Amazon S3 datos le haya otorgado permisos de acceso. Por ejemplo, Amazon Kendra no puede modificar los Amazon S3 permisos que determinan si un objeto debe ser público o cifrado. Amazon Kendra tampoco tiene los permisos predeterminados para crear o devolver un enlace firmado para Amazon S3 objetos. Si desea activar la vinculación firmada para Amazon S3 los objetos de un Amazon Kendra índice, tiene dos opciones:

  • Puede firmar los resultados de la consulta del índice con el objeto URI de origen antes de devolver el resultado a la página de búsqueda. Para ver un step-by-step resumen de este proceso, consulte Compartir objetos mediante direcciones URL prefirmadas.

  • Puedes anular el uri de la fuente de metadatos del Amazon S3 objeto y hacer que tu servicio esté disponible a través de una red de entrega de CloudFront contenido (CDN) conectada a un bucket. Amazon S3 O bien, puedes usar un punto final API Gateway proxy que devuelva una URL prefirmada y la redirija a ella.

Aparece un mensaje de error AccessDenied al usar un archivo de certificado SSL

Si aparece un error de acceso denegado al utilizar un certificado SSL con su fuente de datos, asegúrese de que su IAM función tenga el permiso para acceder al archivo del certificado SSL en la ubicación especificada. Si el certificado está cifrado con una AWS KMS clave, su IAM función también debe tener permiso para descifrar mediante la AWS KMS clave. Para obtener más información, consulte Autenticación y control de acceso para AWS KMS.

Aparece un error de autorización al utilizar una fuente de SharePoint datos

Si se produce un error de autorización al sincronizar el índice con una fuente de SharePoint datos, confirme que se le ha asignado una función de administrador del sitio. SharePoint

Mi índice no rastrea los documentos de mi origen de datos de Confluence

Si tu Amazon Kendra índice no rastrea documentos de tu fuente de datos de Confluence durante el proceso de sincronización, confirma que formas parte de los grupos de administradores de Confluence.