Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Solución de problemas con los orígenes de datos
Esta sección puede ayudarle a resolver problemas comunes al configurar y utilizar Amazon Kendra los conectores de fuentes de datos.
No se han indexado mis documentos
Al sincronizar el Amazon Kendra índice con una fuente de datos, es posible que se produzcan problemas que impidan la indexación de los documentos. La indexación es un proceso que consta de dos pasos. En primer lugar, se comprueba el origen de datos para ver si hay documentos nuevos y actualizados que se deben indexar y se buscan documentos que se deben eliminar del índice. En segundo lugar, en el nivel del documento, se accede a cada documento y se indexa.
Se puede producir un error en cualquiera de estos pasos. Los errores de origen de datos se indican en la consola, en la sección Historial de ejecuciones de sincronización de la página de detalles del origen de datos. El estado del trabajo de sincronización puede ser correcto, incompleto o erróneo. También puede ver el número de documentos indexados y eliminados durante el trabajo. Si el estado es erróneo, se muestra un mensaje en la columna Detalles.
Los errores a nivel de documento se notifican en. Amazon CloudWatch Logs Puede ver los errores en la CloudWatch consola.
Para generar un informe de estado de sincronización de documentos, consulte Deseo generar un informe de estado de sincronización para mis documentos.
Ha fallado mi trabajo de sincronización
Un trabajo de sincronización suele fallar cuando hay un error de configuración en el índice o en el origen de datos. En la consola, encontrará el mensaje de error en la sección Historial de ejecuciones de sincronización de la página de detalles del origen de datos, en la columna Detalles. Los errores de documento se indican en Amazon CloudWatch Logs. El mensaje de error proporciona información sobre lo que ha fallado. El problema suele ser que el índice o la fuente de datos no tienen los IAM permisos adecuados. El mensaje de error describe los permisos que faltan. A continuación se muestran algunos de los mensajes de error que puede recibir:
Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.
Si su función de índice no tiene permiso de uso CloudWatch, la fuente de datos no podrá crear un CloudWatch registro. Si recibe este error, debe añadir CloudWatch permisos al rol de índice.
Failed to access Amazon S3 file prefix (
bucket
name
) while trying to crawl your metadata files. Please make
sure the IAM role (ARN
) provided has
sufficient permissions.
Si utiliza una fuente de Amazon S3 datos, Amazon Kendra debe tener permiso para acceder al depósito que contiene los documentos. Debe añadir permiso para leer el depósito Amazon Kendra a la IAM función de fuente de datos.
The provided IAM role (
ARN
) could
not be assumed. Please make sure Amazon Kendra is a trusted entity that is
allowed to assume the role.
Amazon Kendra necesita permiso para asumir las IAM funciones de índice y fuente de datos. Debe añadir una política de confianza a los roles con permiso para la acción sts:AssumeRole
.
Para conocer las IAM políticas que Amazon Kendra deben indexar una fuente de datos, consulte IAM las funciones.
Para generar un informe de estado de sincronización de documentos, consulte Deseo generar un informe de estado de sincronización para mis documentos.
Mi trabajo de sincronización está incompleto
Por lo general, los trabajos quedan incompletos cuando han finalizado el proceso de origen de datos, pero se produce algún error durante el proceso a nivel de documento. Cuando un trabajo está incompleto, es posible que algunos de los documentos no se hayan indexado correctamente. En el caso de un origen de datos de Amazon S3 , las causas por las que un trabajo está incompleto son:
-
Los metadatos de uno o más documentos no eran válidos.
-
Cuando se envían documentos para su indexación pero no se ha enviado al menos un documento.
-
Cuando se envían documentos para su eliminación del índice pero no se ha enviado al menos un documento.
Para solucionar un problema de sincronización incompleto, consulta primero tus CloudWatch registros.
-
En la columna de detalles, selecciona Ver detalles en CloudWatch.
-
Revise los mensajes de error para ver qué causó el error en el documento.
Para generar un informe de estado de sincronización de documentos, consulte Deseo generar un informe de estado de sincronización para mis documentos.
Mi trabajo de sincronización se ha realizado correctamente, pero no hay documentos indexados
En algunas ocasiones, la ejecución de un trabajo de sincronización de índices se marca como correcto, pero no hay ningún documento nuevo o actualizado indexado en el momento esperado. Algunas de las causas posibles son:
-
Comprueba la CloudWatch
DocumentsSubmittedForIndexingFailed
métrica para ver si algún documento no se ha sincronizado. Comprueba tus CloudWatch registros para obtener más información. -
En el caso de una fuente de Amazon S3 datos, es posible que hayas introducido un nombre Amazon Kendra de depósito o un prefijo incorrectos. Asegúrese de que el depósito que Amazon Kendra está utilizando es el que contiene los documentos que se van a indexar.
-
Al volver a indexar un documento que no se pudo indexar en un trabajo anterior, Amazon Kendra no lo indexará a menos que haya cambiado el documento o el archivo de metadatos asociado.
Para generar un informe de estado de sincronización de documentos, consulte Deseo generar un informe de estado de sincronización para mis documentos.
Tengo problemas con el formato de los archivos al sincronizar mi origen de datos
Si tiene problemas con el formato de los archivos al añadir archivos al origen de datos o al sincronizar el origen de datos, asegúrese de que los tipos de documento sean compatibles con Amazon Kendra . Para obtener una lista de los tipos de documentos compatibles, Amazon Kendra consulte Tipos o formatos de documentos.
Si utiliza la API BatchPutDocument
con archivos de texto sin formato, especifique PLAIN_TEXT
como el tipo de contenido.
Quiero generar un informe del historial de sincronización de mis documentos
CloudWatch Para ver un informe del historial de ejecuciones de sincronización a nivel de documento correspondiente al trabajo de sincronización de la fuente de datos, seleccione Ver informe. Un informe del historial de ejecuciones de sincronización incluirá detalles sobre el progreso y el estado de cada documento del trabajo de sincronización. Muestra si un documento se ha realizado correctamente, si ha fallado o si se ha omitido durante las etapas de rastreo, sincronización e indexación. También encontrará cualquier mensaje de error relacionado con documentos fallidos u omitidos. Si el informe no muestra los resultados de un trabajo de sincronización en curso, es posible que los registros aún no estén disponibles. Vuelva a consultarlo más tarde, ya que los datos se van emitiendo al informe a medida que se producen eventos durante el proceso de sincronización.
Para acceder al informe del historial de ejecuciones de sincronización, sigue estos pasos:
-
Abra la consola Amazon Kendra en. https://console.aws.amazon.com/kendra/
-
En el menú de navegación de la izquierda, en Administración de datos, elija Fuentes de datos y, a continuación, elija su fuente de datos.
-
En la página de resumen de la fuente de datos, desplázate hacia abajo y selecciona la pestaña Historial de sincronización.
-
En Sincronizar el historial de ejecuciones, selecciona Acciones.
-
En Acciones, selecciona Ver informe. Se le redirigirá a la CloudWatch consola donde podrá acceder al informe.
nota
Un historial de ejecución de sincronización registra si un documento se indexó correctamente durante la ingestión, incluidos los datos adjuntos ACLs y los metadatos, para todos los conectores compatibles con Amazon Kendra.
Si utilizas el conector Amazon S3:
Además de ver el informe del historial de ejecuciones de sincronización a nivel de documento CloudWatch, puede generar informes del historial de sincronización para cada documento de su fuente de datos de Amazon S3 y copiarlos en un bucket. Amazon S3 Durante este proceso, sus datos se cifran mediante AWS KMS claves y solo usted puede verlos. El estado del documento del que se ha informado puede ser uno de los siguientes: erróneo, completado o satisfactorio con errores. Antes de poder generar informes de estado de sincronización para Amazon S3, debe hacer lo siguiente:
-
Añada el siguiente principio Amazon Kendra de servicio a su política de Amazon S3 acceso
{ “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
-
Cree un Amazon S3 depósito con permisos de acceso a Amazon Kendra
Si utiliza la consola, para generar un informe del historial de sincronización para Amazon S3, seleccione activar la opción Generar informes en la sección Sincronizar informes del historial (opcional) de la página de detalles de la fuente de datos. A continuación, ingrese la ubicación del bucket de Amazon S3 y elija entre las opciones de configuración disponibles. Los informes se generarán a partir de la siguiente sincronización, una vez que haya activado la opción de generar informes.
Si elimina el Amazon S3 depósito, perderá los datos de registro y tendrá que configurar un nuevo depósito para almacenar los nuevos informes de sincronización.
nota
Un informe del historial de sincronización solo proporciona información sobre si un conector de Amazon S3 rastreó e ingirió datos correctamente.
¿Cuánto tiempo lleva sincronizar un origen de datos?
Si no hay actualizaciones en los documentos, el tiempo de sincronización de un Amazon Kendra índice aumenta en proporción lineal al número de documentos. Por ejemplo, 1000 documentos sin ninguna actualización tardarían unos cinco minutos en sincronizarse y 2000 documentos sin ninguna actualización tardarían unos 10 minutos. Si hay actualizaciones en los documentos, el tiempo de sincronización aumentará en función del número de documentos actualizados.
¿Cuánto cuesta sincronizar un origen de datos?
Al sincronizar el índice, tarda dos minutos en calentarse y activarse Amazon EC2 para establecer las conexiones necesarias. No se le cobrará nada durante este proceso. El medidor de uso solo comienza después de que se inicie el trabajo de sincronización. Para obtener más información sobre Amazon Kendra los precios, consulta Amazon Kendra
los precios
Recibo un error Amazon EC2 de autorización
Si se produce un error de operación Amazon EC2 no autorizada durante la sincronización de una fuente de datos de nube privada virtual (VPC), es probable que su IAM función de VPC carezca de los permisos necesarios. Compruebe que la IAM función que utiliza para la fuente de datos tenga los permisos adjuntos. Para obtener más información, consulte IAM Función de nube privada virtual.
No puedo usar los enlaces del índice de búsqueda para abrir mis Amazon S3 objetos
Su Amazon Kendra índice solo puede acceder a los archivos a los que una fuente de Amazon S3 datos le haya otorgado permisos de acceso. Por ejemplo, Amazon Kendra no puede modificar los Amazon S3 permisos que determinan si un objeto debe ser público o cifrado. Amazon Kendra tampoco tiene los permisos predeterminados para crear o devolver un enlace firmado para Amazon S3 objetos. Si desea activar la vinculación firmada para Amazon S3 los objetos de un Amazon Kendra índice, tiene dos opciones:
-
Puede firmar los resultados de la consulta del índice con el objeto URI de origen antes de devolver el resultado a la página de búsqueda. Para ver un step-by-step resumen de este proceso, consulte Compartir objetos mediante URLs prefirmados.
-
Puedes anular el uri de la fuente de metadatos del Amazon S3 objeto y hacer que tu servicio esté disponible a través de una red de entrega de CloudFront contenido (CDN) conectada a un bucket. Amazon S3 O bien, puedes usar un punto final API Gateway proxy que devuelva una URL prefirmada y la redirija a ella.
Aparece un mensaje de error AccessDenied al usar un archivo de certificado SSL
Si aparece un error de acceso denegado al utilizar un certificado SSL con su fuente de datos, asegúrese de que su IAM función tenga el permiso para acceder al archivo del certificado SSL en la ubicación especificada. Si el certificado está cifrado con una AWS KMS clave, su IAM función también debe tener permiso para descifrarlo mediante la AWS KMS clave. Para obtener más información, consulte Autenticación y control de acceso para AWS KMS.
Aparece un error de autorización al utilizar una fuente de SharePoint datos
Si se produce un error de autorización al sincronizar el índice con una fuente de SharePoint datos, confirme que se le ha asignado una función de administrador del sitio. SharePoint
Mi índice no rastrea los documentos de mi origen de datos de Confluence
Si tu Amazon Kendra índice no rastrea documentos de tu fuente de datos de Confluence durante el proceso de sincronización, confirma que formas parte de los grupos de administradores de Confluence.