Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Realización de trabajos de análisis para el reconocimiento personalizado de entidades
Usted puede llevar a cabo un trabajo de análisis asíncrono para detectar entidades personalizadas en un conjunto de uno o más documentos.
Antes de empezar
Necesita un modelo de reconocimiento de entidades personalizado (también conocido como reconocedor) antes de poder detectar entidades personalizadas. Para obtener más información acerca de estos modelos, consulte Entrenamiento de los modelos de reconocedores personalizados de entidades.
Un reconocedor entrenado con anotaciones de texto sin formato admite la detección de entidades únicamente en documentos de texto sin formato. Un reconocedor entrenado con anotaciones de documentos PDF permite la detección de entidades en documentos de texto sin formato, imágenes, archivos PDF y documentos de Word. En el caso de los archivos que no son de texto, Amazon Comprehend extrae el texto antes de llevar a cabo el análisis. Para obtener más información acerca de los archivos de entrada, consulte Entradas para análisis personalizados asíncronos.
Si planea analizar archivos de imagen o documentos PDF escaneados, su política de IAM debe conceder permisos para usar dos métodos de la API Amazon Textract DetectDocumentText ( AnalyzeDocumenty). Amazon Comprehend invoca estos métodos durante la extracción de texto. Para ver una política de ejemplo, consulte Permisos necesarios para realizar acciones de análisis de documentos.
Para realizar un trabajo de análisis asíncrono, lleve a cabo los siguientes pasos generales:
-
Almacene los documentos en un bucket de Amazon S3.
-
Utilice la API o la consola para iniciar el trabajo de análisis.
-
Monitorice el progreso del trabajo de análisis.
-
Una vez finalizado el trabajo, recupere los resultados del análisis del bucket de S3 que especificó al iniciar el trabajo.