Tutorial: Introducción a la consola Amazon A2I - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Tutorial: Introducción a la consola Amazon A2I

El siguiente tutorial es una introducción al uso de Amazon A2I en la consola de Amazon A2I.

El tutorial le ofrece la opción de utilizar Augmented AI con Amazon Textract para la revisión de documentos o Amazon Rekognition para la revisión del contenido de las imágenes.

Requisitos previos

Para empezar a utilizar Amazon A2I, complete los siguientes requisitos previos.

  • Cree un bucket de Amazon S3 en el mismo AWS La región como flujo de trabajo para los datos de entrada y salida. Por ejemplo, si utiliza Amazon A2I con Amazon Textract en us-east-1, cree su bucket en us-east-1. Para crear un bucket, siga las instrucciones en Crear un bucket en la Guía del usuario de la consola de Amazon Simple Storage Service.

  • Realice una de las siguientes acciones siguientes:

    • Si desea completar el tutorial con Amazon Textract, descargue la siguiente imagen y colóquela en su bucket de Amazon S3.

      Breve solicitud de empleo
    • Si desea completar el tutorial con Amazon Rekognition, descargue la siguiente imagen y colóquela en su bucket de Amazon S3.

      Mujer en bikini haciendo yoga en la playa
nota

La consola Amazon A2I está integrada en la SageMaker consola.

Paso 1: crear un equipo de trabajo

En primer lugar, cree un equipo de trabajo en la consola Amazon A2I y añádase como trabajador para poder obtener una vista previa de la tarea de revisión del trabajador.

importante

En este tutorial, se utiliza un equipo de trabajo privado. La plantilla privada de Amazon A2I está configurada en el área Ground Truth de la SageMaker consola y la comparten Amazon A2I y Ground Truth.

Para crear un personal privado con correos electrónicos de trabajadores
  1. Abre la consola en. SageMaker https://console.aws.amazon.com/sagemaker/

  2. En el panel de navegación, elija Empleados de etiquetado bajo Ground Truth.

  3. Elija Privado, a continuación elija Crear equipo privado.

  4. Elija Invitar a nuevos trabajadores por correo electrónico.

  5. Para este tutorial, introduzca su dirección de correo electrónico y cualquier otra dirección de la que desee obtener una vista previa de la interfaz de usuario de tareas humanas. Pegue o escriba una lista de hasta 50 direcciones de correo electrónico separadas por comas en el cuadro de direcciones de correo electrónico.

  6. Introduzca un nombre de organización y un correo electrónico de contacto.

  7. Si lo desea, elija un SNS tema de Amazon al que desee suscribir al equipo para que los trabajadores reciban una notificación por correo electrónico cuando haya nuevos trabajos de etiquetado de Ground Truth disponibles. SNSLas notificaciones de Amazon son compatibles con Ground Truth y no con Augmented AI. Si suscribes a los trabajadores a SNS las notificaciones de Amazon, solo recibirán notificaciones sobre los trabajos de etiquetado de Ground Truth. No recibirán notificaciones sobre tareas de Augmented AI.

  8. Elija Crear equipo privado.

Si se incorpora a un equipo de trabajo privado, recibirá un correo electrónico de no-reply@verificationemail.com con la información de inicio de sesión. Use el enlace de ese correo electrónico para restablecer su contraseña e iniciar sesión en el portal para trabajadores. Es aquí donde aparecen las tareas de revisión humana al crear un bucle humano.

Paso 2: crear un flujo de trabajo de revisión humana

En este paso, creará un flujo de trabajo de revisión humana. Cada flujo de trabajo de revisión humana se crea para un tipo de tarea específico. Este tutorial le permite elegir entre los tipos de tareas integrados: Amazon Rekognition y Amazon Textract.

Para crear un flujo de trabajo de revisión humana:
  1. Abre la consola Augmented AI en https://console.aws.amazon.com/a2i para acceder a la página de flujos de trabajo de Human Review.

  2. Seleccione Crear un flujo de trabajo de revisión humana.

  3. En la configuración del flujo de trabajo, introduzca el nombre del flujo de trabajo, el bucket de S3 y el IAMrol que creó para este tutorial, con la AWS política AmazonAugmentedAIIntegratedAPIAccess gestionada adjunta.

  4. Para el Tipo de tarea, seleccione Textract: Extracción de pares de clave-valor o Rekognition: Moderación de imágenes.

  5. Seleccione el tipo de tarea que haya elegido de la siguiente tabla para obtener instrucciones sobre ese tipo de tarea.

    Amazon Textract – Key-value pair extraction

    1. Seleccione Desencadenar una revisión humana para claves de formulario específicas basadas en la puntuación de confianza de clave de formulario o cuando faltan algunas claves de formulario específicas.

    2. En Nombre de la clave, introduzca Mail Address.

    3. Establezca el umbral de confianza de la identificación entre 0 y 99.

    4. Establezca el umbral de confianza de la cualificación entre 0 y 99.

    5. Seleccione Desencadenar la revisión humana para todas las claves de formulario identificadas por Amazon Textract con puntuaciones de confianza en un rango especificado.

    6. Establezca el umbral de confianza de la identificación entre 0 y 90.

    7. Establezca el umbral de confianza de la cualificación entre 0 y 90.

    Esto inicia una revisión humana si Amazon Textract devuelve una puntuación de confianza inferior a 99 para Mail Address y su clave, o si devuelve una puntuación de confianza inferior a 90 para cualquier par clave-valor detectado en el documento.

    La siguiente imagen muestra la sección “Amazon Textract form extraction - Conditions for invoking human review” de la consola Amazon A2I. En la imagen, las casillas de verificación de los dos tipos de activadores explicados en el párrafo anterior están marcadas, y Mail Address se utiliza como Nombre de la clave para el primer activador. El umbral de confianza de la identificación se define mediante puntuaciones de confianza para los pares clave-valor detectados en el formulario, y se establece entre 0 y 99. El umbral de confianza de la cualificación se define mediante puntuaciones de confianza para el texto contenido entre claves y valores en un formulario, y se establece entre 0 y 99.

    La consola Amazon A2I muestra las condiciones para invocar la sección de reseñas humanas.
    Amazon Rekognition – Image moderation

    1. Seleccione Active la revisión humana de las etiquetas identificadas por Amazon Rekognition en función de la puntuación de confianza de la etiqueta.

    2. Establezca el umbral entre 0 y 98.

    Esto inicia una revisión humana si Amazon Rekognition devuelve una puntuación de confianza inferior a 98 para un trabajo de moderación de imágenes.

    La siguiente imagen muestra cómo puede seleccionar la opción Active la revisión humana de las etiquetas identificadas por Amazon Rekognition en función de la puntuación de confianza de la etiqueta e introducir un umbral de entre 0 y 98 en la consola Amazon A2I.

    La consola Amazon A2I muestra las condiciones para invocar la sección de reseñas humanas.
  6. En Creación de plantillas de tareas de trabajadores, seleccione Crear a partir de una plantilla predeterminada.

  7. Introduzca un Nombre de plantilla.

  8. En el campo Descripción de la tarea, introduzca el siguiente texto:

    Read the instructions carefully and complete the task.

  9. En Trabajadores, seleccione Privado.

  10. Seleccione el equipo privado que ha creado.

  11. Seleccione Crear.

Tras crear el flujo de trabajo de revisión humana, este aparecerá en la tabla de la página Flujos de trabajo de revisión humana. Cuando el estado seaActive, copie y guarde el flujo de trabajo. ARN Lo necesita para el siguiente paso.

Paso 3: iniciar el bucle humano

Debe utilizar una API operación para iniciar un bucle humano. Hay una variedad de lenguajes específicos SDKs que puede utilizar para interactuar con estas API operaciones. Para ver la documentación de cada una de ellasSDKs, consulte la sección Vea también de la API documentación, como se muestra en la imagen siguiente.

Captura de pantalla de la sección Vea también de la documentación de Amazon Textract API

Para este tutorial, utilice una de las siguientes opciones: APIs

  • Si ha elegido el tipo de tarea Amazon Textract, utilizará la operación AnalyzeDocument.

  • Si ha elegido el tipo de tarea Amazon Rekognition, utilizará la operación DetectModerationLabels.

Puede interactuar con ellas APIs mediante una instancia de SageMaker bloc de notas (recomendada para nuevos usuarios) o el AWS Command Line Interface (AWS CLI). Elija una de las siguientes opciones para obtener más información sobre estas opciones:

Seleccione el tipo de tarea en la siguiente tabla para ver ejemplos de solicitudes para Amazon Textract y Amazon Rekognition mediante el AWS SDK for Python (Boto3).

Amazon Textract – Key-value pair extraction

En el siguiente ejemplo, se utiliza la AWS SDK for Python (Boto3) para llamar a analyze_document us-west-2. Sustituya el texto rojo en cursiva por sus recursos. Solo debe incluir el parámetro DataAttributes si utiliza la plantilla de Amazon Mechanical Turk. Para obtener más información, consulte la analyze_document documentación en la AWS SDK for Python (Boto) APIReferencia.

response = client.analyze_document( Document={ "S3Object": { "Bucket": "amzn-s3-demo-bucket", "Name": "document-name.pdf" } }, HumanLoopConfig={ "FlowDefinitionArn":"arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "HumanLoopName":"human-loop-name", "DataAttributes" : { "ContentClassifiers":["FreeOfPersonallyIdentifiableInformation","FreeOfAdultContent"] } }, FeatureTypes=["TABLES", "FORMS"])
Amazon Rekognition – Image moderation

En el siguiente ejemplo, se utiliza el AWS SDK for Python (Boto3) para llamar a detect_moderation_labels us-west-2. Sustituya el texto rojo en cursiva por sus recursos. Solo debe incluir el parámetro DataAttributes si utiliza la plantilla de Amazon Mechanical Turk. Para obtener más información, consulte la detect_moderation_labels documentación en la AWS SDK for Python (Boto) APIReferencia.

response = client.detect_moderation_labels( Image={ "S3Object":{ "Bucket": "amzn-s3-demo-bucket", "Name": "image-name.png" } }, HumanLoopConfig={ "FlowDefinitionArn":"arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "HumanLoopName":"human-loop-name", "DataAttributes":{ ContentClassifiers:["FreeOfPersonallyIdentifiableInformation"|"FreeOfAdultContent"] } })

Paso 4: ver el estado del bucle humano en la consola

Al iniciar un bucle humano, puede ver su estado en la consola Amazon A2I.

Para ver el estado de su bucle humano
  1. Abre la consola Augmented AI en https://console.aws.amazon.com/a2i para acceder a la página de flujos de trabajo de Human Review.

  2. Seleccione el flujo de trabajo de revisión humana que utilizó para iniciar el bucle humano.

  3. En la sección Bucles humanos, puede ver su bucle humano. Consulte el estado en la columna Estado.

Paso 5: descargar los datos de salida

Los datos de salida se almacenan en el bucket de Amazon S3 que especificó al crear el flujo de trabajo de revisión humana.

Para ver los datos de salida de Amazon A2I
  1. Abra la consola de Amazon S3.

  2. Seleccione el bucket de Amazon S3 que especificó al crear su flujo de trabajo de revisión humana en el paso 2 de este ejemplo.

  3. Empezando por la carpeta que lleva el nombre del flujo de trabajo de revisión humana, vaya a los datos de salida seleccionando la carpeta con la siguiente convención de nomenclatura:

    s3://output-bucket-specified-in-human-review-workflow/human-review-workflow-name/YYYY/MM/DD/hh/mm/ss/human-loop-name/output.json
  4. Seleccione output.json y Descargar.