Didacticiel : Démarrer dans la console Amazon A2I - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Didacticiel : Démarrer dans la console Amazon A2I

Le didacticiel suivant vous montre comment commencer à utiliser Amazon A2I dans la console Amazon A2I.

Le didacticiel vous donne la possibilité d'utiliser Augmented AI avec Amazon Textract pour la vérification des documents, ou Amazon Rekognition pour la vérification du contenu des images.

Prérequis

Pour commencer à utiliser Amazon A2I, vous devez remplir les conditions préalables suivantes.

  • Créez un compartiment Amazon S3 dans le même AWS La région comme flux de travail pour vos données d'entrée et de sortie. Par exemple, si vous utilisez Amazon A2I avec Amazon Textract dans la région us-east-1, créez votre compartiment dans la région us-east-1. Pour créer un compartiment, suivez les instructions de la section Create a Bucket (Créer un compartiment) dans le Guide de l'utilisateur de la console Amazon Simple Storage Service.

  • Effectuez l’une des actions suivantes :

    • Si vous souhaitez suivre le didacticiel à l'aide d'Amazon Textract, téléchargez l'image suivante et placez-la dans votre compartiment Amazon S3.

      Brève demande d'emploi
    • Si vous souhaitez suivre le didacticiel à l'aide d'Amazon Rekognition, téléchargez l'image suivante et placez-la dans votre compartiment Amazon S3.

      Femme en bikini faisant du yoga sur la plage
Note

La console Amazon A2I est intégrée à la SageMaker console.

Étape 1 : Créer une équipe de travail

Tout d'abord, créez une équipe de travail dans la console Amazon A2I et ajoutez-vous en tant qu'employé afin de pouvoir prévisualiser la tâche de vérification humaine.

Important

Ce didacticiel utilise une équipe de travail privée. Le personnel privé Amazon A2I est configuré dans la zone Ground Truth de la SageMaker console et est partagé entre Amazon A2I et Ground Truth.

Pour créer une main-d'œuvre privée à l'aide d'e-mails d'employés
  1. Ouvrez la SageMaker console à l'adresse https://console.aws.amazon.com/sagemaker/.

  2. Dans le panneau de navigation, choisissez Labeling workforces(Mains-d'œuvre de labélisation) sous Ground Truth.

  3. Choisissez Private (Privée), puis Create private team (Créer une équipe privée).

  4. Choisissez Invite new workers by email (Inviter les nouveaux employés par e-mail).

  5. Pour ce tutoriel, saisissez votre e-mail et celui de toutes les autres personnes dont vous voulez qu'elles puissent prévisualiser l'interface utilisateur de la tâche humaine. Collez ou tapez une liste de 50 adresses e-mail au maximum, séparées par des virgules, dans la zone d'adresses e-mail.

  6. Saisissez un nom d'organisation et une adresse e-mail de contact.

  7. Vous pouvez également choisir un SNS sujet Amazon auquel inscrire l'équipe afin que les collaborateurs soient avertis par e-mail lorsque de nouvelles offres d'étiquetage sont disponibles dans Ground Truth. Les SNS notifications Amazon sont prises en charge par Ground Truth et non par Augmented AI. Si vous abonnez les employés aux SNS notifications Amazon, ils ne reçoivent que des notifications concernant les offres d'emploi liées à Ground Truth. Ils ne recevront pas de notifications concernant les tâches Augmented AI.

  8. Choisissez Create private team (Créer une équipe privée).

Si vous vous ajoutez à une équipe de travail privée, vous recevez un e-mail de no-reply@verificationemail.com contenant des informations de connexion. Utilisez le lien figurant dans cet e-mail pour réinitialiser votre mot de passe et vous connecter à votre portail d'employé. C'est là que vos tâches de vérification humaine apparaissent lorsque vous créez une boucle humaine.

Étape 2 : Créer un flux de vérification humaine

Dans cette étape, vous créez un flux de vérification humaine. Chaque flux de vérification humaine est créé pour untype de tâche spécifique. Ce tutoriel vous permet de choisir entre les types de tâches intégrés : Amazon Rekognition et Amazon Textract.

Pour créer un flux de vérification humaine :
  1. Ouvrez la console Augmented AI à l'adresse https://console.aws.amazon.com/a2i pour accéder à la page des flux de travail de révision humaine.

  2. Sélectionnez Create human review workflow (Créer un flux de vérification humaine).

  3. Dans les paramètres du flux de travail, entrez un nom de flux de travail, un compartiment S3 et le IAMrôle que vous avez créé pour ce didacticiel, avec AWS politique gérée AmazonAugmentedAIIntegratedAPIAccess jointe.

  4. Pour Task type (Type de tâche), sélectionnez Textract — Extraction par paire clé-valeur ou Rekognition — Modération des images.

  5. Sélectionnez le type de tâche que vous avez choisi dans le tableau suivant pour obtenir les instructions relatives à ce type de tâche.

    Amazon Textract – Key-value pair extraction

    1. Sélectionnez Trigger a human review for specific form keys based on the form key confidence score or when specific form keys are missing (Déclencher une vérification humaine pour des clés de formulaire spécifiques en fonction de l'indice de confiance de la clé de formulaire ou lorsque des clés de formulaire spécifiques sont manquantes).

    2. Pour Key name (Nom de la clé), saisissez Mail Address.

    3. Définissez le seuil de confiance d'identification entre 0 et 99.

    4. Définissez le seuil de confiance de qualification entre 0 et 99.

    5. Sélectionnez Trigger a human review for all form keys identified by Amazon Textract with confidence scores in a specific range (Déclencher une vérification humaine pour toutes les clés de formulaire identifiées par Amazon Textract avec des indices de confiance figurant dans une plage spécifiée).

    6. Définissez le seuil de confiance d'identification entre 0 et 90.

    7. Définissez le seuil de confiance de qualification entre 0 et 90.

    Cela initie une vérification humaine si Amazon Textract renvoie un indice de confiance inférieur à 99 pour Mail Address et sa clé, ou un indice de confiance inférieur à 90 pour toute paire clé-valeur détectée dans le document.

    L'image suivante montre la section Amazon Textract form extraction - Conditions for invoking human review (Extraction de formulaire Amazon Textract - Conditions d'appel d'une vérification humaine) de la console Amazon A2I. Dans l'image, les cases en regard des deux types de déclencheurs expliqués dans le paragraphe suivant sont cochées, et Mail Address est utilisé comme Nom de clé pour le premier déclencheur. Le seuil de confiance d'identification est défini à l'aide d'indices de confiance pour les paires clé-valeur détectées dans le formulaire. Il est défini entre 0 et 99. Le seuil de confiance de qualification est défini à l'aide d'indices de confiance pour le texte contenu dans les clés et les valeurs d'un formulaire. Il est défini entre 0 et 99.

    Console Amazon A2I indiquant les conditions d'appel de la section d'évaluation humaine.
    Amazon Rekognition – Image moderation

    1. Sélectionnez Trigger human review for labels identified by Amazon Rekognition based on label confidence score (Déclencher une vérification humaine pour les étiquettes identifiées par Amazon Rekognition en fonction de l'indice de confiance de l'étiquette).

    2. Définissez Threshold (Seuil) entre 0 et 98.

    Cela initie une vérification humaine si Amazon Rekognition renvoie un indice de confiance inférieur à 98 pour une tâche de modération des images.

    L'image suivante illustre la façon dont vous pouvez sélectionner l'option Trigger human review for labels identified by Amazon Rekognition based on label confidence score (Déclencher une vérification humaine pour les étiquettes identifiées par Amazon Rekognition en fonction de l'indice de confiance de l'étiquette) et saisissez un Threshold (Seuil) entre 0 et 98 dans la console Amazon A2I.

    Console Amazon A2I indiquant les conditions d'appel de la section d'évaluation humaine.
  6. Pour Worker task template creation (Création d'un modèle de tâche d'employé), sélectionnez Create from a default template (Créer à partir d'un modèle par défaut).

  7. Saisissez un Template name (Nom de modèle).

  8. Dans le champ Task description (Description de la tâche), saisissez le texte suivant :

    Read the instructions carefully and complete the task.

  9. Pour Workers (Employés), sélectionnez Privé.

  10. Sélectionnez l'équipe privée que vous avez créée.

  11. Sélectionnez Create (Créer).

Une fois que votre flux de vérification humaine est créé, il apparaît dans le tableau de la page Human review workflows (Flux de vérification humaine). Lorsque le statut est définiActive, copiez et enregistrez le flux de travailARN. Vous en aurez besoin à l'étape suivante.

Étape 3 : Démarrer une boucle humaine

Vous devez utiliser une API opération pour démarrer une boucle humaine. Il existe plusieurs langages spécifiques SDKs que vous pouvez utiliser pour interagir avec ces API opérations. Pour consulter la documentation relative à chacun de ces élémentsSDKs, reportez-vous à la section Voir aussi de la API documentation, comme illustré dans l'image suivante.

Capture d'écran de la section Voir aussi de la documentation Amazon Textract API

Pour ce didacticiel, vous devez utiliser l'un des outils suivants APIs :

  • Si vous avez choisi le type de tâche Amazon Textract, utilisez l'opération AnalyzeDocument.

  • Si vous avez choisi le type de tâche Amazon Rekognition, utilisez l'opération DetectModerationLabels.

Vous pouvez interagir avec ces derniers APIs à l'aide d'une instance de SageMaker bloc-notes (recommandée pour les nouveaux utilisateurs) ou du AWS Command Line Interface (AWS CLI). Choisissez l'une des options suivantes pour en savoir plus sur ces options :

Sélectionnez votre type de tâche dans le tableau suivant pour voir des exemples de demandes pour Amazon Textract et Amazon Rekognition à l'aide du AWS SDK for Python (Boto3).

Amazon Textract – Key-value pair extraction

L'exemple suivant utilise le AWS SDK for Python (Boto3) pour appeler analyze_document us-west-2. Remplacez le texte en rouge et en italique par vos ressources. N'incluez le paramètre DataAttributes que si vous utilisez la main-d'œuvre Amazon Mechanical Turk. Pour plus d'informations, consultez la analyze_document documentation dans le AWS SDK for Python (Boto) APIRéférence.

response = client.analyze_document( Document={ "S3Object": { "Bucket": "amzn-s3-demo-bucket", "Name": "document-name.pdf" } }, HumanLoopConfig={ "FlowDefinitionArn":"arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "HumanLoopName":"human-loop-name", "DataAttributes" : { "ContentClassifiers":["FreeOfPersonallyIdentifiableInformation","FreeOfAdultContent"] } }, FeatureTypes=["TABLES", "FORMS"])
Amazon Rekognition – Image moderation

L'exemple suivant utilise le AWS SDK for Python (Boto3) pour appeler detect_moderation_labels us-west-2. Remplacez le texte en rouge et en italique par vos ressources. N'incluez le paramètre DataAttributes que si vous utilisez la main-d'œuvre Amazon Mechanical Turk. Pour plus d'informations, consultez la detect_moderation_labels documentation dans le AWS SDK for Python (Boto) APIRéférence.

response = client.detect_moderation_labels( Image={ "S3Object":{ "Bucket": "amzn-s3-demo-bucket", "Name": "image-name.png" } }, HumanLoopConfig={ "FlowDefinitionArn":"arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "HumanLoopName":"human-loop-name", "DataAttributes":{ ContentClassifiers:["FreeOfPersonallyIdentifiableInformation"|"FreeOfAdultContent"] } })

Étape 4 : Voir l'état de la boucle humaine dans la console

Lorsque vous démarrez une boucle humaine, vous pouvez voir son état dans la console Amazon A2I.

Pour voir l'état de votre boucle humaine
  1. Ouvrez la console Augmented AI à l'adresse https://console.aws.amazon.com/a2i pour accéder à la page des flux de travail de révision humaine.

  2. Sélectionnez le flux de vérification humaine que vous avez utilisé pour démarrer votre boucle humaine.

  3. Dans la section Human loops (Boucles humaines), vous pouvez voir votre boucle humaine. Voir son état dans la colonne Status (État).

Étape 5 : Télécharger les données de sortie

Vos données de sortie sont stockées dans le compartiment Amazon S3 que vous avez spécifié lorsque vous avez créé un flux de vérification humaine.

Pour voir vos données de sortie Amazon A2I
  1. Ouvrez la console Amazon S3.

  2. Sélectionnez le compartiment Amazon S3 que vous avez spécifié lorsque vous avez créé votre flux de vérification humaine à l'étape 2 de cet exemple.

  3. En commençant par le dossier nommé d'après votre flux de vérification humaine, accédez à vos données de sortie en sélectionnant le dossier avec la convention de dénomination suivante :

    s3://output-bucket-specified-in-human-review-workflow/human-review-workflow-name/YYYY/MM/DD/hh/mm/ss/human-loop-name/output.json
  4. Sélectionnez output.json et choisissez Download (Télécharger).