Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Étape 3 : Formatage du résultat de l'analyse des entités sous forme de métadonnées Amazon Kendra
Pour convertir les entités extraites par Amazon Comprehend au format de métadonnées requis par un index Amazon Kendra, vous devez exécuter un script Python 3. Les résultats de la conversion sont stockés dans le metadata
dossier de votre compartiment Amazon S3.
Pour plus d'informations sur le format et la structure des métadonnées Amazon Kendra, consultez la section Métadonnées du document S3.
Rubriques
Téléchargement et extraction de la sortie Amazon Comprehend
Pour formater le résultat de l'analyse des entités Amazon Comprehend, vous devez d'abord télécharger l'archive d'analyse des entités Amazon Comprehend et extraire le fichier d'output.tar.gz
analyse des entités.
-
Dans le volet de navigation de la console Amazon Comprehend, accédez à Analysis jobs.
-
Choisissez votre tâche d'analyse d'entités
data-entities-analysis
. -
Sous Sortie, choisissez le lien affiché à côté de Emplacement des données de sortie. Cela vous redirige vers l'
output.tar.gz
archive de votre compartiment S3. -
Dans l'onglet Vue d'ensemble, choisissez Télécharger.
Astuce
Les résultats de toutes les tâches d'analyse Amazon Comprehend portent le même nom. Le fait de renommer votre archive vous permettra de la suivre plus facilement.
-
Décompressez et extrayez le fichier Amazon Comprehend téléchargé sur votre appareil.
-
Pour accéder au nom du dossier généré automatiquement par Amazon Comprehend dans votre compartiment S3 qui contient les résultats de la tâche d'analyse des entités, utilisez la commande suivante : describe-entities-detection-job
-
À partir de l'
OutputDataConfig
objet figurant dans la description de travail de votre entité, copiez et enregistrez laS3Uri
valeur danscomprehend-S3uri
un éditeur de texte.Note
Le format de
S3Uri
la valeur est similaire às3://amzn-s3-demo-bucket/.../output/output.tar.gz
. -
Pour télécharger l'archive de sortie des entités, utilisez la commande copy
: -
Pour extraire la sortie des entités, exécutez la commande suivante dans une fenêtre de terminal :
À la fin de cette étape, vous devriez avoir un fichier sur votre appareil appelé output
contenant une liste des entités identifiées par Amazon Comprehend.
Téléchargement de la sortie dans le compartiment S3
Après avoir téléchargé et extrait le fichier d'analyse des entités Amazon Comprehend, vous chargez le fichier output
extrait dans votre compartiment Amazon S3.
Ouvrez la console Amazon S3 à l'adresse https://console.aws.amazon.com/s3/
. -
Dans Buckets, cliquez sur le nom de votre bucket, puis choisissez Upload.
-
Dans Fichiers et dossiers, choisissez Ajouter des fichiers.
-
Dans la boîte de dialogue, accédez au
output
fichier extrait sur votre appareil, sélectionnez-le, puis choisissez Ouvrir. -
Conservez les paramètres par défaut pour la destination, les autorisations et les propriétés.
-
Sélectionnez Charger.
Conversion de la sortie au format de métadonnées Amazon Kendra
Pour convertir la sortie Amazon Comprehend en métadonnées Amazon Kendra, vous devez exécuter un script Python 3. Si vous utilisez la console, utilisez AWS CloudShell pour cette étape.
-
Téléchargez le fichier compressé .py.zip du convertisseur sur votre appareil.
-
Extrayez le fichier Python 3
converter.py
. -
Connectez-vous à la console AWS de gestion
et assurez-vous que votre AWS région est définie sur la même région que votre compartiment S3 et votre tâche d'analyse Amazon Comprehend. -
Cliquez sur l'AWS CloudShell icône ou saisissez du AWS CloudShelltexte dans la zone de recherche de la barre de navigation supérieure pour lancer un environnement.
Note
Lors du premier AWS CloudShell lancement dans une nouvelle fenêtre de navigateur, un panneau de bienvenue s'affiche et répertorie les principales fonctionnalités. Le shell est prêt à interagir une fois que vous avez fermé ce panneau et que l'invite de commande s'affiche.
-
Une fois le terminal préparé, choisissez Actions dans le volet de navigation, puis choisissez Télécharger le fichier dans le menu.
-
Dans la boîte de dialogue qui s'ouvre, choisissez Sélectionner un fichier, puis choisissez le fichier
converter.py
Python 3 téléchargé sur votre appareil. Sélectionnez Charger. -
Dans l' AWS CloudShell environnement, entrez la commande suivante :
python3 converter.py
-
Lorsque l'interface shell vous invite à saisir le nom de votre compartiment S3, entrez le nom de votre compartiment S3 et appuyez sur Entrée.
-
Lorsque l'interface shell vous invite à entrer le chemin de fichier complet vers votre fichier de sortie Comprehend, entrez et appuyez sur Entrée.
output
-
Lorsque l'interface shell vous invite à saisir le chemin de fichier complet de votre dossier de métadonnées, entrez
metadata/
et appuyez sur Entrée.
Important
Pour que les métadonnées soient correctement formatées, les valeurs d'entrée des étapes 8 à 10 doivent être exactes.
-
Pour télécharger le fichier Python 3
converter.py
, exécutez la commande suivante dans une fenêtre de terminal : -
Pour extraire le fichier Python 3, exécutez la commande suivante dans la fenêtre du terminal :
-
Assurez-vous que Boto3 est installé sur votre appareil en exécutant la commande suivante.
Note
Si Boto3 n'est pas installé, lancez-vous
pip3 install boto3
pour l'installer. -
Pour exécuter le script Python 3 afin de convertir le
output
fichier, exécutez la commande suivante. -
Lorsque vous y AWS CLI êtes invité
Enter the name of your S3 bucket
, entrez le nom de votre compartiment S3 et appuyez sur Entrée. -
Lorsque vous y AWS CLI êtes invité
Enter the full filepath to your Comprehend output file
, entrezoutput
et appuyez sur Entrée. -
Lorsque vous y AWS CLI êtes invité
Enter the full filepath to your metadata folder
, entrezmetadata/
et appuyez sur Entrée.
Important
Pour que les métadonnées soient correctement formatées, les valeurs d'entrée des étapes 5 à 7 doivent être exactes.
À la fin de cette étape, les métadonnées formatées sont déposées dans le metadata
dossier de votre compartiment S3.
Nettoyage de votre compartiment Amazon S3
Étant donné que l'index Amazon Kendra synchronise tous les fichiers stockés dans un compartiment, nous vous recommandons de nettoyer votre compartiment Amazon S3 pour éviter les résultats de recherche redondants.
Ouvrez la console Amazon S3 à l'adresse https://console.aws.amazon.com/s3/
. -
Dans Buckets, choisissez votre compartiment, puis sélectionnez le dossier de sortie de l'analyse des entités Amazon Comprehend, le fichier d'analyse des entités
.temp
Amazon Comprehend et le fichier Amazon Comprehend extrait.output
-
Dans l'onglet Aperçu, choisissez Supprimer.
-
Dans Supprimer des objets, sélectionnez Supprimer définitivement des objets ? et entrez
permanently delete
dans le champ de saisie de texte. -
Choisissez Supprimer les objets.
À la fin de cette étape, vous avez converti les résultats de l'analyse des entités Amazon Comprehend en métadonnées Amazon Kendra. Vous êtes maintenant prêt à créer un index Amazon Kendra.