Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Tutoriel : Création d'une solution de recherche intelligente enrichie de métadonnées avec Amazon Kendra
Ce didacticiel vous explique comment créer une solution de recherche intelligente enrichie de métadonnées, basée sur le langage naturel et basée sur le langage naturel pour les données de votre entreprise à l'aide d'Amazon Kendra,
Amazon Kendra est un service de recherche intelligent capable de créer un index de recherche pour vos référentiels de données non structurés en langage naturel. Pour permettre à vos clients de trouver et de filtrer plus facilement les réponses pertinentes, vous pouvez utiliser Amazon Comprehend pour extraire les métadonnées de vos données et les intégrer dans votre index de recherche Amazon Kendra.
Amazon Comprehend est un service de traitement du langage naturel (NLP) capable d'identifier des entités. Les entités sont des références à des personnes, à des lieux, à des lieux, à des organisations et à des objets contenus dans vos données.
Ce didacticiel utilise un ensemble de données d'articles de presse pour extraire des entités, les convertir en métadonnées et les intégrer dans votre index Amazon Kendra pour y effectuer des recherches. Les métadonnées ajoutées vous permettent de filtrer les résultats de recherche à l'aide de n'importe quel sous-ensemble de ces entités et d'améliorer la précision de la recherche. En suivant ce didacticiel, vous apprendrez à créer une solution de recherche pour les données de votre entreprise sans aucune connaissance spécialisée en machine learning.
Ce didacticiel explique comment créer votre solution de recherche en suivant les étapes suivantes :
-
Stockage d'un ensemble de données d'articles de presse dans Amazon S3.
-
Utiliser Amazon Comprehend pour extraire des entités de vos données.
-
Exécution d'un script Python 3 pour convertir les entités au format de métadonnées d'index Amazon Kendra et stockage de ces métadonnées dans S3.
-
Création d'un index de recherche Amazon Kendra et ingestion des données et des métadonnées.
-
Interrogation de l'index de recherche.
Le schéma suivant montre le flux de travail :

Temps estimé pour terminer ce didacticiel : 1 heure
Coût estimé : certaines des actions décrites dans ce didacticiel entraînent des frais sur votre AWS compte. Pour plus d'informations sur le coût de chaque service, consultez les pages de prix d'Amazon S3
Rubriques
Prérequis
Pour suivre ce didacticiel, vous avez besoin des ressources suivantes :
-
Un AWS compte. Si vous n'avez pas de AWS compte, suivez les étapes décrites dans Configuration d'Amazon Kendra pour configurer votre AWS compte.
-
Un ordinateur de développement exécutant Windows, macOS ou Linux pour accéder à la console AWS de gestion. Pour plus d'informations, consultez Configuration de la console AWS de gestion.
-
Un utilisateur AWS Identity and Access Management
(IAM). Pour savoir comment configurer un utilisateur et un groupe IAM pour votre compte, consultez la section Getting Started du guide de l'utilisateur IAM. Si vous utilisez le AWS Command Line Interface, vous devez également associer la politique suivante à votre utilisateur IAM afin de lui accorder les autorisations de base requises pour suivre ce didacticiel.
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "iam:GetUserPolicy", "iam:DeletePolicy", "iam:CreateRole", "iam:AttachRolePolicy", "iam:DetachRolePolicy", "iam:AttachUserPolicy", "iam:DeleteRole", "iam:CreatePolicy", "iam:GetRolePolicy", "s3:CreateBucket", "s3:ListBucket", "s3:DeleteObject", "s3:DeleteBucket", "s3:PutObject", "s3:GetObject", "s3:ListAllMyBuckets", "comprehend:StartEntitiesDetectionJob", "comprehend:BatchDetectEntities", "comprehend:ListEntitiesDetectionJobs", "comprehend:DescribeEntitiesDetectionJob", "comprehend:StopEntitiesDetectionJob", "comprehend:DetectEntities", "kendra:Query", "kendra:StopDataSourceSyncJob", "kendra:CreateDataSource", "kendra:BatchPutDocument", "kendra:DeleteIndex", "kendra:StartDataSourceSyncJob", "kendra:CreateIndex", "kendra:ListDataSources", "kendra:UpdateIndex", "kendra:DescribeIndex", "kendra:DeleteDataSource", "kendra:ListIndices", "kendra:ListDataSourceSyncJobs", "kendra:DescribeDataSource", "kendra:BatchDeleteDocument" ], "Resource": "*" }, { "Sid": "iamPassRole", "Effect": "Allow", "Action": "iam:PassRole", "Resource": "*", "Condition": { "StringEquals": { "iam:PassedToService": [ "s3.amazonaws.com", "comprehend.amazonaws.com", "kendra.amazonaws.com" ] } } } ] }
Pour plus d'informations, consultez les sections Création de politiques IAM et Ajout et suppression d'autorisations d'identité IAM.
-
La liste des services AWS régionaux
. Pour réduire le temps de latence, vous devez choisir la AWS région la plus proche de votre situation géographique prise en charge par Amazon Comprehend et Amazon Kendra. -
(Facultatif) Un AWS Key Management Service. Bien que ce didacticiel n'utilise pas le chiffrement, vous souhaiterez peut-être utiliser les meilleures pratiques de chiffrement pour votre cas d'utilisation spécifique.
-
(Facultatif) Un Amazon Virtual Private Cloud. Bien que ce didacticiel n'utilise pas de VPC, vous souhaiterez peut-être utiliser les meilleures pratiques en matière de VPC pour garantir la sécurité des données pour votre cas d'utilisation spécifique.