Amazon RDS (MySQL) - Amazon Kendra

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Amazon RDS (MySQL)

Amazon RDS (Amazon Relational Database Service) est un service Web qui facilite la configuration, l'exploitation et le dimensionnement d'une base de données relationnelle dans AWS le cloud. Si vous êtes un Amazon RDS utilisateur, vous pouvez l'utiliser Amazon Kendra pour indexer votre source de Amazon RDS (MySQL) données. Le connecteur Amazon Kendra de source de données prend en charge les versions Amazon RDS MySql 5.6, 5.7 et 8.0.

Vous pouvez vous connecter Amazon Kendra à votre source de Amazon RDS (MySQL) données à l'aide de la Amazon Kendra console et de l'TemplateConfigurationAPI.

Pour résoudre les problèmes liés à votre connecteur de source de Amazon Kendra Amazon RDS (MySQL) données, consultezDépannage des sources de données.

Fonctionnalités prises en charge

  • Mappages de champs

  • Filtrage du contexte utilisateur

  • Filtres d'inclusion/exclusion

  • Synchronisation complète et incrémentielle du contenu

  • Cloud privé virtuel (VPC)

Prérequis

Avant de pouvoir Amazon Kendra indexer votre source de Amazon RDS (MySQL) données, apportez ces modifications à vos AWS comptes Amazon RDS (MySQL) and.

DansAmazon RDS (MySQL), assurez-vous d'avoir :

  • Notez le nom d'utilisateur et le mot de passe de votre base de données.

    Important

    Il est recommandé de fournir des informations d'identification Amazon Kendra de base de données en lecture seule.

  • Vous avez copié l'URL, le port et l'instance de votre hôte de base de données. Vous pouvez trouver ces informations sur la Amazon RDS console.

  • Il est vérifié que chaque document est unique dans Amazon RDS (MySQL) et entre les autres sources de données que vous prévoyez d'utiliser pour le même index. Chaque source de données que vous souhaitez utiliser pour un index ne doit pas contenir le même document dans toutes les sources de données. Les identifiants de document sont globaux à un index et doivent être uniques par index.

Dans votre Compte AWS, assurez-vous d'avoir :

  • Création d'un Amazon Kendra index et, si vous utilisez l'API, notez l'ID de l'index.

  • Vous avez créé un IAM rôle pour votre source de données et, si vous utilisez l'API, notez l'ARN du IAM rôle.

    Note

    Si vous modifiez votre type d'authentification et vos informations d'identification, vous devez mettre à jour votre IAM rôle pour accéder au bon identifiant AWS Secrets Manager secret.

  • Stockez vos informations d'Amazon RDS (MySQL)authentification dans un AWS Secrets Manager secret et, si vous utilisez l'API, notez l'ARN du secret.

    Note

    Nous vous recommandons d'actualiser ou de modifier régulièrement vos informations d'identification et votre code secret. Fournissez uniquement le niveau d'accès nécessaire pour votre propre sécurité. Nous vous déconseillons de réutiliser les informations d'identification et les secrets entre les sources de données et les versions 1.0 et 2.0 du connecteur (le cas échéant).

Si vous n'avez pas de IAM rôle ou de secret existant, vous pouvez utiliser la console pour créer un nouveau IAM rôle et un nouveau Secrets Manager secret lorsque vous connectez votre source de Amazon RDS (MySQL) données à Amazon Kendra. Si vous utilisez l'API, vous devez fournir l'ARN d'un IAM rôle et d'un Secrets Manager secret existants, ainsi qu'un identifiant d'index.

Instructions de connexion

Pour vous connecter Amazon Kendra à votre source de Amazon RDS (MySQL) données, vous devez fournir les détails de vos Amazon RDS (MySQL) informations d'identification afin de Amazon Kendra pouvoir accéder à vos données. Si vous n'avez pas encore configuré Amazon RDS (MySQL) pour Amazon Kendra voirPrérequis.

Console

Pour vous connecter Amazon Kendra à Amazon RDS (MySQL)

  1. Connectez-vous à la Amazon Kendra console AWS Management Console et ouvrez-la.

  2. Dans le volet de navigation de gauche, choisissez Index, puis choisissez l'index que vous souhaitez utiliser dans la liste des index.

    Note

    Vous pouvez choisir de configurer ou de modifier vos paramètres de contrôle d'accès utilisateur dans les paramètres de l'index.

  3. Sur la page de démarrage, choisissez Ajouter une source de données.

  4. Sur la page Ajouter une source de données, choisissez Amazon RDS (MySQL)connecteur, puis sélectionnez Ajouter un connecteur. Si vous utilisez la version 2 (le cas échéant), choisissez le Amazon RDS (MySQL)connecteur avec la balise « V2.0 ».

  5. Sur la page Spécifier les détails de la source de données, entrez les informations suivantes :

    1. Dans Nom et description, pour Nom de la source de données : entrez le nom de votre source de données. Vous pouvez inclure des traits d'union, mais pas des espaces.

    2. (Facultatif) Description : entrez une description facultative pour votre source de données.

    3. Dans la langue par défaut : choisissez une langue pour filtrer vos documents pour l'index. Sauf indication contraire, la langue par défaut est l'anglais. La langue spécifiée dans les métadonnées du document remplace la langue sélectionnée.

    4. Dans Balises, pour Ajouter une nouvelle balise : incluez des balises facultatives pour rechercher et filtrer vos ressources ou suivre vos AWS coûts.

    5. Choisissez Suivant.

  6. Sur la page Définir l'accès et la sécurité, entrez les informations suivantes :

    1. Dans Source, entrez les informations suivantes :

    2. Hôte : entrez l'URL de l'hôte de la base de données, par exemple :http://instance URL.region.rds.amazonaws.com.

    3. Port — Entrez le port de base de données, par exemple,5432.

    4. Instance — Entrez l'instance de base de données, par exemplepostgres.

    5. Activer l'emplacement du certificat SSL : choisissez d'entrer le Amazon S3 chemin d'accès à votre fichier de certificat SSL.

    6. Dans Authentification, entrez les informations suivantes :

      1. AWS Secrets Manager secret —Choisissez un secret existant ou créez-en un nouveau Secrets Manager pour stocker vos informations Amazon RDS (MySQL) d'authentification. Si vous choisissez de créer un nouveau secret, une fenêtre AWS Secrets Manager secrète s'ouvre.

        1. Entrez les informations suivantes dans la fenêtre Créer un AWS Secrets Manager secret :

          1. Nom secret : le nom de votre secret. Le préfixe « AmazonKendra - Amazon RDS (MySQL) - » est automatiquement ajouté à votre nom secret.

          2. Pour le nom d'utilisateur et le mot de passe de la base de données, entrez les valeurs d'identification d'authentification que vous avez copiées depuis votre base de données.

        2. Choisissez Enregistrer.

    7. Virtual Private Cloud (VPC) —Vous pouvez choisir d'utiliser un VPC. Dans ce cas, vous devez ajouter des sous-réseaux et des groupes de sécurité VPC.

    8. IAM rôle —Choisissez un IAM rôle existant ou créez-en un nouveau IAM pour accéder aux informations d'identification de votre référentiel et indexer le contenu.

      Note

      IAM les rôles utilisés pour les index ne peuvent pas être utilisés pour les sources de données. Si vous ne savez pas si un rôle existant est utilisé pour un index ou une FAQ, choisissez Créer un nouveau rôle pour éviter les erreurs.

    9. Choisissez Suivant.

  7. Sur la page Configurer les paramètres de synchronisation, entrez les informations suivantes :

    1. Dans le champ d'application de la synchronisation, choisissez l'une des options suivantes :

      • Requête SQL —Entrez des instructions de requête SQL telles que les opérations SELECT et JOIN. Les requêtes SQL doivent être inférieures à 32 Ko Les requêtes SQL doivent être inférieures à 32 Ko et ne pas contenir de points-virgules (;). Amazon Kendra analysera tout le contenu de la base de données correspondant à votre requête.

      • Colonne clé primaire : indiquez la clé primaire pour la table de base de données. Cela permet d'identifier une table au sein de votre base de données.

      • Colonne de titre : indiquez le nom de la colonne de titre du document dans votre table de base de données.

      • Colonne du corps : indiquez le nom de la colonne du corps du document dans votre table de base de données.

    2. Dans Configuration supplémentaire (facultatif), choisissez l'une des options suivantes pour synchroniser un contenu spécifique au lieu de synchroniser tous les fichiers :

      • Colonnes détectant les modifications : entrez le nom des colonnes qui Amazon Kendra seront utilisées pour détecter les modifications de contenu. Amazon Kendra réindexera le contenu en cas de modification de l'une de ces colonnes.

      • Colonne ID utilisateur : entrez le nom de la colonne qui contient les identifiants utilisateur autorisés à accéder au contenu.

      • Colonne Groupes : entrez le nom de la colonne contenant les groupes autorisés à accéder au contenu.

      • Colonne URL source : entrez le nom de la colonne contenant les URL source à indexer.

      • Colonne horodatage : entrez le nom de la colonne contenant les horodatages. Amazon Kendra utilise les informations d'horodatage pour détecter les modifications apportées à votre contenu et synchroniser uniquement le contenu modifié.

      • Colonne fuseaux horaires : entrez le nom de la colonne contenant les fuseaux horaires du contenu à analyser.

      • Format d'horodatage : entrez le nom de la colonne contenant les formats d'horodatage à utiliser pour détecter les modifications de contenu et resynchroniser votre contenu.

    3. Mode de synchronisation : choisissez la manière dont vous souhaitez mettre à jour votre index lorsque le contenu de votre source de données change. Lorsque vous synchronisez votre source de données Amazon Kendra pour la première fois, tout le contenu est analysé et indexé par défaut. Vous devez exécuter une synchronisation complète de vos données en cas d'échec de la synchronisation initiale, même si vous ne choisissez pas l'option de synchronisation complète comme mode de synchronisation.

      • Synchronisation complète : Indexez tout le contenu fraîchement, en remplaçant le contenu existant chaque fois que votre source de données se synchronise avec votre index.

      • Nouvelle synchronisation modifiée : Indexez uniquement le contenu nouveau et modifié chaque fois que votre source de données se synchronise avec votre index. Amazon Kendra peut utiliser le mécanisme de votre source de données pour suivre les modifications de contenu et indexer le contenu modifié depuis la dernière synchronisation.

      • Synchronisation nouvelle, modifiée ou supprimée : Indexez uniquement le contenu nouveau, modifié et supprimé chaque fois que votre source de données se synchronise avec votre index. Amazon Kendra peut utiliser le mécanisme de votre source de données pour suivre les modifications de contenu et indexer le contenu modifié depuis la dernière synchronisation.

    4. Dans Synchroniser le calendrier d'exécution, pour Fréquence : à quelle fréquence Amazon Kendra sera synchronisée avec votre source de données.

    5. Choisissez Suivant.

  8. Sur la page Définir les mappages de champs, entrez les informations suivantes :

    1. Sélectionnez parmi les champs de source de données par défaut générés (ID de document, titres de documents et URL de source) que vous souhaitez mapper à l'index. Amazon Kendra

    2. Ajouter un champ —Pour ajouter des champs de source de données personnalisés afin de créer un nom de champ d'index à mapper et le type de données du champ.

    3. Choisissez Suivant.

  9. Sur la page Réviser et créer, vérifiez que les informations saisies sont correctes, puis sélectionnez Ajouter une source de données. Vous pouvez également choisir de modifier vos informations à partir de cette page. Votre source de données apparaîtra sur la page Sources de données une fois que la source de données aura été ajoutée avec succès.

API

Pour vous connecter Amazon Kendra à Amazon RDS (MySQL)

Vous devez spécifier les éléments suivants à l'aide de l'TemplateConfigurationAPI :

  • Source de données —Spécifiez le type de source de données tel que JDBC lorsque vous utilisez le schéma TemplateConfigurationJSON. Spécifiez également la source de données TEMPLATE lorsque vous appelez l'CreateDataSourceAPI.

  • Type de base de données —Vous devez spécifier le type de base de données sous mySql la forme.

  • Requête SQL : spécifiez des instructions de requête SQL telles que les opérations SELECT et JOIN. La taille des requêtes SQL doit être inférieure à 32 Ko. Amazon Kendra analysera tout le contenu de la base de données correspondant à votre requête.

  • Mode de synchronisation : spécifiez comment Amazon Kendra mettre à jour votre index lorsque le contenu de votre source de données change. Lorsque vous synchronisez votre source de données Amazon Kendra pour la première fois, tout le contenu est analysé et indexé par défaut. Vous devez exécuter une synchronisation complète de vos données en cas d'échec de la synchronisation initiale, même si vous ne choisissez pas l'option de synchronisation complète comme mode de synchronisation. Vous pouvez choisir entre :

    • FORCED_FULL_CRAWLpour indexer à nouveau tout le contenu, en remplaçant le contenu existant chaque fois que votre source de données se synchronise avec votre index.

    • FULL_CRAWLpour indexer uniquement le contenu nouveau, modifié et supprimé chaque fois que votre source de données se synchronise avec votre index. Amazon Kendra peut utiliser le mécanisme de votre source de données pour suivre les modifications de contenu et indexer le contenu modifié depuis la dernière synchronisation.

    • CHANGE_LOGpour indexer uniquement le contenu nouveau et modifié chaque fois que votre source de données se synchronise avec votre index. Amazon Kendra peut utiliser le mécanisme de votre source de données pour suivre les modifications de contenu et indexer le contenu modifié depuis la dernière synchronisation.

  • Nom de ressource Amazon (ARN) secret : indiquez le nom de ressource Amazon (ARN) d'un Secrets Manager secret contenant les informations d'authentification que vous avez créées dans votre Amazon RDS (MySQL) compte. Le secret est stocké dans une structure JSON avec les clés suivantes :

    { "user name": "database user name", "password": "password" }
    Note

    Nous vous recommandons d'actualiser ou de modifier régulièrement vos informations d'identification et votre code secret. Fournissez uniquement le niveau d'accès nécessaire pour votre propre sécurité. Nous vous déconseillons de réutiliser les informations d'identification et les secrets entre les sources de données et les versions 1.0 et 2.0 du connecteur (le cas échéant).

  • IAM role —Spécifiez à quel RoleArn moment vous appelez CreateDataSource pour fournir à un IAM rôle les autorisations d'accéder à votre Secrets Manager secret et pour appeler les API publiques requises pour le Amazon RDS (MySQL) connecteur et Amazon Kendra. Pour plus d'informations, consultez la section IAM Rôles des sources de Amazon RDS (MySQL) données.

Vous pouvez également ajouter les fonctionnalités optionnelles suivantes :

  • Virtual Private Cloud (VPC) VpcConfiguration —Spécifiez le moment de votre appel. CreateDataSource Pour plus d’informations, consultez Configuration Amazon Kendra pour utiliser un Amazon VPC.

  • Filtres d'inclusion et d'exclusion : vous pouvez spécifier si vous souhaitez inclure un contenu spécifique à l'aide des identifiants utilisateur, des groupes, des URL sources, des horodatages et des fuseaux horaires.

  • Mappages de champs : choisissez de mapper les champs de votre source de Amazon RDS (MySQL) données à vos champs d' Amazon Kendra index. Pour plus d'informations, veuillez consulter la rubrique Mappage des champs de source de données.

    Note

    Le champ du corps du document ou l'équivalent du corps du document pour vos documents est requis pour Amazon Kendra effectuer une recherche dans vos documents. Vous devez associer le nom du champ du corps du document dans votre source de données au nom du champ d'index_document_body. Tous les autres champs sont facultatifs.

  • Filtrage du contexte utilisateur et contrôle d'accèsAmazon Kendra  : analyse la liste de contrôle d'accès (ACL) de vos documents, si vous disposez d'une ACL pour vos documents. Les informations ACL sont utilisées pour filtrer les résultats de recherche en fonction de l'accès de l'utilisateur ou de son groupe aux documents. Pour plus d'informations, consultez la section Filtrage du contexte utilisateur.

Pour obtenir la liste des autres clés JSON importantes à configurer, consultezAmazon RDS Schéma de modèle (MySQL).

Remarques

  • Les lignes de base de données supprimées ne seront pas suivies lors de la Amazon Kendra vérification du contenu mis à jour.

  • La taille des noms et des valeurs des champs d'une ligne de votre base de données ne peut pas dépasser 400 Ko.

  • Si la source de données de votre base de données contient une grande quantité de données et que vous ne souhaitez pas Amazon Kendra indexer tout le contenu de votre base de données après la première synchronisation, vous pouvez choisir de ne synchroniser que les documents nouveaux, modifiés ou supprimés.

  • Il est recommandé de fournir des informations d'identification Amazon Kendra de base de données en lecture seule.

  • Il est recommandé d'éviter d'ajouter des tableaux contenant des données sensibles ou des informations personnelles identifiables (PII).