Création de champs de document personnalisés - Amazon Kendra

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création de champs de document personnalisés

Vous pouvez créer des attributs ou des champs personnalisés pour vos documents dans votre index Amazon Kendra. Par exemple, vous pouvez créer un champ ou un attribut personnalisé appelé « Département » avec les valeurs « RH », « Ventes » et « Fabrication ». Si vous associez ces champs ou attributs personnalisés à votre index Amazon Kendra, vous pouvez les utiliser pour filtrer les résultats de recherche afin d'inclure des documents en fonction de l'attribut « département RH », par exemple.

Avant de pouvoir utiliser un champ ou un attribut personnalisé, vous devez d'abord créer le champ dans l'index. Utilisez la console pour modifier les mappages de champs de source de données afin d'ajouter un champ personnalisé ou utilisez le UpdateIndexAPIpour créer le champ d'index. Vous ne pouvez pas modifier le type de données du champ une fois que vous l'avez créé.

Pour la plupart des sources de données, vous mappez les champs de la source de données externe aux champs correspondants de Amazon Kendra. Pour plus d'informations, veuillez consulter la rubrique Mappage des champs de source de données. Pour les sources de données S3, vous pouvez créer des champs ou des attributs personnalisés à l'aide d'un fichier de JSON métadonnées.

Vous pouvez créer jusqu'à 500 champs ou attributs personnalisés.

Vous pouvez également utiliser des champs Amazon Kendra réservés ou communs. Pour plus d'informations, consultez la section Attributs ou champs du document.

Mise à jour des champs de document personnalisés

Avec le UpdateIndexAPI, vous pouvez ajouter des champs ou des attributs personnalisés à l'aide du DocumentMetadataConfigurationUpdates paramètre.

L'JSONexemple suivant permet DocumentMetadataConfigurationUpdates d'ajouter un champ appelé « Department » à l'index.

"DocumentmetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE" } ]

Les sections suivantes incluent des exemples d'ajout d'attributs ou de champs personnalisés à l'aide de BatchPutDocumentet pour une source de données Amazon S3.

Ajouter des attributs ou des champs personnalisés à l'aide du BatchPutDocument API

Lorsque vous utilisez le BatchPutDocumentAPIpour ajouter un document à votre index, vous spécifiez des champs ou des attributs personnalisés dans le cadre deAttributes. Vous pouvez ajouter plusieurs champs ou attributs lorsque vous appelez leAPI. Vous pouvez créer jusqu'à 500 champs ou attributs personnalisés. L'exemple suivant est un champ ou un attribut personnalisé qui ajoute « Département » à un document.

"Attributes": { "Department": "HR", "_category": "Vacation policy" }

Ajouter des attributs ou des champs personnalisés à une source Amazon S3 de données

Lorsque vous utilisez un compartiment S3 comme source de données pour votre index, vous ajoutez des métadonnées aux documents avec des fichiers de métadonnées associés. Vous placez les JSON fichiers de métadonnées dans une structure de répertoire parallèle à celle de vos documents. Pour plus d'informations, consultez la section Métadonnées du document S3.

Vous spécifiez des champs ou des attributs personnalisés dans la Attributes JSON structure. Vous pouvez créer jusqu'à 500 champs ou attributs personnalisés. Par exemple, l'exemple suivant permet Attributes de définir trois champs ou attributs personnalisés et un champ réservé.

"Attributes": { "brand": "Amazon Basics", "price": 1595, "_category": "sports", "subcategories": ["outdoors", "electronics"] }

Les étapes suivantes vous expliquent comment ajouter des attributs personnalisés à une source de données Amazon S3.

Étape 1 : créer un index Amazon Kendra

Suivez les étapes ci-dessous Création d'un index pour créer votre index Amazon Kendra.

Étape 2 : Mettre à jour l'index pour ajouter des champs de document personnalisés

Après avoir créé un index, vous y ajoutez des champs. La procédure suivante montre comment ajouter des champs à un index à l'aide de la console et duCLI.

Console
Pour créer des champs d'index
  1. Assurez-vous d'avoir créé un index.

  2. Ensuite, dans le menu de navigation de gauche, dans Gestion des données, choisissez Définition des facettes.

  3. Dans le guide des paramètres des champs d'index, dans Champs d'index, choisissez Ajouter un champ pour ajouter des champs personnalisés.

  4. Dans la boîte de dialogue Ajouter un champ d'index, procédez comme suit :

    • Nom du champ — Ajoutez un nom de champ.

    • Type de données : sélectionnez le type de données, qu'il s'agisse d'une chaîne, d'une liste de chaînes ou d'une date.

    • Types d'utilisation : sélectionnez les types d'utilisation, qu'ils soient facetables, consultables, affichables ou triables.

      Sélectionnez ensuite Ajouter.

    Répétez la dernière étape pour tous les autres champs que vous souhaitez mapper.

CLI
aws kendra update-index \ --region $region \ --endpoint-url $endpoint \ --application-id $applicationId \ --index-id $indexId \ --document-metadata-configuration-updates \ "[ { "Name": "string", "Type": "STRING_VALUE"|"STRING_LIST_VALUE"|"LONG_VALUE"|"DATE_VALUE", "Relevance": { "Freshness": true|false, "Importance": integer, "Duration": "string", "RankOrder": "ASCENDING"|"DESCENDING", "ValueImportanceMap": {"string": integer ...} }, "Search": { "Facetable": true|false, "Searchable": true|false, "Displayable": true|false, "Sortable": true|false } } ... ]"

Étape 3 : créer une source de données Amazon S3 et mapper les champs de la source de données à des attributs personnalisés

Pour créer une source de données Amazon S3 et y associer des champs, suivez les instructions figurant dansAmazon S3.

Si vous utilisez leAPI, utilisez l'fieldMappingsattribut ci-dessous configuration lorsque vous utilisez le CreateDataSourceAPI.

Pour un aperçu de la façon dont les champs de source de données sont mappés, voirCartographie des champs de source de données.