Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Récupération de passages
Vous pouvez utiliser le RetrieveAPI en tant que récupérateur pour les systèmes de génération augmentée (RAG).
Les systèmes RAG utilisent l'intelligence artificielle générative pour créer des applications de réponse aux questions. Les systèmes RAG se composent d'un récupérateur et de grands modèles linguistiques (LLM). À la suite d'une requête, le récupérateur identifie les parties de texte les plus pertinentes d'un corpus de documents et les transmet au LLM pour fournir la réponse la plus utile. Ensuite, le LLM analyse les fragments ou passages de texte pertinents et génère une réponse complète à la requête.
L'Retrieve
API examine les fragments de texte ou les extraits appelés passages et renvoie les premiers passages les plus pertinents pour la requête.
Comme le QueryAPI, l'Retrieve
API recherche également les informations pertinentes. La récupération d'informations de l'API Retrieve prend en compte le contexte de la requête et toutes les informations disponibles à partir des documents indexés. Toutefois, par défaut, l'Query
API ne renvoie que des extraits contenant jusqu'à 100 mots symboliques. Grâce à l'Retrieve
API, vous pouvez récupérer des passages plus longs contenant jusqu'à 200 mots symboliques et jusqu'à 100 passages pertinents du point de vue sémantique. Cela n'inclut pas les réponses de type question-réponse ou FAQ de votre index. Les passages, également appelés fragments, sont des extraits de texte qui peuvent être extraits sémantiquement de plusieurs documents et de plusieurs parties d'un même document. L'indice GenAI Enterprise Edition de Kendra fournit des résultats de haute précision à récupérer, en utilisant une recherche hybride sur des indices de vecteurs et de mots clés, ainsi qu'un classement par modèles d'apprentissage en profondeur.
Vous pouvez également effectuer les opérations suivantes avec l'Retrieve
API :
-
Annuler le boost au niveau de l'indice
-
Filtrer en fonction des champs ou des attributs du document
-
Filtrer en fonction de l'accès de l'utilisateur ou de son groupe aux documents
-
Consultez le compartiment des scores de confiance pour obtenir un résultat de passage récupéré. Le bucket de confiance fournit un classement relatif qui indique dans quelle mesure la réponse est pertinente par rapport à la requête. Amazon Kendra
Note
Les buckets de scores de confiance ne sont actuellement disponibles qu'en anglais.
Vous pouvez également inclure dans la réponse certains champs susceptibles de fournir des informations supplémentaires utiles.
L'Retrieve
API ne prend actuellement pas en charge les fonctionnalités suivantes : requêtes utilisant une syntaxe de requête avancée, corrections orthographiques suggérées pour les requêtes, facettage, suggestions de requêtes pour compléter automatiquement les requêtes de recherche et apprentissage progressif. Les requêtes d'API de récupération n'apparaîtront pas dans le tableau de bord d'analyse.
L'Retrieve
API partage le nombre d'unités de capacité de requête que vous définissez pour votre index. Pour plus d'informations sur ce qui est inclus dans une unité de capacité unique et sur la capacité de base par défaut d'un indice, consultez la section Ajustement de la capacité.
Note
Vous ne pouvez pas ajouter de capacité si vous utilisez l'édition Amazon Kendra Developer ; vous ne pouvez ajouter de la capacité que si vous utilisez l'édition Amazon Kendra Enterprise. Pour plus d'informations sur ce qui est inclus dans les éditions Developer et Enterprise, consultez la section Amazon Kendra Éditions.
Voici un exemple d'utilisation de l'Retrieve
API pour récupérer les 100 passages les plus pertinents des documents dans un index pour la requête. "how does amazon kendra work?"