Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Recuperación de pasajes
Puede utilizar el RetrieveLa API como recuperador para sistemas de generación aumentada (RAG) de recuperación.
Los sistemas RAG utilizan inteligencia artificial generativa para crear aplicaciones de preguntas y respuestas. Los sistemas RAG constan de un recuperador y modelos de lenguaje grandes (LLM). Al realizar una consulta, el recuperador identifica los fragmentos de texto más relevantes de un corpus de documentos y los envía al LLM para proporcionar la respuesta más útil. Luego, el LLM analiza los fragmentos de texto relevantes y genera una respuesta integral para la consulta.
La API Retrieve
analiza los fragmentos de texto o los extractos, que se denominan pasajes, y devuelve los pasajes principales que son más relevantes para la consulta.
Como el QueryAPI, la Retrieve
API también busca información relevante. La recuperación de información de la API Retrive tiene en cuenta el contexto de la consulta y toda la información disponible en los documentos indexados. Sin embargo, de forma predeterminada, la API Query
solo devuelve fragmentos o pasajes de hasta 100 palabras simbólicas. Con la API Retrieve
, puede recuperar pasajes más largos de hasta 200 palabras simbólicas y hasta 100 pasajes semánticamente relevantes. Esto no incluye las respuestas de tipo pregunta-respuesta o preguntas frecuentes de su índice. Los pasajes, también llamados fragmentos, son extractos de texto que se pueden extraer semánticamente de varios documentos y de varias partes del mismo documento. El índice GenAI Enterprise Edition de Kendra ofrece resultados de alta precisión para su recuperación, ya que utiliza una búsqueda híbrida en índices vectoriales y de palabras clave, además de una clasificación según modelos de aprendizaje profundo.
También puede utilizar la API Retrieve
para hacer lo siguiente:
-
Anular la priorización en el índice
-
Filtrar en función de los campos o atributos del documento
-
Filtrar en función del acceso del usuario o su grupo a los documentos
-
Consultar el bucket de puntuación de confianza para el resultado de un pasaje recuperado. El bucket de confianza proporciona una clasificación relativa que indica el grado de confianza de Amazon Kendra en que la respuesta es relevante para la consulta.
nota
Por el momento, los buckets de puntuación de confianza solo están disponibles en inglés.
También puede incluir algunos campos en la respuesta que podrían proporcionar información adicional útil.
Actualmente, la Retrieve
API no admite las siguientes funciones: consultas con una sintaxis de consulta avanzada, sugerencias de correcciones ortográficas para las consultas, creación de facetas, sugerencias de consultas para completar automáticamente las consultas de búsqueda y aprendizaje incremental. Las consultas de la API de recuperación no aparecerán en el panel de análisis.
La API Retrieve
comparte el número de unidades de capacidad de consulta que establezca para su índice. Para obtener información sobre lo que incluye una unidad de capacidad única y la capacidad base por defecto de un índice, consulte Ajuste de la capacidad.
nota
No puedes añadir capacidad si utilizas la Amazon Kendra Developer Edition; solo puedes añadir capacidad cuando utilizas la Amazon Kendra Enterprise Edition. Para obtener más información sobre lo que se incluye en las ediciones Developer y Enterprise, consulte Ediciones de Amazon Kendra.
A continuación se muestra un ejemplo del uso de la Retrieve
API para recuperar los 100 pasajes más relevantes de los documentos de un índice para la consulta "how does amazon kendra work?"