Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Para almacenar las incrustaciones vectoriales a las que se convierten los documentos, utilice un almacén vectorial. Si prefiere que Amazon Bedrock cree automáticamente un índice vectorial en Amazon OpenSearch Serverless, omita este requisito previo y continúe con. Cree una base de conocimientos conectándose a una fuente de datos en Amazon Bedrock Knowledge Bases
Si desea almacenar incrustaciones vectoriales binarias en lugar de las incrustaciones vectoriales estándar de punto flotante (float32), debe utilizar un almacén de vectores que admita vectores binarios. Amazon OpenSearch Serverless es actualmente el único almacén de vectores que admite el almacenamiento de vectores binarios.
Puede configurar su propio almacén vectorial compatible para indexar la representación de incrustaciones vectoriales de sus datos. Puede crear campos para los siguientes datos:
-
Un campo para los vectores generados a partir del texto del origen de datos mediante el modelo de incrustaciones que elija.
-
Un campo para los fragmentos de texto extraídos de los archivos del origen de datos.
-
Campos para los metadatos de los archivos de origen que administra Amazon Bedrock.
-
(Si utiliza una base de datos de Amazon Aurora y desea configurar el filtrado de los metadatos) Campos para los metadatos que asocia a sus archivos de origen. Si planea configurar el filtrado en otros almacenes vectoriales, no es necesario que configure estos campos para el filtrado.
Puede cifrar los almacenes vectoriales de terceros con una clave de KMS. Para obtener más información, consulte Cifrado de recursos de bases de conocimientos.
Seleccione la pestaña correspondiente al servicio de almacenamiento vectorial que utilizará para crear el índice vectorial.
-
Para configurar los permisos y crear una colección de búsquedas vectoriales en Amazon OpenSearch Serverless AWS Management Console, siga los pasos 1 y 2 de Cómo trabajar con colecciones de búsquedas vectoriales de la Guía para desarrolladores de Amazon OpenSearch Service. Tenga en cuenta las siguientes consideraciones al configurar la colección:
-
Asigne un nombre a la colección y redacte una descripción.
-
Para que la colección sea privada, seleccione Creación estándar en la sección Seguridad. A continuación, en la sección Configuración de acceso a la red, seleccione VPC como Tipo de acceso y elija un punto de conexión de VPC. Para obtener más información sobre la configuración de un punto de enlace de VPC para una colección de Amazon OpenSearch Serverless, consulte Acceder a Amazon OpenSearch Serverless mediante un punto de enlace de interfaz ()AWS PrivateLink en la Guía para desarrolladores de Amazon OpenSearch Service.
-
-
Después de crear la colección, tome nota del ARN de la colección para crear la base de conocimientos.
-
En el panel de navegación de la izquierda, seleccione Colecciones en Sin servidor. A continuación, seleccione la colección de búsqueda vectorial.
-
Seleccione la pestaña Índices. A continuación, elija Crear índice vectorial.
-
En la sección Detalles del índice vectorial, introduzca un nombre para el índice en el campo Nombre del índice vectorial.
-
En la sección Campos vectoriales, seleccione Agregar campo vectorial. Amazon Bedrock almacena las incrustaciones vectoriales del origen de datos en este campo. Proporcione las siguientes configuraciones:
-
Nombre del campo vectorial: proporcione un nombre para el campo (por ejemplo,
embeddings
). -
Motor: es el motor vectorial utilizado para la búsqueda. Seleccione faiss.
-
Dimensiones: el número de dimensiones del vector. Consulte la siguiente tabla para determinar cuántas dimensiones debe contener el vector:
Modelo Dimensiones Titan Incrustaciones G1: texto 1536 Titan Incrustaciones V2: texto 1 024 Cohere Embed Inglés 1 024 Cohere Embed Multilingüe 1 024 -
Métrica de distancia: métrica que se utiliza para medir la similitud entre los vectores. Recomendamos usar Euclidean.
-
-
Expanda la sección Administración de metadatos y añada dos campos para configurar el índice vectorial para almacenar metadatos adicionales que una base de conocimientos pueda recuperar con vectores. En la siguiente tabla se describen los campos y los valores a especificar para cada campo:
Descripción del campo Asignación de campos Tipo de datos: Filtrable Amazon Bedrock fragmenta el texto sin procesar de sus datos y almacena los fragmentos en este campo. El nombre que quiera (por ejemplo, text
)Cadena True Amazon Bedrock almacena los metadatos relacionados con su base de conocimientos en este campo. El nombre que quiera (por ejemplo, bedrock-metadata
)Cadena False -
Tome nota de los nombres que elija para el índice vectorial, el campo vectorial y el campo de asignación de la administración de metadatos para cuando cree la base de conocimientos. A continuación, seleccione Crear.
Después de crear el índice vectorial, puede continuar con la creación de la base de conocimientos. En la siguiente tabla se resume dónde se debe introducir cada dato del que haya tomado nota.
Campo | Campo correspondiente en la configuración de la base de conocimientos (consola) | Campo correspondiente en la configuración de la base de conocimientos (API) | Descripción |
---|---|---|---|
ARN de colección | ARN de colección | collectionARN | Es el nombre de recurso de Amazon (ARN) de la colección de búsqueda vectorial. |
Nombre del índice vectorial | Nombre del índice vectorial | vectorIndexName | Es el nombre del índice vectorial. |
Nombre del campo vectorial | Campo vectorial | vectorField | Es el nombre del campo en el que se almacenan las incrustaciones vectoriales para los orígenes de datos. |
Administración de metadatos (primer campo de asignación) | Campo de texto | textField | Es el nombre del campo en el que se almacena el texto sin procesar de los orígenes de datos. |
Administración de metadatos (segundo campo de asignación) | Campo de metadatos administrado por Bedrock | metadataField | Es el nombre del campo en el que se almacenan los metadatos que administra Amazon Bedrock. |
Para obtener documentación más detallada sobre la configuración de un almacén vectorial en Amazon OpenSearch Serverless, consulte Cómo trabajar con colecciones de búsquedas vectoriales en la Guía para desarrolladores de Amazon OpenSearch Service.