Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Requisitos previos para usar un almacén vectorial propio para una base de conocimientos

Modo de enfoque
Requisitos previos para usar un almacén vectorial propio para una base de conocimientos - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Para almacenar las incrustaciones vectoriales a las que se convierten los documentos, utilice un almacén vectorial. Si prefiere que Amazon Bedrock cree automáticamente un índice vectorial en Amazon OpenSearch Serverless, omita este requisito previo y continúe con. Cree una base de conocimientos conectándose a una fuente de datos en Amazon Bedrock Knowledge Bases

Si desea almacenar incrustaciones vectoriales binarias en lugar de las incrustaciones vectoriales estándar de punto flotante (float32), debe utilizar un almacén de vectores que admita vectores binarios. Amazon OpenSearch Serverless es actualmente el único almacén de vectores que admite el almacenamiento de vectores binarios.

Puede configurar su propio almacén vectorial compatible para indexar la representación de incrustaciones vectoriales de sus datos. Puede crear campos para los siguientes datos:

  • Un campo para los vectores generados a partir del texto del origen de datos mediante el modelo de incrustaciones que elija.

  • Un campo para los fragmentos de texto extraídos de los archivos del origen de datos.

  • Campos para los metadatos de los archivos de origen que administra Amazon Bedrock.

  • (Si utiliza una base de datos de Amazon Aurora y desea configurar el filtrado de los metadatos) Campos para los metadatos que asocia a sus archivos de origen. Si planea configurar el filtrado en otros almacenes vectoriales, no es necesario que configure estos campos para el filtrado.

Puede cifrar los almacenes vectoriales de terceros con una clave de KMS. Para obtener más información, consulte Cifrado de recursos de bases de conocimientos.

Seleccione la pestaña correspondiente al servicio de almacenamiento vectorial que utilizará para crear el índice vectorial.

Amazon OpenSearch Serverless
  1. Para configurar los permisos y crear una colección de búsquedas vectoriales en Amazon OpenSearch Serverless AWS Management Console, siga los pasos 1 y 2 de Cómo trabajar con colecciones de búsquedas vectoriales de la Guía para desarrolladores de Amazon OpenSearch Service. Tenga en cuenta las siguientes consideraciones al configurar la colección:

    1. Asigne un nombre a la colección y redacte una descripción.

    2. Para que la colección sea privada, seleccione Creación estándar en la sección Seguridad. A continuación, en la sección Configuración de acceso a la red, seleccione VPC como Tipo de acceso y elija un punto de conexión de VPC. Para obtener más información sobre la configuración de un punto de enlace de VPC para una colección de Amazon OpenSearch Serverless, consulte Acceder a Amazon OpenSearch Serverless mediante un punto de enlace de interfaz ()AWS PrivateLink en la Guía para desarrolladores de Amazon OpenSearch Service.

  2. Después de crear la colección, tome nota del ARN de la colección para crear la base de conocimientos.

  3. En el panel de navegación de la izquierda, seleccione Colecciones en Sin servidor. A continuación, seleccione la colección de búsqueda vectorial.

  4. Seleccione la pestaña Índices. A continuación, elija Crear índice vectorial.

  5. En la sección Detalles del índice vectorial, introduzca un nombre para el índice en el campo Nombre del índice vectorial.

  6. En la sección Campos vectoriales, seleccione Agregar campo vectorial. Amazon Bedrock almacena las incrustaciones vectoriales del origen de datos en este campo. Proporcione las siguientes configuraciones:

    • Nombre del campo vectorial: proporcione un nombre para el campo (por ejemplo, embeddings).

    • Motor: es el motor vectorial utilizado para la búsqueda. Seleccione faiss.

    • Dimensiones: el número de dimensiones del vector. Consulte la siguiente tabla para determinar cuántas dimensiones debe contener el vector:

      Modelo Dimensiones
      Titan Incrustaciones G1: texto 1536
      Titan Incrustaciones V2: texto 1 024
      Cohere Embed Inglés 1 024
      Cohere Embed Multilingüe 1 024
    • Métrica de distancia: métrica que se utiliza para medir la similitud entre los vectores. Recomendamos usar Euclidean.

  7. Expanda la sección Administración de metadatos y añada dos campos para configurar el índice vectorial para almacenar metadatos adicionales que una base de conocimientos pueda recuperar con vectores. En la siguiente tabla se describen los campos y los valores a especificar para cada campo:

    Descripción del campo Asignación de campos Tipo de datos: Filtrable
    Amazon Bedrock fragmenta el texto sin procesar de sus datos y almacena los fragmentos en este campo. El nombre que quiera (por ejemplo, text) Cadena True
    Amazon Bedrock almacena los metadatos relacionados con su base de conocimientos en este campo. El nombre que quiera (por ejemplo, bedrock-metadata) Cadena False
  8. Tome nota de los nombres que elija para el índice vectorial, el campo vectorial y el campo de asignación de la administración de metadatos para cuando cree la base de conocimientos. A continuación, seleccione Crear.

Después de crear el índice vectorial, puede continuar con la creación de la base de conocimientos. En la siguiente tabla se resume dónde se debe introducir cada dato del que haya tomado nota.

Campo Campo correspondiente en la configuración de la base de conocimientos (consola) Campo correspondiente en la configuración de la base de conocimientos (API) Descripción
ARN de colección ARN de colección collectionARN Es el nombre de recurso de Amazon (ARN) de la colección de búsqueda vectorial.
Nombre del índice vectorial Nombre del índice vectorial vectorIndexName Es el nombre del índice vectorial.
Nombre del campo vectorial Campo vectorial vectorField Es el nombre del campo en el que se almacenan las incrustaciones vectoriales para los orígenes de datos.
Administración de metadatos (primer campo de asignación) Campo de texto textField Es el nombre del campo en el que se almacena el texto sin procesar de los orígenes de datos.
Administración de metadatos (segundo campo de asignación) Campo de metadatos administrado por Bedrock metadataField Es el nombre del campo en el que se almacenan los metadatos que administra Amazon Bedrock.

Para obtener documentación más detallada sobre la configuración de un almacén vectorial en Amazon OpenSearch Serverless, consulte Cómo trabajar con colecciones de búsquedas vectoriales en la Guía para desarrolladores de Amazon OpenSearch Service.

Amazon Aurora (RDS)
  1. Para crear un clúster de base de datos (DB) de Amazon Aurora, un esquema y una tabla, siga los pasos que se indican en Uso de Aurora PostgreSQL como base de conocimientos. Cuando cree la tabla, configúrela con las columnas y tipos de datos siguientes. Puede usar los nombres de columna que prefiera en lugar de los que aparecen en la tabla anterior. Tome nota de los nombres de las columnas que elija para poder proporcionarlos durante la configuración de la base de conocimientos.

    Nombre de la columna Tipo de datos: Campo correspondiente en la configuración de la base de conocimientos (consola) Campo correspondiente en la configuración de la base de conocimientos (API) Descripción
    id UUID clave principal Clave principal primaryKeyField Contiene identificadores únicos para cada registro.
    Incrustación Vector Campo vectorial vectorField Contiene las incrustaciones vectoriales de los orígenes de datos.
    fragmentos Texto Campo de texto textField Contiene los fragmentos de texto sin procesar de los orígenes de datos.
    metadatos JSON Campo de metadatos administrado por Bedrock metadataField Contiene los metadatos necesarios para llevar a cabo la atribución del origen y para permitir la ingesta y consulta de datos
  2. (Opcional) Si ha añadido metadatos a los archivos para filtrarlos, también debe crear una columna para cada atributo de metadatos de los archivos y especificar el tipo de datos (texto, número o booleano). Por ejemplo, si el atributo genre existe en el origen de datos, añadiría una columna con el nombre genre y especificaría text como tipo de datos. Durante la ingesta de datos, estas columnas se rellenarán con los valores de atributo correspondientes.

  3. Configure un AWS Secrets Manager secreto para su clúster de base de datos Aurora siguiendo los pasos de Administración de contraseñas con Amazon Aurora y AWS Secrets Manager.

  4. Tome nota de la siguiente información después de crear el clúster de base de datos y configurar el secreto.

    Campo en la configuración de la base de conocimientos (consola) Campo en la configuración de la base de conocimientos (API) Descripción
    ARN del clúster de base de datos de Amazon Aurora resourceArn El ARN del clúster de base de datos.
    Nombre de base de datos databaseName El nombre de la base de datos
    Nombre de la tabla tableName El nombre de la tabla en su clúster de base de datos.
    ARN del secreto credentialsSecretArn El ARN de la AWS Secrets Manager clave de su clúster de base de datos
Pinecone
nota

Si usa Pinecone, usted acepta autorizar el acceso AWS a la fuente externa designada en su nombre para proporcionarle servicios de tienda vectorial. Usted es responsable de cumplir con las condiciones de terceros aplicables al uso y la transferencia de datos desde el servicio de terceros.

Para obtener documentación detallada sobre cómo configurar un almacén de vectores en Pinecone, consulte Pinecone como base de conocimientos para Amazon Bedrock.

Mientras configura el almacén vectorial, anote la información siguiente, que deberá rellenar al crear una base de conocimientos.

  • URL de punto final: la URL de punto final de su página de administración de índices.

  • Espacio de nombres: (opcional) el espacio de nombres que se utilizará para escribir nuevos datos en la base de datos. Para obtener más información, consulte Uso de espacios de nombres.

Hay configuraciones adicionales que debe proporcionar al crear un Pinecone índice:

  • Nombre: el nombre del índice vectorial. Elija cualquier nombre válido que desee. Más adelante, cuando cree su base de conocimientos, introduzca el nombre que elija en el campo Nombre del índice vectorial.

  • Dimensiones: el número de dimensiones del vector. Consulte la siguiente tabla para determinar cuántas dimensiones debe contener el vector.

    Modelo Dimensiones
    Titan Incrustaciones G1: texto 1536
    Titan Incrustaciones V2: texto 1 024
    Cohere Embed Inglés 1 024
    Cohere Embed Multilingüe 1 024
  • Métrica de distancia: métrica que se utiliza para medir la similitud entre los vectores. Le recomendamos que experimente con diferentes métricas para su caso de uso. Recomendamos comenzar con la similitud del coseno.

Para acceder a su Pinecone índice, debe proporcionar su Pinecone Clave de API para Amazon Bedrock a través de AWS Secrets Manager.

Para configurar un secreto para tu Pinecone configuración
  1. Sigue los pasos que se indican en Crear un AWS Secrets Manager secreto y establece la clave como clave de API apiKey y el valor como clave de API para acceder a tu Pinecone índice.

  2. Para encontrar su clave de API, abra la consola de Pinecone y seleccione Claves de API.

  3. Después de crear el secreto, anote el ARN de la clave KMS.

  4. Asocie permisos a su rol de servicio para descifrar el ARN de la clave KMS siguiendo los pasos que se indican en Permisos para descifrar un AWS Secrets Manager secreto para el almacén de vectores que contiene tu base de conocimientos.

  5. Más adelante, cuando cree su base de conocimientos, introduzca el ARN en el campo ARN secreto de credenciales.

Redis Enterprise Cloud
nota

Si usas Redis Enterprise Cloud, usted acepta autorizar el acceso AWS a la fuente externa designada en su nombre para proporcionarle servicios de tienda vectorial. Usted es responsable de cumplir con las condiciones de terceros aplicables al uso y la transferencia de datos desde el servicio de terceros.

Para obtener documentación detallada sobre cómo configurar un almacén de vectores en Redis Enterprise Cloud, consulte Integración Redis Enterprise Cloud con Amazon Bedrock.

Mientras configura el almacén vectorial, anote la información siguiente, que deberá rellenar al crear una base de conocimientos.

  • URL del punto de conexión: es la URL del punto de conexión público de su base de datos.

  • Nombre del índice vectorial: es el nombre del índice vectorial de su base de datos.

  • Campo vectorial: es el nombre del campo en el que se almacenarán las incrustaciones vectoriales. Consulte la siguiente tabla para determinar cuántas dimensiones debe contener el vector.

    Modelo Dimensiones
    Titan Incrustaciones G1: texto 1536
    Titan Incrustaciones V2: texto 1 024
    Cohere Embed Inglés 1 024
    Cohere Embed Multilingüe 1 024
  • Campo de texto: es el nombre del campo en el que Amazon Bedrock almacena los fragmentos de texto sin procesar.

  • Campo de metadatos administrado por Bedrock: es el nombre del campo en el que Amazon Bedrock almacena los metadatos relacionados con su base de conocimientos.

Para acceder a su Redis Enterprise Cloud clúster, debe proporcionar su Redis Enterprise Cloud configuración de seguridad para Amazon Bedrock a través de AWS Secrets Manager.

Para configurar un secreto para su Redis Enterprise Cloud configuración
  1. Habilite TLS para usar su base de datos con Amazon Bedrock siguiendo los pasos de seguridad de la capa de transporte (TLS).

  2. Sigue los pasos que se indican en Crear un AWS Secrets Manager secreto. Configura las siguientes claves con los valores adecuados de tu Redis Enterprise Cloud configuración en el secreto:

    • username— El nombre de usuario para acceder a su Redis Enterprise Cloud base de datos. Para encontrar el nombre de usuario, busque en la sección Seguridad de su base de datos en la Consola de Redis.

    • password— La contraseña para acceder a su Redis Enterprise Cloud base de datos. Para encontrar la contraseña, busque en la sección Seguridad de su base de datos en la Consola de Redis.

    • serverCertificate: el contenido del certificado de la autoridad de certificación de Redis Cloud. Descargue el certificado del servidor desde la Consola de administración de Redis siguiendo los pasos que se indican en Descargar los certificados.

    • clientPrivateKey: la clave privada del certificado de la autoridad de certificación de Redis Cloud. Descargue el certificado del servidor desde la Consola de administración de Redis siguiendo los pasos que se indican en Descargar los certificados.

    • clientCertificate: la clave pública del certificado de la autoridad de certificación de Redis Cloud. Descargue el certificado del servidor desde la Consola de administración de Redis siguiendo los pasos que se indican en Descargar los certificados.

  3. Después de crear el secreto, anote su ARN. Más adelante, cuando cree su base de conocimientos, introduzca el ARN en el campo ARN secreto de credenciales.

MongoDB Atlas
nota

Si utiliza MongoDB Atlas, acepta AWS autorizar el acceso a la fuente externa designada en su nombre para proporcionarle servicios de almacenamiento vectorial. Usted es responsable de cumplir con las condiciones de terceros aplicables al uso y la transferencia de datos desde el servicio de terceros.

Para obtener documentación detallada sobre cómo configurar un almacén vectorial en MongoDB Atlas, consulte MongoDB Atlas as a knowledge base for Amazon Bedrock.

Mientras configura el almacén vectorial, tome nota de la información siguiente, que deberá rellenar al crear una base de conocimientos:

  • URL del punto de conexión: es la URL del punto de conexión de su clúster de MongoDB Atlas.

  • Nombre de la base de datos: es el nombre de la base de datos de su clúster de MongoDB Atlas.

  • Nombre de la colección: es el nombre de la colección en la base de datos.

  • ARN secreto de credenciales: es el nombre de recurso de Amazon (ARN) del secreto que ha creado en AWS Secrets Manager y que contiene el nombre de usuario y la contraseña de un usuario de base de datos del clúster de MongoDB Atlas.

  • (Opcional) Clave de KMS administrada por el cliente para el ARN secreto de credenciales: si ha cifrado el ARN secreto de sus credenciales, proporcione la clave de KMS para que Amazon Bedrock pueda descifrarla.

Hay configuraciones adicionales de Asignación de campos que debe proporcionar al crear un índice de MongoDB Atlas:

  • Nombre del índice vectorial: es el nombre del índice de búsqueda vectorial de MongoDB Atlas de su colección.

  • Nombre del campo vectorial: es el nombre del campo en el que Amazon Bedrock debe almacenar las incrustaciones vectoriales.

  • Nombre del campo de texto: es el nombre del campo en el que Amazon Bedrock debe almacenar el texto de los fragmentos sin procesar.

  • Nombre del campo de metadatos: es el nombre del campo en el que Amazon Bedrock debe almacenar los metadatos de atribución de origen.

(Opcional) Para que Amazon Bedrock se conecte a su clúster de MongoDB Atlas a través de PrivateLink AWS, consulte Flujo de trabajo de RAG con MongoDB Atlas mediante Amazon Bedrock.

  1. Para configurar los permisos y crear una colección de búsquedas vectoriales en Amazon OpenSearch Serverless AWS Management Console, siga los pasos 1 y 2 de Cómo trabajar con colecciones de búsquedas vectoriales de la Guía para desarrolladores de Amazon OpenSearch Service. Tenga en cuenta las siguientes consideraciones al configurar la colección:

    1. Asigne un nombre a la colección y redacte una descripción.

    2. Para que la colección sea privada, seleccione Creación estándar en la sección Seguridad. A continuación, en la sección Configuración de acceso a la red, seleccione VPC como Tipo de acceso y elija un punto de conexión de VPC. Para obtener más información sobre la configuración de un punto de enlace de VPC para una colección de Amazon OpenSearch Serverless, consulte Acceder a Amazon OpenSearch Serverless mediante un punto de enlace de interfaz ()AWS PrivateLink en la Guía para desarrolladores de Amazon OpenSearch Service.

  2. Después de crear la colección, tome nota del ARN de la colección para crear la base de conocimientos.

  3. En el panel de navegación de la izquierda, seleccione Colecciones en Sin servidor. A continuación, seleccione la colección de búsqueda vectorial.

  4. Seleccione la pestaña Índices. A continuación, elija Crear índice vectorial.

  5. En la sección Detalles del índice vectorial, introduzca un nombre para el índice en el campo Nombre del índice vectorial.

  6. En la sección Campos vectoriales, seleccione Agregar campo vectorial. Amazon Bedrock almacena las incrustaciones vectoriales del origen de datos en este campo. Proporcione las siguientes configuraciones:

    • Nombre del campo vectorial: proporcione un nombre para el campo (por ejemplo, embeddings).

    • Motor: es el motor vectorial utilizado para la búsqueda. Seleccione faiss.

    • Dimensiones: el número de dimensiones del vector. Consulte la siguiente tabla para determinar cuántas dimensiones debe contener el vector:

      Modelo Dimensiones
      Titan Incrustaciones G1: texto 1536
      Titan Incrustaciones V2: texto 1 024
      Cohere Embed Inglés 1 024
      Cohere Embed Multilingüe 1 024
    • Métrica de distancia: métrica que se utiliza para medir la similitud entre los vectores. Recomendamos usar Euclidean.

  7. Expanda la sección Administración de metadatos y añada dos campos para configurar el índice vectorial para almacenar metadatos adicionales que una base de conocimientos pueda recuperar con vectores. En la siguiente tabla se describen los campos y los valores a especificar para cada campo:

    Descripción del campo Asignación de campos Tipo de datos: Filtrable
    Amazon Bedrock fragmenta el texto sin procesar de sus datos y almacena los fragmentos en este campo. El nombre que quiera (por ejemplo, text) Cadena True
    Amazon Bedrock almacena los metadatos relacionados con su base de conocimientos en este campo. El nombre que quiera (por ejemplo, bedrock-metadata) Cadena False
  8. Tome nota de los nombres que elija para el índice vectorial, el campo vectorial y el campo de asignación de la administración de metadatos para cuando cree la base de conocimientos. A continuación, seleccione Crear.

Después de crear el índice vectorial, puede continuar con la creación de la base de conocimientos. En la siguiente tabla se resume dónde se debe introducir cada dato del que haya tomado nota.

Campo Campo correspondiente en la configuración de la base de conocimientos (consola) Campo correspondiente en la configuración de la base de conocimientos (API) Descripción
ARN de colección ARN de colección collectionARN Es el nombre de recurso de Amazon (ARN) de la colección de búsqueda vectorial.
Nombre del índice vectorial Nombre del índice vectorial vectorIndexName Es el nombre del índice vectorial.
Nombre del campo vectorial Campo vectorial vectorField Es el nombre del campo en el que se almacenan las incrustaciones vectoriales para los orígenes de datos.
Administración de metadatos (primer campo de asignación) Campo de texto textField Es el nombre del campo en el que se almacena el texto sin procesar de los orígenes de datos.
Administración de metadatos (segundo campo de asignación) Campo de metadatos administrado por Bedrock metadataField Es el nombre del campo en el que se almacenan los metadatos que administra Amazon Bedrock.

Para obtener documentación más detallada sobre la configuración de un almacén vectorial en Amazon OpenSearch Serverless, consulte Cómo trabajar con colecciones de búsquedas vectoriales en la Guía para desarrolladores de Amazon OpenSearch Service.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.