Sincronice sus datos con la base de conocimientos de Amazon Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Sincronice sus datos con la base de conocimientos de Amazon Bedrock

Tras crear la base de conocimientos, ingiere o sincroniza los datos para poder consultarlos. Ingestion convierte los datos sin procesar de la fuente de datos en incrustaciones vectoriales, según el modelo de incrustaciones vectoriales y las configuraciones que haya especificado.

Antes de iniciar la ingestión, compruebe que la fuente de datos cumpla las siguientes condiciones:

  • Ha configurado la información de conexión de la fuente de datos. Para configurar un conector de fuente de datos para rastrear los datos del repositorio de fuentes de datos, consulte Conectores de fuentes de datos compatibles. La fuente de datos se configura como parte de la creación de la base de conocimientos.

  • Ha configurado el modelo de incrustaciones vectoriales y el almacén de vectores que ha elegido. Consulte los modelos de incrustaciones vectoriales y los almacenes de vectores compatibles para obtener bases de conocimiento. Las incrustaciones vectoriales se configuran como parte de la creación de la base de conocimientos.

  • Los archivos están en los formatos compatibles. Para obtener más información, consulte Formatos de documentos de Support.

  • Los archivos no superan el tamaño del archivo de trabajo de ingestión especificado en los puntos de enlace y las cuotas de Amazon Bedrock en. Referencia general de AWS

  • Si su fuente de datos contiene archivos de metadatos, compruebe las siguientes condiciones para asegurarse de que no se omitan los archivos de metadatos:

    • Cada .metadata.json archivo comparte el mismo nombre y extensión que el archivo de origen al que está asociado.

    • Si el índice vectorial de su base de conocimientos se encuentra en un almacén vectorial de Amazon OpenSearch Serverless, compruebe que el índice vectorial esté configurado con el faiss motor. Si el índice vectorial está configurado con el nmslib motor, deberá realizar una de las siguientes acciones:

    • Si el índice vectorial de su base de conocimientos se encuentra en un clúster de bases de datos de Amazon Aurora, compruebe que la tabla de su índice contenga una columna para cada propiedad de metadatos de los archivos de metadatos antes de iniciar la ingestión.

Cada vez que añada, modifique o elimine archivos de la fuente de datos, debe sincronizar la fuente de datos para volver a indexarla en la base de conocimientos. La sincronización es incremental, por lo que Amazon Bedrock solo procesa los documentos añadidos, modificados o eliminados desde la última sincronización.

Para obtener información sobre cómo incorporar los datos a su base de conocimientos y sincronizarlos con los datos más recientes, seleccione la pestaña correspondiente al método que prefiera y siga estos pasos:

Console
Para incorporar tus datos a tu base de conocimientos y sincronizarlos con los datos más recientes
  1. Abra la consola Amazon Bedrock en https://console.aws.amazon.com/bedrock/.

  2. En el panel de navegación izquierdo, seleccione Base de conocimientos y elija su base de conocimientos.

  3. En la sección Fuente de datos, seleccione Sincronizar para iniciar la ingesta de datos o sincronizar los datos más recientes. Para detener la sincronización de una fuente de datos en ese momento, selecciona Detener. Una fuente de datos debe estar sincronizándose actualmente para detener la sincronización de la fuente de datos. Puede volver a seleccionar Sincronizar para ingerir el resto de los datos.

  4. Cuando se complete la ingesta de datos, aparecerá un banner verde de confirmación si se ha realizado correctamente.

    nota

    Una vez finalizada la sincronización de datos, es posible que las incrustaciones vectoriales de los datos recién sincronizados tarden unos minutos en reflejarse en su base de conocimientos y estar disponibles para realizar consultas si utiliza un almacén de vectores que no sea Amazon Aurora (). RDS

  5. Puede elegir un origen de datos para ver su Historial de sincronización. Seleccione Ver advertencias para ver por qué ha fallado un trabajo de ingesta de datos.

API

Para incorporar sus datos a su base de conocimientos y sincronizarlos con los datos más recientes, envíe una StartIngestionJobsolicitud a un punto límite de tiempo de compilación de Agents for Amazon Bedrock. Especifique el y. knowledgeBaseId dataSourceId También puede detener un trabajo de ingesta de datos que se esté ejecutando actualmente enviando una StopIngestionJobsolicitud. Especifique los valores de dataSourceId, ingestionJobId y knowledgeBaseId. Debe haber un trabajo de ingesta de datos en ejecución para detener la ingesta de datos. Puede volver a enviar una StartIngestionJob solicitud para ingerir el resto de los datos cuando esté listo.

Utilice lo ingestionJobId devuelto en la respuesta de una GetIngestionJobsolicitud con un punto final de tiempo de compilación de Agents for Amazon Bedrock para realizar un seguimiento del estado del trabajo de ingestión. Además, especifique las teclas y. knowledgeBaseId dataSourceId

  • Cuando finalice el trabajo de ingesta, el status de la respuesta es COMPLETE.

    nota

    Una vez completada la ingesta de datos, las incrustaciones vectoriales de los datos recién ingeridos podrían tardar unos minutos en estar disponibles en el almacén de vectores para su consulta si utiliza un almacén de vectores que no sea Amazon Aurora (). RDS

  • El objeto statistics de la respuesta devuelve información sobre si la ingesta se realizó correctamente o no en el caso de los documentos del origen de datos.

También puede ver la información de todos los trabajos de ingestión de una fuente de datos enviando una ListIngestionJobssolicitud con un punto límite de tiempo de compilación de Agents for Amazon Bedrock. Especifique la base de conocimientos en la que se knowledgeBaseId van a ingerir los datos dataSourceId y la de la base de conocimientos.

  • Filtre los resultados especificando el estado que desee buscar en el objeto filters.

  • Puede ordenarlos por la hora en que se inició el trabajo o por el estado de un trabajo especificando el objeto sortBy. Puede especificar un orden ascendente o descendente.

  • Especifique el número máximo de resultados que se devuelven en una respuesta en el campo maxResults. Si hay más resultados que el número que ha establecido, la respuesta devuelve una nextToken que puede enviar en otra ListIngestionJobssolicitud para ver el siguiente lote de trabajos.