Modificación de un origen de datos para la base de conocimientos de Amazon Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Modificación de un origen de datos para la base de conocimientos de Amazon Bedrock

Puede actualizar un origen de datos para la base de conocimientos, por ejemplo, cambiando las configuraciones del origen de datos.

Puede actualizar un origen de datos de las siguientes maneras:

  • Agregue, cambie o elimine archivos o contenido del origen de datos.

  • Cambie las configuraciones de la fuente de datos o la KMS clave que se utilizará para cifrar los datos transitorios durante la ingesta de datos. Si cambias los detalles de configuración de origen o punto final, debes actualizar o crear un nuevo IAM rol con los permisos de acceso necesarios y el secreto de Secrets Manager (si corresponde).

  • Defina su política de eliminación de orígenes de datos como “Eliminar” o “Retener”. Puede eliminar todos los datos del origen de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de origen de datos. Puede retener todos los datos del origen de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de origen de datos. Tenga en cuenta que el almacén vectorial en sí no se elimina si elimina una base de conocimientos o un recurso de origen de datos.

Cada vez que añada, modifique o elimine archivos del origen de datos, debe sincronizar el origen de datos para volver a indexarlo en la base de conocimientos. La sincronización es incremental, por lo que Amazon Bedrock solo procesa los documentos añadidos, modificados o eliminados desde la última sincronización. Antes de iniciar la ingesta, compruebe que el origen de datos cumpla las siguientes condiciones:

  • Los archivos son del formato admitido. Para obtener más información, consulte Formatos de documentos admitidos.

  • Los archivos no deben superar el Tamaño del archivo de trabajo de ingesta especificado en los Amazon Bedrock endpoints and quotas en la Referencia general de AWS.

  • Si el origen de datos contiene archivos de metadatos, compruebe las siguientes condiciones para asegurarse de que no se omitan los archivos de metadatos:

    • Cada archivo .metadata.json comparte el mismo nombre y extensión que el archivo de origen al que está asociado.

    • Si el índice vectorial de su base de conocimientos se encuentra en un almacén vectorial de Amazon OpenSearch Serverless, compruebe que el índice vectorial esté configurado con el faiss motor. Si el índice vectorial está configurado con el motor nmslib, deberá realizar una de las siguientes acciones:

    • Si el índice vectorial de la base de conocimientos se encuentra en un clúster de bases de datos de Amazon Aurora, compruebe que la tabla del índice contenga una columna para cada propiedad de metadatos de los archivos de metadatos antes de iniciar la ingesta.

Para obtener información sobre cómo actualizar una fuente de datos, elija la pestaña correspondiente al método que prefiera y, a continuación, siga estos pasos:

Console
Actualización de un origen de datos
  1. Inicie sesión en el AWS Management Console uso de un IAMrol con los permisos de Amazon Bedrock y abra la consola de Amazon Bedrock en. https://console.aws.amazon.com/bedrock/

  2. En el panel de navegación izquierdo, elija Bases de conocimiento.

  3. Seleccione el nombre de la base de conocimientos.

  4. En Origen de datos, elija el botón de opción situado junto al origen de datos que desea editar o sincronizar.

  5. (Opcional) Seleccione Editar, cambie las configuraciones y elija Enviar. Si cambias los detalles de configuración de origen o punto final, debes actualizar o crear un nuevo IAM rol con los permisos de acceso necesarios y el secreto de Secrets Manager (si corresponde). Además, tenga en cuenta que no se pueden cambiar las configuraciones de fragmentación que se basan en los datos originales ingeridos. Tiene que volver a crear el origen de datos.

    nota

    No puede cambiar las configuraciones de fragmentación. Tiene que volver a crear el origen de datos.

  6. (Opcional) Elija editar la política de eliminación de datos de origen de datos como parte de la configuración avanzada:

    En cuanto a la configuración de la política de eliminación de datos, puede elegir cualquiera de las siguientes opciones:

    • Eliminar: elimina todos los datos del origen de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de origen de datos. Tenga en cuenta que el almacén vectorial en sí no se elimina, solo se eliminan los datos. Este indicador se ignora si se elimina una AWS cuenta.

    • Retener: retiene todos los datos del origen de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de origen de datos. Tenga en cuenta que el almacén vectorial en sí no se elimina si elimina una base de conocimientos o un recurso de origen de datos.

  7. Elija Sincronizar.

  8. Aparece un banner verde cuando se completa la sincronización y el estado pasa a Listo.

API
Actualización de un origen de datos
  1. (Opcional) Envíe una UpdateDataSourcesolicitud con un punto final de tiempo de compilación de Agents for Amazon Bedrock, modifique cualquier configuración y especifique las mismas configuraciones que no desee cambiar. Si cambias los detalles de configuración de origen o punto final, debes actualizar o crear un nuevo IAM rol con los permisos de acceso necesarios y el secreto de Secrets Manager (si corresponde).

    nota

    No puede cambiar la chunkingConfiguration. Envíe la solicitud con la chunkingConfiguration existente o vuelva a crear el origen de datos.

  2. (Opcional) Cambie la dataDeletionPolicy para el origen de datos. Puede DELETE todos los datos del origen de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de origen de datos. Este indicador se ignora si se elimina una AWS cuenta. Puede RETAIN todos los datos del origen de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de origen de datos. Tenga en cuenta que el almacén vectorial en sí no se elimina si elimina una base de conocimientos o un recurso de origen de datos.

  3. Envíe una StartIngestionJobsolicitud con un punto final de tiempo de compilación de Agents for Amazon Bedrock, especificando el y eldataSourceId. knowledgeBaseId