Modificación de un origen de datos para la base de conocimientos de Amazon Bedrock - Amazon Bedrock

Modificación de un origen de datos para la base de conocimientos de Amazon Bedrock

Puede actualizar un origen de datos para la base de conocimientos, por ejemplo, cambiando las configuraciones del origen de datos.

Puede actualizar un origen de datos de las siguientes maneras:

  • Agregue, cambie o elimine archivos o contenido del origen de datos.

  • Cambie las configuraciones del origen de datos o la clave de KMS que se utilizará para cifrar los datos transitorios durante la ingesta de datos. Si cambia los detalles de configuración del origen o punto de conexión, debería actualizar o crear un nuevo rol de IAM con los permisos de acceso necesarios y el secreto de Secrets Manager (si corresponde).

  • Defina su política de eliminación de orígenes de datos como “Eliminar” o “Retener”. Puede eliminar todos los datos del origen de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de origen de datos. Puede retener todos los datos del origen de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de origen de datos. Tenga en cuenta que el almacén vectorial en sí no se elimina si elimina una base de conocimientos o un recurso de origen de datos.

Cada vez que añada, modifique o elimine archivos del origen de datos, debe sincronizar el origen de datos para volver a indexarlo en la base de conocimientos. La sincronización es incremental, por lo que Amazon Bedrock solo procesa los documentos añadidos, modificados o eliminados desde la última sincronización. Antes de iniciar la ingesta, compruebe que el origen de datos cumpla las siguientes condiciones:

  • Los archivos son del formato admitido. Para obtener más información, consulte Formatos de documentos admitidos.

  • Los archivos no deben superar el Tamaño del archivo de trabajo de ingesta especificado en los Amazon Bedrock endpoints and quotas en la Referencia general de AWS.

  • Si el origen de datos contiene archivos de metadatos, compruebe las siguientes condiciones para asegurarse de que no se omitan los archivos de metadatos:

    • Cada archivo .metadata.json comparte el mismo nombre y extensión que el archivo de origen al que está asociado.

    • Si el índice vectorial de la base de conocimientos se encuentra en un almacén vectorial de Amazon OpenSearch sin servidor, compruebe que el índice vectorial esté configurado con el motor faiss. Si el índice vectorial está configurado con el motor nmslib, deberá realizar una de las siguientes acciones:

    • Si el índice vectorial de la base de conocimientos se encuentra en un clúster de bases de datos de Amazon Aurora, compruebe que la tabla del índice contenga una columna para cada propiedad de metadatos de los archivos de metadatos antes de iniciar la ingesta.

Para obtener más información sobre cómo actualizar un origen de datos, seleccione la pestaña correspondiente al método que prefiera y siga estos pasos:

Console
Actualización de un origen de datos
  1. Inicie sesión en la AWS Management Console con un rol de IAM con los permisos de Amazon Bedrock y abra la consola de Amazon Bedrock en https://console.aws.amazon.com/bedrock/.

  2. En el panel de navegación de la izquierda, seleccione Base de conocimientos.

  3. Seleccione el nombre de la base de conocimientos.

  4. En Origen de datos, elija el botón de opción situado junto al origen de datos que desea editar o sincronizar.

  5. (Opcional) Seleccione Editar, cambie las configuraciones y elija Enviar. Si cambia los detalles de configuración del origen o punto de conexión, debería actualizar o crear un nuevo rol de IAM con los permisos de acceso necesarios y el secreto de Secrets Manager (si corresponde). Además, tenga en cuenta que no se pueden cambiar las configuraciones de fragmentación que se basan en los datos originales ingeridos. Tiene que volver a crear el origen de datos.

    nota

    No puede cambiar las configuraciones de fragmentación. Tiene que volver a crear el origen de datos.

  6. (Opcional) Elija editar la política de eliminación de datos de origen de datos como parte de la configuración avanzada:

    En cuanto a la configuración de la política de eliminación de datos, puede elegir cualquiera de las siguientes opciones:

    • Eliminar: elimina todos los datos del origen de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de origen de datos. Tenga en cuenta que el almacén vectorial en sí no se elimina, solo se eliminan los datos. Este indicador se ignora si se elimina una cuenta de AWS.

    • Retener: retiene todos los datos del origen de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de origen de datos. Tenga en cuenta que el almacén vectorial en sí no se elimina si elimina una base de conocimientos o un recurso de origen de datos.

  7. Elija Sincronizar.

  8. Aparece un banner verde cuando se completa la sincronización y el estado pasa a Listo.

API
Actualización de un origen de datos
  1. (Opcional) Envíe una solicitud UpdateDataSource con un punto de conexión en tiempo de compilación de Agentes para Amazon Bedrock, modifique la configuración y especifique las mismas configuraciones que no desee cambiar. Si cambia los detalles de configuración del origen o punto de conexión, debería actualizar o crear un nuevo rol de IAM con los permisos de acceso necesarios y el secreto de Secrets Manager (si corresponde).

    nota

    No puede cambiar la chunkingConfiguration. Envíe la solicitud con la chunkingConfiguration existente o vuelva a crear el origen de datos.

  2. (Opcional) Cambie la dataDeletionPolicy para el origen de datos. Puede DELETE todos los datos del origen de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de origen de datos. Este indicador se ignora si se elimina una cuenta de AWS. Puede RETAIN todos los datos del origen de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de origen de datos. Tenga en cuenta que el almacén vectorial en sí no se elimina si elimina una base de conocimientos o un recurso de origen de datos.

  3. Envíe una solicitud StartIngestionJob con un punto de conexión en tiempo de compilación de Agentes para Amazon Bedrock, especificando el dataSourceId y el knowledgeBaseId.