Modificar uma fonte de dados da base de conhecimento do Amazon Bedrock - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Modificar uma fonte de dados da base de conhecimento do Amazon Bedrock

É possível atualizar uma fonte de dados da base de dados, como alterar as configurações da fonte de dados.

É possível atualizar uma fonte de dados das seguintes maneiras:

  • Adicionar, alterar ou remover arquivos ou conteúdo da fonte de dados.

  • Alterar as configurações da fonte de dados ou a chave do KMS a ser usada para criptografar dados transitórios durante a ingestão de dados. Se você alterar os detalhes da configuração da fonte ou do endpoint, deverá atualizar ou criar um perfil do IAM com as permissões de acesso necessárias e o segredo do Secrets Manager (se aplicável).

  • Defina a política de exclusão de fonte de dados como “Excluir” ou “Reter”. É possível excluir todos os dados da fonte de dados que são convertidos em incorporações de vetores após a exclusão de uma base de conhecimento ou recurso de fonte de dados. É possível reter todos os dados da fonte de dados que são convertidos em incorporações de vetores após a exclusão de uma base de conhecimento ou recurso de fonte de dados. Observe que o armazenamento de vetores em si não será excluído se você excluir uma base de conhecimento ou um recurso de fonte de dados.

Sempre que você adicionar, modificar ou remover arquivos da fonte de dados, sincronize a fonte de dados para que ela seja reindexada na base de conhecimento. A sincronização é incremental, portanto, o Amazon Bedrock processa somente documentos adicionados, modificados ou excluídos desde a última sincronização. Antes de começar a ingestão, verifique se a fonte de dados atende às seguintes condições:

  • Os arquivos estão nos formatos compatíveis. Para obter mais informações, consulte Formatos de documento compatíveis.

  • Os arquivos não excedem o tamanho do arquivo de trabalho de ingestão especificado em Amazon Bedrock endpoints and quotas no Referência geral da AWS.

  • Se a fonte de dados contiver arquivos de metadados, verifique as seguintes condições para garantir que os arquivos de metadados não sejam ignorados:

    • Cada arquivo .metadata.json compartilha o mesmo nome e extensão do arquivo de origem ao qual está associado.

    • Se o índice vetorial da sua base de conhecimento estiver em um armazenamento vetorial Amazon OpenSearch Serverless, verifique se o índice vetorial está configurado com o faiss mecanismo. Se o índice de vetores estiver configurado com o mecanismo nmslib, será necessário fazer o seguinte:

    • Se o índice de vetores da base de conhecimento estiver em um cluster de banco de dados do Amazon Aurora, verifique se a tabela do índice contém uma coluna para cada propriedade de metadados nos arquivos de metadados antes de iniciar a ingestão.

Para saber como atualizar uma fonte de dados, escolha a guia do seu método preferido e siga as etapas:

Console
Como atualizar uma fonte de dados
  1. Faça login na função AWS Management Console usando uma função do IAM com as permissões do Amazon Bedrock e abra o console do Amazon Bedrock em. https://console.aws.amazon.com/bedrock/

  2. No painel de navegação esquerdo, escolha Bases de conhecimento.

  3. Selecione o nome da base de conhecimento.

  4. Na seção Fonte de dados, selecione o botão de opção ao lado da fonte de dados que deseja editar ou sincronizar.

  5. (Opcional) Escolha Editar, altere as configurações e selecione Enviar. Se você alterar os detalhes da configuração da fonte ou do endpoint, deverá atualizar ou criar um perfil do IAM com as permissões de acesso necessárias e o segredo do Secrets Manager (se aplicável). Além disso, observe que não é possível alterar as configurações de fragmentação baseadas nos dados originais ingeridos. Recrie a fonte de dados.

    nota

    Não é possível alterar as configurações de fragmentação. Recrie a fonte de dados.

  6. (Opcional) Escolha editar a política de exclusão de dados da fonte de dados como parte das configurações avançadas:

    Para configurações da política de exclusão de dados, você pode escolher uma das seguintes opções:

    • Excluir: exclui todos os dados da fonte de dados que são convertidos em incorporações de vetores após a exclusão de uma base de conhecimento ou de recurso de fonte de dados. O armazenamento de vetores propriamente dito não é excluído, apenas os dados. Esse sinalizador será ignorado se uma AWS conta for excluída.

    • Reter: retém todos os dados da fonte de dados que são convertidos em incorporações de vetores após a exclusão de uma base de conhecimento ou recurso de fonte de dados. Observe que o armazenamento de vetores em si não será excluído se você excluir uma base de conhecimento ou um recurso de fonte de dados.

  7. Escolha Sincronizar.

  8. Um banner verde aparece quando a sincronização é concluída e o Status se torna Pronto.

API
Como atualizar uma fonte de dados
  1. (Opcional) Envie uma UpdateDataSourcesolicitação com um endpoint de tempo de construção do Agents for Amazon Bedrock, alterando todas as configurações e especificando as mesmas configurações que você não deseja alterar. Se você alterar os detalhes da configuração da fonte ou do endpoint, deverá atualizar ou criar um perfil do IAM com as permissões de acesso necessárias e o segredo do Secrets Manager (se aplicável).

    nota

    Não é possível alterar a chunkingConfiguration. Envie a solicitação com a chunkingConfiguration existente ou recrie a fonte de dados.

  2. (Opcional) Altere a dataDeletionPolicy da fonte de dados. É possível DELETE todos os dados da fonte de dados que são convertidos em incorporações de vetores após a exclusão de uma base de conhecimento ou recurso de fonte de dados. Esse sinalizador será ignorado se uma AWS conta for excluída. É possível RETAIN todos os dados da fonte de dados que são convertidos em incorporações de vetores após a exclusão de uma base de conhecimento ou recurso de fonte de dados. Observe que o armazenamento de vetores em si não será excluído se você excluir uma base de conhecimento ou um recurso de fonte de dados.

  3. Envie uma StartIngestionJobsolicitação com um endpoint de tempo de construção do Agents for Amazon Bedrock, especificando o e o. dataSourceId knowledgeBaseId