Opções de análise para sua fonte de dados - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Opções de análise para sua fonte de dados

A análise se refere à interpretação de documentos e seus componentes significativos. As bases de conhecimento Amazon Bedrock oferecem as seguintes opções para analisar sua fonte de dados durante a ingestão:

  • Analisador padrão Amazon Bedrock — analisa somente o texto em seus documentos. Esse analisador não incorre em nenhuma cobrança de uso.

  • Amazon Bedrock Data Automation (versão prévia) — Um serviço totalmente gerenciado que processa dados multimodais com eficácia, incluindo texto e imagens, sem a necessidade de fornecer qualquer solicitação adicional. Para obter mais informações sobre esse serviço, consulte Amazon Bedrock Data Automation.

  • Modelos básicos — Processa dados multimodais, incluindo texto e imagens, usando um modelo básico ou perfil de inferência. Esse analisador oferece a opção de personalizar o prompt usado para extração de dados. O custo desse analisador depende do número de tokens processados pelo modelo básico. Para obter uma lista de modelos que suportam a análise de dados do Amazon Bedrock Knowledge Bases, consulte. Modelos e regiões compatíveis para análise

nota

Se você escolher um modelo básico ou o Amazon Bedrock Data Automation para análise e ele falhar ao analisar um arquivo, o analisador padrão do Amazon Bedrock será usado em seu lugar.

A tabela a seguir resume o suporte ao tipo de arquivo para cada tipo de analisador:

Tipos de arquivo Extensão Analisador padrão Automação de dados Amazon Bedrock Modelo de fundação
Texto sem formatação (somente ASCII) .txt Yes Sim Yes Sim Yes Sim
Markdown .md Yes Sim Yes Sim Yes Sim
HyperText Linguagem de marcação .html Yes Sim Yes Sim Yes Sim
Documentos do Microsoft Word .doc/.docx Yes Sim Yes Sim Yes Sim
valores separados por vírgulas .csv Yes Sim Yes Sim Yes Sim
Planilha do Microsoft Excel .xls/.xlsx Yes Sim Yes Sim Yes Sim
Formato de documento portátil (PDF) .pdf Yes Sim Yes Sim Yes Sim
Imagens — formato JPEG/PNG .jpeg, .png No Não Yes Sim Yes Sim

Ao selecionar como analisar seus dados, considere o seguinte:

  • Se seus dados são puramente textuais ou contêm dados multimodais, como imagens, gráficos e tabelas, que você deseja que a base de conhecimento possa consultar.

  • Se você deseja a opção de personalizar o prompt usado para instruir o modelo sobre como analisar seus dados.

  • O custo do analisador. Para obter mais informações, consulte Preço do Amazon Bedrock.

Há limites para os tipos de arquivos e o total de dados que podem ser analisados com a análise avançada. Para obter informações sobre os tipos de arquivo para análise avançada, consulteFormatos de documentos e limites compatíveis com os dados da base de conhecimento. Para obter informações sobre o total de dados que podem ser analisados usando análise avançada, consulte os endpoints e cotas do Amazon Bedrock no. Referência geral da AWS

Para saber como configurar como sua base de conhecimento é analisada, consulte a configuração de conexão de uma fonte de dados compatível emConecte uma fonte de dados à sua base de conhecimento.