As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Integrando uma carga de trabalho tradicional na nuvem com o Amazon Bedrock
O escopo desse caso de uso é demonstrar uma carga de trabalho de nuvem tradicional integrada ao Amazon Bedrock para aproveitar os recursos de IA generativa. O diagrama a seguir ilustra a conta Generative AI em conjunto com um exemplo de conta de aplicativo.

A conta Generative AI é dedicada a fornecer funcionalidade de IA generativa usando o Amazon Bedrock. A conta do aplicativo é um exemplo de carga de trabalho. Os serviços da AWS que você usa nessa conta dependem dos seus requisitos. As interações entre a conta Generative AI e a conta do Aplicativo usam o Amazon Bedrock APIs.
A conta Application é separada da conta Generative AI para ajudar a agrupar cargas de trabalho com base nos objetivos comerciais e na propriedade. Isso ajuda a restringir o acesso a dados confidenciais no ambiente generativo de IA e oferece suporte à aplicação de controles de segurança distintos por ambiente. Manter a carga de trabalho tradicional da nuvem em uma conta separada também ajuda a limitar o escopo do impacto de eventos adversos.
Você pode criar e escalar aplicativos corporativos de IA generativa com base em vários casos de uso que são suportados pelo Amazon Bedrock. Alguns casos de uso comuns são geração de texto, assistência virtual, pesquisa de texto e imagem, resumo de texto e geração de imagens. Dependendo do seu caso de uso, seu componente de aplicativo interage com um ou mais recursos do Amazon Bedrock, como bases de conhecimento e agentes.
Conta do aplicativo
A conta do aplicativo hospeda a infraestrutura e os serviços principais para executar e manter um aplicativo corporativo. Nesse contexto, a conta Application atua como a carga de trabalho tradicional da nuvem, que interage com o serviço gerenciado Amazon Bedrock na conta Generative AI. Consulte a seção Conta do aplicativo Workload OU para ver as melhores práticas gerais de segurança para proteger essa conta.
As melhores práticas padrão de segurança de aplicativos se aplicam como em outros aplicativos. Se você planeja usar a geração aumentada de recuperação (RAG), em que o aplicativo consulta informações relevantes de uma base de conhecimento, como um banco de dados vetoriais
Outro padrão de design para aplicativos generativos de IA é usar agentes
Também é importante limitar o acesso direto aos pontos finais de inferência do modelo pré-treinado que foram usados para gerar inferências. Você deseja restringir o acesso aos endpoints de inferência para controlar custos e monitorar atividades. Se seus endpoints de inferência estiverem hospedados na AWS, como nos modelos básicos do Amazon Bedrock, você poderá usar o IAM
Se seu aplicativo de IA estiver disponível para os usuários como um aplicativo da Web, você deverá proteger sua infraestrutura usando controles como firewalls de aplicativos da Web. Ameaças cibernéticas tradicionais, como injeções de SQL e inundações de solicitações, podem ser possíveis contra seu aplicativo. Como as invocações do seu aplicativo causam invocações da inferência do modelo APIs, e as chamadas da API de inferência do modelo geralmente são cobradas, é importante reduzir as inundações para minimizar as cobranças inesperadas do seu provedor de FM. Os firewalls de aplicativos da Web não protegem contra ameaças de injeção imediata
Registrar e monitorar a inferência em modelos generativos de IA é crucial para manter a segurança e evitar o uso indevido. Ele permite a identificação de possíveis agentes de ameaças, atividades maliciosas ou acesso não autorizado e ajuda a permitir a intervenção e a mitigação oportunas dos riscos associados à implantação desses modelos poderosos.
Conta generativa de IA
Dependendo do caso de uso, a conta de IA generativa hospeda todas as atividades de IA generativa. Isso inclui, mas não está limitado a, invocação de modelo, RAG, agentes e ferramentas e personalização de modelos. Consulte as seções anteriores que discutem casos de uso específicos para ver quais recursos e implementação são necessários para sua carga de trabalho.
As arquiteturas apresentadas neste guia oferecem uma estrutura abrangente para organizações que usam os serviços da AWS para aproveitar os recursos generativos de IA de forma segura e eficiente. Essas arquiteturas combinam a funcionalidade totalmente gerenciada do Amazon Bedrock com as melhores práticas de segurança para fornecer uma base sólida para integrar a IA generativa às cargas de trabalho e processos organizacionais tradicionais da nuvem. Os casos de uso específicos abordados, incluindo o fornecimento de IA generativa FMs, RAG, agentes e personalização de modelos, abordam uma ampla variedade de possíveis aplicações e cenários. Essa orientação fornece às organizações a compreensão necessária dos serviços AWS Bedrock e de seus controles de segurança inerentes e configuráveis, permitindo que elas tomem decisões informadas adaptadas à sua infraestrutura, aplicações e requisitos de segurança exclusivos.