Criar uma barreira de proteção - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criar uma barreira de proteção

Você cria uma barreira de proteção definindo as configurações e os tópicos a serem negados, fornecendo filtros para lidar com conteúdo prejudicial e confidencial e escrevendo mensagens para quando os prompts e as respostas ao usuário forem bloqueados.

Uma barreira de proteção deve conter pelo menos um filtro e mensagens para quando os prompts e as respostas ao usuário forem bloqueados. É possível optar por usar as mensagens padrão. É possível adicionar filtros e iterar em sua barreira de proteção posteriormente, seguindo as etapas em Modificar uma barreira de proteção para configurar todos os componentes necessários para a barreira de proteção.

Escolha a guia do seu método preferido e siga as etapas:

Console
Para criar uma grade de proteção no console AWS
  1. Faça login no AWS Management Console usando uma IAMfunção com as permissões do Amazon Bedrock e abra o console do Amazon Bedrock em. https://console.aws.amazon.com/bedrock/

  2. No painel de navegação à esquerda, selecione Barreiras de proteção.

  3. Na seção Barreiras de proteção, selecione Crie uma barreira de proteção.

  4. Na página Fornecer detalhes da barreira de proteção, faça o seguinte:

    1. Na seção Detalhes da barreira de proteção, forneça um Nome e uma Descrição opcional para a barreira de proteção.

    2. Insira uma mensagem em Mensagens bloqueadas para prompts que serão exibidas quando as barreiras de proteção forem invocadas. Marque a caixa de seleção Usar a mesma mensagem bloqueada para respostas para usar a mesma mensagem quando as barreiras de proteção forem invocadas na resposta.

    3. (Opcional) Por padrão, sua grade de proteção é criptografada com um. Chave gerenciada pela AWS Para usar sua própria KMS chave gerenciada pelo cliente, selecione a seta para a direita ao lado da seleção da KMS chave e marque a caixa de seleção Personalizar configurações de criptografia (avançadas). Você pode selecionar uma AWS KMS chave existente ou selecionar Criar uma AWS KMS chave para criar uma nova.

    4. Em Opções de criação de barreira de proteção, selecione Criação rápida com filtros de toxicidade para usar as configurações padrão ou escolha Criar sua própria barreira de proteção para personalizar suas configurações de barreira de proteção. Também é possível selecionar Visualizar e editar filtros de toxicidade para visualizar ou personalizar as configurações do filtro de palavrões e de ataque de prompt da barreira de proteção.

    5. (Opcional) Para adicionar tags à barreira de proteção, selecione a seta para a direita ao lado de Tags. Selecione Adicionar nova tag e defina pares de chave-valor para as tags. Para obter mais informações, consulte Marcação de recursos do Amazon Bedrock.

    6. Escolha Próximo.

    nota

    Configure pelo menos um filtro para criar uma barreira de proteção. É possível selecionar Criar para ignorar a criação de outros filtros.

  5. (Opcional) Na página Configurar filtros de conteúdo, configure com que intensidade você deseja filtrar o conteúdo relacionado às categorias definidas em Bloquear palavras e conversas prejudiciais com filtros de conteúdo fazendo o seguinte:

    1. Para configurar filtros para categorias prejudiciais, selecione Configurar filtro de categorias prejudiciais. Selecione Texto e/ou Imagem para filtrar o conteúdo de texto ou imagem a partir de solicitações ou respostas ao modelo. Selecione Nenhum, Baixo, Médio ou Alto para o nível de filtragem que você deseja aplicar a cada categoria. Você pode optar por ter diferentes níveis de filtro para solicitações ou respostas. É possível selecionar o filtro de ataques de prompt nas categorias prejudiciais. Configure o rigor de cada filtro para prompts que o usuário fornece ao modelo.

    2. Para configurar filtros para prompt atacado, selecione Habilitar filtro de ataques de prompt. Configure quão rigorosamente o filtro deve detectar e bloquear ataques de jailbreak e de injeção de prompt.

    3. Selecione Criar para criar a grade de proteção ou selecione Usar filtros avançados para personalizar as configurações do filtro.

  6. (Opcional) Na página Adicionar tópicos negados, é possível adicionar tópicos negados ou selecionar Ir para analisar e criar.

    1. Para definir um tópico a ser bloqueado, selecione Adicionar tópico negado. Faça o seguinte:

      1. Insira um Nome para o tópico.

      2. Na caixa Definição de tópico, defina o tópico. Para obter as diretrizes sobre como definir um tópico negado, consulte Bloquear tópicos negados para ajudar a remover conteúdo prejudicial.

      3. (Opcional) Para adicionar prompts de entrada representativas ou respostas de modelo relacionadas a esse tópico, selecione a seta para a direita ao lado de Adicionar exemplos de frases. Digite uma frase na caixa. Para adicionar outra frase, selecione Adicionar frase.

      4. Quando concluir a configuração do tópico negado, selecione Confirmar.

    2. É possível executar as ações a seguir com os tópicos negados.

      • Para adicionar outro tópico, selecione Adicionar tópico negado.

      • Para editar um tópico, selecione o ícone de três pontos na mesma linha do tópico na coluna Ações. Selecione Editar. Ao concluir a edição, selecione Confirmar.

      • Para excluir um tópico ou tópicos, marque as caixas de seleção dos tópicos a serem excluídos. Selecione Excluir e Sim, excluir.

      • Para excluir todos os tópicos, selecione Excluir e Excluir tudo.

      • Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( Gear icon representing settings or configuration options. ). Defina suas preferências e selecione Confirmar.

    3. Ao concluir a configuração dos tópicos negados, selecione Próximo.

  7. (Opcional) Na página Adicionar filtros de palavras, faça o seguinte:

    1. Na seção Filtrar palavrões, selecione Filtrar palavrões para bloquear palavrões em prompts e respostas. A lista de palavrões é baseada em definições convencionais e é atualizada continuamente.

    2. Na seção Adicionar palavras e frases personalizadas, selecione como adicionar palavras e frases para que a barreira de proteção bloqueie. Se optar por carregar um arquivo, cada linha do arquivo deverá conter uma palavra ou uma frase de até três palavras. Não inclua um cabeçalho. Você tem as seguintes opções:

      Opção Instruções
      Adicionar palavras e frases manualmente Adicione palavras e frases diretamente na seção Visualizar e editar palavras e frases.
      Fazer upload de um arquivo local Para carregar um arquivo .txt ou .csv que contém as palavras e frases, selecione Escolher arquivo depois de selecionar essa opção.
      Carregar de um objeto do Amazon S3 Para carregar de um arquivo do Amazon S3, especifique o Objeto do S3 após selecionar essa opção. Cada linha do arquivo deverá conter uma palavra ou uma frase de até três palavras.
    3. Edite as palavras e frases a serem bloqueadas pela barreira de proteção na seção Visualizar e editar palavras e frases. Você tem as seguintes opções:

      • Se carregar de uma lista de palavras de um arquivo local ou objeto do Amazon S3, essa seção será preenchida com a sua lista de palavras. Para filtrar itens com erros, selecione Mostrar erros.

      • Para adicionar um item à lista de palavras, selecione Adicionar palavra ou frase. Insira uma palavra ou frase de até três palavras na caixa e pressione Enter ou selecione o ícone de marca de seleção para confirmar o item.

      • Para editar um item, selecione o ícone de edição ( Edit icon represented by a pencil symbol. ) ao lado do item.

      • Para excluir um item da lista de palavras, selecione o ícone da lixeira ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ) ou, se estiver editando um item, selecione o ícone de exclusão ( Close or cancel icon represented by an "X" symbol. ) ao lado do item.

      • Para excluir itens que contêm erros, selecione Excluir tudo e selecione Excluir todas as linhas com erro

      • Para excluir todos os itens, selecione Excluir tudo e selecione Excluir todas as linhas

      • Para pesquisar um item, insira uma expressão na barra de pesquisa.

      • Para mostrar somente itens com erros, selecione o menu suspenso Mostrar tudo e selecione Mostrar somente erros.

      • Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( Gear icon representing settings or configuration options. ). Defina suas preferências e selecione Confirmar.

      • Por padrão, essa seção exibe o editor de Tabela. Para mudar para um editor de texto no qual seja possível inserir uma palavra ou frase em cada linha, selecione Editor de texto. O Editor de texto fornece os seguintes recursos:

        • É possível copiar uma lista de palavras de outro editor de texto e colá-la nesse editor.

        • Um ícone de X vermelho aparece ao lado dos itens que contêm erros e uma lista de erros é exibida abaixo do editor.

    4. Selecione Ignorar para revisar e criar para criar a grade de proteção ou selecione Avançar para adicionar filtros PII e padrões de regex.

  8. (Opcional) Na página Adicionar filtros de informações confidenciais, configure filtros para bloquear ou mascarar informações confidenciais. Para obter mais informações, consulte Remova as PII das conversas usando filtros de informações confidenciais. Faça o seguinte:

    1. Na seção PIIde tipos, configure as categorias de informações de identificação pessoal (PII) para bloquear ou mascarar. Você tem as seguintes opções:

      • Para adicionar um PII tipo, selecione Adicionar um PII tipo. Faça o seguinte:

        1. Na coluna Tipo, selecione um PII tipo.

        2. Na coluna Comportamento do guardrail, selecione se o guardrail deve bloquear o conteúdo contendo o PII tipo ou mascará-lo com um identificador.

      • Para adicionar todos os PII tipos, selecione a seta suspensa ao lado de Adicionar um PII tipo. Selecione o comportamento da barreira de proteção a ser aplicado a eles.

        Atenção

        Se você especificar um comportamento, qualquer comportamento existente que você configurou para PII tipos será substituído.

      • Para excluir um PII tipo, selecione o ícone da lixeira ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ).

      • Para excluir linhas que contêm erros, selecione Excluir tudo e selecione Excluir todas as linhas com erro

      • Para excluir todos os PII tipos, selecione Excluir tudo e, em seguida, selecione Excluir todas as linhas

      • Para pesquisar uma linha, insira uma expressão na barra de pesquisa.

      • Para mostrar somente linhas com erros, selecione o menu suspenso Mostrar tudo e selecione Mostrar somente erros.

      • Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( Gear icon representing settings or configuration options. ). Defina suas preferências e selecione Confirmar.

    2. Na seção Padrões Regex, use expressões regulares para definir padrões para a barreira de proteção filtrar. Você tem as seguintes opções:

      • Para adicionar um padrão, selecione Adicionar padrão regex. Configure os campos a seguir.

        Campo Descrição
        Name Um nome para o padrão
        Padrão Regex Uma expressão regular que define o padrão
        Comportamento da barreira de proteção Escolha se deseja Bloquear conteúdo que contém o padrão ou Mascarar o conteúdo com um identificador. Para mascarar o padrão somente em logs, selecione Nenhum.
        Adicionar descrição (Opcional) Escrever uma descrição para o padrão
      • Para editar um padrão, selecione o ícone de três pontos na mesma linha do tópico na coluna Ações. Selecione Editar. Ao concluir a edição, selecione Confirmar.

      • Para excluir um padrão ou padrões, marque as caixas de seleção dos padrões a serem excluídos. Selecione Excluir e Sim, excluir.

      • Para excluir todos os padrões, selecione Excluir e Excluir tudo.

      • Para pesquisar um padrão, insira uma expressão na barra de pesquisa.

      • Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( Gear icon representing settings or configuration options. ). Defina suas preferências e selecione Confirmar.

    3. Ao concluir a configuração dos filtros de informações confidenciais, selecione Próximo ou Ir para analisar e criar.

  9. Na página Adicionar verificação de base contextual (opcional), configure limites para bloquear informações não fundamentadas ou irrelevantes.

    nota

    Para cada tipo de verificação, é possível mover o controle deslizante ou inserir um valor limite de 0 a 0,99. Selecione um limite apropriado para seus usos. Um limite mais alto exige que as respostas sejam fundamentadas ou relevantes, com um alto grau de confiança para serem permitidas. As respostas abaixo do limite serão filtradas. Para saber mais sobre a verificação de aterramento contextual, consulte. Usar a verificação de base contextual para filtrar alucinações nas respostas

    1. No campo Base, selecione Habilitar verificação de base para verificar se as respostas do modelo estão fundamentadas.

    2. No campo Relevância, selecione Habilitar verificação de relevância para verificar se as respostas do modelo são relevantes.

    3. Escolha Próximo.

  10. Revisar e criar: revise as configurações da barreira de proteção.

    1. Selecione Editar em qualquer seção na qual desejar fazer alterações.

    2. Quando as configurações da barreira de proteção estiverem adequadas para você, selecione Criar para criar a barreira de proteção.

API

Para criar uma grade de proteção, envie uma CreateGuardrailsolicitação. O formato da solicitação é o seguinte:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "contentPolicyConfig": { "filtersConfig": [ { "inputStrength": "NONE | LOW | MEDIUM | HIGH", "outputStrength": "NONE | LOW | MEDIUM | HIGH", "type": "SEXUAL | VIOLENCE | HATE | INSULTS | MISCONDUCT | PROMPT_ATTACK" } ] }, "wordPolicyConfig": { "wordsConfig": [ { "text": "string" } ], "managedWordListsConfig": [ { "type": "string" } ] }, "sensitiveInformationPolicyConfig": { "piiEntitiesConfig": [ { "type": "string", "action": "string" } ], "regexesConfig": [ { "name": "string", "description": "string", "regex": "string", "action": "string" } ] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [ { "key": "string", "value": "string" } ], "topicPolicyConfig": { "topicsConfig": [ { "definition": "string", "examples": [ "string" ], "name": "string", "type": "DENY" } ] } }
  • Especifique um name e uma description para a barreira de proteção.

  • Especifique mensagens para quando a barreira de proteção bloquear um prompt ou uma resposta do modelo com sucesso nos campos blockedInputMessaging e blockedOutputsMessaging.

  • Especifique tópicos para a barreira de proteção negar no objeto topicPolicy. Cada item na lista de topics pertence a um tópico. Para obter mais informações sobre os campos em um tópico, consulte Tópico.

    • Forneça uma name e uma description para que a barreira de proteção possa identificar adequadamente o tópico.

    • Especifique DENY no campo action.

    • (Opcional) Forneça até cinco exemplos que você classificaria como pertencentes ao tópico na lista de examples.

  • Especifique as intensidades do filtro para as categorias prejudiciais definidas no Amazon Bedrock no objeto contentPolicy. Cada item da lista de filters pertence a uma categoria prejudicial. Para obter mais informações, consulte Bloquear palavras e conversas prejudiciais com filtros de conteúdo. Para obter mais informações sobre os campos em um filtro de conteúdo, consulte ContentFilter.

    • Especifique a categoria no campo type.

    • Especifique a intensidade do filtro para prompts no campo strength do campo textToTextFiltersForPrompt e para respostas do modelo no campo strength de textToTextFiltersForResponse.

  • (Opcional) Anexe todas as tags à barreira de proteção. Para obter mais informações, consulte Marcação de recursos do Amazon Bedrock.

  • (Opcional) Por motivos ARN de segurança, inclua a KMS chave no kmsKeyId campo.

O formato da resposta é o seguinte:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }