Crea un guardrail - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Crea un guardrail

Puoi creare un guardrail impostando le configurazioni, definendo argomenti da negare, fornendo filtri per gestire contenuti dannosi e sensibili e scrivendo messaggi per quando le richieste e le risposte degli utenti sono bloccate.

Un guardrail deve contenere almeno un filtro e un messaggio per quando i prompt e le risposte degli utenti sono bloccati. Puoi scegliere di utilizzare la messaggistica predefinita. Puoi aggiungere filtri ed eseguire iterazioni sul guardrail in un secondo momento seguendo i passaggi indicati Modificare un guardrail per configurare tutti i componenti necessari per il guardrail.

Seleziona la scheda corrispondente al metodo scelto e segui i passaggi:

Console
Per creare un guardrail nella console AWS
  1. Accedi all' AWS Management Console utilizzo di un IAMruolo con le autorizzazioni di Amazon Bedrock e apri la console Amazon Bedrock all'indirizzo. https://console.aws.amazon.com/bedrock/

  2. Dal riquadro di navigazione a sinistra, seleziona Guardrails.

  3. Nella sezione Guardrails, seleziona Crea guardrail.

  4. Nella pagina Fornisci i dettagli del guardrail, procedi come segue:

    1. Nella sezione Dettagli del guardrail, fornisci un nome e una descrizione facoltativa per il guardrail.

    2. Inserisci un messaggio per i messaggi bloccati per i prompt che verranno visualizzati quando viene richiamato il guardrail. Seleziona la casella di controllo Usa lo stesso messaggio bloccato per le risposte per utilizzare lo stesso messaggio quando i guardrails vengono richiamati nella risposta.

    3. (Facoltativo) Per impostazione predefinita, il guardrail è crittografato con un. Chiave gestita da AWS Per utilizzare la tua KMS chiave gestita dal cliente, seleziona la freccia destra accanto alla selezione della KMS chiave e seleziona la casella di controllo Personalizza le impostazioni di crittografia (avanzate). Puoi selezionare una AWS KMS chiave esistente o selezionare Crea una AWS KMS chiave per crearne una nuova.

    4. Per le opzioni di creazione di Guardrail, seleziona Creazione rapida con filtri di tossicità per utilizzare le impostazioni predefinite oppure seleziona Crea il tuo guardrail per personalizzare le impostazioni del guardrail. Puoi anche selezionare Visualizza e modifica i filtri di tossicità per visualizzare o personalizzare le impostazioni del filtro guardrail, le parolacce e il filtro Prompt Attack.

    5. (Facoltativo) Per aggiungere tag al tuo guardrail, seleziona la freccia destra accanto a Tag. Quindi, seleziona Aggiungi nuovo tag e definisci le coppie chiave-valore per i tag. Per ulteriori informazioni, consulta Etichettare le risorse di Amazon Bedrock.

    6. Scegli Next (Successivo).

    Nota

    È necessario configurare almeno un filtro per creare un guardrail. Puoi quindi selezionare Crea per saltare la creazione di altri filtri.

  5. (Facoltativo) Nella pagina Configura i filtri dei contenuti, imposta la forza con cui desideri filtrare i contenuti correlati alle categorie definite in Blocca parole e conversazioni dannose con filtri di contenuto procedendo come segue:

    1. Per configurare i filtri per le categorie dannose, seleziona Abilita il filtro per le categorie dannose. Puoi selezionare il filtro per gli attacchi rapidi nelle categorie dannose. Configura quanto rigoroso desideri che ogni filtro sia per i prompt che l'utente fornisce al modello.

    2. Per configurare i filtri per i prompt attaccati, seleziona Abilita il filtro Prompt Attacks. Configura con quale rigore desideri che il filtro rilevi e blocchi gli attacchi di jailbreak e prompt injection.

    3. Seleziona Crea per creare il guardrail o seleziona Usa filtri avanzati per personalizzare le impostazioni del filtro.

  6. (Facoltativo) Nella pagina Aggiungi argomenti negati, puoi aggiungere argomenti negati o selezionare Vai alla revisione e alla creazione.

    1. Per definire un argomento da bloccare, seleziona Aggiungi argomento negato. Quindi, esegui queste operazioni:

      1. Immetti un nome per l'argomento.

      2. Nella casella Definizione per argomento, definisci l'argomento. Per linee guida su come definire un argomento negato, consultaBlocca gli argomenti negati per rimuovere i contenuti dannosi.

      3. (Facoltativo) Per aggiungere richieste di input rappresentative o risposte modello relative a questo argomento, seleziona la freccia destra accanto a Aggiungi frasi di esempio. Immettete una frase nella casella. Per aggiungere un'altra frase, seleziona Aggiungi frase.

      4. Quando hai finito di configurare l'argomento negato, seleziona Conferma.

    2. È possibile eseguire le seguenti azioni con gli argomenti Negati.

      • Per aggiungere un altro argomento, seleziona Aggiungi argomento negato.

      • Per modificare un argomento, seleziona l'icona con i tre puntini nella stessa riga dell'argomento nella colonna Azioni. Quindi seleziona Modifica. Al termine della modifica, seleziona Conferma.

      • Per eliminare uno o più argomenti, seleziona le caselle di controllo relative agli argomenti da eliminare. Seleziona Elimina, quindi seleziona Elimina selezionato.

      • Per eliminare tutti gli argomenti, seleziona Elimina, quindi seleziona Elimina tutto.

      • Per configurare le dimensioni di ogni pagina della tabella o la visualizzazione delle colonne nella tabella, seleziona l'icona delle impostazioni ( Gear icon representing settings or configuration options. ). Imposta le tue preferenze, quindi seleziona Conferma.

    3. Al termine della configurazione degli argomenti negati, seleziona Avanti.

  7. (Facoltativo) Nella pagina Aggiungi filtri di parole, procedi come segue:

    1. Nella sezione Filtra parolacce, seleziona Filtra parolacce per bloccare le parolacce nei prompt e nelle risposte. L'elenco delle parolacce si basa su definizioni convenzionali e viene continuamente aggiornato.

    2. Nella sezione Aggiungi parole e frasi personalizzate, seleziona come aggiungere parole e frasi da bloccare nel guardrail. Se scegli di caricare un file, ogni riga del file deve contenere una parola o una frase composta da un massimo di tre parole. Non includere un'intestazione. Sono disponibili le seguenti opzioni:

      Opzione Istruzioni
      Aggiungi parole e frasi manualmente Aggiungi direttamente parole e frasi nella sezione Visualizza e modifica parole e frasi.
      Carica da un file locale Per caricare un file.txt o .csv contenente le parole e le frasi, seleziona Scegli file dopo aver selezionato questa opzione.
      Caricamento da un oggetto Amazon S3 Per caricare un file da Amazon S3, specifica l'oggetto S3 dopo aver selezionato questa opzione. Ogni riga del file deve contenere una parola o una frase composta da un massimo di tre parole.
    3. Puoi modificare le parole e le frasi che il guardrail deve bloccare nella sezione Visualizza e modifica parole e frasi. Sono disponibili le seguenti opzioni:

      • Se hai caricato un elenco di parole da un file locale o da un oggetto Amazon S3, questa sezione verrà compilata con il tuo elenco di parole. Per filtrare gli elementi con errori, seleziona Mostra errori.

      • Per aggiungere un elemento all'elenco di parole, seleziona Aggiungi parola o frase. Inserisci una parola o una frase composta da un massimo di tre parole nella casella e premi Invio o seleziona l'icona del segno di spunta per confermare l'elemento.

      • Per modificare un elemento, seleziona l'icona di modifica ( Edit icon represented by a pencil symbol. ) accanto all'elemento.

      • Per eliminare un elemento dall'elenco di parole, seleziona l'icona del cestino ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ) oppure, se stai modificando un elemento, seleziona l'icona di eliminazione ( Close or cancel icon represented by an "X" symbol. ) accanto all'elemento.

      • Per eliminare gli elementi che contengono errori, seleziona Elimina tutto, quindi seleziona Elimina tutte le righe con errore

      • Per eliminare tutti gli elementi, seleziona Elimina tutto, quindi seleziona Elimina tutte le righe

      • Per cercare un elemento, inserisci un'espressione nella barra di ricerca.

      • Per mostrare solo gli elementi con errori, seleziona il menu a discesa denominato Mostra tutto e seleziona Mostra solo errori.

      • Per configurare le dimensioni di ogni pagina della tabella o la visualizzazione delle colonne nella tabella, seleziona l'icona delle impostazioni () Gear icon representing settings or configuration options. . Imposta le tue preferenze, quindi seleziona Conferma.

      • Per impostazione predefinita, questa sezione mostra l'editor di tabelle. Per passare a un editor di testo in cui è possibile inserire una parola o una frase in ogni riga, seleziona Editor di testo. L'editor di testo offre le seguenti funzionalità:

        • È possibile copiare un elenco di parole da un altro editor di testo e incollarlo in questo editor.

        • Un'icona a forma di X rossa appare accanto agli elementi contenenti errori e un elenco di errori appare sotto l'editor.

    4. Seleziona Salta per rivedere e creare per creare il guardrail oppure seleziona Avanti per aggiungere filtri PII e modelli regex.

  8. (Facoltativo) Nella pagina Aggiungi filtri per informazioni sensibili, configura i filtri per bloccare o mascherare le informazioni sensibili. Per ulteriori informazioni, consulta Rimuovi PII dalle conversazioni utilizzando filtri per informazioni sensibili. Esegui questa operazione:

    1. Nella sezione PIItipi, configura le categorie di informazioni di identificazione personale (PII) da bloccare o mascherare. Sono disponibili le seguenti opzioni:

      • Per aggiungere un PII tipo, seleziona Aggiungi un PII tipo. Successivamente, esegui queste operazioni:

        1. Nella colonna Tipo, seleziona un PII tipo.

        2. Nella colonna Comportamento del guardrail, selezionate se il guardrail deve bloccare il contenuto contenente il PII tipo o mascherarlo con un identificatore.

      • Per aggiungere tutti i PII tipi, seleziona la freccia del menu a discesa accanto a Aggiungi un tipo. PII Quindi seleziona il comportamento del guardrail da applicare a loro.

        avvertimento

        Se specificate un comportamento, qualsiasi comportamento esistente che avete configurato per i PII tipi verrà sovrascritto.

      • Per eliminare un PII tipo, selezionate l'icona del cestino () Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. .

      • Per eliminare le righe che contengono errori, seleziona Elimina tutto, quindi seleziona Elimina tutte le righe con errore

      • Per eliminare tutti i PII tipi, seleziona Elimina tutto, quindi seleziona Elimina tutte le righe

      • Per cercare una riga, inserisci un'espressione nella barra di ricerca.

      • Per mostrare solo le righe con errori, seleziona il menu a discesa denominato Mostra tutto e seleziona Mostra solo errori.

      • Per configurare le dimensioni di ogni pagina della tabella o la visualizzazione delle colonne nella tabella, seleziona l'icona delle impostazioni () Gear icon representing settings or configuration options. . Imposta le tue preferenze, quindi seleziona Conferma.

    2. Nella sezione Regex patterns, usa le espressioni regolari per definire i pattern da filtrare nel guardrail. Sono disponibili le seguenti opzioni:

      • Per aggiungere un pattern, seleziona Aggiungi pattern regex. Configura i campi seguenti:

        Campo Descrizione
        Nome Un nome per il pattern
        Schema Regex Un'espressione regolare che definisce il modello
        Comportamento dei guardrail Scegliete se bloccare il contenuto contenente il pattern o mascherarlo con un identificatore. Per mascherare il pattern solo nei log, seleziona Nessuno.
        Aggiungi descrizione (Facoltativo) Scrivi una descrizione per il modello
      • Per modificare un motivo, seleziona l'icona a tre punti nella stessa riga dell'argomento nella colonna Azioni. Quindi seleziona Modifica. Al termine della modifica, seleziona Conferma.

      • Per eliminare uno o più motivi, seleziona le caselle di controllo relative ai motivi da eliminare. Seleziona Elimina, quindi seleziona Elimina selezionato.

      • Per eliminare tutti i pattern, seleziona Elimina, quindi seleziona Elimina tutto.

      • Per cercare un pattern, inserisci un'espressione nella barra di ricerca.

      • Per configurare le dimensioni di ogni pagina della tabella o la visualizzazione delle colonne nella tabella, selezionate l'icona delle impostazioni ( Gear icon representing settings or configuration options. ). Imposta le tue preferenze, quindi seleziona Conferma.

    3. Al termine della configurazione dei filtri per le informazioni sensibili, seleziona Avanti o Salta per rivedere e creare.

  9. Nella pagina Aggiungi controllo contestuale della base (opzionale), configura le soglie per bloccare le informazioni non fondate o irrilevanti.

    Nota

    Per ogni tipo di controllo, puoi spostare il cursore o inserire un valore di soglia compreso tra 0 e 0,99. Seleziona una soglia appropriata per i tuoi usi. Una soglia più alta richiede che le risposte siano fondate o pertinenti con un alto grado di confidenza per poter essere consentite. Le risposte al di sotto della soglia verranno filtrate. Per ulteriori informazioni sul controllo contestuale della messa a terra, consulta Controllo contestuale della messa a terra.

    1. Nel campo Grounding, seleziona Enable Grounding check per verificare se le risposte del modello sono basate sulla base.

    2. Nel campo Rilevanza, seleziona Abilita il controllo di pertinenza per verificare se le risposte del modello sono pertinenti.

    3. Seleziona Avanti.

  10. Rivedi e crea: rivedi le impostazioni del tuo guardrail.

    1. Seleziona Modifica in qualsiasi sezione a cui desideri apportare modifiche.

    2. Quando sei soddisfatto delle impostazioni del guardrail, seleziona Crea per creare il guardrail.

API

Per creare un guardrail, invia una richiesta. CreateGuardrail Il formato della richiesta è il seguente:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "contentPolicyConfig": { "filtersConfig": [ { "inputStrength": "NONE | LOW | MEDIUM | HIGH", "outputStrength": "NONE | LOW | MEDIUM | HIGH", "type": "SEXUAL | VIOLENCE | HATE | INSULTS | MISCONDUCT | PROMPT_ATTACK" } ] }, "wordPolicyConfig": { "wordsConfig": [ { "text": "string" } ], "managedWordListsConfig": [ { "type": "string" } ] }, "sensitiveInformationPolicyConfig": { "piiEntitiesConfig": [ { "type": "string", "action": "string" } ], "regexesConfig": [ { "name": "string", "description": "string", "regex": "string", "action": "string" } ] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [ { "key": "string", "value": "string" } ], "topicPolicyConfig": { "topicsConfig": [ { "definition": "string", "examples": [ "string" ], "name": "string", "type": "DENY" } ] } }
  • Specificare una name e description per il guardrail.

  • Specificate i messaggi che indicano quando il guardrail blocca correttamente un prompt o una risposta del modello nei campi and. blockedInputMessaging blockedOutputsMessaging

  • Specificate gli argomenti che il guardrail deve negare nell'oggetto. topicPolicy Ogni elemento dell'topicselenco riguarda un argomento. Per ulteriori informazioni sui campi di un argomento, vedere Argomento.

    • Dai un name e description in modo che il guardrail possa identificare correttamente l'argomento.

    • Specificare DENY nel action campo.

    • (Facoltativo) Fornisci fino a cinque esempi da classificare come appartenenti all'argomento nell'exampleselenco.

  • Specificate i livelli di filtraggio per le categorie dannose definite in Amazon Bedrock nell'contentPolicyoggetto. Ogni elemento dell'filterselenco appartiene a una categoria dannosa. Per ulteriori informazioni, consulta Blocca parole e conversazioni dannose con filtri di contenuto. Per ulteriori informazioni sui campi di un filtro di contenuti, consulta ContentFilter.

    • Specificare la categoria nel type campo.

    • Specificate l'intensità del filtro per i prompt nel strength campo del textToTextFiltersForPrompt campo e per le risposte del modello nel strength campo di. textToTextFiltersForResponse

  • (Facoltativo) Attacca qualsiasi tag al guardrail. Per ulteriori informazioni, consulta Etichettare le risorse di Amazon Bedrock.

  • (Facoltativo) Per motivi di sicurezza, ARN includi una KMS chiave nel kmsKeyId campo.

Il formato di risposta è il seguente:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }