Prova un guardrail - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Prova un guardrail

Dopo aver creato un guardrail, è disponibile una versione di working draft (DRAFT). La bozza di lavoro è una versione del guardrail che potete modificare e iterare continuamente fino a raggiungere una configurazione soddisfacente per il vostro caso d'uso. Puoi testare la bozza di lavoro o altre versioni del guardrail per vedere se le configurazioni sono appropriate per il tuo caso d'uso. Modifica le configurazioni nella bozza di lavoro e prova diversi prompt per vedere quanto bene il guardrail valuta e intercetta i prompt o le risposte.

Quando siete soddisfatti della configurazione, potete creare una versione del guardrail, che funge da istantanea delle configurazioni della bozza di lavoro al momento della creazione della versione. È possibile utilizzare le versioni per semplificare l'installazione dei guardrail nelle applicazioni di produzione ogni volta che si apportano modifiche ai guardrail. Eventuali modifiche alla bozza di lavoro o alla nuova versione creata non si rifletteranno nell'applicazione di intelligenza artificiale generativa finché non utilizzerete specificamente la nuova versione nell'applicazione.

Console
Per testare un guardrail per vedere se blocca i contenuti dannosi
  1. Accedi al AWS Management Console utilizzando un IAMruolo con autorizzazioni Amazon Bedrock e apri la console Amazon Bedrock all'indirizzo. https://console.aws.amazon.com/bedrock/

  2. Scegli Guardrails dal pannello di navigazione a sinistra. Quindi, seleziona un guardrail nella sezione Guardrails.

  3. Sulla destra viene visualizzata una finestra di prova. Nella finestra di test sono disponibili le seguenti opzioni:

    1. Per impostazione predefinita, la bozza di lavoro del guardrail viene utilizzata nella finestra di test. Per testare una versione diversa del guardrail, scegliete Working draft nella parte superiore della finestra di test, quindi selezionate la versione.

    2. Per selezionare un modello, scegliete Seleziona modello. Dopo aver effettuato una scelta, selezionate Applica. Per modificare il modello, scegliete Cambia.

    3. Immettete una richiesta nella casella Richiesta.

    4. Per ottenere una risposta del modello, selezionate Esegui.

    5. Il modello restituisce una risposta nella casella Risposta finale (che può essere modificata dal guardrail). Se il guardrail blocca o filtra il prompt o la risposta del modello, sotto Guardrail check viene visualizzato un messaggio che indica quante violazioni ha rilevato il guardrail.

    6. Per visualizzare gli argomenti o le categorie dannose nel prompt o nella risposta che sono stati riconosciuti e consentiti oltre il filtro o bloccati da esso, seleziona Visualizza traccia.

    7. Utilizza le schede Prompt e Model response per visualizzare gli argomenti o le categorie dannose che sono stati filtrati o bloccati dal guardrail.

Puoi anche testare il guardrail nel parco giochi Text. Seleziona il parco giochi e seleziona Guardrail nel riquadro Configurazioni prima di testare le istruzioni.

API

Per utilizzare un guardrail nell'invocazione del modello, invia una richiesta or. InvokeModelInvokeModelWithResponseStream In alternativa, se stai creando un'applicazione conversazionale, puoi usare Converse. API

Formato della richiesta

Gli endpoint di richiesta per richiamare un modello, con e senza streaming, sono i seguenti. Replace (Sostituisci) modelId con l'ID del modello da utilizzare.

  • InvokeModel— POST /model/modelId/invoke /1.1 HTTP

  • InvokeModelWithResponseStream— POST /modello/modelId//1.1 invoke-with-response-stream HTTP

L'intestazione per entrambe API le operazioni ha il seguente formato.

Accept: accept Content-Type: contentType X-Amzn-Bedrock-Trace: trace X-Amzn-Bedrock-GuardrailIdentifier: guardrailIdentifier X-Amzn-Bedrock-GuardrailVersion: guardrailVersion

I parametri sono descritti di seguito.

  • AcceptImposta sul MIME tipo di corpo di inferenza nella risposta. Il valore predefinito è application/json.

  • Content-TypeImposta sul MIME tipo di dati di input nella richiesta. Il valore predefinito è application/json.

  • Impostato X-Amzn-Bedrock-Trace per ENABLED abilitare una traccia per vedere, tra le altre cose, quali contenuti sono stati bloccati dai guardrail e perché.

  • Imposta X-Amzn-Bedrock-GuardrailIdentifier con l'identificatore del guardrail che desideri applicare alla richiesta alla richiesta e modella la risposta.

  • Imposta X-Amzn-Bedrock-GuardrailVersion con la versione del guardrail che desideri applicare alla richiesta e al modello di risposta.

Il formato generale del corpo della richiesta è mostrato nell'esempio seguente. La tagSuffix proprietà viene utilizzata solo con i tag di input. È inoltre possibile configurare il guardrail sullo streaming in modo sincrono o asincrono utilizzando. streamProcessingMode Funziona solo con. InvokeModelWithResponseStream

{ <see model details>, "amazon-bedrock-guardrailConfig": { "tagSuffix": "string", "streamProcessingMode": "SYNCHRONOUS" | "ASYNCHRONOUS" } }
avvertimento

Riceverai un errore nelle seguenti situazioni

  • Si abilita il guardrail ma non è presente alcun amazon-bedrock-guardrailConfig campo nel corpo della richiesta.

  • Si disabilita il guardrail ma si specifica un amazon-bedrock-guardrailConfig campo nel corpo della richiesta.

  • Si abilita il guardrail ma non lo contentType è. application/json

Per visualizzare il corpo della richiesta per diversi modelli, vedereParametri di inferenza per modelli di fondazione.

Nota

In Cohere Command modelli, puoi specificare solo una generazione nel num_generations campo se usi un guardrail.

Se abilitate un guardrail e la relativa traccia, il formato generale della risposta per richiamare un modello, con e senza streaming, è il seguente. Per vedere il formato del resto di body per ogni modello, vedi. Parametri di inferenza per modelli di fondazione Il contentType corrisponde a quanto specificato nella richiesta.

  • InvokeModel

    HTTP/1.1 200 Content-Type: contentType { <see model details for model-specific fields>, "completion": "<model response>", "amazon-bedrock-guardrailAction": "INTERVENED | NONE", "amazon-bedrock-trace": { "guardrail": { "modelOutput": [ "<see model details for model-specific fields>" ], "input": { "<sample-guardrailId>": { "topicPolicy": { "topics": [ { "name": "string", "type": "string", "action": "string" } ] }, "contentPolicy": { "filters": [ { "type": "string", "confidence": "string", "action": "string" } ] }, "wordPolicy": { "customWords": [ { "match": "string", "action": "string" } ], "managedWordLists": [ { "match": "string", "type": "string", "action": "string" } ] }, "sensitiveInformationPolicy": { "piiEntities": [ { "type": "string", "match": "string", "action": "string" } ], "regexes": [ { "name": "string", "regex": "string", "match": "string", "action": "string" } ] } } }, "outputs": ["<same guardrail trace format as input>"] } } }
  • InvokeModelWithResponseStream— Ogni risposta restituisce un testo chunk il cui testo è nel bytes campo, insieme alle eventuali eccezioni che si verificano. La traccia del guardrail viene restituita solo per l'ultimo blocco.

    HTTP/1.1 200 X-Amzn-Bedrock-Content-Type: contentType Content-type: application/json { "chunk": { "bytes": "<blob>" }, "internalServerException": {}, "modelStreamErrorException": {}, "throttlingException": {}, "validationException": {}, "amazon-bedrock-guardrailAction": "INTERVENED | NONE", "amazon-bedrock-trace": { "guardrail": { "modelOutput": ["<see model details for model-specific fields>"], "input": { "<sample-guardrailId>": { "topicPolicy": { "topics": [ { "name": "string", "type": "string", "action": "string" } ] }, "contentPolicy": { "filters": [ { "type": "string", "confidence": "string", "action": "string" } ] }, "wordPolicy": { "customWords": [ { "match": "string", "action": "string" } ], "managedWordLists": [ { "match": "string", "type": "string", "action": "string" } ] }, "sensitiveInformationPolicy": { "piiEntities": [ { "type": "string", "match": "string", "action": "string" } ], "regexes": [ { "name": "string", "regex": "string", "match": "string", "action": "string" } ] } } }, "outputs": ["<same guardrail trace format as input>"] } } }

La risposta restituisce i seguenti campi se si abilita un guardrail.

  • amazon-bedrock-guardrailAction— Speciifica se il guardrail INTERVENED o meno (). NONE

  • amazon-bedrock-trace— Viene visualizzato solo se si abilita la traccia. Contiene un elenco di tracce, ognuna delle quali fornisce informazioni sul contenuto bloccato dal guardrail. La traccia contiene i seguenti campi:

    • modelOutput— Un oggetto contenente gli output del modello che è stato bloccato.

    • input— Contiene i seguenti dettagli sulla valutazione del prompt da parte del guardrail:

      • topicPolicy— Contiene topics un elenco di valutazioni per ogni argomento che è stata violata. Ogni argomento include i seguenti campi:

        • name— Il nome della politica dell'argomento.

        • type— Speciifica se negare l'argomento.

        • action— Speciifica che l'argomento è stato bloccato

      • contentPolicy— Contiene filters un elenco di valutazioni per ogni filtro di contenuto che è stato violato. Ogni filtro include i seguenti campi:

        • type— La categoria del filtro dei contenuti.

        • confidence— Il livello di fiducia che l'output possa essere classificato come appartenente alla categoria dannosa.

        • action— specifica che il contenuto è stato bloccato. Questo risultato dipende dalla resistenza del filtro impostato nel guardrail.

      • wordPolicy— Contiene una raccolta di parole personalizzate e le parole gestite sono state filtrate e una valutazione corrispondente su tali parole. Ogni elenco contiene i seguenti campi:

        • customWords— Un elenco di parole personalizzate che corrispondono al filtro.

          • match— La parola o la frase che corrisponde al filtro.

          • action— specifica che la parola è stata bloccata.

        • managedWordLists— Un elenco di parole gestite che corrispondono al filtro.

          • match— La parola o la frase che corrisponde al filtro.

          • type— specifica il tipo di parola gestita che corrisponde al filtro. Ad esempio, PROFANITY se corrisponde al filtro contro le parolacce.

          • action— Indica che la parola è stata bloccata.

      • sensitiveInformationPolicy— Contiene i seguenti oggetti, che contengono valutazioni per le informazioni di identificazione personale (PII) e i filtri regex che sono stati violati:

        • piiEntities— Un elenco di valutazioni per ogni PII filtro violato. Ogni filtro contiene i seguenti campi:

          • type— Il PII tipo che è stato trovato.

          • match— La parola o la frase che corrisponde al filtro.

          • action— specifica se la parola è stata BLOCKED o sostituita con un identificatore (). ANONYMIZED

        • regexes— Un elenco di valutazioni per ogni filtro regex violato. Ogni filtro contiene i seguenti campi:

          • name— Il nome del filtro regex.

          • regex— Il PII tipo che è stato trovato.

          • match— La parola o la frase che corrisponde al filtro.

          • action— specifica se la parola è stata BLOCKED o sostituita con un identificatore (). ANONYMIZED

    • outputs— Un elenco di dettagli sulla valutazione della risposta del modello da parte del guardrail. Ogni elemento dell'elenco è un oggetto che corrisponde al formato dell'inputoggetto. Per maggiori dettagli, consulta il input campo.