Prova un guardrail

Dopo aver creato un guardrail, è disponibile una versione di working draft (DRAFT). La bozza di lavoro è una versione del guardrail che potete modificare e iterare continuamente fino a raggiungere una configurazione soddisfacente per il vostro caso d'uso. È possibile testare e confrontare la bozza di lavoro o altre versioni del guardrail per garantire che le configurazioni soddisfino i requisiti del caso d'uso. Modifica le configurazioni nella bozza di lavoro e prova diversi prompt per vedere quanto bene il guardrail valuta e intercetta i prompt o le risposte.

Quando siete soddisfatti della configurazione, potete creare una versione del guardrail, che funge da istantanea delle configurazioni della bozza di lavoro al momento della creazione della versione. È possibile utilizzare le versioni per semplificare l'installazione dei guardrail nelle applicazioni di produzione ogni volta che si apportano modifiche ai guardrail. Eventuali modifiche alla bozza di lavoro o alla nuova versione creata non si rifletteranno nell'applicazione di intelligenza artificiale generativa finché non utilizzerete specificamente la nuova versione nell'applicazione.

Console

Per testare un guardrail per vedere se blocca i contenuti dannosi

Accedi all' AWS Management Console utilizzo di un ruolo IAM con autorizzazioni Amazon Bedrock e apri la console Amazon Bedrock all'indirizzo. https://console.aws.amazon.com/bedrock/
Scegli Guardrails dal riquadro di navigazione a sinistra. Quindi, seleziona un guardrail nella sezione Guardrails.
Sulla destra viene visualizzata una finestra di prova. Nella finestra di test sono disponibili le seguenti opzioni:
1. Per impostazione predefinita, la bozza di lavoro del guardrail viene utilizzata nella finestra di test. Per testare una versione diversa del guardrail, scegliete Working draft nella parte superiore della finestra di test, quindi selezionate la versione.
2. Per selezionare un modello, scegliete Seleziona modello. Dopo aver effettuato una scelta, selezionate Applica. Per modificare il modello, scegliete Cambia.
3. Immettete una richiesta nella casella Richiesta.
4. Per ottenere una risposta del modello, selezionate Esegui.
5. Il modello restituisce una risposta nella casella Risposta finale (che può essere modificata dal guardrail). Se il guardrail blocca o filtra il prompt o la risposta del modello, sotto Guardrail check viene visualizzato un messaggio che indica quante violazioni ha rilevato il guardrail.
6. Per visualizzare gli argomenti o le categorie dannose nel prompt o nella risposta che sono stati riconosciuti e consentiti oltre il filtro o bloccati da esso, seleziona Visualizza traccia.
7. Utilizza le schede Prompt e Model response per visualizzare gli argomenti o le categorie dannose che sono stati filtrati o bloccati dal guardrail.

Puoi anche testare il guardrail nel parco giochi Text. Seleziona il parco giochi e seleziona Guardrail nel riquadro Configurazioni prima di testare le istruzioni.

API

Per utilizzare un guardrail nell'invocazione del modello, invia una richiesta or. InvokeModel InvokeModelWithResponseStream In alternativa, se state creando un'applicazione conversazionale, potete usare il Converse API.

Formato della richiesta

Gli endpoint di richiesta per richiamare un modello, con e senza streaming, sono i seguenti. Sostituisci modelId con l'ID del modello da utilizzare.

InvokeModel— POST /model/ /invoke modelId HTTP/1.1
InvokeModelWithResponseStream— modelId POST/modello/ invoke-with-response-stream HTTP/1.1

L'intestazione per entrambe le operazioni API ha il seguente formato.


Accept: accept
Content-Type: contentType
X-Amzn-Bedrock-Trace: trace
X-Amzn-Bedrock-GuardrailIdentifier: guardrailIdentifier
X-Amzn-Bedrock-GuardrailVersion: guardrailVersion

I parametri sono descritti di seguito.

AcceptImposta sul tipo MIME del corpo di inferenza nella risposta. Il valore predefinito è application/json.
Content-TypeImposta sul tipo MIME dei dati di input nella richiesta. Il valore predefinito è application/json.
Impostato X-Amzn-Bedrock-Trace per ENABLED abilitare una traccia per vedere, tra le altre cose, quali contenuti sono stati bloccati dai guardrail e perché.
Imposta X-Amzn-Bedrock-GuardrailIdentifier con l'identificatore del guardrail che desideri applicare alla richiesta alla richiesta e modella la risposta.
Imposta X-Amzn-Bedrock-GuardrailVersion con la versione del guardrail che desideri applicare alla richiesta e al modello di risposta.

Il formato generale del corpo della richiesta è mostrato nell'esempio seguente. La tagSuffix proprietà viene utilizzata solo con i tag di input. È inoltre possibile configurare il guardrail sullo streaming in modo sincrono o asincrono utilizzando. streamProcessingMode Funziona solo con. InvokeModelWithResponseStream


{
    <see model details>,
    "amazon-bedrock-guardrailConfig": {
        "tagSuffix": "string", 
        "streamProcessingMode": "SYNCHRONOUS" | "ASYNCHRONOUS"
    }
}

avvertimento

Riceverai un errore nelle seguenti situazioni

Si abilita il guardrail ma non è presente alcun amazon-bedrock-guardrailConfig campo nel corpo della richiesta.
Si disabilita il guardrail ma si specifica un amazon-bedrock-guardrailConfig campo nel corpo della richiesta.
Si abilita il guardrail ma non lo contentType è. application/json

Per visualizzare il corpo della richiesta per diversi modelli, vedereParametri della richiesta di inferenza e campi di risposta per i modelli di base.

Nota

In Cohere Command modelli, puoi specificare solo una generazione nel num_generations campo se usi un guardrail.

Se abilitate un guardrail e la relativa traccia, il formato generale della risposta per richiamare un modello, con e senza streaming, è il seguente. Per vedere il formato del resto di body per ogni modello, vedi. Parametri della richiesta di inferenza e campi di risposta per i modelli di base contentTypeCorrisponde a quanto specificato nella richiesta.

InvokeModel


HTTP/1.1 200
Content-Type: contentType

{
    <see model details for model-specific fields>,
    "completion": "<model response>",
    "amazon-bedrock-guardrailAction": "INTERVENED | NONE",
    "amazon-bedrock-trace": {
        "guardrail": {
            "modelOutput": [
                "<see model details for model-specific fields>"
            ],
            "input": {
                "sample-guardrailId": {
                    "topicPolicy": {
                        "topics": [
                            {
                                "name": "string",
                                "type": "string",
                                "action": "string"
                            }
                        ]
                    },
                    "contentPolicy": {
                        "filters": [
                            {
                                "type": "string",
                                "confidence": "string",
                                "filterStrength": "string",
                                "action": "string"
                            }
                        ]
                    },
                    "wordPolicy": {
                        "customWords": [
                            {
                                "match": "string",
                                "action": "string"
                            }
                        ],
                        "managedWordLists": [
                            {
                                "match": "string",
                                "type": "string",
                                "action": "string"
                            }
                        ]
                    },
                    "sensitiveInformationPolicy": {
                        "piiEntities": [
                            {
                                "type": "string",
                                "match": "string",
                                "action": "string"
                            }
                        ],
                        "regexes": [
                            {
                                "name": "string",
                                "regex": "string",
                                "match": "string",
                                "action": "string"
                            }
                        ]
                    },
                    "invocationMetrics": {
                        "guardrailProcessingLatency": "integer",
                        "usage": {
                            "topicPolicyUnits": "integer",
                            "contentPolicyUnits": "integer",
                            "wordPolicyUnits": "integer",
                            "sensitiveInformationPolicyUnits": "integer",
                            "sensitiveInformationPolicyFreeUnits": "integer",
                            "contextualGroundingPolicyUnits": "integer"
                        },
                        "guardrailCoverage": {
                            "textCharacters": {
                            "guarded": "integer",
                            "total": "integer"
                            }
                        }
                    }
                }
            },
            "outputs": ["same guardrail trace format as input"]
        }
    }
}

InvokeModelWithResponseStream— Ogni risposta restituisce un testo chunk il cui testo è nel bytes campo, insieme alle eventuali eccezioni che si verificano. La traccia del guardrail viene restituita solo per l'ultimo blocco.


HTTP/1.1 200
X-Amzn-Bedrock-Content-Type: contentType
Content-type: application/json

{
    "chunk": { 
      "bytes": "<blob>"
    },
  "internalServerException": {},
  "modelStreamErrorException": {},
  "throttlingException": {},
  "validationException": {},
  "amazon-bedrock-guardrailAction": "INTERVENED | NONE",
  "amazon-bedrock-trace": {
    "guardrail": {
      "modelOutput": ["<see model details for model-specific fields>"],
      "input": {
        "sample-guardrailId": {
          "topicPolicy": {
            "topics": [
              {
                "name": "string",
                "type": "string",
                "action": "string"
              }
            ]
          },
          "contentPolicy": {
            "filters": [
              {
                "type": "string",
                "confidence": "string",
                "filterStrength": "string",
                "action": "string"
              }
            ]
          },
          "wordPolicy": {
            "customWords": [
              {
                "match": "string",
                "action": "string"
              }
            ],
            "managedWordLists": [
              {
                "match": "string",
                "type": "string",
                "action": "string"
              }
            ]
          },
          "sensitiveInformationPolicy": {
            "piiEntities": [
              {
                "type": "string",
                "match": "string",
                "action": "string"
              }
            ],
            "regexes": [
              {
                "name": "string",
                "regex": "string",
                "match": "string",
                "action": "string"
              }
            ]
          },
          "invocationMetrics": {
            "guardrailProcessingLatency": "integer",
            "usage": {
              "topicPolicyUnits": "integer",
              "contentPolicyUnits": "integer",
              "wordPolicyUnits": "integer",
              "sensitiveInformationPolicyUnits": "integer",
              "sensitiveInformationPolicyFreeUnits": "integer",
              "contextualGroundingPolicyUnits": "integer"
            },
            "guardrailCoverage": {
              "textCharacters": {
                "guarded": "integer",
                "total": "integer"
              }
            }
          }
        }
      },
      "outputs": ["same guardrail trace format as input"]
    }
  }
}

La risposta restituisce i seguenti campi se si abilita un guardrail.

amazon-bedrock-guardrailAction— Speciifica se il guardrail INTERVENED o meno (). NONE
amazon-bedrock-trace— Viene visualizzato solo se si abilita la traccia. Contiene un elenco di tracce, ognuna delle quali fornisce informazioni sul contenuto bloccato dal guardrail. La traccia contiene i seguenti campi:
- modelOutput— Un oggetto contenente gli output del modello che è stato bloccato.
- input— Contiene i seguenti dettagli sulla valutazione del prompt da parte del guardrail:
  - topicPolicy— Contiene topics un elenco di valutazioni per ogni argomento che è stata violata. Ogni argomento include i seguenti campi:
    
    name— Il nome della politica dell'argomento.
    
    type— Speciifica se negare l'argomento.
    
    action— specifica che l'argomento è stato bloccato
  - contentPolicy— Contiene filters un elenco di valutazioni per ogni filtro di contenuto che è stato violato. Ogni filtro include i seguenti campi:
    
    type— La categoria del filtro dei contenuti.
    
    confidence— Il livello di fiducia che l'output possa essere classificato come appartenente alla categoria dannosa.
    
    action— specifica che il contenuto è stato bloccato. Questo risultato dipende dalla resistenza del filtro impostato nel guardrail.
  - wordPolicy— Contiene una raccolta di parole personalizzate e le parole gestite sono state filtrate e una valutazione corrispondente su tali parole. Ogni elenco contiene i seguenti campi:
    
    customWords— Un elenco di parole personalizzate che corrispondono al filtro.
    
    match— La parola o la frase che corrisponde al filtro.
    
    action— specifica che la parola è stata bloccata.
    
    managedWordLists— Un elenco di parole gestite che corrispondono al filtro.
    
    match— La parola o la frase che corrisponde al filtro.
    
    type— specifica il tipo di parola gestita che corrisponde al filtro. Ad esempio, PROFANITY se corrisponde al filtro contro le parolacce.
    
    action— Indica che la parola è stata bloccata.
  - sensitiveInformationPolicy— Contiene i seguenti oggetti, che contengono valutazioni per le informazioni di identificazione personale (PII) e i filtri regex che sono stati violati:
    
    piiEntities— Un elenco di valutazioni per ogni filtro PII violato. Ogni filtro contiene i seguenti campi:
    
    type— Il tipo di PII trovato.
    
    match— La parola o la frase che corrisponde al filtro.
    
    action— specifica se la parola è stata BLOCKED o sostituita con un identificatore (). ANONYMIZED
    
    regexes— Un elenco di valutazioni per ogni filtro regex violato. Ogni filtro contiene i seguenti campi:
    
    name— Il nome del filtro regex.
    
    regex— Il tipo di PII trovato.
    
    match— La parola o la frase che corrisponde al filtro.
    
    action— specifica se la parola è stata BLOCKED o sostituita con un identificatore (). ANONYMIZED
- outputs— Un elenco di dettagli sulla valutazione della risposta del modello da parte del guardrail. Ogni elemento dell'elenco è un oggetto che corrisponde al formato dell'inputoggetto. Per maggiori dettagli, consulta il input campo.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Autorizzazioni per Amazon Bedrock Guardrails

Visualizza le informazioni sui tuoi guardrail