Utilizzo dell'API Bedrock Data Automation

Modalità Focus

Utilizzo dell'API Bedrock Data Automation - Amazon Bedrock

Crea un progetto di automazione dei dati Richiama Data Automation Async Ottieni lo stato di automazione dei dati Risposta di uscita asincrona

La funzionalità Amazon Bedrock Data Automation (BDA) fornisce un flusso di lavoro API semplificato per l'elaborazione dei dati. Per tutte le modalità, questo flusso di lavoro consiste in tre fasi principali: creazione di un progetto, richiamo dell'analisi e recupero dei risultati. Per recuperare l'output personalizzato per i dati elaborati, fornisci l'ARN Blueprint quando richiami l'operazione di analisi.

Crea un progetto di automazione dei dati

Per iniziare a elaborare i file con BDA, devi prima creare un progetto di automazione dei dati. Ciò può essere fatto in due modi, con l' CreateDataAutomationProject operazione o la Amazon Bedrock console Amazon.

Utilizzo dell'API

Quando si utilizza l'API per creare un progetto, si invoca il CreateDataAutomationProject. Quando si crea un progetto, è necessario definire le impostazioni di configurazione per il tipo di file che si tende a elaborare (la modalità che si intende utilizzare). Ecco un esempio di come è possibile configurare l'output standard per le immagini:


{
"standardOutputConfiguration": {
"image": {
"state": "ENABLED",
"extraction": {
"category": {
"state": "ENABLED",
"types": ["CONTENT_MODERATION", "TEXT_DETECTION"]
},
"boundingBox": {
"state": "ENABLED"
}
},
"generativeField": {
"state": "ENABLED",
"types": ["IMAGE_SUMMARY", "IAB"]
}
}
}
}

L'API convalida la configurazione di input. Crea un nuovo progetto con un ARN unico. Le impostazioni del progetto vengono memorizzate per utilizzi futuri. Se un progetto viene creato senza parametri, verranno applicate le impostazioni predefinite. Ad esempio, durante l'elaborazione delle immagini, il riepilogo delle immagini e il rilevamento del testo saranno abilitati per impostazione predefinita.

C'è un limite al numero di progetti che possono essere creati per AWS account. Alcune combinazioni di impostazioni potrebbero non essere consentite o potrebbero richiedere autorizzazioni aggiuntive.

Richiama Data Automation Async

Hai un progetto configurato, puoi iniziare a elaborare le immagini usando l'operazione. InvokeDataAutomationAsync Se si utilizza un output personalizzato, è possibile inviare solo un singolo blueprint ARN per richiesta.

Questa chiamata API avvia l'elaborazione asincrona dei file in un bucket S3 specificato. L'API accetta l'ARN del progetto e la posizione dei file da elaborare, quindi avvia il processo di elaborazione asincrono. Viene restituito un ID di lavoro per tracciare il processo. Verranno generati errori se il progetto non esiste, se il chiamante dispone delle autorizzazioni necessarie o se i file di input non sono in un formato supportato.

Di seguito è riportata la struttura della richiesta JSON:


{
   "InputConfiguration" : { "s3Uri": "string"}, // required
  "DataAutomationConfiguration" : {
    "DataAutomationARN": "",
    "stage": LIVE | DEV
  }, // optional 
  "BlueprintArn": [], // optional
  "OutputConfiguration" : { 
    "s3Uri": "string"
  }, // required
  "EncryptionConfiguration": { // optional
    "KmsKeyId": "string",
    "KmsEncryptionContext": { "key" : "string" },
  },
  "NotificationConfiguration": { // optional
    "EventBridgeConfiguration": {"EventBridgeEnabled" : Boolean },
  } 
   "ClientToken": "string",
   "JobTags": { "string" : "string" }
}

Ottieni lo stato di automazione dei dati

Per controllare lo stato del processo di elaborazione e recuperare i risultati, usa GetDataAutomationStatus.

L' GetDataAutomationStatus API consente di monitorare lo stato di avanzamento del lavoro e di accedere ai risultati una volta completata l'elaborazione. L'API accetta l'ID del lavoro restituito da InvokeDataAutomationAsync. Controlla lo stato attuale del lavoro e restituisce le informazioni pertinenti. Una volta completato il lavoro, fornisce l'ubicazione dei risultati in S3.

Se il lavoro è ancora in corso, restituisce lo stato corrente (ad esempio, «RUNNING», «QUEUED»). Se il lavoro è completo, restituisce «COMPLETATO» insieme alla posizione S3 dei risultati. Se c'è stato un errore, restituisce «FAILED» con i dettagli dell'errore.

Di seguito è riportato il formato della richiesta JSON:


{
   "InvocationArn": "string" // Arn
}

Risposta di uscita asincrona

I risultati dell'elaborazione dei file vengono archiviati nel bucket S3 configurato per le immagini di input. L'output include strutture uniche che dipendono sia dalla modalità del file che dai tipi di operazioni specificati nella chiamata a. InvokeDataAutomationAsync

Per informazioni sulle uscite standard per una determinata modalità, vedere. Output standard in Bedrock Data Automation

Ad esempio, per le immagini può includere informazioni su quanto segue:

Riepilogo dell'immagine: un riepilogo o una didascalia descrittiva dell'immagine.
Classificazione IAB: categorizzazione basata sulla tassonomia IAB.
Rilevamento del testo dell'immagine: testo estratto con informazioni sul riquadro di delimitazione.
Moderazione dei contenuti: rileva contenuti inappropriati, indesiderati o offensivi in un'immagine.

Di seguito è riportato un frammento di esempio dell'output per l'elaborazione delle immagini:


{
"metadata": {
  "id": "image_123",
  "semantic_modality": "IMAGE",
  "s3_bucket": "my-s3-bucket",
  "s3_prefix": "images/",
  "image_width_pixels": 1920,
  "image_height_pixels": 1080
},
  "image": {
    "summary": "A lively party scene with colorful decorations and supplies",
    "iab_categories": [
  {
      "category": "Party Supplies",
      "confidence": 0.9,
      "parent_name": "Events & Attractions"
  }
],
 "content_moderation": [
  {
    "category": "Drugs & Tobacco Paraphernalia & Use",
    "confidence": 0.7
  }
],
  "text_words": [
        {
            "id": "word_1",
            "text": "lively",
            "confidence": 0.9,
            "line_id": "line_1",
            "locations": [
                {
                    "bounding_box": {
                        "left": 100,
                        "top": 200,
                        "width": 50,
                        "height": 20
                    },
                    "polygon": [
                        {"x": 100, "y": 200},
                        {"x": 150, "y": 200},
                        {"x": 150, "y": 220},
                        {"x": 100, "y": 220}
                    ]
                }
             ]
           }
         ],  
  }
}

Questo output strutturato consente una facile integrazione con le applicazioni a valle e ulteriori analisi.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Utilizzo della console di automazione dei dati Bedrock

Inferenze e risorse di etichettatura in Bedrock Data Automation

In questa pagina

Seleziona le tue preferenze relative ai cookie

Personalizza le tue preferenze relative ai cookie

Essenziali

Prestazione

Funzionali

Pubblicitari

Impossibile salvare le preferenze dei cookie

Utilizzo dell'API Bedrock Data Automation

Crea un progetto di automazione dei dati

Utilizzo dell'API

Richiama Data Automation Async

Ottieni lo stato di automazione dei dati

Risposta di uscita asincrona

In questa pagina

Related resources

Questa pagina ti è stata utile?

Related resources

Argomento successivo:

Argomento precedente:

Hai bisogno di aiuto?