Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
La funzionalità Amazon Bedrock Data Automation (BDA) fornisce un flusso di lavoro API semplificato per l'elaborazione dei dati. Per tutte le modalità, questo flusso di lavoro consiste in tre fasi principali: creazione di un progetto, richiamo dell'analisi e recupero dei risultati. Per recuperare l'output personalizzato per i dati elaborati, fornisci l'ARN Blueprint quando richiami l'operazione di analisi.
Crea un progetto di automazione dei dati
Per iniziare a elaborare i file con BDA, devi prima creare un progetto di automazione dei dati. Ciò può essere fatto in due modi, con l' CreateDataAutomationProject operazione o la Amazon Bedrock console Amazon.
Utilizzo dell'API
Quando si utilizza l'API per creare un progetto, si invoca il CreateDataAutomationProject. Quando si crea un progetto, è necessario definire le impostazioni di configurazione per il tipo di file che si tende a elaborare (la modalità che si intende utilizzare). Ecco un esempio di come è possibile configurare l'output standard per le immagini:
{
"standardOutputConfiguration": {
"image": {
"state": "ENABLED",
"extraction": {
"category": {
"state": "ENABLED",
"types": ["CONTENT_MODERATION", "TEXT_DETECTION"]
},
"boundingBox": {
"state": "ENABLED"
}
},
"generativeField": {
"state": "ENABLED",
"types": ["IMAGE_SUMMARY", "IAB"]
}
}
}
}
L'API convalida la configurazione di input. Crea un nuovo progetto con un ARN unico. Le impostazioni del progetto vengono memorizzate per utilizzi futuri. Se un progetto viene creato senza parametri, verranno applicate le impostazioni predefinite. Ad esempio, durante l'elaborazione delle immagini, il riepilogo delle immagini e il rilevamento del testo saranno abilitati per impostazione predefinita.
C'è un limite al numero di progetti che possono essere creati per AWS account. Alcune combinazioni di impostazioni potrebbero non essere consentite o potrebbero richiedere autorizzazioni aggiuntive.
Richiama Data Automation Async
Hai un progetto configurato, puoi iniziare a elaborare le immagini usando l'operazione. InvokeDataAutomationAsync Se si utilizza un output personalizzato, è possibile inviare solo un singolo blueprint ARN per richiesta.
Questa chiamata API avvia l'elaborazione asincrona dei file in un bucket S3 specificato. L'API accetta l'ARN del progetto e la posizione dei file da elaborare, quindi avvia il processo di elaborazione asincrono. Viene restituito un ID di lavoro per tracciare il processo. Verranno generati errori se il progetto non esiste, se il chiamante dispone delle autorizzazioni necessarie o se i file di input non sono in un formato supportato.
Di seguito è riportata la struttura della richiesta JSON:
{
"InputConfiguration" : { "s3Uri": "string"}, // required
"DataAutomationConfiguration" : {
"DataAutomationARN": "",
"stage": LIVE | DEV
}, // optional
"BlueprintArn": [], // optional
"OutputConfiguration" : {
"s3Uri": "string"
}, // required
"EncryptionConfiguration": { // optional
"KmsKeyId": "string",
"KmsEncryptionContext": { "key" : "string" },
},
"NotificationConfiguration": { // optional
"EventBridgeConfiguration": {"EventBridgeEnabled" : Boolean },
}
"ClientToken": "string",
"JobTags": { "string" : "string" }
}
Ottieni lo stato di automazione dei dati
Per controllare lo stato del processo di elaborazione e recuperare i risultati, usa GetDataAutomationStatus.
L' GetDataAutomationStatus API consente di monitorare lo stato di avanzamento del lavoro e di accedere ai risultati una volta completata l'elaborazione. L'API accetta l'ID del lavoro restituito da InvokeDataAutomationAsync. Controlla lo stato attuale del lavoro e restituisce le informazioni pertinenti. Una volta completato il lavoro, fornisce l'ubicazione dei risultati in S3.
Se il lavoro è ancora in corso, restituisce lo stato corrente (ad esempio, «RUNNING», «QUEUED»). Se il lavoro è completo, restituisce «COMPLETATO» insieme alla posizione S3 dei risultati. Se c'è stato un errore, restituisce «FAILED» con i dettagli dell'errore.
Di seguito è riportato il formato della richiesta JSON:
{
"InvocationArn": "string" // Arn
}
Risposta di uscita asincrona
I risultati dell'elaborazione dei file vengono archiviati nel bucket S3 configurato per le immagini di input. L'output include strutture uniche che dipendono sia dalla modalità del file che dai tipi di operazioni specificati nella chiamata a. InvokeDataAutomationAsync
Per informazioni sulle uscite standard per una determinata modalità, vedere. Output standard in Bedrock Data Automation
Ad esempio, per le immagini può includere informazioni su quanto segue:
Riepilogo dell'immagine: un riepilogo o una didascalia descrittiva dell'immagine.
Classificazione IAB: categorizzazione basata sulla tassonomia IAB.
Rilevamento del testo dell'immagine: testo estratto con informazioni sul riquadro di delimitazione.
Moderazione dei contenuti: rileva contenuti inappropriati, indesiderati o offensivi in un'immagine.
Di seguito è riportato un frammento di esempio dell'output per l'elaborazione delle immagini:
{
"metadata": {
"id": "image_123",
"semantic_modality": "IMAGE",
"s3_bucket": "my-s3-bucket",
"s3_prefix": "images/",
"image_width_pixels": 1920,
"image_height_pixels": 1080
},
"image": {
"summary": "A lively party scene with colorful decorations and supplies",
"iab_categories": [
{
"category": "Party Supplies",
"confidence": 0.9,
"parent_name": "Events & Attractions"
}
],
"content_moderation": [
{
"category": "Drugs & Tobacco Paraphernalia & Use",
"confidence": 0.7
}
],
"text_words": [
{
"id": "word_1",
"text": "lively",
"confidence": 0.9,
"line_id": "line_1",
"locations": [
{
"bounding_box": {
"left": 100,
"top": 200,
"width": 50,
"height": 20
},
"polygon": [
{"x": 100, "y": 200},
{"x": 150, "y": 200},
{"x": 150, "y": 220},
{"x": 100, "y": 220}
]
}
]
}
],
}
}
Questo output strutturato consente una facile integrazione con le applicazioni a valle e ulteriori analisi.