Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Un modo per elaborare i file utilizzando Amazon Bedrock data automation (BDA) consiste nel creare un progetto. Un progetto è un raggruppamento di configurazioni di output standard e personalizzate. Gli output standard sono richiesti nei progetti, ma gli output personalizzati sono opzionali. Quando si chiama l'InvokeDataAutomationAsync
API con un ARN di progetto, il file viene elaborato automaticamente utilizzando le impostazioni di configurazione definite in quel progetto. L'output viene quindi generato in base alla configurazione del progetto.
A un progetto può essere assegnata una fase, LIVE
oppureDEVELOPMENT
. Ogni fase è una versione unica e mutevole del progetto. Ciò significa che puoi modificare o testare la DEVELOPMENT
fase ed elaborare le richieste dei clienti utilizzando la LIVE
fase.
Un progetto consente di utilizzare una singola risorsa per più tipi di file. Ad esempio, un file audio inviato a BDA utilizzando il nome di progetto ABC verrà elaborato utilizzando la configurazione di uscita audio standard del progetto ABC. Un documento inviato a BDA utilizzando il nome di progetto ABC verrà elaborato utilizzando la configurazione di output standard del documento del progetto ABC.
I progetti garantiscono una maggiore flessibilità nella configurazione degli output standard. Ogni output standard ha il proprio set di opzioni configurabili, come trascrizioni o riepiloghi, e i progetti consentono di modificare tali opzioni per adattarle meglio al proprio caso d'uso. Puoi anche configurare un progetto con Blueprints per documenti o immagini, per definire un output personalizzato. Un progetto configurato per generare un output personalizzato genererà automaticamente anche un output standard.
Le sezioni seguenti esamineranno alcuni esempi di utilizzo dei progetti.
Utilizzo di progetti con output standard
Consideriamo un caso d'uso in cui sei interessato solo a estrarre i riepiloghi delle trascrizioni dei tuoi file audio e video completi. Per impostazione predefinita, quando invii file audio e video a BDA, ricevi i riepiloghi delle trascrizioni insieme a trascrizioni complete, riepiloghi a livello di scena, testo rilevato e altre informazioni. In questo caso d'uso, non è consigliabile dedicare tempo e risorse aggiuntivi alla raccolta di informazioni non necessarie. In questo caso d'uso, è possibile configurare un progetto di output standard per abilitare solo la funzionalità di riepilogo per i file audio e video.
A tale scopo, utilizzando l'API o la console, create un progetto e modificate le impostazioni di output standard per audio e video. Per i video, abilita il riepilogo completo del video ma assicurati che le altre estrazioni (ad esempio, trascrizione audio completa, riepiloghi delle scene, moderazione dei contenuti, ecc.) siano disabilitate. Ripeti questa configurazione per l'audio. Dopo aver configurato il progetto per generare solo riepiloghi, salva il progetto e annota gli Amazon Resource Names (ARN) del progetto. Questo ARN può essere utilizzato per l'InvokeDataAutomationAsync
operazione di elaborazione dei file su larga scala. Passando un file audio o video al BDA e specificando l'ARN di questo progetto, riceverai in uscita solo i riepiloghi per ciascuno dei file. Nota, in questo esempio non è stata eseguita alcuna configurazione per documenti o immagini. Ciò significa che se si passa un'immagine o un documento a BDA utilizzando l'ARN del progetto, si riceverà l'output standard predefinito per tali file.
Utilizzo di progetti con output personalizzato e output standard
In questo caso d'uso, supponiamo di voler generare riepiloghi di output standard per documenti e file audio e di estrarre anche campi personalizzati dai documenti. Dopo aver creato un progetto, configurate l'uscita standard per l'audio per abilitare il riepilogo audio completo e assicuratevi che non siano abilitate altre estrazioni. Ripetete questa configurazione di output standard per i documenti. È quindi possibile configurare l'output personalizzato per i documenti aggiungendo un nuovo blueprint o un blueprint preesistente dal catalogo globale BDA. I documenti passati a BDA utilizzando questo progetto ARN genereranno l'output standard, i riepiloghi completi dei documenti e l'output del blueprint per i campi personalizzati definiti. I file audio passati a BDA utilizzando l'ARN di questo progetto genereranno riepiloghi completi.
Durante l'elaborazione dei documenti, potresti voler utilizzare più progetti per diversi tipi di documenti che vengono passati al tuo progetto. A un progetto possono essere allegati fino a 40 progetti di documenti. BDA abbina automaticamente i documenti al blueprint appropriato configurato nel progetto e genera un output personalizzato utilizzando tale progetto. Inoltre, potresti voler trasmettere documenti in blocco. Se passate un file che contiene più documenti, potete scegliere di dividere il documento durante la creazione del progetto. Se scegli di farlo, BDA scansiona il file e lo divide in singoli documenti in base al contesto. Questi singoli documenti vengono quindi abbinati al modello di elaborazione corretto.
Attualmente, le immagini supportano solo una singola definizione di blueprint per progetto. I tipi di file di immagine JPG e PNG potrebbero essere trattati come immagini o come documenti scansionati in base al loro contenuto. Si consiglia di creare un modello personalizzato per le immagini quando si elabora l'output personalizzato per i documenti, in modo che BDA fornisca l'output desiderato per i file di immagine che contengono testo.