Segnali d'azione tecnici Rilevamento delle riprese Informazioni sull'API di rilevamento dei segmenti di Video Amazon Rekognition

Rilevamento di segmenti video nei video archiviati

Video Amazon Rekognition fornisce un'API che identifica segmenti di video utili, come cornici nere e titoli di coda.

Gli utenti visualizzano una quantità di contenuti senza precedenti. In particolare, le piattaforme Over-The-Top (OTT) e Video-On-Demand (VOD) offrono una ricca selezione di contenuti in qualsiasi momento, ovunque e su qualsiasi schermo. Con la proliferazione dei volumi di contenuti, le aziende del settore multimediale devono affrontare sfide nella preparazione e nella gestione dei contenuti. Per questo è fondamentale offrire un'esperienza di visualizzazione di alta qualità e una migliore monetizzazione dei contenuti. Oggi, le aziende utilizzano grandi team di forza lavoro umana qualificata per svolgere attività come le seguenti.

Trovare dove si trovano i titoli di coda in una parte di contenuto.
Scelta dei punti giusti in cui inserire annunci pubblicitari, ad esempio nelle sequenze silenziose di cornici nere
Suddividere i video in clip più piccole per una migliore indicizzazione

Questi processi manuali sono costosi, lenti e non possono essere dimensionati per tenere il passo con il volume di contenuti prodotti, concessi in licenza e recuperati quotidianamente dagli archivi.

Puoi utilizzare Video Amazon Rekognition per automatizzare le attività operative di analisi dei media utilizzando API di rilevamento dei segmenti video completamente gestite e create appositamente, basate sul machine learning (ML). Utilizzando Video Amazon Rekognition Segment API, è possibile analizzare facilmente grandi volumi di video e rilevare contrassegni come fotogrammi neri o cambiamenti di ripresa. Ricevi i timecode, i timestamp e i numeri di frame SMPTE (Society of Motion Picture and Television Engineers) per ogni rilevamento. Non è richiesta alcuna esperienza di machine learning.

Video Amazon Rekognition analizza i video archiviati in un bucket Amazon Simple Storage Service (Amazon S3). I codici temporali SMPTE restituiti sono accurati in frame: Video Amazon Rekognition fornisce il numero esatto di frame di un segmento di video rilevato e gestisce automaticamente vari formati di frame rate video. È possibile utilizzare i metadati precisi a livello di fotogramma da Video Amazon Rekognition per automatizzare completamente determinate attività o ridurre significativamente il carico di lavoro di revisione degli operatori umani qualificati, in modo che possano concentrarsi su un lavoro più creativo. Puoi eseguire attività quali la preparazione di contenuti, l'inserimento di annunci pubblicitari e l'aggiunta di "binge-marker" ai contenuti su scala nel cloud.

Per informazioni sui prezzi, consulta Prezzi di Amazon Rekognition.

Il rilevamento dei segmenti di Video Amazon Rekognition supporta due tipi di attività di segmentazione: rilevamento Segnali d'azione tecnici e Rilevamento delle riprese.

Argomenti

Segnali d'azione tecnici

Un segnale d’azione identifica fotogrammi neri, barre colore, titoli di testa, titoli di coda, loghi degli studi e il contenuto principale del programma in un video.

Fotogrammi neri

I video spesso contengono fotogrammi neri vuoti privi di audio di breve durata che vengono utilizzati come segnali di azione tecnici per inserire pubblicità o per contrassegnare la fine di un segmento di programma, come una scena o i titoli di testa. Con Video Amazon Rekognition, puoi rilevare sequenze di fotogrammi neri per automatizzare l'inserimento di annunci pubblicitari, i contenuti di pacchetti per VOD e delimitare vari segmenti di programma o scene. I fotogrammi neri con audio (dissolvenze o voci fuori campo) sono considerati come contenuti e non vengono restituiti.

Crediti

Video Amazon Rekognition consente di identificare automaticamente i fotogrammi esatti in cui iniziano e terminano i titoli di coda e i titoli di testa per un film o una serie TV. Con queste informazioni, potete generare «binge marker» o istruzioni interattive per i visualizzatori, come «Next Episode» o «Skip Intro», nelle applicazioni di video on demand (VOD). È inoltre possibile rilevare il primo e l'ultimo fotogramma del contenuto del programma in un video. Video Amazon Rekognition è addestrato a gestire un'ampia varietà di stili di crediti iniziali e finali, dai semplici crediti ricorrenti ai crediti più impegnativi insieme ai contenuti.

Barre colore

Video Amazon Rekognition consente di rilevare sezioni di video con barre colore SMPTE, che sono un insieme di colori visualizzati in modelli specifici per garantire che il colore sia calibrato correttamente su monitor, programmi e telecamere. Per ulteriori informazioni sulle barre colore SMPTE, consulta Barre colore SMPTE. Questi metadati sono utili per preparare contenuti di applicazioni VOD rimuovendo i segmenti di barre colore o per rilevare problemi come la perdita dei segnali di trasmissione quando le barre colore compaiono continuamente come segnale predefinito al posto dei contenuti.

Liste

Le liste sono sezioni del video, in genere vicine all'inizio, che contengono metadati di testo relativi all'episodio, allo studio, al formato video, ai canali audio e altro ancora. Video Amazon Rekognition è in grado di identificare l'inizio e la fine delle liste, semplificando l'utilizzo dei metadati di testo o la rimozione della lavagna durante la preparazione dei contenuti per la visualizzazione finale.

Loghi Studio

I loghi degli studi sono sequenze che mostrano i loghi o gli emblemi dello studio di produzione coinvolto nella realizzazione dello spettacolo. Video Amazon Rekognition è in grado di rilevare queste sequenze in modo che gli utenti possano esaminarle per identificare gli studi.

Contenuti

I contenuti sono le parti della serie TV o del film che contengono il programma o elementi correlati. I fotogrammi neri, i crediti, le barre di colore, le lavagne e i loghi di studio non sono considerati contenuti. Video Amazon Rekognition è in grado di rilevare l'inizio e la fine di ogni segmento di contenuto del video, in modo da poter trovare la durata del programma o segmenti specifici.

I segmenti di contenuto includono, tra l'altro, quanto segue:

Scene di programma tra due interruzioni pubblicitarie
Un breve riassunto dell'episodio precedente all'inizio del video
Contenuti bonus dopo i crediti
Contenuti «senza testo», ad esempio un insieme di tutte le scene del programma che originariamente contenevano testo sovrapposto, ma in cui il testo è stato rimosso per supportare la traduzione in altre lingue.

Dopo che Video Amazon Rekognition avrà terminato il rilevamento di tutti i segmenti di contenuto, puoi applicare le informazioni sul dominio o inviarli alla revisione umana per classificare ulteriormente ogni segmento. Ad esempio, se utilizzi video che iniziano sempre con un riepilogo, puoi classificare il primo segmento di contenuto come riepilogo.

Il diagramma seguente mostra i segmenti dei segnali d'azione tecnici della sequenza temporale di una serie o di un film. Nota le barre colorate e i titoli di testa, i segmenti di contenuto come il riepilogo e il programma principale, i riquadri neri in tutto il video e i titoli di coda.

Barre colorate, segmento di riepilogo, due segmenti di contenuto del programma e cornici nere che rappresentano la sequenza temporale di uno spettacolo o di un film.

Rilevamento delle riprese

Una ripresa è costituita da una serie di immagini consecutive collegate tra loro, riprese in modo contiguo da un'unica telecamera e che rappresentano un'azione continua nel tempo e nello spazio. Con Video Amazon Rekognition, è possibile rilevare l'inizio, la fine e la durata di ogni ripresa, nonché un conteggio per tutte le riprese in una parte di contenuto. È possibile utilizzare i metadati di ripresa per attività quali le seguenti.

Creazione di video promozionali utilizzando riprese selezionate.
Inserimento di annunci pubblicitari in punti che non interrompono l'esperienza dello spettatore, ad esempio nel mezzo di una ripresa quando qualcuno sta parlando.
Generazione di una serie di miniature di anteprima che evitano contenuti di transizione tra le riprese.

Un rilevamento delle riprese è contrassegnato nel fotogramma esatto in cui è presente un hard cut su una telecamera diversa. Se c'è una transizione graduale da una telecamera all'altra, Video Amazon Rekognition omette la transizione. Ciò garantisce che l'ora di inizio e di fine ripresa non includa sezioni senza contenuto effettivo.

Il diagramma seguente illustra i segmenti di rilevamento delle riprese su una pellicola. Si noti che ogni ripresa è identificata da un taglio da un'angolazione o posizione da una telecamera a quella successiva.

Sette scatti numerati che ritraggono le strade della città, il cruscotto dell'auto, un sentiero nel bosco, un bambino, un pulcino, un lago al tramonto con la sagoma di un fotografo.

Informazioni sull'API di rilevamento dei segmenti di Video Amazon Rekognition

Per segmentare un video archiviato, si utilizzano le operazioni asincrone StartSegmentDetectione GetSegmentDetectionAPI per avviare un processo di segmentazione e recuperare i risultati. Il rilevamento dei segmenti accetta i video archiviati in un bucket Amazon S3 e restituisce un output JSON. È possibile scegliere di rilevare solo segnali d'azione tecnici, solo modifiche di ripresa, o entrambe le cose insieme, configurando la richiesta API StartSegmentdetection. È inoltre possibile filtrare i segmenti rilevati impostando le soglie per ottenere un livello minimo di affidabilità delle previsioni. Per ulteriori informazioni, consulta Utilizzo dell'API Amazon Rekognition Segment . Per il codice di esempio, consulta Esempio: rilevamento di segmenti in un video archiviato.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Rilevamento del testo in un video archiviato

Utilizzo dell'API Amazon Rekognition Segment