Trascrizioni alternative - Amazon Transcribe

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Trascrizioni alternative

QuandoAmazon Transcribe trascrive l'audio, crea versioni diverse della stessa trascrizione e assegna un punteggio di affidabilità a ciascuna versione. In una trascrizione tipica, si ottiene solo la versione con il punteggio di affidabilità più elevato.

Se attivi le trascrizioni alternative,Amazon Transcribe restituisce altre versioni della trascrizione con livelli di confidenza inferiori. Puoi scegliere di richiedere la restituzione di un massimo di 10 trascrizioni alternative. Se si specifica un numero maggiore di alternative rispetto a quelloAmazon Transcribe identificato, viene restituito solo il numero effettivo di alternative.

Tutte le alternative si trovano nello stesso file di output di trascrizione e sono presentate a livello di segmento. I segmenti sono pause naturali nel parlato, come un cambio di altoparlante o una pausa nell'audio.

Le trascrizioni alternative sono disponibili solo per le trascrizioni in batch.

L'output della trascrizione è strutturato come segue. Le ellissi (... ) negli esempi di codice indicano dove il contenuto è stato rimosso per brevità.

  1. Una trascrizione finale completa per un determinato segmento.

    "results": { "language_code": "en-US", "transcripts": [ { "transcript": "The amazon is the largest rainforest on the planet." } ],
  2. Un punteggio di affidabilità per ogni parola dellatranscript sezione precedente.

    "items": [ { "start_time": "1.15", "end_time": "1.35", "alternatives": [ { "confidence": "1.0", "content": "The" } ], "type": "pronunciation" }, { "start_time": "1.35", "end_time": "2.05", "alternatives": [ { "confidence": "1.0", "content": "amazon" } ], "type": "pronunciation" },
  3. Le tue trascrizioni alternative si trovano nellasegments parte dell'output della trascrizione. Le alternative per ogni segmento sono ordinate in base al punteggio di confidenza decrescente.

    "segments": [ { "start_time": "1.04", "end_time": "5.065", "alternatives": [ { ... "transcript": "The amazon is the largest rain forest on the planet.", "items": [ { "start_time": "1.15", "confidence": "1.0", "end_time": "1.35", "type": "pronunciation", "content": "The" }, ... { "start_time": "3.06", "confidence": "0.0037", "end_time": "3.38", "type": "pronunciation", "content": "rain" }, { "start_time": "3.38", "confidence": "0.0037", "end_time": "3.96", "type": "pronunciation", "content": "forest" },
  4. Uno stato alla fine dell'output della trascrizione.

    "status": "COMPLETED" }

Richiesta di trascrizioni alternative

Puoi richiedere trascrizioni alternative utilizzando i AWS Management ConsoleAWS CLI, o gli AWSSDK; consulta quanto segue per alcuni esempi:

  1. Accedere alla AWS Management Console.

  2. Nel riquadro di navigazione, scegli Lavori di trascrizione, quindi seleziona Crea lavoro (in alto a destra). Si apre la pagina Specifica i dettagli del lavoro.

    Amazon Transcribepagina «Specifica i dettagli del lavoro» della console. Nel pannello «Impostazioni Job», puoi specificare un nome per il tuo lavoro di trascrizione, selezionare un tipo di modello e specificare le impostazioni della lingua.
  3. Compila i campi che desideri includere nella pagina Specifica i dettagli del lavoro, quindi seleziona Avanti. Si accede alla pagina Configura job (opzionale).

    Seleziona Risultati alternativi e specifica il numero massimo di risultati di trascrizione alternativi che desideri nella trascrizione.

    Amazon Transcribepagina 'Configura lavoro' della console. Nel pannello «Impostazioni audio», puoi abilitare i risultati alternativi e specificare il numero massimo di alternative che desideri includere nell'output della trascrizione.
  4. Seleziona Crea lavoro per eseguire il processo di trascrizione.

Questo esempio utilizza il start-transcription-jobcomando e ilShowAlternatives parametro. Per ulteriori informazioni, consultare StartTranscriptionJob e ShowAlternatives.

Tieni presente che se includiShowAlternatives=true nella tua richiesta, devi includere ancheMaxAlternatives.

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --output-key my-output-files/ \ --language-code en-US \ --settings ShowAlternatives=true,MaxAlternatives=4

Ecco un altro esempio che utilizza il start-transcription-jobcomando e un corpo della richiesta che include trascrizioni alternative.

aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://filepath/my-first-alt-transcription-job.json

Il file my-first-alt-transcription-job.json contiene il seguente corpo della richiesta.

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 4 } }

L'esempio seguente utilizza ilAWS SDK for Python (Boto3) per richiedere trascrizioni alternative utilizzando l'ShowAlternativesargomento per il metodo start_transcription_job. Per ulteriori informazioni, consultare StartTranscriptionJob e ShowAlternatives.

Per ulteriori esempi di utilizzo degliAWS SDK, inclusi esempi specifici per funzionalità, scenari e interservizi, consulta ilEsempi di codice per l'utilizzo di Amazon Transcribe AWS SDKs capitolo.

Tieni presente che se includi'ShowAlternatives':True nella tua richiesta, devi includere ancheMaxAlternatives.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Settings = { 'ShowAlternatives':True, 'MaxAlternatives':4 } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)