Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Trascrizioni alternative
QuandoAmazon Transcribe trascrive l'audio, crea versioni diverse della stessa trascrizione e assegna un punteggio di affidabilità a ciascuna versione. In una trascrizione tipica, si ottiene solo la versione con il punteggio di affidabilità più elevato.
Se attivi le trascrizioni alternative,Amazon Transcribe restituisce altre versioni della trascrizione con livelli di confidenza inferiori. Puoi scegliere di richiedere la restituzione di un massimo di 10 trascrizioni alternative. Se si specifica un numero maggiore di alternative rispetto a quelloAmazon Transcribe identificato, viene restituito solo il numero effettivo di alternative.
Tutte le alternative si trovano nello stesso file di output di trascrizione e sono presentate a livello di segmento. I segmenti sono pause naturali nel parlato, come un cambio di altoparlante o una pausa nell'audio.
Le trascrizioni alternative sono disponibili solo per le trascrizioni in batch.
L'output della trascrizione è strutturato come segue. Le ellissi (...
) negli esempi di codice indicano dove il contenuto è stato rimosso per brevità.
Una trascrizione finale completa per un determinato segmento.
"results": { "language_code": "en-US", "transcripts": [ { "transcript": "The amazon is the largest rainforest on the planet." } ],
Un punteggio di affidabilità per ogni parola della
transcript
sezione precedente."items": [ { "start_time": "1.15", "end_time": "1.35", "alternatives": [ { "confidence": "1.0", "content": "The" } ], "type": "pronunciation" }, { "start_time": "1.35", "end_time": "2.05", "alternatives": [ { "confidence": "1.0", "content": "amazon" } ], "type": "pronunciation" },
-
Le tue trascrizioni alternative si trovano nella
segments
parte dell'output della trascrizione. Le alternative per ogni segmento sono ordinate in base al punteggio di confidenza decrescente."segments": [ { "start_time": "1.04", "end_time": "5.065", "alternatives": [ {
...
"transcript": "The amazon is the largest rain forest on the planet.", "items": [ { "start_time": "1.15", "confidence": "1.0", "end_time": "1.35", "type": "pronunciation", "content": "The" },...
{ "start_time": "3.06", "confidence": "0.0037", "end_time": "3.38", "type": "pronunciation", "content": "rain" }, { "start_time": "3.38", "confidence": "0.0037", "end_time": "3.96", "type": "pronunciation", "content": "forest" }, -
Uno stato alla fine dell'output della trascrizione.
"status": "COMPLETED" }
Richiesta di trascrizioni alternative
Puoi richiedere trascrizioni alternative utilizzando i AWS Management ConsoleAWS CLI, o gli AWSSDK; consulta quanto segue per alcuni esempi:
-
Accedere alla AWS Management Console
. -
Nel riquadro di navigazione, scegli Lavori di trascrizione, quindi seleziona Crea lavoro (in alto a destra). Si apre la pagina Specifica i dettagli del lavoro.
-
Compila i campi che desideri includere nella pagina Specifica i dettagli del lavoro, quindi seleziona Avanti. Si accede alla pagina Configura job (opzionale).
Seleziona Risultati alternativi e specifica il numero massimo di risultati di trascrizione alternativi che desideri nella trascrizione.
-
Seleziona Crea lavoro per eseguire il processo di trascrizione.
Questo esempio utilizza il start-transcription-jobShowAlternatives
parametro. Per ulteriori informazioni, consultare StartTranscriptionJob
e ShowAlternatives
.
Tieni presente che se includiShowAlternatives=true
nella tua richiesta, devi includere ancheMaxAlternatives
.
aws transcribe start-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
\ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
\ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --output-keymy-output-files
/ \ --language-codeen-US
\ --settings ShowAlternatives=true,MaxAlternatives=4
Ecco un altro esempio che utilizza il start-transcription-job
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://filepath
/my-first-alt-transcription-job.json
Il file my-first-alt-transcription-job.json contiene il seguente corpo della richiesta.
{
"TranscriptionJobName": "my-first-transcription-job
",
"Media": {
"MediaFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
"
},
"OutputBucketName": "DOC-EXAMPLE-BUCKET
",
"OutputKey": "my-output-files
/",
"LanguageCode": "en-US
",
"Settings": {
"ShowAlternatives": true,
"MaxAlternatives": 4
}
}
L'esempio seguente utilizza ilAWS SDK for Python (Boto3) per richiedere trascrizioni alternative utilizzando l'ShowAlternatives
argomento per il metodo start_transcription_jobStartTranscriptionJob
e ShowAlternatives
.
Per ulteriori esempi di utilizzo degliAWS SDK, inclusi esempi specifici per funzionalità, scenari e interservizi, consulta ilEsempi di codice per l'utilizzo di Amazon Transcribe AWS SDKs capitolo.
Tieni presente che se includi'ShowAlternatives':True
nella tua richiesta, devi includere ancheMaxAlternatives
.
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2
')
job_name = "my-first-transcription-job
"
job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
"
transcribe.start_transcription_job(
TranscriptionJobName = job_name,
Media = {
'MediaFileUri': job_uri
},
OutputBucketName = 'DOC-EXAMPLE-BUCKET
',
OutputKey = 'my-output-files
/',
LanguageCode = 'en-US
',
Settings = {
'ShowAlternatives':True,
'MaxAlternatives':4
}
)
while True:
status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
break
print("Not ready yet...")
time.sleep(5)
print(status)