Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Transcripciones alternativas
CuandoAmazon Transcribe transcribe audio, crea diferentes versiones de la misma transcripción y asigna una puntuación de confianza a cada versión. En una transcripción típica, solo se obtiene la versión con la puntuación de confianza más alta.
Si activas las transcripciones alternativas,Amazon Transcribe devuelve otras versiones de la transcripción que tienen niveles de confianza más bajos. Puede elegir que se le devuelvan hasta 10 transcripciones alternativas. Si especifica un número de alternativas mayor al queAmazon Transcribe identifica, solo se devuelve el número real de alternativas.
Todas las alternativas se encuentran en el mismo archivo de salida de transcripción y se presentan a nivel de segmento. Los segmentos son pausas naturales en la voz, como un cambio de altavoz o una pausa en el audio.
Las transcripciones alternativas solo están disponibles para las transcripciones por lotes.
El instrucción tiene la estructura siguiente. Las elipses (...
) en los ejemplos de código indican dónde se ha eliminado el contenido por motivos de brevedad.
Una transcripción final completa para un segmento determinado.
"results": { "language_code": "en-US", "transcripts": [ { "transcript": "The amazon is the largest rainforest on the planet." } ],
Una puntuación de confianza para cada palabra de la
transcript
sección anterior."items": [ { "start_time": "1.15", "end_time": "1.35", "alternatives": [ { "confidence": "1.0", "content": "The" } ], "type": "pronunciation" }, { "start_time": "1.35", "end_time": "2.05", "alternatives": [ { "confidence": "1.0", "content": "amazon" } ], "type": "pronunciation" },
-
Las transcripciones alternativas se encuentran en la
segments
parte del resultado de la transcripción. Las alternativas para cada segmento se ordenan por puntuación de confianza descendente."segments": [ { "start_time": "1.04", "end_time": "5.065", "alternatives": [ {
...
"transcript": "The amazon is the largest rain forest on the planet.", "items": [ { "start_time": "1.15", "confidence": "1.0", "end_time": "1.35", "type": "pronunciation", "content": "The" },...
{ "start_time": "3.06", "confidence": "0.0037", "end_time": "3.38", "type": "pronunciation", "content": "rain" }, { "start_time": "3.38", "confidence": "0.0037", "end_time": "3.96", "type": "pronunciation", "content": "forest" }, -
Un estado al final del resultado de la transcripción.
"status": "COMPLETED" }
Solicitud de transcripciones alternativas
Puede solicitar transcripciones alternativas mediante los SDK AWS Management ConsoleAWS CLI, o AWSlos SDK; consulte los siguientes ejemplos:
-
Inicie sesión en AWS Management Console
. -
En el panel de navegación, selecciona Trabajos de transcripción y, a continuación, selecciona Crear trabajo (arriba a la derecha). Se abre la página Especificar detalles del trabajo.
-
Rellene los campos que desee incluir en la página Especificar detalles del trabajo y, a continuación, seleccione Siguiente. Esto le llevará a la página Configurar trabajo: opcional.
Seleccione Resultados alternativos y especifique el número máximo de resultados de transcripción alternativos que desea incluir en su transcripción.
-
Selecciona Crear trabajo para ejecutar tu trabajo de transcripción.
En este ejemplo se utilizan el start-transcription-jobShowAlternatives
parámetro. Para obtener más información, consulte StartTranscriptionJob
y ShowAlternatives
.
Tenga en cuenta que si lo incluyeShowAlternatives=true
en su solicitud, también debe incluirloMaxAlternatives
.
aws transcribe start-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
\ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
\ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --output-keymy-output-files
/ \ --language-codeen-US
\ --settings ShowAlternatives=true,MaxAlternatives=4
Este es otro ejemplo de uso del start-transcription-job
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://filepath
/my-first-alt-transcription-job.json
El archivo my-first-alt-transcription-job.json contiene el siguiente cuerpo de solicitud.
{ "TranscriptionJobName": "
my-first-transcription-job
", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET
", "OutputKey": "my-output-files
/", "LanguageCode": "en-US
", "Settings": { "ShowAlternatives": true, "MaxAlternatives":4
} }
En el siguiente ejemplo, se utilizaAWS SDK for Python (Boto3) para solicitar transcripciones alternativas mediante elShowAlternatives
argumento del método start_transcription_jobStartTranscriptionJob
y ShowAlternatives
.
Para ver más ejemplos de uso deAWS los SDK, incluidos ejemplos de funciones específicas, escenarios y multiservicios, consulte elEjemplos de código para Amazon Transcribe usando AWS SDKs capítulo.
Tenga en cuenta que si lo incluye'ShowAlternatives':True
en su solicitud, también debe incluirloMaxAlternatives
.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') job_name = "my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET
', OutputKey = 'my-output-files
/', LanguageCode = 'en-US
', Settings = { 'ShowAlternatives':True, 'MaxAlternatives':4
} ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)