Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Identificación de idiomas con trabajos de transcripción por lotes
Utilice la identificación de idioma por lotes para identificar automáticamente el idioma o los idiomas del archivo multimedia.
Si el contenido multimedia contiene un único idioma, puede activar la identificación en un sólo idioma, que identifica el idioma dominante que se habla en el archivo multimedia y crea la transcripción utilizando únicamente este idioma.
Si el contenido multimedia contiene más de un idioma, puede habilitar la identificación en varios idiomas, que identifica todos los idiomas que se hablan en el archivo multimedia y crea la transcripción utilizando únicamente este idioma. Tenga en cuenta que se produce una transcripción multilingüe. Puede utilizar otros servicios, por ejemplo Amazon Translate, para traducir su expediente académico.
Consulte la tabla de idiomas admitidos para obtener una lista completa de los idiomas admitidos y los códigos de idioma asociados.
Para obtener los mejores resultados, asegúrese de que el archivo multimedia contenga al menos 30 segundos de voz.
Para ver ejemplos de uso con AWS Management Console AWS CLI, y el SDK de AWS Python, consulteUtilizar la identificación de idiomas con transcripciones por lotes.
Cómo identificar los idiomas en el audio multilingüe
La identificación multilingüe está pensada para archivos multimedia multilingües y le proporciona una transcripción que refleja todos los idiomas admitidos que se hablan en sus archivos multimedia. Esto significa que si los hablantes cambian de idioma a mitad de la conversación, o si cada participante habla un idioma diferente, el resultado de la transcripción detectará y transcribirá cada idioma correctamente. Por ejemplo, si su contenido multimedia contiene un hablante bilingüe que alterna entre el inglés estadounidense (en-US
) y el hindi (hi-IN
), la identificación multilingüe puede identificar y transcribir el inglés estadounidense hablado como en-US
y el hindi hablado como hi-IN
.
Esto difiere de la identificación en un único idioma, en la que sólo se usa un idioma dominante para crear una transcripción. En este caso, cualquier idioma hablado que no sea el idioma dominante se transcribe incorrectamente.
nota
Los modelos lingüísticos personalizados y de redacción no son compatibles actualmente con la identificación en varios idiomas.
nota
Actualmente, se admiten los siguientes idiomas con identificación multilingüe: en-AB, en-AU, en-GB, en-IE, en-IN, en-IN, en-NZ, en-US, en-WL, en-ZA, es-ES, es-US, fr-CA, fr-FR, zh-CN, zh-TW, pt-BR, pt-PT, de-CH, de-DE, af-ZA, ar-AE, da-DK, he-IL, Hi-in, ID-ID, Fa-ir, es-it, ja-JP, ko-KR, MS-my, NL-NL, ru-RU, Ta-in, Te-in, Th-th, TR-TR
Las transcripciones multilingües proporcionan un resumen de los idiomas detectados y del tiempo total que se habla cada idioma en el contenido multimedia. A continuación se muestra un ejemplo:
"results": { "transcripts": [ { "transcript": "welcome to Amazon transcribe. ये तो उदाहरण हैं क्या कैसे कर सकते हैं ।一つのファイルに複数の言語を書き写す" } ],
...
"language_codes": [ { "language_code": "en-US", "duration_in_seconds": 2.45 }, { "language_code": "hi-IN", "duration_in_seconds": 5.325 }, { "language_code": "ja-JP", "duration_in_seconds": 4.15 } ] }
Mejora de la precisión de la identificación de idiomas
Con la identificación de idiomas, tiene la opción de incluir una lista de los idiomas que cree que pueden estar presentes en sus archivos multimedia. La inclusión de opciones de idioma (LanguageOptions
) restringe Amazon Transcribe el uso exclusivo de los idiomas que especifique al hacer coincidir el audio con el idioma correcto, lo que puede acelerar la identificación del idioma y mejorar la precisión asociada a la asignación del dialecto correcto.
Si decide incluir códigos de idioma, debe incluir al menos dos. No hay límite en la cantidad de códigos de idioma que puede incluir, pero le recomendamos usar entre dos y cinco para lograr una eficiencia y precisión óptimas.
nota
Si incluye códigos de idioma en su solicitud y ninguno de los códigos de idioma que proporciona coincide con el idioma o los idiomas identificados en el audio, Amazon Transcribe selecciona el idioma que más coincida entre los códigos de idioma especificados. A continuación, produce una transcripción en ese idioma. Por ejemplo, si el contenido multimedia está en inglés estadounidense (en-US
) y usted proporciona los códigos de idiomazh-CN
, y fr-FR
de-DE
, Amazon Transcribe es probable que haga coincidir el contenido Amazon Transcribe con el alemán (de-DE
) y produzca una transcripción en alemán. Si los códigos de idioma y los idiomas hablados no coinciden, es posible que la transcripción sea imprecisa, por lo que recomendamos tener cuidado al incluir los códigos de idioma.
Combinar la identificación del idioma con otras características de Amazon Transcribe
Puede utilizar la identificación de idioma por lotes en combinación con cualquier otra característica de Amazon Transcribe . Si combina la identificación de idiomas con otras características, usted está limitado a los idiomas compatibles con esas características. Por ejemplo, si utilizas la identificación lingüística para redactar el contenido, estás limitado al inglés estadounidense (en-US
) o al español estadounidense (es-US
), ya que este es el único idioma disponible para la redacción. Para obtener más información, consulte Idiomas compatibles y características específicas de cada idioma.
importante
Si utilizas la identificación automática del idioma con la redacción de contenido habilitada y tu audio contiene idiomas distintos del inglés estadounidense (en-US
) o el español de EE. UU. (es-US
), en tu transcripción solo aparecerá redactado el contenido en inglés o español de EE. UU. No se puede redactar en otros idiomas y no hay advertencias ni errores en el trabajo.
Modelos de idioma personalizados, vocabularios personalizados y filtros de vocabulario personalizados
Si desea agregar uno o más modelos de idioma personalizados, vocabularios personalizados o filtros de vocabulario personalizados a su solicitud de identificación de idioma, debe incluir el parámetro LanguageIdSettings
. A continuación, puede especificar un código de idioma con el modelo de idioma personalizado, el vocabulario personalizado y el filtro de vocabulario personalizado correspondientes. Tenga en cuenta que la identificación multilingüe no admite modelos de idioma personalizados.
Se recomienda incluir LanguageOptions
cuando utilice LanguageIdSettings
para asegurarse de que se identifica el dialecto correcto. Por ejemplo, si especificas un vocabulario en-US
personalizado, pero Amazon Transcribe determinas que es el idioma que se habla en el contenido multimediaen-AU
, ese vocabulario personalizado no se aplicará a la transcripción. Si incluye LanguageOptions
y especifica en-US
como el único dialecto del idioma inglés, su vocabulario personalizado se aplicará a la transcripción.
Para ver ejemplos de LanguageIdSettings
de una solicitud, consulte la Opción 2 de los paneles desplegables AWS CLI y de los SDK de AWS en la sección Utilizar la identificación de idiomas con transcripciones por lotes.
Utilizar la identificación de idiomas con transcripciones por lotes
Puede utilizar la identificación automática del idioma en un trabajo de transcripción por lotes utilizando AWS Management Console, AWS CLI o los SDK de AWS ; consulte los ejemplos siguientes:
-
Inicie sesión en la AWS Management Console
. -
En el panel de navegación, elija Trabajos de transcripción y, a continuación, seleccione Crear trabajo (arriba a la derecha). Se abrirá la página Especificar los detalles del trabajo.
-
En el panel de Configuración del trabajo, busque la sección Configuración de idioma y seleccione Identificación automática de idioma o Identificación automática de varios idiomas.
Tiene la opción de seleccionar varias opciones de idioma (en el cuadro desplegable Seleccionar idiomas) si conoce qué idiomas están presentes en su archivo de audio. Proporcionar las opciones del idioma puede mejorar la precisión, pero no es obligatorio.
-
Rellene todos los campos que desee incluir en la página Especificar los detalles del trabajo y, a continuación, seleccione Siguiente. Esto lo llevará a la página Configurar trabajo: opcional.
-
Seleccione Crear trabajo para ejecutar su trabajo de transcripción.
En este ejemplo se utilizan el start-transcription-jobIdentifyLanguage
el parámetro. Para obtener más información, consulte StartTranscriptionJob
y LanguageIdSettings
.
Opción 1: sin el parámetro language-id-settings
. Utilice esta opción si no incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud. language-options
es opcional, pero recomendable.
aws transcribe start-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
\ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
\ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --output-keymy-output-files
/ \ --identify-language \ (or --identify-multiple-languages) \ --language-options "en-US
" "hi-IN
"
Opción 2: sin el parámetro language-id-settings
. Utilice esta opción si incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud.
aws transcribe start-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
\ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
\ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --output-keymy-output-files
/ \ --identify-language \ (or --identify-multiple-languages) --language-options "en-US
" "hi-IN
" \ --language-id-settingsen-US
=VocabularyName=my-en-US-vocabulary
,en-US
=VocabularyFilterName=my-en-US-vocabulary-filter
,en-US
=LanguageModelName=my-en-US-language-model
,hi-IN
=VocabularyName=my-hi-IN-vocabulary
,hi-IN
=VocabularyFilterName=my-hi-IN-vocabulary-filter
A continuación, se muestra otro ejemplo en el que se utiliza el start-transcription-job
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://filepath
/my-first-language-id-job.json
El archivo my-first-language-id-job.json contiene el siguiente cuerpo de solicitud.
Opción 1: sin el parámetro LanguageIdSettings
. Utilice esta opción si no incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud. LanguageOptions
es opcional, pero recomendable.
{ "TranscriptionJobName": "
my-first-transcription-job
", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET
", "OutputKey": "my-output-files
/", "IdentifyLanguage":true
, (or "IdentifyMultipleLanguages":true
), "LanguageOptions": [ "en-US
", "hi-IN
" ] }
Opción 2: sin el parámetro LanguageIdSettings
. Utilice esta opción si incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud.
{ "TranscriptionJobName": "
my-first-transcription-job
", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET
", "OutputKey": "my-output-files
/", "IdentifyLanguage":true
, (or "IdentifyMultipleLanguages":true
) "LanguageOptions": [ "en-US
", "hi-IN
" ], "LanguageIdSettings": { "en-US
" : { "LanguageModelName": "my-en-US-language-model
", "VocabularyFilterName": "my-en-US-vocabulary-filter
", "VocabularyName": "my-en-US-vocabulary
" }, "hi-IN
": { "VocabularyName": "my-hi-IN-vocabulary
", "VocabularyFilterName": "my-hi-IN-vocabulary-filter
" } } }
En este ejemplo, se utiliza AWS SDK for Python (Boto3) para identificar el idioma del archivo mediante el IdentifyLanguage
argumento del método start_transcription_job.StartTranscriptionJob
y LanguageIdSettings
.
Para ver ejemplos adicionales sobre el uso de los AWS SDK, incluidos ejemplos de funciones específicas, escenarios y servicios cruzados, consulta el capítulo. Ejemplos de código para Amazon Transcribe usando AWS SDKs
Opción 1: sin el parámetro LanguageIdSettings
. Utilice esta opción si no incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud. LanguageOptions
es opcional, pero recomendable.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') job_name = "my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET
', OutputKey = 'my-output-files
/', MediaFormat = 'flac
', IdentifyLanguage =True
, (or IdentifyMultipleLanguages =True
), LanguageOptions = [ 'en-US
', 'hi-IN
' ] ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Opción 2: sin el parámetro LanguageIdSettings
. Utilice esta opción si incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "
my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET
', OutputKey = 'my-output-files
/', MediaFormat='flac
', IdentifyLanguage=True
, (or IdentifyMultipleLanguages=True
) LanguageOptions = [ 'en-US
', 'hi-IN
' ], LanguageIdSettings={ 'en-US': { 'VocabularyName': 'my-en-US-vocabulary
', 'VocabularyFilterName': 'my-en-US-vocabulary-filter
', 'LanguageModelName': 'my-en-US-language-model
' }, 'hi-IN': { 'VocabularyName': 'my-hi-IN-vocabulary
', 'VocabularyFilterName': 'my-hi-IN-vocabulary-filter
' } } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)