Identificación de idiomas con trabajos de transcripción por lotes - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Identificación de idiomas con trabajos de transcripción por lotes

Utilice la identificación de idioma por lotes para identificar automáticamente el idioma o los idiomas del archivo multimedia.

Si el contenido multimedia contiene un único idioma, puede activar la identificación en un sólo idioma, que identifica el idioma dominante que se habla en el archivo multimedia y crea la transcripción utilizando únicamente este idioma.

Si el contenido multimedia contiene más de un idioma, puede habilitar la identificación en varios idiomas, que identifica todos los idiomas que se hablan en el archivo multimedia y crea la transcripción utilizando únicamente este idioma. Tenga en cuenta que se produce una transcripción multilingüe. Puede utilizar otros servicios, por ejemplo Amazon Translate, para traducir su expediente académico.

Consulte la tabla de idiomas admitidos para obtener una lista completa de los idiomas admitidos y los códigos de idioma asociados.

Para obtener los mejores resultados, asegúrese de que el archivo multimedia contenga al menos 30 segundos de voz.

Para ver ejemplos de uso con AWS Management Console AWS CLI, y el SDK de AWS Python, consulteUtilizar la identificación de idiomas con transcripciones por lotes.

Cómo identificar los idiomas en el audio multilingüe

La identificación multilingüe está pensada para archivos multimedia multilingües y le proporciona una transcripción que refleja todos los idiomas admitidos que se hablan en sus archivos multimedia. Esto significa que si los hablantes cambian de idioma a mitad de la conversación, o si cada participante habla un idioma diferente, el resultado de la transcripción detectará y transcribirá cada idioma correctamente. Por ejemplo, si su contenido multimedia contiene un hablante bilingüe que alterna entre el inglés estadounidense (en-US) y el hindi (hi-IN), la identificación multilingüe puede identificar y transcribir el inglés estadounidense hablado como en-US y el hindi hablado como hi-IN.

Esto difiere de la identificación en un único idioma, en la que sólo se usa un idioma dominante para crear una transcripción. En este caso, cualquier idioma hablado que no sea el idioma dominante se transcribe incorrectamente.

nota

Los modelos lingüísticos personalizados y de redacción no son compatibles actualmente con la identificación en varios idiomas.

nota

Actualmente, se admiten los siguientes idiomas con identificación multilingüe: en-AB, en-AU, en-GB, en-IE, en-IN, en-IN, en-NZ, en-US, en-WL, en-ZA, es-ES, es-US, fr-CA, fr-FR, zh-CN, zh-TW, pt-BR, pt-PT, de-CH, de-DE, af-ZA, ar-AE, da-DK, he-IL, Hi-in, ID-ID, Fa-ir, es-it, ja-JP, ko-KR, MS-my, NL-NL, ru-RU, Ta-in, Te-in, Th-th, TR-TR

Las transcripciones multilingües proporcionan un resumen de los idiomas detectados y del tiempo total que se habla cada idioma en el contenido multimedia. A continuación se muestra un ejemplo:

"results": { "transcripts": [ { "transcript": "welcome to Amazon transcribe. ये तो उदाहरण हैं क्या कैसे कर सकते हैं ।一つのファイルに複数の言語を書き写す" } ], ... "language_codes": [ { "language_code": "en-US", "duration_in_seconds": 2.45 }, { "language_code": "hi-IN", "duration_in_seconds": 5.325 }, { "language_code": "ja-JP", "duration_in_seconds": 4.15 } ] }

Mejora de la precisión de la identificación de idiomas

Con la identificación de idiomas, tiene la opción de incluir una lista de los idiomas que cree que pueden estar presentes en sus archivos multimedia. La inclusión de opciones de idioma (LanguageOptions) restringe Amazon Transcribe el uso exclusivo de los idiomas que especifique al hacer coincidir el audio con el idioma correcto, lo que puede acelerar la identificación del idioma y mejorar la precisión asociada a la asignación del dialecto correcto.

Si decide incluir códigos de idioma, debe incluir al menos dos. No hay límite en la cantidad de códigos de idioma que puede incluir, pero le recomendamos usar entre dos y cinco para lograr una eficiencia y precisión óptimas.

nota

Si incluye códigos de idioma en su solicitud y ninguno de los códigos de idioma que proporciona coincide con el idioma o los idiomas identificados en el audio, Amazon Transcribe selecciona el idioma que más coincida entre los códigos de idioma especificados. A continuación, produce una transcripción en ese idioma. Por ejemplo, si el contenido multimedia está en inglés estadounidense (en-US) y usted proporciona los códigos de idiomazh-CN, y fr-FRde-DE, Amazon Transcribe es probable que haga coincidir el contenido Amazon Transcribe con el alemán (de-DE) y produzca una transcripción en alemán. Si los códigos de idioma y los idiomas hablados no coinciden, es posible que la transcripción sea imprecisa, por lo que recomendamos tener cuidado al incluir los códigos de idioma.

Combinar la identificación del idioma con otras características de Amazon Transcribe

Puede utilizar la identificación de idioma por lotes en combinación con cualquier otra característica de Amazon Transcribe . Si combina la identificación de idiomas con otras características, usted está limitado a los idiomas compatibles con esas características. Por ejemplo, si utilizas la identificación lingüística para redactar el contenido, estás limitado al inglés estadounidense (en-US) o al español estadounidense (es-US), ya que este es el único idioma disponible para la redacción. Para obtener más información, consulte Idiomas compatibles y características específicas de cada idioma.

importante

Si utilizas la identificación automática del idioma con la redacción de contenido habilitada y tu audio contiene idiomas distintos del inglés estadounidense (en-US) o el español de EE. UU. (es-US), en tu transcripción solo aparecerá redactado el contenido en inglés o español de EE. UU. No se puede redactar en otros idiomas y no hay advertencias ni errores en el trabajo.

Modelos de idioma personalizados, vocabularios personalizados y filtros de vocabulario personalizados

Si desea agregar uno o más modelos de idioma personalizados, vocabularios personalizados o filtros de vocabulario personalizados a su solicitud de identificación de idioma, debe incluir el parámetro LanguageIdSettings. A continuación, puede especificar un código de idioma con el modelo de idioma personalizado, el vocabulario personalizado y el filtro de vocabulario personalizado correspondientes. Tenga en cuenta que la identificación multilingüe no admite modelos de idioma personalizados.

Se recomienda incluir LanguageOptions cuando utilice LanguageIdSettings para asegurarse de que se identifica el dialecto correcto. Por ejemplo, si especificas un vocabulario en-US personalizado, pero Amazon Transcribe determinas que es el idioma que se habla en el contenido multimediaen-AU, ese vocabulario personalizado no se aplicará a la transcripción. Si incluye LanguageOptions y especifica en-US como el único dialecto del idioma inglés, su vocabulario personalizado se aplicará a la transcripción.

Para ver ejemplos de LanguageIdSettings de una solicitud, consulte la Opción 2 de los paneles desplegables AWS CLI y de los SDK de AWS en la sección Utilizar la identificación de idiomas con transcripciones por lotes.

Utilizar la identificación de idiomas con transcripciones por lotes

Puede utilizar la identificación automática del idioma en un trabajo de transcripción por lotes utilizando AWS Management Console, AWS CLI o los SDK de AWS ; consulte los ejemplos siguientes:

  1. Inicie sesión en la AWS Management Console.

  2. En el panel de navegación, elija Trabajos de transcripción y, a continuación, seleccione Crear trabajo (arriba a la derecha). Se abrirá la página Especificar los detalles del trabajo.

  3. En el panel de Configuración del trabajo, busque la sección Configuración de idioma y seleccione Identificación automática de idioma o Identificación automática de varios idiomas.

    Tiene la opción de seleccionar varias opciones de idioma (en el cuadro desplegable Seleccionar idiomas) si conoce qué idiomas están presentes en su archivo de audio. Proporcionar las opciones del idioma puede mejorar la precisión, pero no es obligatorio.

    Amazon Transcribe captura de pantalla de la consola: el panel de «configuración del trabajo» de la página «especificar los detalles del trabajo».
  4. Rellene todos los campos que desee incluir en la página Especificar los detalles del trabajo y, a continuación, seleccione Siguiente. Esto lo llevará a la página Configurar trabajo: opcional.

    Amazon Transcribe captura de pantalla de la consola: la página de «configurar el trabajo».
  5. Seleccione Crear trabajo para ejecutar su trabajo de transcripción.

En este ejemplo se utilizan el start-transcription-jobcomando y IdentifyLanguage el parámetro. Para obtener más información, consulte StartTranscriptionJob y LanguageIdSettings.

Opción 1: sin el parámetro language-id-settings. Utilice esta opción si no incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud. language-options es opcional, pero recomendable.

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --output-key my-output-files/ \ --identify-language \ (or --identify-multiple-languages) \ --language-options "en-US" "hi-IN"

Opción 2: sin el parámetro language-id-settings. Utilice esta opción si incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud.

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --output-key my-output-files/ \ --identify-language \ (or --identify-multiple-languages) --language-options "en-US" "hi-IN" \ --language-id-settings en-US=VocabularyName=my-en-US-vocabulary,en-US=VocabularyFilterName=my-en-US-vocabulary-filter,en-US=LanguageModelName=my-en-US-language-model,hi-IN=VocabularyName=my-hi-IN-vocabulary,hi-IN=VocabularyFilterName=my-hi-IN-vocabulary-filter

A continuación, se muestra otro ejemplo en el que se utiliza el start-transcription-jobcomando y el cuerpo de la solicitud que identifica el idioma.

aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://filepath/my-first-language-id-job.json

El archivo my-first-language-id-job.json contiene el siguiente cuerpo de solicitud.

Opción 1: sin el parámetro LanguageIdSettings. Utilice esta opción si no incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud. LanguageOptions es opcional, pero recomendable.

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "IdentifyLanguage": true, (or "IdentifyMultipleLanguages": true), "LanguageOptions": [ "en-US", "hi-IN" ] }

Opción 2: sin el parámetro LanguageIdSettings. Utilice esta opción si incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud.

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "IdentifyLanguage": true, (or "IdentifyMultipleLanguages": true) "LanguageOptions": [ "en-US", "hi-IN" ], "LanguageIdSettings": { "en-US" : { "LanguageModelName": "my-en-US-language-model", "VocabularyFilterName": "my-en-US-vocabulary-filter", "VocabularyName": "my-en-US-vocabulary" }, "hi-IN": { "VocabularyName": "my-hi-IN-vocabulary", "VocabularyFilterName": "my-hi-IN-vocabulary-filter" } } }

En este ejemplo, se utiliza AWS SDK for Python (Boto3) para identificar el idioma del archivo mediante el IdentifyLanguage argumento del método start_transcription_job. Para obtener más información, consulte StartTranscriptionJob y LanguageIdSettings.

Para ver ejemplos adicionales sobre el uso de los AWS SDK, incluidos ejemplos de funciones específicas, escenarios y servicios cruzados, consulta el capítulo. Ejemplos de código para Amazon Transcribe usando AWS SDKs

Opción 1: sin el parámetro LanguageIdSettings. Utilice esta opción si no incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud. LanguageOptions es opcional, pero recomendable.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', MediaFormat = 'flac', IdentifyLanguage = True, (or IdentifyMultipleLanguages = True), LanguageOptions = [ 'en-US', 'hi-IN' ] ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

Opción 2: sin el parámetro LanguageIdSettings. Utilice esta opción si incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', MediaFormat='flac', IdentifyLanguage=True, (or IdentifyMultipleLanguages=True) LanguageOptions = [ 'en-US', 'hi-IN' ], LanguageIdSettings={ 'en-US': { 'VocabularyName': 'my-en-US-vocabulary', 'VocabularyFilterName': 'my-en-US-vocabulary-filter', 'LanguageModelName': 'my-en-US-language-model' }, 'hi-IN': { 'VocabularyName': 'my-hi-IN-vocabulary', 'VocabularyFilterName': 'my-hi-IN-vocabulary-filter' } } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)