Cómo identificar los idiomas en el audio multilingüe Uso de la identificación del idioma con contenido multimedia en streaming

Identificación de idiomas con transcripciones en streaming

La identificación del idioma en streaming puede identificar el idioma dominante que se habla en su transmisión multimedia. Amazon Transcribe requiere un mínimo de tres segundos de conversación para identificar el idioma.

Si la transmisión incluye un único idioma, puede habilitar la identificación en un solo idioma, que identifica el idioma dominante que se habla en el archivo multimedia y crea la transcripción únicamente con este idioma.

Si el la transmisión incluye más de un idioma, puede habilitar la identificación en varios idiomas, que identifica todos los idiomas que se hablan en el archivo multimedia y crea la transcripción únicamente con este idioma. Tenga en cuenta que se produce una transcripción multilingüe. Puede utilizar otros servicios, como Amazon Transcribe, para traducir su trasncripción.

Para usar la identificación del idioma de la transmisión, debe proporcionar al menos dos códigos de idioma y sólo puede seleccionar un dialecto de idioma por idioma y por transmisión. Esto significa que no puede seleccionar en-US ni en-AU como opciones de idioma para la misma transcripción.

También tiene la opción de seleccionar un idioma preferido del conjunto de códigos de idioma que proporcione. Añadir un idioma preferido puede acelerar el proceso de identificación del idioma, lo que resulta útil para clips cortos de audio.

importante

Si ninguno de los códigos de idioma que proporciona coincide con el idioma o los idiomas identificados en el audio, Amazon Transcribe selecciona el idioma que más coincida entre los códigos de idioma especificados. A continuación, produce una transcripción en ese idioma. Por ejemplo, si su contenido multimedia está en inglés estadounidense (en-US) y usted proporciona Amazon Transcribe con los códigos de idioma zh-CN, fr-FR y de-DE, es probable que Amazon Transcribe haga coincidir el contenido multimedia con el alemán (de-DE) y genere una transcripción en alemán. Si los códigos de idioma y los idiomas hablados no coinciden, es posible que la transcripción sea imprecisa, por lo que recomendamos tener cuidado al incluir los códigos de idioma.

Si su contenido multimedia contiene dos canales, Amazon Transcribe puede identificar el idioma dominante que se habla en cada canal. En este caso, defina el parámetro ChannelIdentification en true y cada canal se transcribirá por separado. El valor predeterminado para este parámetro es false. Si no lo cambia, sólo se transcribe el primer canal y sólo se identifica un idioma.

La identificación del idioma en streaming no se puede combinar con modelos de idioma personalizados ni con la redacción. Si combina la identificación de idiomas con otras características, está limitado a los idiomas compatibles con esas características y también con las transcripciones de streaming. Consulte Idiomas compatibles.

nota

PCM y FLAC son los únicos formatos de audio compatibles para la identificación del idioma en streaming.

Cómo identificar los idiomas en el audio multilingüe

La identificación multilingüe está pensada para transmisiones multilingües y le proporciona una transcripción que refleja todos los idiomas admitidos que se hablan en la transmisión. Esto significa que si los hablantes cambian de idioma a mitad de la conversación, o si cada participante habla un idioma diferente, el resultado de la transcripción detectará y transcribirá cada idioma correctamente.

Por ejemplo, si la transmisión incluye un hablante bilingüe que alterna entre el inglés estadounidense (en-US) y el hindi (hi-IN), la identificación multilingüe puede identificar y transcribir el inglés estadounidense hablado como en-US y el hindi hablado como hi-IN. Esto difiere de la identificación en un único idioma, en la que sólo se usa un idioma dominante para crear una transcripción. En este caso, cualquier idioma hablado que no sea el idioma dominante se transcribe incorrectamente.

nota

Los modelos lingüísticos personalizados y de redacción no son compatibles actualmente con la identificación en varios idiomas.

Uso de la identificación del idioma con contenido multimedia en streaming

Puede utilizar la identificación automática del idioma en una transcripción de streaming mediante AWS Management Console, HTTP/2 o WebSockets; consulte los siguientes ejemplos:

Inicie sesión en la AWS Management Console.
En el panel de navegación, elija Transcripción en tiempo real. Desplácese hacia abajo hasta Configuración de idioma y expanda este campo si está minimizado.
Seleccione Identificación automática del idioma o Identificación automática de varios idiomas.
Proporcione un mínimo de dos códigos de idioma para su transcripción. Tenga en cuenta que sólo puede proporcionar un dialecto por idioma. Por ejemplo, no puede seleccionar en-US ni fr-CA como opciones de idioma para la misma transcripción.
(Opcional) Del subconjunto de idiomas que seleccionó en el paso anterior, puede elegir el idioma que prefiera para su transcripción.
Ya lo tiene todo listo para transcribir la secuencia. Seleccione Comenzar streaming y comience a hablar. Para finalizar el dictado, seleccione Detener streaming.

En este ejemplo, se crea una solicitud HTTP/2 con la identificación de idioma habilitada. Para obtener más información sobre el uso del streaming HTTP/2 con Amazon Transcribe, consulte Configuración de una transmisión HTTP /2. Para obtener más información sobre los parámetros y encabezados específicos de Amazon Transcribe, consulte. StartStreamTranscription


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-language: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked

En este ejemplo se crea una solicitud HTTP/2 con la identificación de idioma habilitada. Para obtener más información sobre el uso del streaming HTTP/2 con Amazon Transcribe, consulte Configuración de una transmisión HTTP /2. Para obtener más información sobre los parámetros y encabezados específicos de Amazon Transcribe, consulte. StartStreamTranscription


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-multiple-languages: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked

Si utiliza identify-language o identify-multiple-languages en la solicitud, también debe incluir language-options. No puede usar ambos language-code y identify-language en la misma solicitud.

Las definiciones de los parámetros se encuentran en Referencia de la API; los parámetros comunes a todas las operaciones de la API de AWS se enumeran en la sección Parámetros comunes.

En este ejemplo, se crea una URL prefirmada que utiliza la identificación de idioma en una secuencia de WebSocket. Se han añadido saltos de línea para facilitar la lectura. Para obtener más información acerca de cómo usar las secuencias de WebSocket con Amazon Transcribe, consulte Configuración de una WebSocket transmisión. Para obtener más información sobre parámetros, consulte StartStreamTranscription.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-language=true
&language-options=en-US,de-DE
&preferred-language=en-US

En este ejemplo se crea una URL prefirmada que utiliza la identificación de varios idiomas en una transmisión de WebSocket. Se han añadido saltos de línea para facilitar la lectura. Para obtener más información acerca de cómo usar las secuencias de WebSocket con Amazon Transcribe, consulte Configuración de una WebSocket transmisión. Para obtener más información sobre parámetros, consulte StartStreamTranscription.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-multiple-languages=true
&language-options=en-US,de-DE
&preferred-language=en-US

Las definiciones de los parámetros se encuentran en Referencia de la API; los parámetros comunes a todas las operaciones de la API de AWS se enumeran en la sección Parámetros comunes.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

identificación del idioma por lotes

Transcripciones alternativas