StartTranscriptionJob - Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

StartTranscriptionJob

Transcribe el audio de un archivo multimedia y aplica cualquier parámetro de solicitud adicional que elija incluir en su solicitud.

Para realizar unaStartTranscriptionJob solicitud, primero debe cargar el archivo multimedia en un bucket de Amazon S3; a continuación, puede especificar la ubicación del archivo en Amazon S3 mediante elMedia parámetro.

Debe incluir los siguientes parámetros en suStartTranscriptionJob solicitud:

  • region: ElRegión de AWS lugar donde realiza su solicitud. Para obtener una lista de lasRegiones de AWS opciones compatibles con Amazon Transcribe, consulte los puntos de conexión y cuotas de Amazon Transcribe.

  • TranscriptionJobName: un nombre personalizado que creas para tu trabajo de transcripción y que es único dentro de tuCuenta de AWS.

  • Media(MediaFileUri): la ubicación de Amazon S3 de su archivo multimedia.

  • Uno deLanguageCodeIdentifyLanguage, oIdentifyMultipleLanguages: Si conoce el idioma del archivo multimedia, especifíquelo mediante elLanguageCode parámetro; puede encontrar todos los códigos de idioma válidos en la tabla de idiomas admitidos. Si no conoce los idiomas que se hablan en sus archivos multimedia, utilice unoIdentifyLanguage de los dosIdentifyMultipleLanguages y deje que Amazon Transcribe identifique los idiomas por usted.

Sintaxis de la solicitud

{ "ContentRedaction": { "PiiEntityTypes": [ "string" ], "RedactionOutput": "string", "RedactionType": "string" }, "IdentifyLanguage": boolean, "IdentifyMultipleLanguages": boolean, "JobExecutionSettings": { "AllowDeferredExecution": boolean, "DataAccessRoleArn": "string" }, "KMSEncryptionContext": { "string" : "string" }, "LanguageCode": "string", "LanguageIdSettings": { "string" : { "LanguageModelName": "string", "VocabularyFilterName": "string", "VocabularyName": "string" } }, "LanguageOptions": [ "string" ], "Media": { "MediaFileUri": "string", "RedactedMediaFileUri": "string" }, "MediaFormat": "string", "MediaSampleRateHertz": number, "ModelSettings": { "LanguageModelName": "string" }, "OutputBucketName": "string", "OutputEncryptionKMSKeyId": "string", "OutputKey": "string", "Settings": { "ChannelIdentification": boolean, "MaxAlternatives": number, "MaxSpeakerLabels": number, "ShowAlternatives": boolean, "ShowSpeakerLabels": boolean, "VocabularyFilterMethod": "string", "VocabularyFilterName": "string", "VocabularyName": "string" }, "Subtitles": { "Formats": [ "string" ], "OutputStartIndex": number }, "Tags": [ { "Key": "string", "Value": "string" } ], "TranscriptionJobName": "string" }

Parámetros de solicitud

Para obtener información sobre los parámetros comunes a todas las acciones, consulte Parámetros comunes.

La solicitud acepta los siguientes datos en formato JSON.

ContentRedaction

Permite redactar o marcar información de identificación personal (PII) [Clave de identificación personal (PII)]. Si lo usaContentRedaction, también debe incluir los subparámetros:PiiEntityTypesRedactionOutput, yRedactionType.

Tipo: objeto ContentRedaction

Obligatorio: no

IdentifyLanguage

Permite la identificación automática del idioma en su solicitud de trabajo de transcripción. Utilice este parámetro si el archivo multimedia contiene solo un idioma. Si tu contenido multimedia contiene varios idiomas, úsaloIdentifyMultipleLanguages en su lugar.

Si lo incluyeIdentifyLanguage, puede incluir opcionalmente una lista de códigos de idioma, utilizandoLanguageOptions, que crea que pueden estar presentes en su archivo multimedia. LanguageOptionsIncluir restricciones soloIdentifyLanguage a las opciones de idioma que especifique, lo que puede mejorar la precisión de la transcripción.

Si desea aplicar un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado a su solicitud de identificación automática de idioma,LanguageIdSettings inclúyalo con los subparámetros pertinentes (VocabularyName,LanguageModelName, yVocabularyFilterName). Si incluyeLanguageIdSettings, incluya tambiénLanguageOptions.

Tenga en cuenta que debe incluir uno deLanguageCodeIdentifyLanguage, oIdentifyMultipleLanguages en su solicitud. Si incluye más de uno de estos parámetros, se produce un error.

Tipo: booleano

Obligatorio: no

IdentifyMultipleLanguages

Permite la identificación automática en varios idiomas en su solicitud de trabajo de transcripción. Utilice este parámetro si el archivo multimedia contiene más de un idioma. Si su contenido multimedia contiene solo un idioma, utilíceloIdentifyLanguage en su lugar.

Si lo incluyeIdentifyMultipleLanguages, puede incluir opcionalmente una lista de códigos de idioma, utilizandoLanguageOptions, que crea que pueden estar presentes en su archivo multimedia. LanguageOptionsIncluir restricciones soloIdentifyLanguage a las opciones de idioma que especifique, lo que puede mejorar la precisión de la transcripción.

Si desea aplicar un vocabulario personalizado o un filtro de vocabulario personalizado a su solicitud de identificación automática de idioma,LanguageIdSettings inclúyalo con los subparámetros pertinentes (VocabularyNameyVocabularyFilterName). Si incluyeLanguageIdSettings, incluya tambiénLanguageOptions.

Tenga en cuenta que debe incluir uno deLanguageCodeIdentifyLanguage, oIdentifyMultipleLanguages en su solicitud. Si incluye más de uno de estos parámetros, se produce un error.

Tipo: booleano

Obligatorio: no

JobExecutionSettings

Permite controlar la forma en que se procesa el trabajo de transcripción. Actualmente, la únicaJobExecutionSettings modificación que puede elegir es habilitar la cola de trabajos mediante elAllowDeferredExecution subparámetro.

Si incluyesJobExecutionSettings en tu solicitud, también debes incluir los subparámetros:AllowDeferredExecution yDataAccessRoleArn.

Tipo: objeto JobExecutionSettings

Obligatorio: no

KMSEncryptionContext

Un mapa de pares clave-valor no secretos en texto plano, conocidos como pares de contextos de cifrado, que proporcionan una capa adicional de seguridad para los datos. Para obtener más información, consulte el contexto deAWS KMS cifrado y las claves asimétricas enAWS KMS.

Tipo: mapa de cadena a cadena

Entradas de mapa: número máximo de 10 elementos.

Limitaciones de longitud de la clave: longitud mínima de 1. La longitud máxima es de 2000 caracteres.

Patrón de clave: .*\S.*

Limitaciones de longitud de los valores: longitud mínima de 1. La longitud máxima es de 2000 caracteres.

Patrón de valores:.*\S.*

Obligatorio: no

LanguageCode

El código de idioma que representa el idioma que se habla en el archivo multimedia de entrada.

Si no estás seguro del idioma que se habla en tu archivo multimedia, considera usarIdentifyLanguage oIdentifyMultipleLanguages habilitar la identificación automática del idioma.

Tenga en cuenta que debe incluir uno deLanguageCodeIdentifyLanguage, oIdentifyMultipleLanguages en su solicitud. Si incluye más de uno de estos parámetros, se produce un error.

Para obtener una lista de los idiomas admitidos y sus códigos de idioma asociados, consulte la tabla de idiomas admitidos.

nota

Para transcribir voz en árabe estándar moderno (ar-SA), el archivo multimedia debe estar codificado a una frecuencia de muestreo de 16 000 Hz o superior.

Tipo: cadena

Valores válidos: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Obligatorio: no

LanguageIdSettings

Si utiliza la identificación automática de idiomas en su solicitud y desea aplicar un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado,LanguageIdSettings inclúyalo con los subparámetros pertinentes (VocabularyName,LanguageModelName, yVocabularyFilterName). Tenga en cuenta que la identificación multilingüe (IdentifyMultipleLanguages) no admite modelos de idioma personalizados.

LanguageIdSettingsadmite códigos de dos a cinco idiomas. Cada código de idioma que incluya puede tener un modelo de idioma personalizado, un vocabulario personalizado y un filtro de vocabulario personalizado asociados. Los códigos de idioma que especifique deben coincidir con los idiomas de los modelos de idioma personalizados, los vocabularios personalizados y los filtros de vocabulario personalizados asociados.

Se recomienda incluirloLanguageOptions al usarloLanguageIdSettings para garantizar que se identifique el dialecto del idioma correcto. Por ejemplo, si especifica un vocabulario personalizado,en-US pero Amazon Transcribe determina que es el idioma que se habla en su contenido multimediaen-AU, su vocabulario personalizado no se aplicará a la transcripción. Si incluyesLanguageOptions een-US incluyes como el único dialecto del idioma inglés, tu vocabulario personalizado se aplicará a tu transcripción.

Si desea incluir un modelo de idioma personalizado en su solicitud, pero no desea utilizar la identificación automática de idioma, utilice en su lugar el ModelSettings parámetro con elLanguageModelName subparámetro. Si desea incluir un vocabulario personalizado o un filtro de vocabulario personalizado (o ambos) en su solicitud, pero no desea utilizar la identificación automática de idiomas, utilice en su lugar el Settings parámetro con el subparámetroVocabularyName oVocabularyFilterName (o ambos).

Tipo: cadenaLanguageIdSettings al mapa

Entradas de mapa: número máximo de 5 elementos.

Claves válidas: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Obligatorio: no

LanguageOptions

Puede especificar dos o más códigos de idioma que representen los idiomas que cree que pueden estar presentes en su contenido multimedia. No se recomienda incluir más de cinco. Si no estás seguro de qué idiomas están presentes, no incluyas este parámetro.

Si incluyeLanguageOptions en su solicitud, también debe incluirIdentifyLanguage.

Para obtener más información, consulte Idiomas compatibles.

Para transcribir voz en árabe estándar moderno (ar-SA), el archivo multimedia debe estar codificado a una frecuencia de muestreo de 16 000 Hz o superior.

Tipo: matriz de cadenas

Miembros de la matriz: número mínimo de 1 elemento.

Valores válidos: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Obligatorio: no

Media

Describe la ubicación de Amazon S3 del archivo multimedia que desea usar en su solicitud.

Tipo: objeto Media

Obligatorio: sí

MediaFormat

Especifique el formato del archivo multimedia de entrada.

Tipo: cadena

Valores válidos: mp3 | mp4 | wav | flac | ogg | amr | webm

Obligatorio: no

MediaSampleRateHertz

La frecuencia de muestreo, en hercios, de la pista de audio del archivo multimedia de entrada.

Si no especifica la frecuencia de muestreo del contenido, Amazon Transcribe la determina por usted. Si especifica la frecuencia de muestreo, debe coincidir con la frecuencia detectada por Amazon Transcribe. Si hay una discrepancia entre el valor que especificó y el valor detectado, se producirá un error en el trabajo. En la mayoría de los casos, puede omitirMediaSampleRateHertz y dejar que Amazon Transcribe determine la frecuencia de muestreo.

Tipo: entero

Rango válido: valor mínimo de 8000. Valor máximo de 48000 caracteres.

Obligatorio: no

ModelSettings

Especifica el modelo de idioma personalizado que deseas incluir en tu trabajo de transcripción. Si lo incluyeModelSettings en su solicitud, debe incluir elLanguageModelName subparámetro.

Para obtener más información, consulte Modelos de idioma personalizados.

Tipo: objeto ModelSettings

Obligatorio: no

OutputBucketName

El nombre del bucket de Amazon S3 donde desea almacenar el resultado de la transcripción. No incluya elS3:// prefijo del bucket especificado.

Si desea que la salida vaya a una subcarpeta de este depósito, especifíquelo mediante elOutputKey parámetro;OutputBucketName solo acepta el nombre de un depósito.

Por ejemplo, si desea almacenar la salida enS3://DOC-EXAMPLE-BUCKET,OutputBucketName configúrela enDOC-EXAMPLE-BUCKET. Sin embargo, si desea almacenar la salida enS3://DOC-EXAMPLE-BUCKET/test-files/,OutputBucketName defina comoDOC-EXAMPLE-BUCKET yOutputKey comotest-files/.

Tenga en cuenta que Amazon Transcribe debe tener permiso para utilizar la ubicación especificada. Puede cambiar los permisos de Amazon S3 mediante AWS Management Console. Consulte también Permisos necesarios para las funciones de usuario de IAM.

Si no lo especificasOutputBucketName, la transcripción se coloca en un bucket de Amazon S3 administrado por el servicio y se te proporciona un URI para acceder a la transcripción.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 64 caracteres.

Patrón: [a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]

Obligatorio: no

OutputEncryptionKMSKeyId

La clave KMS que desea utilizar para cifrar el resultado de la transcripción.

Si utiliza una clave ubicada en la actualCuenta de AWS, puede especificar su clave de KMS de una de las cuatro maneras siguientes:

  1. Utilice el identificador de clave de KMS propiamente dicho. Por ejemplo, 1234abcd-12ab-34cd-56ef-1234567890ab.

  2. Utilice un alias para el ID de la clave de KMS. Por ejemplo, alias/ExampleAlias.

  3. Utilice Amazon (ARN) como ID de la clave de KMS. Por ejemplo, arn:aws:kms:region:account-ID:key/1234abcd-12ab-34cd-56ef-1234567890ab.

  4. Utilice el ARN como alias de la clave KMS. Por ejemplo, arn:aws:kms:region:account-ID:alias/ExampleAlias.

Si usa una clave ubicada en una ubicación Cuenta de AWSdiferente a la actualCuenta de AWS, puede especificar su clave de KMS de dos maneras:

  1. Utilice el ARN para el ID de clave de KMS. Por ejemplo, arn:aws:kms:region:account-ID:key/1234abcd-12ab-34cd-56ef-1234567890ab.

  2. Utilice el ARN como alias de la clave KMS. Por ejemplo, arn:aws:kms:region:account-ID:alias/ExampleAlias.

Si no especifica una clave de cifrado, la salida se cifrará con la clave de Amazon S3 (SSE-S3) [Clave de Amazon S3 (SSE-S3)].

Si especifica una clave de KMS para cifrar la salida, también debe especificar una ubicación de salida mediante elOutputLocation parámetro.

Tenga en cuenta que el rol que realiza laStartCallAnalyticsJob solicitud debe tener permiso para utilizar la clave KMS especificada.

Tipo: cadena

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 2048 caracteres.

Patrón: ^[A-Za-z0-9][A-Za-z0-9:_/+=,@.-]{0,2048}$

Obligatorio: no

OutputKey

Úselo en combinación conOutputBucketName para especificar la ubicación de salida de la transcripción y, opcionalmente, un nombre único para el archivo de salida. El nombre predeterminado del resultado de la transcripción es el mismo que especificó para el trabajo de transcripción (TranscriptionJobName).

He aquí algunos ejemplos de cómo puede utilizarOutputKey:

  • Si especifica 'DOC-EXAMPLE-BUCKET' como 'OutputBucketNamey' my-transcript.json 'comoOutputKey, la ruta de salida de la transcripción ess3://DOC-EXAMPLE-BUCKET/my-transcript.json.

  • Si especifica «my-first-transcription» comoTranscriptionJobName, «DOC-EXAMPLE-BUCKET» como y «my-transcription» comoOutputKey, la ruta de salida de la transcripción ess3://DOC-EXAMPLE-BUCKET/my-transcript/my-first-transcription.json.OutputBucketName

  • Si especifica 'DOC-EXAMPLE-BUCKET' como 'OutputBucketNamey' test-files/my-transcript.json 'comoOutputKey, la ruta de salida de la transcripción ess3://DOC-EXAMPLE-BUCKET/test-files/my-transcript.json.

  • Si especifica «my-first-transcription» comoTranscriptionJobName, «DOC-EXAMPLE-BUCKET» como y «test-files/my-transcript» comoOutputKey, la ruta de salida de la transcripción ess3://DOC-EXAMPLE-BUCKET/test-files/my-transcript/my-first-transcription.json.OutputBucketName

Si especifica el nombre de una subcarpeta de bucket de Amazon S3 que no existe, se crea una para usted.

Tipo: cadena

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 1024 caracteres.

Patrón: [a-zA-Z0-9-_.!*'()/]{1,1024}$

Obligatorio: no

Settings

Especifique ajustes opcionales adicionales en suStartTranscriptionJob solicitud, incluida la identificación de canales, las transcripciones alternativas y la partición de los altavoces. Puede usarlo para aplicar vocabularios y filtros de vocabulario personalizados.

Si quieres incluir un vocabulario personalizado o un filtro de vocabulario personalizado (o ambos) en tu solicitud, pero no quieres utilizar la identificación automática de idiomas,Settings utilízalo con el subparámetroVocabularyName oVocabularyFilterName (o ambos).

Si utilizas la identificación automática de idiomas en tu solicitud y quieres incluir un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado, utiliza en su lugar el LanguageIdSettings parámetro conVocabularyFilterName los subparámetrosVocabularyName o.LanguageModelName

Tipo: objeto Settings

Obligatorio: no

Subtitles

Produce archivos de subtítulos para los medios de entrada. Puede especificar los formatos WebVTT (*.vtt) y SubRip (*.srt).

Tipo: objeto Subtitles

Obligatorio: no

Tags

Añade una o más etiquetas personalizadas, cada una en forma de par clave:valor, a un nuevo trabajo de transcripción al iniciar este nuevo trabajo.

Para obtener más información sobre cómo usar etiquetas con Amazon Transcribe, consulte Encryption (Recursos de etiquetado).

Tipo: Matriz de objetos Tag

Miembros de la matriz: número mínimo de 1 elemento. Número máximo de 200 elementos.

Obligatorio: no

TranscriptionJobName

Un nombre único, elegido por usted, para su trabajo de transcripción. El nombre que especifique también se utilizará como nombre predeterminado del archivo de salida de la transcripción. Si desea especificar un nombre diferente para el resultado de la transcripción, utilice elOutputKey parámetro.

Este nombre distingue entre mayúsculas y minúsculas, no puede contener espacios y debe ser único dentro de unCuenta de AWS. Si intenta crear un trabajo nuevo con el mismo nombre que un trabajo existente,ConflictException aparece un error.

Tipo: cadena

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

Obligatorio: sí

Sintaxis de la respuesta

{ "TranscriptionJob": { "CompletionTime": number, "ContentRedaction": { "PiiEntityTypes": [ "string" ], "RedactionOutput": "string", "RedactionType": "string" }, "CreationTime": number, "FailureReason": "string", "IdentifiedLanguageScore": number, "IdentifyLanguage": boolean, "IdentifyMultipleLanguages": boolean, "JobExecutionSettings": { "AllowDeferredExecution": boolean, "DataAccessRoleArn": "string" }, "LanguageCode": "string", "LanguageCodes": [ { "DurationInSeconds": number, "LanguageCode": "string" } ], "LanguageIdSettings": { "string" : { "LanguageModelName": "string", "VocabularyFilterName": "string", "VocabularyName": "string" } }, "LanguageOptions": [ "string" ], "Media": { "MediaFileUri": "string", "RedactedMediaFileUri": "string" }, "MediaFormat": "string", "MediaSampleRateHertz": number, "ModelSettings": { "LanguageModelName": "string" }, "Settings": { "ChannelIdentification": boolean, "MaxAlternatives": number, "MaxSpeakerLabels": number, "ShowAlternatives": boolean, "ShowSpeakerLabels": boolean, "VocabularyFilterMethod": "string", "VocabularyFilterName": "string", "VocabularyName": "string" }, "StartTime": number, "Subtitles": { "Formats": [ "string" ], "OutputStartIndex": number, "SubtitleFileUris": [ "string" ] }, "Tags": [ { "Key": "string", "Value": "string" } ], "Transcript": { "RedactedTranscriptFileUri": "string", "TranscriptFileUri": "string" }, "TranscriptionJobName": "string", "TranscriptionJobStatus": "string" } }

Elementos de respuesta

Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.

El servicio devuelve los datos siguientes en formato JSON.

TranscriptionJob

Proporciona información detallada sobre el trabajo de transcripción actual, incluido el estado del trabajo y, si corresponde, el motivo del fracaso.

Tipo: objeto TranscriptionJob

Errores

Para obtener información sobre los errores comunes a todas las acciones, consulteErrores comunes.

BadRequestException

Tu solicitud no ha superado una o más pruebas de validación. Esto puede ocurrir cuando la entidad que intentas eliminar no existe o si se encuentra en un estado no terminal (por ejemploIN PROGRESS). Para obtener más información, consulte el campo del mensaje de excepción para obtener más información.

Código de estado HTTP: 400

ConflictException

Ya existe un recurso con este nombre. Los nombres de recurso deben ser únicos dentro de unCuenta de AWS.

Código de estado HTTP: 400

InternalFailureException

Se produjo un error interno. Compruebe el mensaje de error, corrija el problema e intente realizar la solicitud de nuevo.

Código de estado HTTP: 500

LimitExceededException

Has enviado demasiadas solicitudes o tu archivo de entrada es demasiado largo. Espere antes de volver a intentar la solicitud o utilice un archivo más pequeño y vuelva a intentarlo.

Código de estado HTTP: 400

Véase también

Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: