Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
StartTranscriptionJob
Transcribe el audio de un archivo multimedia y aplica cualquier parámetro de solicitud adicional que elija incluir en su solicitud.
Para realizar unaStartTranscriptionJob
solicitud, primero debe cargar el archivo multimedia en un bucket de Amazon S3; a continuación, puede especificar la ubicación del archivo en Amazon S3 mediante elMedia
parámetro.
Debe incluir los siguientes parámetros en suStartTranscriptionJob
solicitud:
-
region
: ElRegión de AWS lugar donde realiza su solicitud. Para obtener una lista de lasRegiones de AWS opciones compatibles con Amazon Transcribe, consulte los puntos de conexión y cuotas de Amazon Transcribe. -
TranscriptionJobName
: un nombre personalizado que creas para tu trabajo de transcripción y que es único dentro de tuCuenta de AWS. -
Media
(MediaFileUri
): la ubicación de Amazon S3 de su archivo multimedia. -
Uno de
LanguageCode
IdentifyLanguage
, oIdentifyMultipleLanguages
: Si conoce el idioma del archivo multimedia, especifíquelo mediante elLanguageCode
parámetro; puede encontrar todos los códigos de idioma válidos en la tabla de idiomas admitidos. Si no conoce los idiomas que se hablan en sus archivos multimedia, utilice unoIdentifyLanguage
de los dosIdentifyMultipleLanguages
y deje que Amazon Transcribe identifique los idiomas por usted.
Sintaxis de la solicitud
{
"ContentRedaction": {
"PiiEntityTypes": [ "string
" ],
"RedactionOutput": "string
",
"RedactionType": "string
"
},
"IdentifyLanguage": boolean
,
"IdentifyMultipleLanguages": boolean
,
"JobExecutionSettings": {
"AllowDeferredExecution": boolean
,
"DataAccessRoleArn": "string
"
},
"KMSEncryptionContext": {
"string
" : "string
"
},
"LanguageCode": "string
",
"LanguageIdSettings": {
"string
" : {
"LanguageModelName": "string
",
"VocabularyFilterName": "string
",
"VocabularyName": "string
"
}
},
"LanguageOptions": [ "string
" ],
"Media": {
"MediaFileUri": "string
",
"RedactedMediaFileUri": "string
"
},
"MediaFormat": "string
",
"MediaSampleRateHertz": number
,
"ModelSettings": {
"LanguageModelName": "string
"
},
"OutputBucketName": "string
",
"OutputEncryptionKMSKeyId": "string
",
"OutputKey": "string
",
"Settings": {
"ChannelIdentification": boolean
,
"MaxAlternatives": number
,
"MaxSpeakerLabels": number
,
"ShowAlternatives": boolean
,
"ShowSpeakerLabels": boolean
,
"VocabularyFilterMethod": "string
",
"VocabularyFilterName": "string
",
"VocabularyName": "string
"
},
"Subtitles": {
"Formats": [ "string
" ],
"OutputStartIndex": number
},
"Tags": [
{
"Key": "string
",
"Value": "string
"
}
],
"TranscriptionJobName": "string
"
}
Parámetros de solicitud
Para obtener información sobre los parámetros comunes a todas las acciones, consulte Parámetros comunes.
La solicitud acepta los siguientes datos en formato JSON.
- ContentRedaction
-
Permite redactar o marcar información de identificación personal (PII) [Clave de identificación personal (PII)]. Si lo usa
ContentRedaction
, también debe incluir los subparámetros:PiiEntityTypes
RedactionOutput
, yRedactionType
.Tipo: objeto ContentRedaction
Obligatorio: no
- IdentifyLanguage
-
Permite la identificación automática del idioma en su solicitud de trabajo de transcripción. Utilice este parámetro si el archivo multimedia contiene solo un idioma. Si tu contenido multimedia contiene varios idiomas, úsalo
IdentifyMultipleLanguages
en su lugar.Si lo incluye
IdentifyLanguage
, puede incluir opcionalmente una lista de códigos de idioma, utilizandoLanguageOptions
, que crea que pueden estar presentes en su archivo multimedia.LanguageOptions
Incluir restricciones soloIdentifyLanguage
a las opciones de idioma que especifique, lo que puede mejorar la precisión de la transcripción.Si desea aplicar un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado a su solicitud de identificación automática de idioma,
LanguageIdSettings
inclúyalo con los subparámetros pertinentes (VocabularyName
,LanguageModelName
, yVocabularyFilterName
). Si incluyeLanguageIdSettings
, incluya tambiénLanguageOptions
.Tenga en cuenta que debe incluir uno de
LanguageCode
IdentifyLanguage
, oIdentifyMultipleLanguages
en su solicitud. Si incluye más de uno de estos parámetros, se produce un error.Tipo: booleano
Obligatorio: no
- IdentifyMultipleLanguages
-
Permite la identificación automática en varios idiomas en su solicitud de trabajo de transcripción. Utilice este parámetro si el archivo multimedia contiene más de un idioma. Si su contenido multimedia contiene solo un idioma, utilícelo
IdentifyLanguage
en su lugar.Si lo incluye
IdentifyMultipleLanguages
, puede incluir opcionalmente una lista de códigos de idioma, utilizandoLanguageOptions
, que crea que pueden estar presentes en su archivo multimedia.LanguageOptions
Incluir restricciones soloIdentifyLanguage
a las opciones de idioma que especifique, lo que puede mejorar la precisión de la transcripción.Si desea aplicar un vocabulario personalizado o un filtro de vocabulario personalizado a su solicitud de identificación automática de idioma,
LanguageIdSettings
inclúyalo con los subparámetros pertinentes (VocabularyName
yVocabularyFilterName
). Si incluyeLanguageIdSettings
, incluya tambiénLanguageOptions
.Tenga en cuenta que debe incluir uno de
LanguageCode
IdentifyLanguage
, oIdentifyMultipleLanguages
en su solicitud. Si incluye más de uno de estos parámetros, se produce un error.Tipo: booleano
Obligatorio: no
- JobExecutionSettings
-
Permite controlar la forma en que se procesa el trabajo de transcripción. Actualmente, la única
JobExecutionSettings
modificación que puede elegir es habilitar la cola de trabajos mediante elAllowDeferredExecution
subparámetro.Si incluyes
JobExecutionSettings
en tu solicitud, también debes incluir los subparámetros:AllowDeferredExecution
yDataAccessRoleArn
.Tipo: objeto JobExecutionSettings
Obligatorio: no
- KMSEncryptionContext
-
Un mapa de pares clave-valor no secretos en texto plano, conocidos como pares de contextos de cifrado, que proporcionan una capa adicional de seguridad para los datos. Para obtener más información, consulte el contexto deAWS KMS cifrado y las claves asimétricas enAWS KMS.
Tipo: mapa de cadena a cadena
Entradas de mapa: número máximo de 10 elementos.
Limitaciones de longitud de la clave: longitud mínima de 1. La longitud máxima es de 2000 caracteres.
Patrón de clave:
.*\S.*
Limitaciones de longitud de los valores: longitud mínima de 1. La longitud máxima es de 2000 caracteres.
Patrón de valores:
.*\S.*
Obligatorio: no
- LanguageCode
-
El código de idioma que representa el idioma que se habla en el archivo multimedia de entrada.
Si no estás seguro del idioma que se habla en tu archivo multimedia, considera usar
IdentifyLanguage
oIdentifyMultipleLanguages
habilitar la identificación automática del idioma.Tenga en cuenta que debe incluir uno de
LanguageCode
IdentifyLanguage
, oIdentifyMultipleLanguages
en su solicitud. Si incluye más de uno de estos parámetros, se produce un error.Para obtener una lista de los idiomas admitidos y sus códigos de idioma asociados, consulte la tabla de idiomas admitidos.
nota
Para transcribir voz en árabe estándar moderno (
ar-SA
), el archivo multimedia debe estar codificado a una frecuencia de muestreo de 16 000 Hz o superior.Tipo: cadena
Valores válidos:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE
Obligatorio: no
- LanguageIdSettings
-
Si utiliza la identificación automática de idiomas en su solicitud y desea aplicar un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado,
LanguageIdSettings
inclúyalo con los subparámetros pertinentes (VocabularyName
,LanguageModelName
, yVocabularyFilterName
). Tenga en cuenta que la identificación multilingüe (IdentifyMultipleLanguages
) no admite modelos de idioma personalizados.LanguageIdSettings
admite códigos de dos a cinco idiomas. Cada código de idioma que incluya puede tener un modelo de idioma personalizado, un vocabulario personalizado y un filtro de vocabulario personalizado asociados. Los códigos de idioma que especifique deben coincidir con los idiomas de los modelos de idioma personalizados, los vocabularios personalizados y los filtros de vocabulario personalizados asociados.Se recomienda incluirlo
LanguageOptions
al usarloLanguageIdSettings
para garantizar que se identifique el dialecto del idioma correcto. Por ejemplo, si especifica un vocabulario personalizado,en-US
pero Amazon Transcribe determina que es el idioma que se habla en su contenido multimediaen-AU
, su vocabulario personalizado no se aplicará a la transcripción. Si incluyesLanguageOptions
een-US
incluyes como el único dialecto del idioma inglés, tu vocabulario personalizado se aplicará a tu transcripción.Si desea incluir un modelo de idioma personalizado en su solicitud, pero no desea utilizar la identificación automática de idioma, utilice en su lugar el
ModelSettings
parámetro con elLanguageModelName
subparámetro. Si desea incluir un vocabulario personalizado o un filtro de vocabulario personalizado (o ambos) en su solicitud, pero no desea utilizar la identificación automática de idiomas, utilice en su lugar elSettings
parámetro con el subparámetroVocabularyName
oVocabularyFilterName
(o ambos).Tipo: cadenaLanguageIdSettings al mapa
Entradas de mapa: número máximo de 5 elementos.
Claves válidas:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE
Obligatorio: no
- LanguageOptions
-
Puede especificar dos o más códigos de idioma que representen los idiomas que cree que pueden estar presentes en su contenido multimedia. No se recomienda incluir más de cinco. Si no estás seguro de qué idiomas están presentes, no incluyas este parámetro.
Si incluye
LanguageOptions
en su solicitud, también debe incluirIdentifyLanguage
.Para obtener más información, consulte Idiomas compatibles.
Para transcribir voz en árabe estándar moderno (
ar-SA
), el archivo multimedia debe estar codificado a una frecuencia de muestreo de 16 000 Hz o superior.Tipo: matriz de cadenas
Miembros de la matriz: número mínimo de 1 elemento.
Valores válidos:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE
Obligatorio: no
- Media
-
Describe la ubicación de Amazon S3 del archivo multimedia que desea usar en su solicitud.
Tipo: objeto Media
Obligatorio: sí
- MediaFormat
-
Especifique el formato del archivo multimedia de entrada.
Tipo: cadena
Valores válidos:
mp3 | mp4 | wav | flac | ogg | amr | webm
Obligatorio: no
- MediaSampleRateHertz
-
La frecuencia de muestreo, en hercios, de la pista de audio del archivo multimedia de entrada.
Si no especifica la frecuencia de muestreo del contenido, Amazon Transcribe la determina por usted. Si especifica la frecuencia de muestreo, debe coincidir con la frecuencia detectada por Amazon Transcribe. Si hay una discrepancia entre el valor que especificó y el valor detectado, se producirá un error en el trabajo. En la mayoría de los casos, puede omitir
MediaSampleRateHertz
y dejar que Amazon Transcribe determine la frecuencia de muestreo.Tipo: entero
Rango válido: valor mínimo de 8000. Valor máximo de 48000 caracteres.
Obligatorio: no
- ModelSettings
-
Especifica el modelo de idioma personalizado que deseas incluir en tu trabajo de transcripción. Si lo incluye
ModelSettings
en su solicitud, debe incluir elLanguageModelName
subparámetro.Para obtener más información, consulte Modelos de idioma personalizados.
Tipo: objeto ModelSettings
Obligatorio: no
- OutputBucketName
-
El nombre del bucket de Amazon S3 donde desea almacenar el resultado de la transcripción. No incluya el
S3://
prefijo del bucket especificado.Si desea que la salida vaya a una subcarpeta de este depósito, especifíquelo mediante el
OutputKey
parámetro;OutputBucketName
solo acepta el nombre de un depósito.Por ejemplo, si desea almacenar la salida en
S3://DOC-EXAMPLE-BUCKET
,OutputBucketName
configúrela enDOC-EXAMPLE-BUCKET
. Sin embargo, si desea almacenar la salida enS3://DOC-EXAMPLE-BUCKET/test-files/
,OutputBucketName
defina comoDOC-EXAMPLE-BUCKET
yOutputKey
comotest-files/
.Tenga en cuenta que Amazon Transcribe debe tener permiso para utilizar la ubicación especificada. Puede cambiar los permisos de Amazon S3 mediante AWS Management Console
. Consulte también Permisos necesarios para las funciones de usuario de IAM. Si no lo especificas
OutputBucketName
, la transcripción se coloca en un bucket de Amazon S3 administrado por el servicio y se te proporciona un URI para acceder a la transcripción.Tipo: cadena
Limitaciones de longitud: longitud máxima de 64 caracteres.
Patrón:
[a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]
Obligatorio: no
- OutputEncryptionKMSKeyId
-
La clave KMS que desea utilizar para cifrar el resultado de la transcripción.
Si utiliza una clave ubicada en la actualCuenta de AWS, puede especificar su clave de KMS de una de las cuatro maneras siguientes:
-
Utilice el identificador de clave de KMS propiamente dicho. Por ejemplo,
1234abcd-12ab-34cd-56ef-1234567890ab
. -
Utilice un alias para el ID de la clave de KMS. Por ejemplo,
alias/ExampleAlias
. -
Utilice Amazon (ARN) como ID de la clave de KMS. Por ejemplo,
arn:aws:kms:region:account-ID:key/1234abcd-12ab-34cd-56ef-1234567890ab
. -
Utilice el ARN como alias de la clave KMS. Por ejemplo,
arn:aws:kms:region:account-ID:alias/ExampleAlias
.
Si usa una clave ubicada en una ubicación Cuenta de AWSdiferente a la actualCuenta de AWS, puede especificar su clave de KMS de dos maneras:
-
Utilice el ARN para el ID de clave de KMS. Por ejemplo,
arn:aws:kms:region:account-ID:key/1234abcd-12ab-34cd-56ef-1234567890ab
. -
Utilice el ARN como alias de la clave KMS. Por ejemplo,
arn:aws:kms:region:account-ID:alias/ExampleAlias
.
Si no especifica una clave de cifrado, la salida se cifrará con la clave de Amazon S3 (SSE-S3) [Clave de Amazon S3 (SSE-S3)].
Si especifica una clave de KMS para cifrar la salida, también debe especificar una ubicación de salida mediante el
OutputLocation
parámetro.Tenga en cuenta que el rol que realiza laStartCallAnalyticsJob solicitud debe tener permiso para utilizar la clave KMS especificada.
Tipo: cadena
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 2048 caracteres.
Patrón:
^[A-Za-z0-9][A-Za-z0-9:_/+=,@.-]{0,2048}$
Obligatorio: no
-
- OutputKey
-
Úselo en combinación con
OutputBucketName
para especificar la ubicación de salida de la transcripción y, opcionalmente, un nombre único para el archivo de salida. El nombre predeterminado del resultado de la transcripción es el mismo que especificó para el trabajo de transcripción (TranscriptionJobName
).He aquí algunos ejemplos de cómo puede utilizar
OutputKey
:-
Si especifica 'DOC-EXAMPLE-BUCKET' como '
OutputBucketName
y' my-transcript.json 'comoOutputKey
, la ruta de salida de la transcripción ess3://DOC-EXAMPLE-BUCKET/my-transcript.json
. -
Si especifica «my-first-transcription» como
TranscriptionJobName
, «DOC-EXAMPLE-BUCKET» como y «my-transcription» comoOutputKey
, la ruta de salida de la transcripción ess3://DOC-EXAMPLE-BUCKET/my-transcript/my-first-transcription.json
.OutputBucketName
-
Si especifica 'DOC-EXAMPLE-BUCKET' como '
OutputBucketName
y' test-files/my-transcript.json 'comoOutputKey
, la ruta de salida de la transcripción ess3://DOC-EXAMPLE-BUCKET/test-files/my-transcript.json
. -
Si especifica «my-first-transcription» como
TranscriptionJobName
, «DOC-EXAMPLE-BUCKET» como y «test-files/my-transcript» comoOutputKey
, la ruta de salida de la transcripción ess3://DOC-EXAMPLE-BUCKET/test-files/my-transcript/my-first-transcription.json
.OutputBucketName
Si especifica el nombre de una subcarpeta de bucket de Amazon S3 que no existe, se crea una para usted.
Tipo: cadena
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 1024 caracteres.
Patrón:
[a-zA-Z0-9-_.!*'()/]{1,1024}$
Obligatorio: no
-
- Settings
-
Especifique ajustes opcionales adicionales en suStartTranscriptionJob solicitud, incluida la identificación de canales, las transcripciones alternativas y la partición de los altavoces. Puede usarlo para aplicar vocabularios y filtros de vocabulario personalizados.
Si quieres incluir un vocabulario personalizado o un filtro de vocabulario personalizado (o ambos) en tu solicitud, pero no quieres utilizar la identificación automática de idiomas,
Settings
utilízalo con el subparámetroVocabularyName
oVocabularyFilterName
(o ambos).Si utilizas la identificación automática de idiomas en tu solicitud y quieres incluir un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado, utiliza en su lugar el
LanguageIdSettings
parámetro conVocabularyFilterName
los subparámetrosVocabularyName
o.LanguageModelName
Tipo: objeto Settings
Obligatorio: no
- Subtitles
-
Produce archivos de subtítulos para los medios de entrada. Puede especificar los formatos WebVTT (*.vtt) y SubRip (*.srt).
Tipo: objeto Subtitles
Obligatorio: no
- Tags
-
Añade una o más etiquetas personalizadas, cada una en forma de par clave:valor, a un nuevo trabajo de transcripción al iniciar este nuevo trabajo.
Para obtener más información sobre cómo usar etiquetas con Amazon Transcribe, consulte Encryption (Recursos de etiquetado).
Tipo: Matriz de objetos Tag
Miembros de la matriz: número mínimo de 1 elemento. Número máximo de 200 elementos.
Obligatorio: no
- TranscriptionJobName
-
Un nombre único, elegido por usted, para su trabajo de transcripción. El nombre que especifique también se utilizará como nombre predeterminado del archivo de salida de la transcripción. Si desea especificar un nombre diferente para el resultado de la transcripción, utilice el
OutputKey
parámetro.Este nombre distingue entre mayúsculas y minúsculas, no puede contener espacios y debe ser único dentro de unCuenta de AWS. Si intenta crear un trabajo nuevo con el mismo nombre que un trabajo existente,
ConflictException
aparece un error.Tipo: cadena
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
Obligatorio: sí
Sintaxis de la respuesta
{
"TranscriptionJob": {
"CompletionTime": number,
"ContentRedaction": {
"PiiEntityTypes": [ "string" ],
"RedactionOutput": "string",
"RedactionType": "string"
},
"CreationTime": number,
"FailureReason": "string",
"IdentifiedLanguageScore": number,
"IdentifyLanguage": boolean,
"IdentifyMultipleLanguages": boolean,
"JobExecutionSettings": {
"AllowDeferredExecution": boolean,
"DataAccessRoleArn": "string"
},
"LanguageCode": "string",
"LanguageCodes": [
{
"DurationInSeconds": number,
"LanguageCode": "string"
}
],
"LanguageIdSettings": {
"string" : {
"LanguageModelName": "string",
"VocabularyFilterName": "string",
"VocabularyName": "string"
}
},
"LanguageOptions": [ "string" ],
"Media": {
"MediaFileUri": "string",
"RedactedMediaFileUri": "string"
},
"MediaFormat": "string",
"MediaSampleRateHertz": number,
"ModelSettings": {
"LanguageModelName": "string"
},
"Settings": {
"ChannelIdentification": boolean,
"MaxAlternatives": number,
"MaxSpeakerLabels": number,
"ShowAlternatives": boolean,
"ShowSpeakerLabels": boolean,
"VocabularyFilterMethod": "string",
"VocabularyFilterName": "string",
"VocabularyName": "string"
},
"StartTime": number,
"Subtitles": {
"Formats": [ "string" ],
"OutputStartIndex": number,
"SubtitleFileUris": [ "string" ]
},
"Tags": [
{
"Key": "string",
"Value": "string"
}
],
"Transcript": {
"RedactedTranscriptFileUri": "string",
"TranscriptFileUri": "string"
},
"TranscriptionJobName": "string",
"TranscriptionJobStatus": "string"
}
}
Elementos de respuesta
Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.
El servicio devuelve los datos siguientes en formato JSON.
- TranscriptionJob
-
Proporciona información detallada sobre el trabajo de transcripción actual, incluido el estado del trabajo y, si corresponde, el motivo del fracaso.
Tipo: objeto TranscriptionJob
Errores
Para obtener información sobre los errores comunes a todas las acciones, consulteErrores comunes.
- BadRequestException
-
Tu solicitud no ha superado una o más pruebas de validación. Esto puede ocurrir cuando la entidad que intentas eliminar no existe o si se encuentra en un estado no terminal (por ejemplo
IN PROGRESS
). Para obtener más información, consulte el campo del mensaje de excepción para obtener más información.Código de estado HTTP: 400
- ConflictException
-
Ya existe un recurso con este nombre. Los nombres de recurso deben ser únicos dentro de unCuenta de AWS.
Código de estado HTTP: 400
- InternalFailureException
-
Se produjo un error interno. Compruebe el mensaje de error, corrija el problema e intente realizar la solicitud de nuevo.
Código de estado HTTP: 500
- LimitExceededException
-
Has enviado demasiadas solicitudes o tu archivo de entrada es demasiado largo. Espere antes de volver a intentar la solicitud o utilice un archivo más pequeño y vuelva a intentarlo.
Código de estado HTTP: 400
Véase también
Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: