CreateVocabulary - Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

CreateVocabulary

Crea un vocabulario personalizado.

Al crear un nuevo vocabulario personalizado, puede cargar un archivo de texto que contenga sus nuevas entradas, frases y términos en un bucket de Amazon S3 e incluir el URI en su solicitud. O puedes incluir una lista de términos directamente en tu solicitud utilizando laPhrases bandera.

Cada idioma tiene un conjunto de caracteres que contiene todos los caracteres permitidos para ese idioma específico. Si utilizas caracteres no compatibles, se producirá un error en tu solicitud de vocabulario personalizado. Consulte Conjuntos de caracteres para obtener vocabulario personalizado para obtener el conjunto de caracteres de su idioma.

Para obtener más información, consulte Vocabularios personalizados.

Sintaxis de la solicitud

{ "LanguageCode": "string", "Phrases": [ "string" ], "Tags": [ { "Key": "string", "Value": "string" } ], "VocabularyFileUri": "string", "VocabularyName": "string" }

Parámetros de solicitud

Para obtener información sobre los parámetros comunes a todas las acciones, consulte Parámetros comunes.

La solicitud acepta los siguientes datos en formato JSON.

LanguageCode

El código de idioma que representa el idioma de las entradas del vocabulario personalizado. Cada vocabulario personalizado debe contener términos en un solo idioma.

Un vocabulario personalizado solo se puede usar para transcribir archivos en el mismo idioma que el vocabulario personalizado. Por ejemplo, si crea un vocabulario personalizado con inglés estadounidense (en-US), solo puede aplicar este vocabulario personalizado a archivos que contengan audio en inglés.

Para obtener una lista de los idiomas admitidos y sus códigos de idioma asociados, consulte la tabla de idiomas admitidos.

Tipo: cadena

Valores válidos: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Obligatorio: sí

Phrases

Utilice este parámetro si desea crear su vocabulario personalizado incluyendo todos los términos deseados, como valores separados por comas, en su solicitud. La otra opción para crear su vocabulario personalizado consiste en guardar las entradas en un archivo de texto y subirlas a un bucket de Amazon S3 y, a continuación, especificar la ubicación del archivo mediante elVocabularyFileUri parámetro.

Tenga en cuenta que si lo incluyePhrases en su solicitud, no puede usarloVocabularyFileUri; debe elegir uno u otro.

Cada idioma tiene un conjunto de caracteres que contiene todos los caracteres permitidos para ese idioma específico. Si utilizas caracteres no admitidos, fallará tu solicitud de filtro de vocabulario personalizado. Consulte Conjuntos de caracteres para obtener vocabulario personalizado para obtener el conjunto de caracteres de su idioma.

Tipo: matriz de cadenas

Limitaciones de longitud: longitud mínima de 0. La longitud máxima es de 256 caracteres.

Patrón: .+

Obligatorio: no

Tags

Añade una o más etiquetas personalizadas, cada una en forma de par clave:valor, a un vocabulario personalizado nuevo al crear este nuevo vocabulario personalizado.

Para obtener más información sobre cómo usar etiquetas de para usar etiquetas de para usar Amazon Transcribe etiquetas de para usar etiquetas de para usar etiquetas de para usar etiquetas de para usar

Tipo: Matriz de objetos Tag

Miembros de la matriz: número mínimo de 1 elemento. Número máximo de 200 elementos.

Obligatorio: no

VocabularyFileUri

La ubicación de Amazon S3 del archivo de texto que contiene su vocabulario personalizado. La URI debe encontrarse en laRegión de AWS misma que el recurso al que llama.

A continuación se muestra un ejemplo de ruta de URI:s3://DOC-EXAMPLE-BUCKET/my-vocab-file.txt

Tenga en cuenta que si lo incluyeVocabularyFileUri en su solicitud, no puedePhrases usar la marca; debe elegir una u otra.

Tipo: cadena

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 2000 caracteres.

Patrón: (s3://|http(s*)://).+

Obligatorio: no

VocabularyName

Un nombre único, elegido por ti, para tu nuevo vocabulario personalizado.

Este nombre distingue entre mayúsculas y minúsculas, no puede contener espacios y debe ser único dentro de unCuenta de AWS. Si intentas crear un nuevo vocabulario personalizado con el mismo nombre que un vocabulario personalizado existente,ConflictException aparece un error.

Tipo: cadena

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

Obligatorio: sí

Sintaxis de la respuesta

{ "FailureReason": "string", "LanguageCode": "string", "LastModifiedTime": number, "VocabularyName": "string", "VocabularyState": "string" }

Elementos de respuesta

Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.

El servicio devuelve los datos siguientes en formato JSON.

FailureReason

SiVocabularyState es asíFAILED,FailureReason contiene información sobre por qué falló la solicitud de vocabulario personalizado. Consulte también: Errores comunes.

Tipo: cadena

LanguageCode

El código de idioma que seleccionaste para tu vocabulario personalizado.

Tipo: cadena

Valores válidos: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

LastModifiedTime

La fecha y la hora en que creaste tu vocabulario personalizado.

Las marcas de tiempo están en el formatoYYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTC. Por ejemplo,2022-05-04T12:32:58.761000-07:00 representa a las 12:32 p. m., hora peninsular española, del 4 de mayo de 2022.

Tipo: marca temporal

VocabularyName

El nombre que elegiste para tu vocabulario personalizado.

Tipo: cadena

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

VocabularyState

El estado de procesamiento de tu vocabulario personalizado. Si el estado lo esREADY, puedes usar el vocabulario personalizado en unaStartTranscriptionJob solicitud.

Tipo: cadena

Valores válidos: PENDING | READY | FAILED

Errores

Para obtener información sobre los errores comunes a todas las acciones, consulteErrores comunes.

BadRequestException

Tu solicitud no ha superado una o más pruebas de validación. Esto puede ocurrir cuando la entidad que intentas eliminar no existe o si se encuentra en un estado no terminal (por ejemploIN PROGRESS). Para obtener más información, consulte el campo de mensaje de excepción.

Código de estado HTTP: 400

ConflictException

Ya existe un recurso con este nombre. Los nombres de recursos deben ser únicos dentro de unCuenta de AWS.

Código de estado HTTP: 400

InternalFailureException

Se produjo un error interno. Compruebe el mensaje de error, corrija el problema e intente realizar la solicitud de nuevo.

Código de estado HTTP: 500

LimitExceededException

Has enviado demasiadas solicitudes o tu archivo de entrada es demasiado largo. Espere antes de volver a intentar la solicitud o utilice un archivo más pequeño y vuelva a intentarlo.

Código de estado HTTP: 400

Véase también

Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: