Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
CreateVocabulary
Crea un vocabulario personalizado.
Al crear un nuevo vocabulario personalizado, puede cargar un archivo de texto que contenga sus nuevas entradas, frases y términos en un bucket de Amazon S3 e incluir el URI en su solicitud. O puedes incluir una lista de términos directamente en tu solicitud utilizando laPhrases
bandera.
Cada idioma tiene un conjunto de caracteres que contiene todos los caracteres permitidos para ese idioma específico. Si utilizas caracteres no compatibles, se producirá un error en tu solicitud de vocabulario personalizado. Consulte Conjuntos de caracteres para obtener vocabulario personalizado para obtener el conjunto de caracteres de su idioma.
Para obtener más información, consulte Vocabularios personalizados.
Sintaxis de la solicitud
{
"LanguageCode": "string
",
"Phrases": [ "string
" ],
"Tags": [
{
"Key": "string
",
"Value": "string
"
}
],
"VocabularyFileUri": "string
",
"VocabularyName": "string
"
}
Parámetros de solicitud
Para obtener información sobre los parámetros comunes a todas las acciones, consulte Parámetros comunes.
La solicitud acepta los siguientes datos en formato JSON.
- LanguageCode
-
El código de idioma que representa el idioma de las entradas del vocabulario personalizado. Cada vocabulario personalizado debe contener términos en un solo idioma.
Un vocabulario personalizado solo se puede usar para transcribir archivos en el mismo idioma que el vocabulario personalizado. Por ejemplo, si crea un vocabulario personalizado con inglés estadounidense (
en-US
), solo puede aplicar este vocabulario personalizado a archivos que contengan audio en inglés.Para obtener una lista de los idiomas admitidos y sus códigos de idioma asociados, consulte la tabla de idiomas admitidos.
Tipo: cadena
Valores válidos:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE
Obligatorio: sí
- Phrases
-
Utilice este parámetro si desea crear su vocabulario personalizado incluyendo todos los términos deseados, como valores separados por comas, en su solicitud. La otra opción para crear su vocabulario personalizado consiste en guardar las entradas en un archivo de texto y subirlas a un bucket de Amazon S3 y, a continuación, especificar la ubicación del archivo mediante el
VocabularyFileUri
parámetro.Tenga en cuenta que si lo incluye
Phrases
en su solicitud, no puede usarloVocabularyFileUri
; debe elegir uno u otro.Cada idioma tiene un conjunto de caracteres que contiene todos los caracteres permitidos para ese idioma específico. Si utilizas caracteres no admitidos, fallará tu solicitud de filtro de vocabulario personalizado. Consulte Conjuntos de caracteres para obtener vocabulario personalizado para obtener el conjunto de caracteres de su idioma.
Tipo: matriz de cadenas
Limitaciones de longitud: longitud mínima de 0. La longitud máxima es de 256 caracteres.
Patrón:
.+
Obligatorio: no
- Tags
-
Añade una o más etiquetas personalizadas, cada una en forma de par clave:valor, a un vocabulario personalizado nuevo al crear este nuevo vocabulario personalizado.
Para obtener más información sobre cómo usar etiquetas de para usar etiquetas de para usar Amazon Transcribe etiquetas de para usar etiquetas de para usar etiquetas de para usar etiquetas de para usar
Tipo: Matriz de objetos Tag
Miembros de la matriz: número mínimo de 1 elemento. Número máximo de 200 elementos.
Obligatorio: no
- VocabularyFileUri
-
La ubicación de Amazon S3 del archivo de texto que contiene su vocabulario personalizado. La URI debe encontrarse en laRegión de AWS misma que el recurso al que llama.
A continuación se muestra un ejemplo de ruta de URI:
s3://DOC-EXAMPLE-BUCKET/my-vocab-file.txt
Tenga en cuenta que si lo incluye
VocabularyFileUri
en su solicitud, no puedePhrases
usar la marca; debe elegir una u otra.Tipo: cadena
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 2000 caracteres.
Patrón:
(s3://|http(s*)://).+
Obligatorio: no
- VocabularyName
-
Un nombre único, elegido por ti, para tu nuevo vocabulario personalizado.
Este nombre distingue entre mayúsculas y minúsculas, no puede contener espacios y debe ser único dentro de unCuenta de AWS. Si intentas crear un nuevo vocabulario personalizado con el mismo nombre que un vocabulario personalizado existente,
ConflictException
aparece un error.Tipo: cadena
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
Obligatorio: sí
Sintaxis de la respuesta
{
"FailureReason": "string",
"LanguageCode": "string",
"LastModifiedTime": number,
"VocabularyName": "string",
"VocabularyState": "string"
}
Elementos de respuesta
Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.
El servicio devuelve los datos siguientes en formato JSON.
- FailureReason
-
Si
VocabularyState
es asíFAILED
,FailureReason
contiene información sobre por qué falló la solicitud de vocabulario personalizado. Consulte también: Errores comunes.Tipo: cadena
- LanguageCode
-
El código de idioma que seleccionaste para tu vocabulario personalizado.
Tipo: cadena
Valores válidos:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE
- LastModifiedTime
-
La fecha y la hora en que creaste tu vocabulario personalizado.
Las marcas de tiempo están en el formato
YYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTC
. Por ejemplo,2022-05-04T12:32:58.761000-07:00
representa a las 12:32 p. m., hora peninsular española, del 4 de mayo de 2022.Tipo: marca temporal
- VocabularyName
-
El nombre que elegiste para tu vocabulario personalizado.
Tipo: cadena
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
- VocabularyState
-
El estado de procesamiento de tu vocabulario personalizado. Si el estado lo es
READY
, puedes usar el vocabulario personalizado en unaStartTranscriptionJob
solicitud.Tipo: cadena
Valores válidos:
PENDING | READY | FAILED
Errores
Para obtener información sobre los errores comunes a todas las acciones, consulteErrores comunes.
- BadRequestException
-
Tu solicitud no ha superado una o más pruebas de validación. Esto puede ocurrir cuando la entidad que intentas eliminar no existe o si se encuentra en un estado no terminal (por ejemplo
IN PROGRESS
). Para obtener más información, consulte el campo de mensaje de excepción.Código de estado HTTP: 400
- ConflictException
-
Ya existe un recurso con este nombre. Los nombres de recursos deben ser únicos dentro de unCuenta de AWS.
Código de estado HTTP: 400
- InternalFailureException
-
Se produjo un error interno. Compruebe el mensaje de error, corrija el problema e intente realizar la solicitud de nuevo.
Código de estado HTTP: 500
- LimitExceededException
-
Has enviado demasiadas solicitudes o tu archivo de entrada es demasiado largo. Espere antes de volver a intentar la solicitud o utilice un archivo más pequeño y vuelva a intentarlo.
Código de estado HTTP: 400
Véase también
Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: