Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
CreateLanguageModel
Crea un nuevo modelo de idioma personalizado.
Al crear un nuevo modelo de idioma personalizado, debe especificar:
-
Si desea un modelo base de banda ancha (frecuencias de muestreo de audio superiores a 16.000 Hz) o banda estrecha (frecuencias de muestreo de audio inferiores a 16.000 Hz)
-
La ubicación de sus archivos de entrenamiento y ajuste (debe ser un URI de Amazon S3)
-
El idioma de su modelo
-
Un nombre único para su modelo
Para obtener más información, consulte Modelos de idioma personalizados.
Sintaxis de la solicitud
{
"BaseModelName": "string
",
"InputDataConfig": {
"DataAccessRoleArn": "string
",
"S3Uri": "string
",
"TuningDataS3Uri": "string
"
},
"LanguageCode": "string
",
"ModelName": "string
",
"Tags": [
{
"Key": "string
",
"Value": "string
"
}
]
}
Parámetros de solicitud
Para obtener información sobre los parámetros comunes a todas las acciones, consulte Parámetros comunes.
La solicitud acepta los siguientes datos en formato JSON.
- BaseModelName
-
El modelo de idioma estándar de Amazon Transcribe, o modelo base, que se utiliza para crear su modelo de idioma personalizado. Amazon Transcribe ofrece dos opciones para los modelos base: banda ancha y banda estrecha.
Si el audio que desea transcribir tiene una frecuencia de muestreo de 16.000 Hz o superior, elija
WideBand
. Para transcribir audio con una frecuencia de muestreo inferior a 16.000 Hz, seleccioneNarrowBand
.Tipo: cadena
Valores válidos:
NarrowBand | WideBand
Obligatorio: sí
- InputDataConfig
-
Contiene la ubicación de Amazon S3 de los datos de entrenamiento que desea usar para crear un nuevo modelo de idioma personalizado y los permisos para acceder a esta ubicación.
Al usarlos
InputDataConfig
, debe incluir estos subparámetros:S3Uri
, que es la ubicación de Amazon S3 de sus datos de entrenamiento yDataAccessRoleArn
que es el nombre del recurso de Amazon (ARN) del rol que tiene permiso para acceder a la ubicación de Amazon S3 especificada. Si lo deseaTuningDataS3Uri
, puede incluir la ubicación de Amazon S3 de sus datos de ajuste. Si especifica diferentes ubicaciones de Amazon S3 para los datos de entrenamiento y ajuste, el ARN que utilice debe tener permisos para acceder a ambas ubicaciones.Tipo: objeto InputDataConfig
Obligatorio: sí
- LanguageCode
-
El código de idioma que representa el idioma del modelo. Cada modelo de idioma personalizado debe contener términos en un solo idioma, y el idioma que selecciones para tu modelo de idioma personalizado debe coincidir con el idioma de tus datos de entrenamiento y ajuste.
Para obtener una lista de los idiomas admitidos y sus códigos de idioma asociados, consulte la tabla de idiomas admitidos. Tenga en cuenta que el inglés estadounidense (
en-US
) es el único idioma admitido en Amazon Transcribe Medical.Un modelo de idioma personalizado solo se puede utilizar para transcribir archivos en el mismo idioma que el modelo. Por ejemplo, si crea un modelo de idioma personalizado con inglés estadounidense (
en-US
), solo puede aplicar este modelo a los archivos que contengan audio en inglés.Tipo: cadena
Valores válidos:
en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP
Obligatorio: sí
- ModelName
-
Un nombre único, elegido por usted, para su modelo de idioma personalizado.
Este nombre distingue entre mayúsculas y minúsculas, no puede contener espacios y debe ser único dentro de unCuenta de AWS. Si intenta crear un nuevo modelo de idioma personalizado con el mismo nombre que un modelo de idioma personalizado existente,
ConflictException
aparece un error.Tipo: cadena
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
Obligatorio: sí
- Tags
-
Añade una o más etiquetas personalizadas, cada una en forma de par clave:valor, a un nuevo modelo de idioma personalizado al crear este nuevo modelo.
Para obtener más información sobre cómo usar etiquetas con Amazon Transcribe, consulte Recursos de etiquetado.
Tipo: Matriz de objetos Tag
Miembros de la matriz: número mínimo de 1 elemento. Número máximo de 200 elementos.
Obligatorio: no
Sintaxis de la respuesta
{
"BaseModelName": "string",
"InputDataConfig": {
"DataAccessRoleArn": "string",
"S3Uri": "string",
"TuningDataS3Uri": "string"
},
"LanguageCode": "string",
"ModelName": "string",
"ModelStatus": "string"
}
Elementos de respuesta
Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.
El servicio devuelve los datos siguientes en formato JSON.
- BaseModelName
-
El modelo de idioma estándar de Amazon Transcribe, o modelo base, que especificó al crear su modelo de idioma personalizado.
Tipo: cadena
Valores válidos:
NarrowBand | WideBand
- InputDataConfig
-
Muestra el ARN (nombre de recurso de Amazon) de su rol de acceso a datos y las ubicaciones de Amazon S3 que proporcionó para sus datos de entrenamiento (
S3Uri
) y ajuste (TuningDataS3Uri
).Tipo: objeto InputDataConfig
- LanguageCode
-
El código de idioma que seleccionó para su modelo de idioma personalizado.
Tipo: cadena
Valores válidos:
en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP
- ModelName
-
El nombre del modelo de idioma personalizado.
Tipo: cadena
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
- ModelStatus
-
El estado de su modelo de idioma personalizado. Cuando el estado se muestre como
COMPLETED
, su modelo está listo para usar.Tipo: cadena
Valores válidos:
IN_PROGRESS | FAILED | COMPLETED
Errores
Para obtener información sobre los errores comunes a todas las acciones, consulteErrores comunes.
- BadRequestException
-
Tu solicitud no ha superado una o más pruebas de validación. Esto puede ocurrir cuando la entidad que intentas eliminar no existe o si se encuentra en un estado no terminal (por ejemplo
IN PROGRESS
). Para obtener más información, consulte el campo de mensaje de excepción.Código de estado HTTP: 400
- ConflictException
-
Ya existe un recurso con este nombre. Los nombres de recurso deben ser únicos dentro deCuenta de AWS.
Código de estado HTTP: 400
- InternalFailureException
-
Se produjo un error interno. Compruebe el mensaje de error, corrija el problema e intente realizar su solicitud de nuevo.
Código de estado HTTP: 500
- LimitExceededException
-
Has enviado demasiadas solicitudes o tu archivo de entrada es demasiado largo. Espere antes de volver a intentar la solicitud o utilice un archivo más pequeño y vuelva a intentarlo.
Código de estado HTTP: 400
Véase también
Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: