CreateLanguageModel - Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

CreateLanguageModel

Crea un nuevo modelo de idioma personalizado.

Al crear un nuevo modelo de idioma personalizado, debe especificar:

  • Si desea un modelo base de banda ancha (frecuencias de muestreo de audio superiores a 16.000 Hz) o banda estrecha (frecuencias de muestreo de audio inferiores a 16.000 Hz)

  • La ubicación de sus archivos de entrenamiento y ajuste (debe ser un URI de Amazon S3)

  • El idioma de su modelo

  • Un nombre único para su modelo

Para obtener más información, consulte Modelos de idioma personalizados.

Sintaxis de la solicitud

{ "BaseModelName": "string", "InputDataConfig": { "DataAccessRoleArn": "string", "S3Uri": "string", "TuningDataS3Uri": "string" }, "LanguageCode": "string", "ModelName": "string", "Tags": [ { "Key": "string", "Value": "string" } ] }

Parámetros de solicitud

Para obtener información sobre los parámetros comunes a todas las acciones, consulte Parámetros comunes.

La solicitud acepta los siguientes datos en formato JSON.

BaseModelName

El modelo de idioma estándar de Amazon Transcribe, o modelo base, que se utiliza para crear su modelo de idioma personalizado. Amazon Transcribe ofrece dos opciones para los modelos base: banda ancha y banda estrecha.

Si el audio que desea transcribir tiene una frecuencia de muestreo de 16.000 Hz o superior, elijaWideBand. Para transcribir audio con una frecuencia de muestreo inferior a 16.000 Hz, seleccioneNarrowBand.

Tipo: cadena

Valores válidos: NarrowBand | WideBand

Obligatorio: sí

InputDataConfig

Contiene la ubicación de Amazon S3 de los datos de entrenamiento que desea usar para crear un nuevo modelo de idioma personalizado y los permisos para acceder a esta ubicación.

Al usarlosInputDataConfig, debe incluir estos subparámetros:S3Uri, que es la ubicación de Amazon S3 de sus datos de entrenamiento yDataAccessRoleArn que es el nombre del recurso de Amazon (ARN) del rol que tiene permiso para acceder a la ubicación de Amazon S3 especificada. Si lo deseaTuningDataS3Uri, puede incluir la ubicación de Amazon S3 de sus datos de ajuste. Si especifica diferentes ubicaciones de Amazon S3 para los datos de entrenamiento y ajuste, el ARN que utilice debe tener permisos para acceder a ambas ubicaciones.

Tipo: objeto InputDataConfig

Obligatorio: sí

LanguageCode

El código de idioma que representa el idioma del modelo. Cada modelo de idioma personalizado debe contener términos en un solo idioma, y el idioma que selecciones para tu modelo de idioma personalizado debe coincidir con el idioma de tus datos de entrenamiento y ajuste.

Para obtener una lista de los idiomas admitidos y sus códigos de idioma asociados, consulte la tabla de idiomas admitidos. Tenga en cuenta que el inglés estadounidense (en-US) es el único idioma admitido en Amazon Transcribe Medical.

Un modelo de idioma personalizado solo se puede utilizar para transcribir archivos en el mismo idioma que el modelo. Por ejemplo, si crea un modelo de idioma personalizado con inglés estadounidense (en-US), solo puede aplicar este modelo a los archivos que contengan audio en inglés.

Tipo: cadena

Valores válidos: en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP

Obligatorio: sí

ModelName

Un nombre único, elegido por usted, para su modelo de idioma personalizado.

Este nombre distingue entre mayúsculas y minúsculas, no puede contener espacios y debe ser único dentro de unCuenta de AWS. Si intenta crear un nuevo modelo de idioma personalizado con el mismo nombre que un modelo de idioma personalizado existente,ConflictException aparece un error.

Tipo: cadena

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

Obligatorio: sí

Tags

Añade una o más etiquetas personalizadas, cada una en forma de par clave:valor, a un nuevo modelo de idioma personalizado al crear este nuevo modelo.

Para obtener más información sobre cómo usar etiquetas con Amazon Transcribe, consulte Recursos de etiquetado.

Tipo: Matriz de objetos Tag

Miembros de la matriz: número mínimo de 1 elemento. Número máximo de 200 elementos.

Obligatorio: no

Sintaxis de la respuesta

{ "BaseModelName": "string", "InputDataConfig": { "DataAccessRoleArn": "string", "S3Uri": "string", "TuningDataS3Uri": "string" }, "LanguageCode": "string", "ModelName": "string", "ModelStatus": "string" }

Elementos de respuesta

Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.

El servicio devuelve los datos siguientes en formato JSON.

BaseModelName

El modelo de idioma estándar de Amazon Transcribe, o modelo base, que especificó al crear su modelo de idioma personalizado.

Tipo: cadena

Valores válidos: NarrowBand | WideBand

InputDataConfig

Muestra el ARN (nombre de recurso de Amazon) de su rol de acceso a datos y las ubicaciones de Amazon S3 que proporcionó para sus datos de entrenamiento (S3Uri) y ajuste (TuningDataS3Uri).

Tipo: objeto InputDataConfig

LanguageCode

El código de idioma que seleccionó para su modelo de idioma personalizado.

Tipo: cadena

Valores válidos: en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP

ModelName

El nombre del modelo de idioma personalizado.

Tipo: cadena

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

ModelStatus

El estado de su modelo de idioma personalizado. Cuando el estado se muestre comoCOMPLETED, su modelo está listo para usar.

Tipo: cadena

Valores válidos: IN_PROGRESS | FAILED | COMPLETED

Errores

Para obtener información sobre los errores comunes a todas las acciones, consulteErrores comunes.

BadRequestException

Tu solicitud no ha superado una o más pruebas de validación. Esto puede ocurrir cuando la entidad que intentas eliminar no existe o si se encuentra en un estado no terminal (por ejemploIN PROGRESS). Para obtener más información, consulte el campo de mensaje de excepción.

Código de estado HTTP: 400

ConflictException

Ya existe un recurso con este nombre. Los nombres de recurso deben ser únicos dentro deCuenta de AWS.

Código de estado HTTP: 400

InternalFailureException

Se produjo un error interno. Compruebe el mensaje de error, corrija el problema e intente realizar su solicitud de nuevo.

Código de estado HTTP: 500

LimitExceededException

Has enviado demasiadas solicitudes o tu archivo de entrada es demasiado largo. Espere antes de volver a intentar la solicitud o utilice un archivo más pequeño y vuelva a intentarlo.

Código de estado HTTP: 400

Véase también

Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: