CreateLanguageModel - Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

CreateLanguageModel

Crée un modèle de langue personnalisé.

Lorsque vous créez un modèle de langue personnalisé, vous devez spécifier :

  • Si vous souhaitez un modèle de base à large bande (fréquences d'échantillonnage audio supérieures à 16 000 Hz) ou à bande étroite (fréquences d'échantillonnage audio inférieures à 16 000 Hz)

  • L'emplacement de vos fichiers d'entraînement et de réglage (il doit s'agir d'un URI Amazon S3)

  • Langue de votre modèle

  • Nom unique de votre modèle

Pour de plus amples informations, veuillez consulter Modèles de langue personnalisés.

Syntaxe de la requête

{ "BaseModelName": "string", "InputDataConfig": { "DataAccessRoleArn": "string", "S3Uri": "string", "TuningDataS3Uri": "string" }, "LanguageCode": "string", "ModelName": "string", "Tags": [ { "Key": "string", "Value": "string" } ] }

Paramètres de demande

Pour plus d'informations sur les paramètres communs à toutes les actions, voir Paramètres communs.

Cette demande accepte les données suivantes au format JSON.

BaseModelName

Le modèle de langue standard Amazon Transcribe, ou modèle de base, utilisé pour créer votre modèle linguistique personnalisé. Amazon Transcribe propose deux options pour les modèles de base : large bande et bande étroite.

Si le son que vous souhaitez transcrire a une fréquence d'échantillonnage de 16 000 Hz ou plus, choisissezWideBand. Pour transcrire du son avec une fréquence d'échantillonnage inférieure à 16 000 Hz, choisissezNarrowBand.

Type : String

Valeurs valides : NarrowBand | WideBand

Obligatoire : oui

InputDataConfig

Contient l'emplacement Amazon S3 des données de formation que vous souhaitez utiliser pour créer un nouveau modèle linguistique personnalisé, ainsi que les autorisations d'accès à cet emplacement.

Lors de l'utilisationInputDataConfig, vous devez inclure les sous-paramètres suivants :S3Uri, qui est l'emplacement Amazon S3 de vos données d'entraînement etDataAccessRoleArn, qui est le nom de ressource Amazon (ARN) du rôle autorisé à accéder à l'emplacement Amazon S3 que vous avez spécifié. Vous pouvez éventuellement inclureTuningDataS3Uri l'emplacement Amazon S3 de vos données de réglage. Si vous spécifiez différents emplacements Amazon S3 pour les données d'entraînement et de réglage, l'ARN que vous utilisez doit être autorisé à accéder aux deux emplacements.

Type : objet InputDataConfig

Obligatoire : oui

LanguageCode

Code de langue qui représente la langue de votre modèle. Chaque modèle linguistique personnalisé doit contenir des termes dans une seule langue, et la langue que vous sélectionnez pour votre modèle linguistique personnalisé doit correspondre à la langue de vos données d'entraînement et de réglage.

Pour obtenir la liste des langues prises en charge et leurs codes de langue associés, consultez le tableau des langues prises en charge. Notez que l'anglais américain (en-US) est la seule langue prise en charge par Amazon Transcribe Medical.

Un modèle linguistique personnalisé ne peut être utilisé que pour transcrire des fichiers dans la même langue que le modèle. Par exemple, si vous créez un modèle linguistique personnalisé à l'aide de l'anglais américain (en-US), vous ne pouvez appliquer ce modèle qu'aux fichiers contenant du son en anglais.

Type : String

Valeurs valides : en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP

Obligatoire : oui

ModelName

Un nom unique, que vous avez choisi, pour votre modèle linguistique personnalisé.

Ce nom distingue les majuscules, ne peut pas contenir d'espaces et doit être unique au sein d'unCompte AWS. Si vous essayez de créer un nouveau modèle de langage personnalisé portant le même nom qu'un modèle de langage personnalisé existant, vous obtenez uneConflictException erreur.

Type : String

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[0-9a-zA-Z._-]+

Obligatoire : oui

Tags

Ajoute une ou plusieurs balises personnalisées, chacune sous la forme d'une paire clé:valeur, à un nouveau modèle de langage personnalisé au moment où vous créez ce nouveau modèle.

Pour en savoir plus sur l'utilisation des balises avec Amazon Transcribe, consultez Ressources sur le balisage.

Type : tableau d’objets Tag

Membres du tableau : Nombre minimum de 1 élément. Nombre maximal de 200 éléments.

Obligatoire : non

Syntaxe de la réponse

{ "BaseModelName": "string", "InputDataConfig": { "DataAccessRoleArn": "string", "S3Uri": "string", "TuningDataS3Uri": "string" }, "LanguageCode": "string", "ModelName": "string", "ModelStatus": "string" }

Eléments de réponse

Si l'action aboutit, le service renvoie une réponse HTTP 200.

Les données suivantes sont renvoyées au format JSON par le service.

BaseModelName

Le modèle de langue standard Amazon Transcribe, ou modèle de base, que vous avez spécifié lors de la création de votre modèle linguistique personnalisé.

Type : String

Valeurs valides : NarrowBand | WideBand

InputDataConfig

Répertorie votre rôle d'accès aux données ARN (Amazon Resource Name) et les emplacements Amazon S3 que vous avez fournis pour vos données d'entraînement (S3Uri) et de réglage (TuningDataS3Uri).

Type : objet InputDataConfig

LanguageCode

Le code de langue que vous avez sélectionné pour votre modèle de langue personnalisé.

Type : String

Valeurs valides : en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP

ModelName

Le nom de votre modèle linguistique personnalisé.

Type : String

Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.

Modèle : ^[0-9a-zA-Z._-]+

ModelStatus

État de votre modèle linguistique personnalisé. Lorsque le statut s'afficheCOMPLETED, votre modèle est prêt à être utilisé.

Type : String

Valeurs valides : IN_PROGRESS | FAILED | COMPLETED

Erreurs

Pour plus d'informations sur les erreurs communes à toutes les actions, consultezErreurs courantes.

BadRequestException

Votre demande n'a pas passé un ou plusieurs tests de validation. Cela peut se produire lorsque l'entité que vous essayez de supprimer n'existe pas ou si elle est dans un état non terminal (par exempleIN PROGRESS). Consultez le champ du message d'exception pour plus d'informations.

Code d'état HTTP : 400

ConflictException

Une ressource portant ce nom existe déjà. Les noms de ressource doivent être uniques dans unCompte AWS.

Code d'état HTTP : 400

InternalFailureException

Une erreur interne s'est produite. Vérifiez le message d'erreur, résolvez le problème et réessayez votre demande.

Code d'état HTTP : 500

LimitExceededException

Vous avez envoyé trop de demandes ou votre fichier d'entrée est trop long. Attendez avant de réessayer votre demande, ou utilisez un fichier plus petit et réessayez.

Code d'état HTTP : 400

Voir aussi

Pour plus d'informations sur l'utilisation de cette API dans l'un des kits SDK AWS spécifiques au langage, consultez les ressources suivantes :