Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
CreateLanguageModel
Crée un modèle de langue personnalisé.
Lorsque vous créez un modèle de langue personnalisé, vous devez spécifier :
-
Si vous souhaitez un modèle de base à large bande (fréquences d'échantillonnage audio supérieures à 16 000 Hz) ou à bande étroite (fréquences d'échantillonnage audio inférieures à 16 000 Hz)
-
L'emplacement de vos fichiers d'entraînement et de réglage (il doit s'agir d'un URI Amazon S3)
-
Langue de votre modèle
-
Nom unique de votre modèle
Pour de plus amples informations, veuillez consulter Modèles de langue personnalisés.
Syntaxe de la requête
{
"BaseModelName": "string
",
"InputDataConfig": {
"DataAccessRoleArn": "string
",
"S3Uri": "string
",
"TuningDataS3Uri": "string
"
},
"LanguageCode": "string
",
"ModelName": "string
",
"Tags": [
{
"Key": "string
",
"Value": "string
"
}
]
}
Paramètres de demande
Pour plus d'informations sur les paramètres communs à toutes les actions, voir Paramètres communs.
Cette demande accepte les données suivantes au format JSON.
- BaseModelName
-
Le modèle de langue standard Amazon Transcribe, ou modèle de base, utilisé pour créer votre modèle linguistique personnalisé. Amazon Transcribe propose deux options pour les modèles de base : large bande et bande étroite.
Si le son que vous souhaitez transcrire a une fréquence d'échantillonnage de 16 000 Hz ou plus, choisissez
WideBand
. Pour transcrire du son avec une fréquence d'échantillonnage inférieure à 16 000 Hz, choisissezNarrowBand
.Type : String
Valeurs valides :
NarrowBand | WideBand
Obligatoire : oui
- InputDataConfig
-
Contient l'emplacement Amazon S3 des données de formation que vous souhaitez utiliser pour créer un nouveau modèle linguistique personnalisé, ainsi que les autorisations d'accès à cet emplacement.
Lors de l'utilisation
InputDataConfig
, vous devez inclure les sous-paramètres suivants :S3Uri
, qui est l'emplacement Amazon S3 de vos données d'entraînement etDataAccessRoleArn
, qui est le nom de ressource Amazon (ARN) du rôle autorisé à accéder à l'emplacement Amazon S3 que vous avez spécifié. Vous pouvez éventuellement inclureTuningDataS3Uri
l'emplacement Amazon S3 de vos données de réglage. Si vous spécifiez différents emplacements Amazon S3 pour les données d'entraînement et de réglage, l'ARN que vous utilisez doit être autorisé à accéder aux deux emplacements.Type : objet InputDataConfig
Obligatoire : oui
- LanguageCode
-
Code de langue qui représente la langue de votre modèle. Chaque modèle linguistique personnalisé doit contenir des termes dans une seule langue, et la langue que vous sélectionnez pour votre modèle linguistique personnalisé doit correspondre à la langue de vos données d'entraînement et de réglage.
Pour obtenir la liste des langues prises en charge et leurs codes de langue associés, consultez le tableau des langues prises en charge. Notez que l'anglais américain (
en-US
) est la seule langue prise en charge par Amazon Transcribe Medical.Un modèle linguistique personnalisé ne peut être utilisé que pour transcrire des fichiers dans la même langue que le modèle. Par exemple, si vous créez un modèle linguistique personnalisé à l'aide de l'anglais américain (
en-US
), vous ne pouvez appliquer ce modèle qu'aux fichiers contenant du son en anglais.Type : String
Valeurs valides :
en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP
Obligatoire : oui
- ModelName
-
Un nom unique, que vous avez choisi, pour votre modèle linguistique personnalisé.
Ce nom distingue les majuscules, ne peut pas contenir d'espaces et doit être unique au sein d'unCompte AWS. Si vous essayez de créer un nouveau modèle de langage personnalisé portant le même nom qu'un modèle de langage personnalisé existant, vous obtenez une
ConflictException
erreur.Type : String
Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.
Modèle :
^[0-9a-zA-Z._-]+
Obligatoire : oui
- Tags
-
Ajoute une ou plusieurs balises personnalisées, chacune sous la forme d'une paire clé:valeur, à un nouveau modèle de langage personnalisé au moment où vous créez ce nouveau modèle.
Pour en savoir plus sur l'utilisation des balises avec Amazon Transcribe, consultez Ressources sur le balisage.
Type : tableau d’objets Tag
Membres du tableau : Nombre minimum de 1 élément. Nombre maximal de 200 éléments.
Obligatoire : non
Syntaxe de la réponse
{
"BaseModelName": "string",
"InputDataConfig": {
"DataAccessRoleArn": "string",
"S3Uri": "string",
"TuningDataS3Uri": "string"
},
"LanguageCode": "string",
"ModelName": "string",
"ModelStatus": "string"
}
Eléments de réponse
Si l'action aboutit, le service renvoie une réponse HTTP 200.
Les données suivantes sont renvoyées au format JSON par le service.
- BaseModelName
-
Le modèle de langue standard Amazon Transcribe, ou modèle de base, que vous avez spécifié lors de la création de votre modèle linguistique personnalisé.
Type : String
Valeurs valides :
NarrowBand | WideBand
- InputDataConfig
-
Répertorie votre rôle d'accès aux données ARN (Amazon Resource Name) et les emplacements Amazon S3 que vous avez fournis pour vos données d'entraînement (
S3Uri
) et de réglage (TuningDataS3Uri
).Type : objet InputDataConfig
- LanguageCode
-
Le code de langue que vous avez sélectionné pour votre modèle de langue personnalisé.
Type : String
Valeurs valides :
en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP
- ModelName
-
Le nom de votre modèle linguistique personnalisé.
Type : String
Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.
Modèle :
^[0-9a-zA-Z._-]+
- ModelStatus
-
État de votre modèle linguistique personnalisé. Lorsque le statut s'affiche
COMPLETED
, votre modèle est prêt à être utilisé.Type : String
Valeurs valides :
IN_PROGRESS | FAILED | COMPLETED
Erreurs
Pour plus d'informations sur les erreurs communes à toutes les actions, consultezErreurs courantes.
- BadRequestException
-
Votre demande n'a pas passé un ou plusieurs tests de validation. Cela peut se produire lorsque l'entité que vous essayez de supprimer n'existe pas ou si elle est dans un état non terminal (par exemple
IN PROGRESS
). Consultez le champ du message d'exception pour plus d'informations.Code d'état HTTP : 400
- ConflictException
-
Une ressource portant ce nom existe déjà. Les noms de ressource doivent être uniques dans unCompte AWS.
Code d'état HTTP : 400
- InternalFailureException
-
Une erreur interne s'est produite. Vérifiez le message d'erreur, résolvez le problème et réessayez votre demande.
Code d'état HTTP : 500
- LimitExceededException
-
Vous avez envoyé trop de demandes ou votre fichier d'entrée est trop long. Attendez avant de réessayer votre demande, ou utilisez un fichier plus petit et réessayez.
Code d'état HTTP : 400
Voir aussi
Pour plus d'informations sur l'utilisation de cette API dans l'un des kits SDK AWS spécifiques au langage, consultez les ressources suivantes :