CreateLanguageModel - Transcribe

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

CreateLanguageModel

Crea un modello di lingua nuovo.

Quando si crea un modello di lingua personalizzato, è necessario specificare:

  • Se desideri un modello base a banda larga (frequenze di campionamento audio superiori a 16.000 Hz) o a banda stretta (frequenze di campionamento audio inferiori a 16.000 Hz)

  • L'ubicazione dei file di training e tuning (deve essere un URI Amazon S3)

  • Il linguaggio del modello

  • Un nome univoco per il modello

Per ulteriori informazioni, consulta Modelli di lingua.

Sintassi della richiesta

{ "BaseModelName": "string", "InputDataConfig": { "DataAccessRoleArn": "string", "S3Uri": "string", "TuningDataS3Uri": "string" }, "LanguageCode": "string", "ModelName": "string", "Tags": [ { "Key": "string", "Value": "string" } ] }

Parametri della richiesta

Per informazioni sui parametri comuni a tutte le azioni, vedere Parametri comuni.

La richiesta accetta i seguenti dati in formato JSON.

BaseModelName

Il modello linguistico standard di Amazon Transcribe, o modello base, utilizzato per creare il tuo modello linguistico personalizzato. Amazon Transcribe offre due opzioni per i modelli base: banda larga e banda stretta.

Se l'audio che desideri trascrivere ha una frequenza di campionamento di 16.000 Hz o superiore, scegliWideBand. Per trascrivere l'audio con una frequenza di campionamento inferiore a 16.000 Hz, scegliNarrowBand.

Tipo: String

Valori validi: NarrowBand | WideBand

Campo obbligatorio: sì

InputDataConfig

Contiene la posizione Amazon S3 dei dati di formazione che desideri utilizzare per creare un nuovo modello linguistico personalizzato e le autorizzazioni per accedere a questa posizione.

Durante l'utilizzoInputDataConfig, devi includere questi sottoparametri:S3Uri, qual è la posizione Amazon S3 dei tuoi dati di allenamento eDataAccessRoleArn, qual è l'Amazon Resource Name (ARN) del ruolo che ha il permesso di accedere alla posizione Amazon S3 specificata. Facoltativamente, puoi includereTuningDataS3Uri, che è la posizione Amazon S3 dei tuoi dati di ottimizzazione. Se specifichi diverse sedi Amazon S3 per l'addestramento e l'ottimizzazione dei dati, l'ARN che utilizzi deve disporre delle autorizzazioni per accedere a entrambe le sedi.

Tipo: InputDataConfig oggetto

Campo obbligatorio: sì

LanguageCode

Il codice della lingua che rappresenta la lingua del modello. Ogni modello linguistico personalizzato deve contenere termini in una sola lingua e la lingua selezionata per il modello linguistico personalizzato deve corrispondere alla lingua dei dati di formazione e ottimizzazione.

Per un elenco delle lingue supportate e dei codici di lingua associati, consulta la tabella Lingue supportate. Tieni presente che l'inglese americano (en-US) è l'unica lingua supportata da Amazon Transcribe Medical.

Un modello linguistico personalizzato può essere utilizzato solo per trascrivere file nella stessa lingua del modello. Ad esempio, se crei un modello linguistico personalizzato utilizzando l'inglese americano (en-US), puoi applicare questo modello solo ai file che contengono audio in inglese.

Tipo: String

Valori validi: en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP

Campo obbligatorio: sì

ModelName

Un nome univoco, scelto da te, per il tuo modello linguistico personalizzato.

Questo nome fa distinzione tra maiuscole e minuscole, non può contenere spazi e deve essere univoco all'interno di unAccount AWS. Se si tenta di creare un nuovo modello linguistico personalizzato con lo stesso nome di un modello linguistico personalizzato esistente, viene visualizzato unConflictException errore.

Tipo: String

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

Campo obbligatorio: sì

Tags

Aggiunge uno o più tag personalizzati, ciascuno sotto forma di coppia chiave:valore, a un nuovo modello di linguaggio personalizzato al momento della creazione di questo nuovo modello.

Per ulteriori informazioni sull'uso dei tag con Amazon Transcribe, consulta le risorse per l'etichettatura.

Tipo: matrice di oggetti Tag

Membri dell’array: numero minimo di 1 elemento. Numero massimo di 200 item.

Required: No

Sintassi della risposta

{ "BaseModelName": "string", "InputDataConfig": { "DataAccessRoleArn": "string", "S3Uri": "string", "TuningDataS3Uri": "string" }, "LanguageCode": "string", "ModelName": "string", "ModelStatus": "string" }

Elementi di risposta

Se l'operazione riesce, il servizio restituisce una risposta HTTP 200.

I dati seguenti vengono restituiti in formato JSON mediante il servizio.

BaseModelName

Il modello linguistico standard di Amazon Transcribe, o modello base, che hai specificato durante la creazione del tuo modello linguistico personalizzato.

Tipo: String

Valori validi: NarrowBand | WideBand

InputDataConfig

Elenca l'ARN (Amazon Resource Name) del tuo ruolo di accesso ai dati e le sedi Amazon S3 che hai fornito per i dati di formazione (S3Uri) e ottimizzazione (TuningDataS3Uri).

Tipo: InputDataConfig oggetto

LanguageCode

Il codice della lingua che hai selezionato per il tuo modello linguistico personalizzato.

Tipo: String

Valori validi: en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP

ModelName

Il nome del tuo modello linguistico personalizzato.

Tipo: String

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

ModelStatus

Lo stato del tuo modello linguistico personalizzato. Quando lo stato viene visualizzata comeCOMPLETED, il modello è pronta per l'uso.

Tipo: String

Valori validi: IN_PROGRESS | FAILED | COMPLETED

Errori

Per informazioni sugli errori comuni a tutte le operazioni, consultare Errori comuni.

BadRequestException

La tua richiesta non ha superato uno o più test di convalida. Ciò può verificarsi quando l'entità che stai cercando di eliminare non esiste o se si trova in uno stato non terminale (ad esempioIN PROGRESS). Per ulteriori informazioni, consulta il campo del messaggio di eccezione.

Codice di stato HTTP: 400

ConflictException

Esiste già una risorsa con questo nome. I nomi delle risorse devono essere univoci all'interno di unAccount AWS.

Codice di stato HTTP: 400

InternalFailureException

Si è verificato un errore interno. Controlla il messaggio di errore, correggi il problema e riprova con la richiesta.

Codice di stato HTTP: 500

LimitExceededException

Hai inviato troppe richieste o il file di input è troppo lungo. Attendi prima di riprovare la richiesta oppure utilizza un file più piccolo e riprova la richiesta.

Codice di stato HTTP: 400

Vedi anche

Per ulteriori informazioni sull'utilizzo di questa API in uno degli SDK AWS specifici della lingua, consulta quanto segue: