As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
CreateLanguageModel
Cria um modelo de idioma personalizado.
Ao criar um modelo de idioma personalizado, você deve especificar:
-
Se você quiser um modelo básico de banda larga (taxas de amostragem de áudio acima de 16.000 Hz) ou banda estreita (taxas de amostragem de áudio abaixo de 16.000 Hz)
-
O local dos seus arquivos de treinamento e ajuste (deve ser um URI do Amazon S3)
-
O idioma do seu modelo
-
Um nome único para seu modelo
Para obter mais informações, consulte Modelos de idioma personalizados.
Sintaxe da solicitação
{
"BaseModelName": "string
",
"InputDataConfig": {
"DataAccessRoleArn": "string
",
"S3Uri": "string
",
"TuningDataS3Uri": "string
"
},
"LanguageCode": "string
",
"ModelName": "string
",
"Tags": [
{
"Key": "string
",
"Value": "string
"
}
]
}
Parâmetros de solicitação
Para obter informações sobre os parâmetros que são comuns a todas as ações, consulte Parâmetros comuns.
A solicitação aceita os dados a seguir no formato JSON.
- BaseModelName
-
O modelo de linguagem padrão do Amazon Transcribe, ou modelo base, usado para criar seu modelo de linguagem personalizado. O Amazon Transcribe oferece duas opções para modelos básicos: banda larga e banda estreita.
Se o áudio que você deseja transcrever tiver uma taxa de amostragem de 16.000 Hz ou mais, escolha
WideBand
. Para transcrever áudio com uma taxa de amostragem inferior a 16.000 Hz, escolhaNarrowBand
.Tipo: String
Valores válidos:
NarrowBand | WideBand
Obrigatório: Sim
- InputDataConfig
-
Contém a localização do Amazon S3 dos dados de treinamento que você deseja usar para criar um novo modelo de linguagem personalizado e as permissões para acessar esse local.
Ao usar
InputDataConfig
, você deve incluir esses subparâmetros:S3Uri
, que é a localização do Amazon S3 de seus dados de treinamento eDataAccessRoleArn
, que é o nome de recurso da Amazon (ARN) da função que tem permissão para acessar seu local especificado do Amazon S3. Opcionalmente, você pode incluirTuningDataS3Uri
, que é a localização dos seus dados de ajuste no Amazon S3. Se você especificar diferentes locais do Amazon S3 para dados de treinamento e ajuste, o ARN usado deverá ter permissões para acessar os dois locais.Tipo: objeto InputDataConfig
Obrigatório: Sim
- LanguageCode
-
O código do idioma que representa o idioma do seu modelo. Cada modelo de idioma personalizado deve conter termos em apenas um idioma, e o idioma selecionado para seu modelo de idioma personalizado deve corresponder ao idioma dos seus dados de treinamento e ajuste.
Para obter uma lista dos idiomas suportados e seus códigos de idioma associados, consulte a tabela de idiomas suportados. Observe que o inglês dos EUA (
en-US
) é o único idioma compatível com o Amazon Transcribe Medical.Um modelo de linguagem personalizado só pode ser usado para transcrever arquivos no mesmo idioma do modelo. Por exemplo, se você criar um modelo de idioma personalizado usando inglês dos EUA (
en-US
), só poderá aplicar esse modelo a arquivos que contenham áudio em inglês.Tipo: String
Valores válidos:
en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP
Obrigatório: Sim
- ModelName
-
Um nome exclusivo, escolhido por você, para seu modelo de idioma personalizado.
Esse nome diferencia maiúsculas de minúsculas, não pode conter espaços e deve ser exclusivo em umConta da AWS. Se você tentar criar um novo modelo de idioma personalizado com o mesmo nome de um modelo de idioma personalizado existente, você receberá um
ConflictException
erro.Tipo: String
Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.
Padrão:
^[0-9a-zA-Z._-]+
Obrigatório: Sim
- Tags
-
Adiciona uma ou mais tags personalizadas, cada uma na forma de um par chave:valor, a um novo modelo de linguagem personalizado no momento em que você cria esse novo modelo.
Para saber mais sobre como usar tags com o Amazon Transcribe, consulte Recursos de marcação.
Tipo: matriz de objetos Tag
Membros da matriz: número mínimo de 1 item. Número máximo de 200 itens.
Obrigatório: não
Sintaxe da resposta
{
"BaseModelName": "string",
"InputDataConfig": {
"DataAccessRoleArn": "string",
"S3Uri": "string",
"TuningDataS3Uri": "string"
},
"LanguageCode": "string",
"ModelName": "string",
"ModelStatus": "string"
}
Elementos de resposta
Se a ação for bem-sucedida, o serviço reenviará uma resposta HTTP 200.
Os seguintes dados são retornados no formato JSON pelo serviço.
- BaseModelName
-
O modelo de linguagem padrão do Amazon Transcribe, ou modelo base, que você especificou ao criar seu modelo de linguagem personalizado.
Tipo: String
Valores válidos:
NarrowBand | WideBand
- InputDataConfig
-
Lista seu ARN (nome de recurso da Amazon) de acesso a dados e os locais do Amazon S3 que você forneceu para seus dados de treinamento (
S3Uri
) e ajuste (TuningDataS3Uri
).Tipo: objeto InputDataConfig
- LanguageCode
-
O código de idioma que você selecionou para seu modelo de idioma personalizado.
Tipo: String
Valores válidos:
en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP
- ModelName
-
O nome do seu modelo de idioma personalizado.
Tipo: String
Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.
Padrão:
^[0-9a-zA-Z._-]+
- ModelStatus
-
O status do seu modelo de idioma personalizado. Quando o status for exibido como
COMPLETED
, seu modelo estará pronto para ser usado.Tipo: String
Valores válidos:
IN_PROGRESS | FAILED | COMPLETED
Erros
Para obter informações sobre os erros comuns a todas as ações, consulteErros comuns.
- BadRequestException
-
Sua solicitação não passou em um ou mais testes de validação. Isso pode ocorrer quando a entidade que você está tentando excluir não existe ou se está em um estado não terminal (como
IN PROGRESS
). Consulte o campo da mensagem de exceção para obter mais informações.Código de status HTTP: 400
- ConflictException
-
Já existe um recurso com esse nome. Os nomes dos recursos devem ser exclusivos dentro de umConta da AWS.
Código de status HTTP: 400
- InternalFailureException
-
Ocorreu um erro interno. Verifique a mensagem de erro, corrija o problema e tente fazer sua solicitação novamente.
Código de status HTTP: 500
- LimitExceededException
-
Você enviou muitas solicitações ou seu arquivo de entrada é muito longo. Espere antes de repetir sua solicitação ou use um arquivo menor e tente novamente.
Código de status HTTP: 400
Consulte também
Para obter mais informações sobre como usar essa API em um dos AWS SDKs específicos de linguagem, consulte o seguinte: