CreateLanguageModel - Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

CreateLanguageModel

Cria um modelo de idioma personalizado.

Ao criar um modelo de idioma personalizado, você deve especificar:

  • Se você quiser um modelo básico de banda larga (taxas de amostragem de áudio acima de 16.000 Hz) ou banda estreita (taxas de amostragem de áudio abaixo de 16.000 Hz)

  • O local dos seus arquivos de treinamento e ajuste (deve ser um URI do Amazon S3)

  • O idioma do seu modelo

  • Um nome único para seu modelo

Para obter mais informações, consulte Modelos de idioma personalizados.

Sintaxe da solicitação

{ "BaseModelName": "string", "InputDataConfig": { "DataAccessRoleArn": "string", "S3Uri": "string", "TuningDataS3Uri": "string" }, "LanguageCode": "string", "ModelName": "string", "Tags": [ { "Key": "string", "Value": "string" } ] }

Parâmetros de solicitação

Para obter informações sobre os parâmetros que são comuns a todas as ações, consulte Parâmetros comuns.

A solicitação aceita os dados a seguir no formato JSON.

BaseModelName

O modelo de linguagem padrão do Amazon Transcribe, ou modelo base, usado para criar seu modelo de linguagem personalizado. O Amazon Transcribe oferece duas opções para modelos básicos: banda larga e banda estreita.

Se o áudio que você deseja transcrever tiver uma taxa de amostragem de 16.000 Hz ou mais, escolhaWideBand. Para transcrever áudio com uma taxa de amostragem inferior a 16.000 Hz, escolhaNarrowBand.

Tipo: String

Valores válidos: NarrowBand | WideBand

Obrigatório: Sim

InputDataConfig

Contém a localização do Amazon S3 dos dados de treinamento que você deseja usar para criar um novo modelo de linguagem personalizado e as permissões para acessar esse local.

Ao usarInputDataConfig, você deve incluir esses subparâmetros:S3Uri, que é a localização do Amazon S3 de seus dados de treinamento eDataAccessRoleArn, que é o nome de recurso da Amazon (ARN) da função que tem permissão para acessar seu local especificado do Amazon S3. Opcionalmente, você pode incluirTuningDataS3Uri, que é a localização dos seus dados de ajuste no Amazon S3. Se você especificar diferentes locais do Amazon S3 para dados de treinamento e ajuste, o ARN usado deverá ter permissões para acessar os dois locais.

Tipo: objeto InputDataConfig

Obrigatório: Sim

LanguageCode

O código do idioma que representa o idioma do seu modelo. Cada modelo de idioma personalizado deve conter termos em apenas um idioma, e o idioma selecionado para seu modelo de idioma personalizado deve corresponder ao idioma dos seus dados de treinamento e ajuste.

Para obter uma lista dos idiomas suportados e seus códigos de idioma associados, consulte a tabela de idiomas suportados. Observe que o inglês dos EUA (en-US) é o único idioma compatível com o Amazon Transcribe Medical.

Um modelo de linguagem personalizado só pode ser usado para transcrever arquivos no mesmo idioma do modelo. Por exemplo, se você criar um modelo de idioma personalizado usando inglês dos EUA (en-US), só poderá aplicar esse modelo a arquivos que contenham áudio em inglês.

Tipo: String

Valores válidos: en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP

Obrigatório: Sim

ModelName

Um nome exclusivo, escolhido por você, para seu modelo de idioma personalizado.

Esse nome diferencia maiúsculas de minúsculas, não pode conter espaços e deve ser exclusivo em umConta da AWS. Se você tentar criar um novo modelo de idioma personalizado com o mesmo nome de um modelo de idioma personalizado existente, você receberá umConflictException erro.

Tipo: String

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.

Padrão: ^[0-9a-zA-Z._-]+

Obrigatório: Sim

Tags

Adiciona uma ou mais tags personalizadas, cada uma na forma de um par chave:valor, a um novo modelo de linguagem personalizado no momento em que você cria esse novo modelo.

Para saber mais sobre como usar tags com o Amazon Transcribe, consulte Recursos de marcação.

Tipo: matriz de objetos Tag

Membros da matriz: número mínimo de 1 item. Número máximo de 200 itens.

Obrigatório: não

Sintaxe da resposta

{ "BaseModelName": "string", "InputDataConfig": { "DataAccessRoleArn": "string", "S3Uri": "string", "TuningDataS3Uri": "string" }, "LanguageCode": "string", "ModelName": "string", "ModelStatus": "string" }

Elementos de resposta

Se a ação for bem-sucedida, o serviço reenviará uma resposta HTTP 200.

Os seguintes dados são retornados no formato JSON pelo serviço.

BaseModelName

O modelo de linguagem padrão do Amazon Transcribe, ou modelo base, que você especificou ao criar seu modelo de linguagem personalizado.

Tipo: String

Valores válidos: NarrowBand | WideBand

InputDataConfig

Lista seu ARN (nome de recurso da Amazon) de acesso a dados e os locais do Amazon S3 que você forneceu para seus dados de treinamento (S3Uri) e ajuste (TuningDataS3Uri).

Tipo: objeto InputDataConfig

LanguageCode

O código de idioma que você selecionou para seu modelo de idioma personalizado.

Tipo: String

Valores válidos: en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP

ModelName

O nome do seu modelo de idioma personalizado.

Tipo: String

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.

Padrão: ^[0-9a-zA-Z._-]+

ModelStatus

O status do seu modelo de idioma personalizado. Quando o status for exibido comoCOMPLETED, seu modelo estará pronto para ser usado.

Tipo: String

Valores válidos: IN_PROGRESS | FAILED | COMPLETED

Erros

Para obter informações sobre os erros comuns a todas as ações, consulteErros comuns.

BadRequestException

Sua solicitação não passou em um ou mais testes de validação. Isso pode ocorrer quando a entidade que você está tentando excluir não existe ou se está em um estado não terminal (comoIN PROGRESS). Consulte o campo da mensagem de exceção para obter mais informações.

Código de status HTTP: 400

ConflictException

Já existe um recurso com esse nome. Os nomes dos recursos devem ser exclusivos dentro de umConta da AWS.

Código de status HTTP: 400

InternalFailureException

Ocorreu um erro interno. Verifique a mensagem de erro, corrija o problema e tente fazer sua solicitação novamente.

Código de status HTTP: 500

LimitExceededException

Você enviou muitas solicitações ou seu arquivo de entrada é muito longo. Espere antes de repetir sua solicitação ou use um arquivo menor e tente novamente.

Código de status HTTP: 400

Consulte também

Para obter mais informações sobre como usar essa API em um dos AWS SDKs específicos de linguagem, consulte o seguinte: