Usando um arquivo de texto para criar um vocabulário médico personalizado

Para criar um vocabulário personalizado, você deve ter preparado um arquivo de texto que contenha uma coleção de palavras ou frases. Amazon Transcribe O Medical usa esse arquivo de texto para criar um vocabulário personalizado que pode ser usado para melhorar a precisão da transcrição dessas palavras ou frases. Você pode criar um vocabulário personalizado usando a CreateMedicalVocabularyAPI ou o consoleAmazon Transcribe médico.

Para usar oAWS Management Console para criar um vocabulário personalizado, você fornece oAmazon S3 URI do arquivo de texto contendo suas palavras ou frases.

Faça login no AWS Management Console.
No painel de navegação, emAmazon Transcribe Médico, escolha Vocabulário personalizado.
Em Nome, em Configurações de vocabulário, escolha um nome para seu vocabulário personalizado.
Especifique a localização do arquivo de áudio ou arquivo de vídeo no Amazon S3:
- Para a localização do arquivo de entrada de vocabulário no S3, em Configurações de vocabulário, especifique oAmazon S3 URI que identifica o arquivo de texto que você usará para criar seu vocabulário personalizado.
- Para Localização do arquivo de entrada de vocabulário no S3, escolha Procurar S3 para procurar o arquivo de texto e selecioná-lo.
Escolha Criar vocabulário.

Você pode ver o status de processamento do seu vocabulário personalizado noAWS Management Console.

Para criar um vocabulário médico personalizado (API)

Para a StartTranscriptionJobAPI, especifique o seguinte.
1. Para LanguageCode, especifique en-US.
2. ParaVocabularyFileUri, especifique aAmazon S3 localização do arquivo de texto que você usa para definir seu vocabulário personalizado.
3. ParaVocabularyName, especifique um nome para seu vocabulário personalizado. O nome que pode ser especificado deve ser exclusivo em suaConta da AWS.

Para ver o status de processamento do seu vocabulário personalizado, use a GetMedicalVocabularyAPI.

Este é um exemplo de solicitação que usa oAWS SDK for Python (Boto3) para criar um vocabulário personalizado.



from __future__ import print_function
import time
import boto3  
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_medical_vocabulary(
    VocabularyName = job_name,
    VocabularyFileUri = 's3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-table.txt'
    LanguageCode = 'en-US',
  )
  
while True:
    status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Para habilitar o particionamento de alto-falantes em um trabalho de transcrição em lote (AWS CLI)

Execute o código a seguir.



aws transcribe create-medical-vocabulary \
--vocabulary-name my-first-vocabulary \ 
--vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-file.txt \
--language-code en-US

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Criando um arquivo de texto para seu vocabulário médico personalizado

Transcrevendo um arquivo de áudio usando um vocabulário médico personalizado