Transcrever um arquivo de áudio de um ditado médico - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Transcrever um arquivo de áudio de um ditado médico

Use um trabalho de transcrição em lote para transcrever arquivos de áudio de conversas médicas. Você pode usar isso para transcrever um diálogo entre médico e paciente. Você pode iniciar um trabalho de transcrição em lote na API StartMedicalTranscriptionJob ou no AWS Management Console.

Ao iniciar um trabalho de transcrição médica com a API StartMedicalTranscriptionJob, você especifica PRIMARYCARE como o valor do parâmetro Specialty.

Transcrever um diálogo entre médico e paciente (AWS Management Console)

Para usar o AWS Management Console para transcrever um diálogo médico-paciente, crie um trabalho de transcrição e escolha Conversação como tipo de entrada de áudio.

  1. Faça login no AWS Management Console.

  2. No painel de navegação, em Amazon Transcribe Medicina, escolha Trabalhos de transcrição.

  3. Escolha Criar trabalho.

  4. Na página Especificar os detalhes da tarefa, em Configurações de tarefa, especifique as configurações a seguir.

    1. Nome: o nome do trabalho de transcrição.

    2. Tipo de entrada de áudio: Ditado

  5. Para os campos restantes, especifique a Amazon S3 localização do seu arquivo de áudio e onde você deseja armazenar a saída do seu trabalho de transcrição.

  6. Escolha Próximo.

  7. Escolha Criar.

Como transcrever uma conversa médica usando um trabalho de transcrição em lote (API)
  • Para a API StartMedicalTranscriptionJob, especifique o seguinte.

    1. Para MedicalTranscriptionJobName, especifique um nome exclusivo em sua Conta da AWS.

    2. Em LanguageCode, especifique o código do idioma falado no arquivo de mídia e o idioma do filtro de vocabulário.

    3. No parâmetro MediaFileUri do objeto Media, especifique o nome do arquivo de áudio que você deseja transcrever.

    4. Em Specialty, indique a especialidade médica do médico que está se pronunciando no arquivo de áudio.

    5. Em Type, especifique DICTATION.

    6. Em OutputBucketName, especifique o bucket do Amazon S3 para armazenar os resultados da transcrição.

    A seguir está um exemplo de solicitação que usa o AWS SDK for Python (Boto3) para transcrever um ditado médico de um médico da especialidade. PRIMARYCARE

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-med-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'DICTATION' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

O código de exemplo a seguir mostra os resultados da transcrição de um ditado médico.

{ "jobName": "dictation-medical-transcription-job", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "... came for a follow up visit today..." } ], "items": [ { ... "start_time": "4.85", "end_time": "5.12", "alternatives": [ { "confidence": "1.0", "content": "came" } ], "type": "pronunciation" }, { "start_time": "5.12", "end_time": "5.29", "alternatives": [ { "confidence": "1.0", "content": "for" } ], "type": "pronunciation" }, { "start_time": "5.29", "end_time": "5.33", "alternatives": [ { "confidence": "0.9955", "content": "a" } ], "type": "pronunciation" }, { "start_time": "5.33", "end_time": "5.66", "alternatives": [ { "confidence": "0.9754", "content": "follow" } ], "type": "pronunciation" }, { "start_time": "5.66", "end_time": "5.75", "alternatives": [ { "confidence": "0.9754", "content": "up" } ], "type": "pronunciation" }, { "start_time": "5.75", "end_time": "6.02", "alternatives": [ { "confidence": "1.0", "content": "visit" } ] ... }, "status": "COMPLETED" }
Como habilitar a separação de oradores (locutores) em um trabalho de transcrição em lote (AWS CLI)
  • Execute o código a seguir.

    aws transcribe start-medical-transcription-job \ --region us-west-2 \ --cli-input-json file://example-start-command.json

    O código a seguir mostra o conteúdo de example-start-command.json.

    { "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" }, "OutputBucketName": "amzn-s3-demo-bucket", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }