Transcripción de un archivo de audio de un dictado médico - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Transcripción de un archivo de audio de un dictado médico

Utilice un trabajo de transcripción por lotes para transcribir archivos de audio de conversaciones médicas. Puede usarlo para transcribir un diálogo entre el médico y el paciente. Puede iniciar un trabajo de transcripción por lotes en la API de StartMedicalTranscriptionJob o en AWS Management Console.

Al iniciar un trabajo de transcripción médica con la API de StartMedicalTranscriptionJob, debe especificar PRIMARYCARE como valor del parámetro Specialty.

Para transcribir un diálogo entre el médico y el paciente (AWS Management Console)

Para usar el AWS Management Console para transcribir un diálogo entre el médico y el paciente, cree un trabajo de transcripción y seleccione Conversación como tipo de entrada de audio.

  1. Inicie sesión en la AWS Management Console.

  2. En el panel de navegación, en Amazon Transcribe Medicina, selecciona Trabajos de transcripción.

  3. Seleccione Crear trabajo.

  4. En la página Especificar detalles del trabajo, en Configuración del trabajo, especifique lo siguiente.

    1. Nombre: el nombre del trabajo de transcripción.

    2. Tipo de entrada de audio: dictado

  5. Para el resto de los campos, especifique la Amazon S3 ubicación del archivo de audio y dónde desea almacenar el resultado del trabajo de transcripción.

  6. Elija Next (Siguiente).

  7. Seleccione Crear.

Para transcribir una conversación médica mediante un trabajo de transcripción por lotes (API)
  • En la API de StartMedicalTranscriptionJob, especifique lo siguiente.

    1. Para MedicalTranscriptionJobName, especifique un nombre único en su Cuenta de AWS.

    2. En LanguageCode, especifique el código de idioma correspondiente al idioma hablado en el archivo multimedia y el idioma de su filtro de vocabulario.

    3. En el parámetro MediaFileUri del objeto Media, especifique el nombre del archivo que desea transcribir.

    4. Para Specialty, especifique la especialidad médica del profesional que habla en el archivo de audio.

    5. En Type, especifique DICTATION.

    6. Para OutputBucketName, especifique el bucket de Amazon S3 en el que se almacenarán los resultados de la transcripción.

    El siguiente es un ejemplo de solicitud que utiliza el AWS SDK for Python (Boto3) para transcribir un dictado médico de un médico de la especialidad. PRIMARYCARE

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-med-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'DICTATION' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

El siguiente código de ejemplo muestra los resultados de la transcripción de un dictado médico.

{ "jobName": "dictation-medical-transcription-job", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "... came for a follow up visit today..." } ], "items": [ { ... "start_time": "4.85", "end_time": "5.12", "alternatives": [ { "confidence": "1.0", "content": "came" } ], "type": "pronunciation" }, { "start_time": "5.12", "end_time": "5.29", "alternatives": [ { "confidence": "1.0", "content": "for" } ], "type": "pronunciation" }, { "start_time": "5.29", "end_time": "5.33", "alternatives": [ { "confidence": "0.9955", "content": "a" } ], "type": "pronunciation" }, { "start_time": "5.33", "end_time": "5.66", "alternatives": [ { "confidence": "0.9754", "content": "follow" } ], "type": "pronunciation" }, { "start_time": "5.66", "end_time": "5.75", "alternatives": [ { "confidence": "0.9754", "content": "up" } ], "type": "pronunciation" }, { "start_time": "5.75", "end_time": "6.02", "alternatives": [ { "confidence": "1.0", "content": "visit" } ] ... }, "status": "COMPLETED" }
Para habilitar la partición de las voces en un trabajo de transcripción por lotes (AWS CLI)
  • Ejecute el siguiente código.

    aws transcribe start-medical-transcription-job \ --region us-west-2 \ --cli-input-json file://example-start-command.json

    El texto siguiente muestra el contenido de example-start-command.json.

    { "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" }, "OutputBucketName": "amzn-s3-demo-bucket", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }