Generar transcripciones alternativas - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Generar transcripciones alternativas

Cuando utilizaAmazon Transcribe Medical, obtiene la transcripción que tiene el nivel de confianza más alto. Sin embargo, puede configurarAmazon Transcribe Medical para que devuelva transcripciones adicionales con niveles de confianza más bajos.

Utilice transcripciones alternativas para ver diferentes interpretaciones del audio transcrito. Por ejemplo, si utiliza una aplicación que permite que una persona revise la transcripción, puede presentar las transcripciones alternativas para que esa persona elija.

Puede generar transcripciones alternativas con la APIAWS Management Console o la StartMedicalTranscriptionJobAPI.

Para utilizar elAWS Management Console para generar transcripciones alternativas, habilite los resultados alternativos al configurar su trabajo.

  1. Inicie sesión en AWS Management Console.

  2. En el panel de navegación, en Database (Amazon Transcribeen Database), elija Transcription.

  3. Seleccione Create job (Crear trabajo).

  4. En la página Especificar los detalles del trabajo, proporciona información sobre tu trabajo de transcripción.

  5. Elija Next (Siguiente).

  6. Habilite los resultados alternativos.

  7. En Máximo de alternativas, introduzca un valor entero entre 2 y 10 para el número máximo de transcripciones alternativas que desee incluir en la salida.

  8. Seleccione Create (Crear).

Para separar el texto por altavoz en un archivo de audio mediante un trabajo de transcripción por lotes (API)
  • Para la StartMedicalTranscriptionJobAPI, especifique lo siguiente.

    1. ParaMedicalTranscriptionJobName, especifique un nombre que sea único en suCuenta de AWS.

    2. ParaLanguageCode ello, especifique el código de idioma que se corresponde con el idioma que se habla en el archivo de audio y el idioma del filtro de vocabulario.

    3. En elMediaFileUri parámetro delMedia objeto, especifique la ubicación del archivo de audio que desea transcribir.

    4. ParaSpecialty, especifique la especialidad médica del médico que habla en el archivo de audio.

    5. EnType este caso, especifique si va a transcribir una conversación médica o un dictado.

    6. ParaOutputBucketName, especifique elAmazon S3 depósito para almacenar los resultados de la transcripción.

    7. Para elSettings objeto, especifique lo siguiente.

      1. ShowAlternativestrue.

      2. MaxAlternatives- Un número entero entre 2 y 10 para indicar el número de transcripciones alternativas que desea incluir en el resultado de la transcripción.

La siguiente solicitud utiliza elAWS SDK for Python (Boto3) para iniciar un trabajo de transcripción que genera hasta dos transcripciones alternativas.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', Settings = { 'ShowAlternatives': True, 'MaxAlternatives': 2 } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Para transcribir un archivo de audio de una conversación entre un médico de atención primaria y un paciente en un archivo de audio (AWS CLI)
  • Ejecute el siguiente código.

    aws transcribe start-transcription-job \ --cli-input-json file://filepath/example-start-command.json

    A continuación se muestra el contenido deexample-start-command.json.

    { "MedicalTranscriptionJobName": "my-first-transcription-job", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }