대체 트랜스크립션 생성 - Amazon Transcribe

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

대체 트랜스크립션 생성

Amazon Transcribe Medical을 사용하면 신뢰도가 가장 높은 트랜스크립션을 얻을 수 있습니다. 그러나 신뢰도가 낮은 추가 트랜스크립션을 반환하도록 Amazon Transcribe Medical을 구성할 수 있습니다.

대체 트랜스크립션을 사용하여 트랜스크립션된 오디오의 다른 해석을 볼 수 있습니다. 예를 들어, 사람이 트랜스크립션을 검토할 수 있도록 하는 애플리케이션에 사람이 선택할 수 있는 대체 트랜스크립션을 제공할 수 있습니다.

AWS Management Console 또는 StartMedicalTranscriptionJob API를 사용하여 대체 트랜스크립션을 생성할 수 있습니다.

를 사용하여 대체 트랜스크립션 AWS Management Console 을 생성하려면 작업을 구성할 때 대체 결과를 활성화합니다.

  1. AWS Management Console에 로그인합니다.

  2. 탐색 창의 Amazon Transcribe 의료에서 트랜스크립션 작업을 선택합니다.

  3. 작업 생성을 선택합니다.

  4. 작업 세부 정보 지정 페이지에서 트랜스크립션 작업에 대한 정보를 제공합니다.

  5. Next(다음)를 선택합니다.

  6. 대체 결과를 활성화합니다.

  7. 최대 대안에는 출력에 포함할 대체 트랜스크립션 최대 개수를 2에서 10 사이의 정수 값으로 입력합니다.

  8. 생성(Create)을 선택합니다.

배치 트랜스크립션 작업을 사용하여 오디오 파일에서 화자별로 텍스트를 구분하려면(API)
  • StartMedicalTranscriptionJob API의 경우 다음을 지정하세요.

    1. MedicalTranscriptionJobName에서 AWS 계정의 고유한 이름을 지정합니다.

    2. LanguageCode에는 오디오 파일에서 사용하는 언어와 어휘 필터의 언어에 해당하는 언어 코드를 지정합니다.

    3. Media 객체의 MediaFileUri 파라미터에서 트랜스크립션할 오디오 파일의 위치를 지정합니다.

    4. Specialty에는 오디오 파일에서 말하는 임상의의 전문 분야를 지정합니다.

    5. Type에서 의료 대화 또는 구술을 트랜스크립션할지 여부를 지정합니다.

    6. OutputBucketName에서 트랜스크립션 결과를 저장할 Amazon S3 버킷을 지정합니다.

    7. Settings 객체에서 다음을 지정합니다.

      1. ShowAlternativestrue.

      2. MaxAlternatives - 트랜스크립션 출력에 포함하려는 대체 트랜스크립트의 수를 나타내는 2에서 10 사이의 정수.

다음 요청은 AWS SDK for Python (Boto3) 를 사용하여 최대 2개의 대체 트랜스크립션을 생성하는 트랜스크립션 작업을 시작합니다.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', Settings = { 'ShowAlternatives': True, 'MaxAlternatives': 2 } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
1차 의료 임상의와 환자 간의 대화를 녹음한 오디오 파일을 오디오 파일에 트랜스크립션하려면(AWS CLI)
  • 다음 코드를 실행합니다.

    aws transcribe start-transcription-job \ --cli-input-json file://filepath/example-start-command.json

    다음 코드는 example-start-command.json의 내용을 보여줍니다.

    { "MedicalTranscriptionJobName": "my-first-transcription-job", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"amzn-s3-demo-bucket", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }