의료 구술의 오디오 파일 트랜스크립션 - Amazon Transcribe

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

의료 구술의 오디오 파일 트랜스크립션

배치 트랜스크립션 작업을 사용하면 의료 대화의 오디오 파일을 트랜스크립션할 수 있습니다. 이를 사용하면 임상의와 환자의 대화를 트랜스크립션할 수 있습니다. StartMedicalTranscriptionJob API 또는 AWS Management Console에서 배치 트랜스크립션 작업을 시작할 수 있습니다.

StartMedicalTranscriptionJob API로 의료 트랜스크립션 작업을 시작하는 경우 Specialty 파라미터의 값으로 PRIMARYCARE를 지정합니다.

임상의와 환자의 대화를 트랜스크립션하려면(AWS Management Console)

AWS Management Console 를 사용하여 임상의-환자 대화를 트랜스크립션하려면 트랜스크립션 작업을 생성하고 오디오 입력 유형에 대한 대화를 선택합니다.

  1. AWS Management Console에 로그인합니다.

  2. 탐색 창의 Amazon Transcribe 의료에서 트랜스크립션 작업을 선택합니다.

  3. 작업 생성을 선택합니다.

  4. DB 세부 정보 지정 페이지의 작업 설정에서 다음을 지정합니다.

    1. 이름 - 트랜스크립션 작업의 이름

    2. 오디오 입력 유형 - 구술

  5. 나머지 필드에는 오디오 파일의 Amazon S3 위치와 트랜스크립션 작업의 출력을 저장할 위치를 지정합니다.

  6. [Next]를 선택합니다.

  7. Create를 선택합니다.

배치 트랜스크립션 작업을 사용하여 의료 대화를 트랜스크립션하려면(API)
  • StartMedicalTranscriptionJob API의 경우 다음을 지정하세요.

    1. MedicalTranscriptionJobName에서 AWS 계정의 고유한 이름을 지정합니다.

    2. LanguageCode에는 오디오 파일에서 사용하는 언어와 어휘 필터의 언어에 해당하는 언어 코드를 지정합니다.

    3. Media 객체의 MediaFileUri 파라미터에서 트랜스크립션할 오디어 파일의 이름을 지정합니다.

    4. Specialty에는 오디오 파일에서 말하는 임상의의 전문 분야를 지정합니다.

    5. Type에서 DICTATION를 지정합니다.

    6. OutputBucketName에서 트랜스크립션 결과를 저장할 Amazon S3 버킷을 지정합니다.

    다음은 AWS SDK for Python (Boto3) 를 사용하여 PRIMARYCARE 전문 분야의 임상의의 의학적 지시문을 트랜스크립션하는 요청의 예입니다.

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-med-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'DICTATION' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

다음 예시 코드는 의료구술의 트랜스크립션 결과를 보여줍니다.

{ "jobName": "dictation-medical-transcription-job", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "... came for a follow up visit today..." } ], "items": [ { ... "start_time": "4.85", "end_time": "5.12", "alternatives": [ { "confidence": "1.0", "content": "came" } ], "type": "pronunciation" }, { "start_time": "5.12", "end_time": "5.29", "alternatives": [ { "confidence": "1.0", "content": "for" } ], "type": "pronunciation" }, { "start_time": "5.29", "end_time": "5.33", "alternatives": [ { "confidence": "0.9955", "content": "a" } ], "type": "pronunciation" }, { "start_time": "5.33", "end_time": "5.66", "alternatives": [ { "confidence": "0.9754", "content": "follow" } ], "type": "pronunciation" }, { "start_time": "5.66", "end_time": "5.75", "alternatives": [ { "confidence": "0.9754", "content": "up" } ], "type": "pronunciation" }, { "start_time": "5.75", "end_time": "6.02", "alternatives": [ { "confidence": "1.0", "content": "visit" } ] ... }, "status": "COMPLETED" }
배치 트랜스크립션 작업에서 화자 파티셔닝을 활성화하려면(AWS CLI)
  • 다음 코드를 실행합니다.

    aws transcribe start-medical-transcription-job \ --region us-west-2 \ --cli-input-json file://example-start-command.json

    다음 코드는 example-start-command.json의 내용을 보여줍니다.

    { "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" }, "OutputBucketName": "amzn-s3-demo-bucket", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }