쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

오디오 파일에서 PHI 식별 - Amazon Transcribe

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

오디오 파일에서 PHI 식별

배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 그 안에 있는 개인 건강 정보(PHI)를 식별할 수 있습니다. 개인 건강 정보(PHI) 식별을 활성화하면 Amazon Transcribe Medical은 트랜스크립션 결과에서 식별한 PHI에 레이블을 지정합니다. Amazon Transcribe Medical에서 식별할 수 있는 PHI에 대한 자세한 내용은 섹션을 참조하세요트랜스크립션의 개인 건강 정보(PHI) 식별.

StartMedicalTranscriptionJob API 또는 AWS Management Console을 사용하여 배치 트랜스크립션 작업을 시작할 수 있습니다.

AWS Management Console 를 사용하여 임상의-환자 대화를 트랜스크립션하려면 트랜스크립션 작업을 생성하고 오디오 입력 유형에 대한 대화를 선택합니다.

오디오 파일을 트랜스크립션하고 해당 PHI를 식별하려면(AWS Management Console)
  1. AWS Management Console에 로그인합니다.

  2. 탐색 창의 Amazon Transcribe 의료에서 트랜스크립션 작업을 선택합니다.

  3. 작업 생성을 선택합니다.

  4. DB 세부 정보 지정 페이지의 작업 설정에서 다음을 지정합니다.

    1. 이름 - 고유한 트랜스크립션 작업의 이름입니다 AWS 계정.

    2. 오디오 입력 유형대화 또는 구술.

  5. 나머지 필드에는 오디오 파일의 Amazon S3 위치와 트랜스크립션 작업의 출력을 저장할 위치를 지정합니다.

  6. Next(다음)를 선택합니다.

  7. 오디오 설정에서 PHI 식별을 선택합니다.

  8. 생성(Create)을 선택합니다.

AWS Management Console

AWS Management Console 를 사용하여 임상의-환자 대화를 트랜스크립션하려면 트랜스크립션 작업을 생성하고 오디오 입력 유형에 대한 대화를 선택합니다.

오디오 파일을 트랜스크립션하고 해당 PHI를 식별하려면(AWS Management Console)
  1. AWS Management Console에 로그인합니다.

  2. 탐색 창의 Amazon Transcribe 의료에서 트랜스크립션 작업을 선택합니다.

  3. 작업 생성을 선택합니다.

  4. DB 세부 정보 지정 페이지의 작업 설정에서 다음을 지정합니다.

    1. 이름 - 고유한 트랜스크립션 작업의 이름입니다 AWS 계정.

    2. 오디오 입력 유형대화 또는 구술.

  5. 나머지 필드에는 오디오 파일의 Amazon S3 위치와 트랜스크립션 작업의 출력을 저장할 위치를 지정합니다.

  6. Next(다음)를 선택합니다.

  7. 오디오 설정에서 PHI 식별을 선택합니다.

  8. 생성(Create)을 선택합니다.

배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 해당 PHI를 식별하려면(API)
  • StartMedicalTranscriptionJob API의 경우 다음을 지정하세요.

    1. MedicalTranscriptionJobName에서 AWS 계정의 고유한 이름을 지정합니다.

    2. LanguageCode에는 오디오 파일에서 사용하는 언어에 해당하는 언어 코드를 지정합니다.

    3. Media 객체의 MediaFileUri 파라미터에서 트랜스크립션할 오디오 파일의 이름을 지정합니다.

    4. Specialty에는 오디오 파일에서 말하는 임상의의 전문 분야를 PRIMARYCARE로 지정합니다.

    5. Type에서 CONVERSATION 또는 DICTATION를 지정합니다.

    6. OutputBucketName에서 트랜스크립션 결과를 저장할 Amazon S3 버킷을 지정합니다.

    다음은 AWS SDK for Python (Boto3) 를 사용하여 오디오 파일을 트랜스크립션하고 환자의 PHI를 식별하는 요청의 예입니다.

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'amzn-s3-demo-bucket' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

다음 예시 코드는 환자 PHI를 식별한 트랜스크립션 결과를 보여줍니다.

{ "jobName": "my-medical-transcription-job-name", "accountId": "111122223333", "results": { "transcripts": [{ "transcript": "The patient's name is Bertrand." }], "items": [{ "id": 0, "start_time": "0.0", "end_time": "0.37", "alternatives": [{ "confidence": "0.9993", "content": "The" }], "type": "pronunciation" }, { "id": 1, "start_time": "0.37", "end_time": "0.44", "alternatives": [{ "confidence": "0.9981", "content": "patient's" }], "type": "pronunciation" }, { "id": 2, "start_time": "0.44", "end_time": "0.52", "alternatives": [{ "confidence": "1.0", "content": "name" }], "type": "pronunciation" }, { "id": 3, "start_time": "0.52", "end_time": "0.92", "alternatives": [{ "confidence": "1.0", "content": "is" }], "type": "pronunciation" }, { "id": 4, "start_time": "0.92", "end_time": "0.9989", "alternatives": [{ "confidence": "1.0", "content": "Bertrand" }], "type": "pronunciation" }, { "id": 5, "alternatives": [{ "confidence": "0.0", "content": "." }], "type": "punctuation" }], "entities": [{ "content": "Bertrand", "category": "PHI*-Personal*", "startTime": 0.92, "endTime": 1.2, "confidence": 0.9989 }], "audio_segments": [ { "id": 0, "transcript": "The patient's name is Bertrand.", "start_time": "0.0", "end_time": "0.9989", "items": [ 0, 1, 2, 3, 4, 5 ] } ] }, "status": "COMPLETED" }

배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 해당 PHI를 식별하려면(API)
  • StartMedicalTranscriptionJob API의 경우 다음을 지정하세요.

    1. MedicalTranscriptionJobName에서 AWS 계정의 고유한 이름을 지정합니다.

    2. LanguageCode에는 오디오 파일에서 사용하는 언어에 해당하는 언어 코드를 지정합니다.

    3. Media 객체의 MediaFileUri 파라미터에서 트랜스크립션할 오디오 파일의 이름을 지정합니다.

    4. Specialty에는 오디오 파일에서 말하는 임상의의 전문 분야를 PRIMARYCARE로 지정합니다.

    5. Type에서 CONVERSATION 또는 DICTATION를 지정합니다.

    6. OutputBucketName에서 트랜스크립션 결과를 저장할 Amazon S3 버킷을 지정합니다.

    다음은 AWS SDK for Python (Boto3) 를 사용하여 오디오 파일을 트랜스크립션하고 환자의 PHI를 식별하는 요청의 예입니다.

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'amzn-s3-demo-bucket' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

다음 예시 코드는 환자 PHI를 식별한 트랜스크립션 결과를 보여줍니다.

{ "jobName": "my-medical-transcription-job-name", "accountId": "111122223333", "results": { "transcripts": [{ "transcript": "The patient's name is Bertrand." }], "items": [{ "id": 0, "start_time": "0.0", "end_time": "0.37", "alternatives": [{ "confidence": "0.9993", "content": "The" }], "type": "pronunciation" }, { "id": 1, "start_time": "0.37", "end_time": "0.44", "alternatives": [{ "confidence": "0.9981", "content": "patient's" }], "type": "pronunciation" }, { "id": 2, "start_time": "0.44", "end_time": "0.52", "alternatives": [{ "confidence": "1.0", "content": "name" }], "type": "pronunciation" }, { "id": 3, "start_time": "0.52", "end_time": "0.92", "alternatives": [{ "confidence": "1.0", "content": "is" }], "type": "pronunciation" }, { "id": 4, "start_time": "0.92", "end_time": "0.9989", "alternatives": [{ "confidence": "1.0", "content": "Bertrand" }], "type": "pronunciation" }, { "id": 5, "alternatives": [{ "confidence": "0.0", "content": "." }], "type": "punctuation" }], "entities": [{ "content": "Bertrand", "category": "PHI*-Personal*", "startTime": 0.92, "endTime": 1.2, "confidence": 0.9989 }], "audio_segments": [ { "id": 0, "transcript": "The patient's name is Bertrand.", "start_time": "0.0", "end_time": "0.9989", "items": [ 0, 1, 2, 3, 4, 5 ] } ] }, "status": "COMPLETED" }
배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 PHI를 식별하려면(AWS CLI)
  • 다음 코드를 실행합니다.

    aws transcribe start-medical-transcription-job \ --medical-transcription-job-name my-medical-transcription-job-name\ --language-code en-US \ --media MediaFileUri="s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" \ --output-bucket-name amzn-s3-demo-bucket \ --specialty PRIMARYCARE \ --type type \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation. --content-identification-type PHI

배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 PHI를 식별하려면(AWS CLI)
  • 다음 코드를 실행합니다.

    aws transcribe start-medical-transcription-job \ --medical-transcription-job-name my-medical-transcription-job-name\ --language-code en-US \ --media MediaFileUri="s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" \ --output-bucket-name amzn-s3-demo-bucket \ --specialty PRIMARYCARE \ --type type \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation. --content-identification-type PHI
프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.