기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
오디오 파일에서 PHI 식별
배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 그 안에 있는 개인 건강 정보(PHI)를 식별할 수 있습니다. 개인 건강 정보(PHI) 식별을 활성화하면 Amazon Transcribe Medical은 트랜스크립션 결과에서 식별한 PHI에 레이블을 지정합니다. Amazon Transcribe Medical에서 식별할 수 있는 PHI에 대한 자세한 내용은 섹션을 참조하세요트랜스크립션의 개인 건강 정보(PHI) 식별.
StartMedicalTranscriptionJob
API 또는 AWS Management Console을 사용하여 배치 트랜스크립션 작업을 시작할 수 있습니다.
AWS Management Console 를 사용하여 임상의-환자 대화를 트랜스크립션하려면 트랜스크립션 작업을 생성하고 오디오 입력 유형에 대한 대화를 선택합니다.
오디오 파일을 트랜스크립션하고 해당 PHI를 식별하려면(AWS Management Console)
-
AWS Management Console
에 로그인합니다. -
탐색 창의 Amazon Transcribe 의료에서 트랜스크립션 작업을 선택합니다.
-
작업 생성을 선택합니다.
-
DB 세부 정보 지정 페이지의 작업 설정에서 다음을 지정합니다.
-
이름 - 고유한 트랜스크립션 작업의 이름입니다 AWS 계정.
-
오디오 입력 유형 – 대화 또는 구술.
-
-
나머지 필드에는 오디오 파일의 Amazon S3 위치와 트랜스크립션 작업의 출력을 저장할 위치를 지정합니다.
-
Next(다음)를 선택합니다.
-
오디오 설정에서 PHI 식별을 선택합니다.
-
생성(Create)을 선택합니다.
배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 해당 PHI를 식별하려면(API)
-
StartMedicalTranscriptionJob
API의 경우 다음을 지정하세요.-
MedicalTranscriptionJobName
에서 AWS 계정의 고유한 이름을 지정합니다. -
LanguageCode
에는 오디오 파일에서 사용하는 언어에 해당하는 언어 코드를 지정합니다. -
Media
객체의MediaFileUri
파라미터에서 트랜스크립션할 오디오 파일의 이름을 지정합니다. -
Specialty
에는 오디오 파일에서 말하는 임상의의 전문 분야를PRIMARYCARE
로 지정합니다. -
Type
에서CONVERSATION
또는DICTATION
를 지정합니다. -
OutputBucketName
에서 트랜스크립션 결과를 저장할 Amazon S3 버킷을 지정합니다.
다음은 AWS SDK for Python (Boto3) 를 사용하여 오디오 파일을 트랜스크립션하고 환자의 PHI를 식별하는 요청의 예입니다.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "
my-first-transcription-job
" job_uri = "s3://amzn-s3-demo-bucket
/my-input-files
/my-audio-file
.flac
" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type
', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'amzn-s3-demo-bucket
' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status) -
다음 예시 코드는 환자 PHI를 식별한 트랜스크립션 결과를 보여줍니다.
{
"jobName": "my-medical-transcription-job-name",
"accountId": "111122223333",
"results": {
"transcripts": [{
"transcript": "The patient's name is Bertrand."
}],
"items": [{
"id": 0,
"start_time": "0.0",
"end_time": "0.37",
"alternatives": [{
"confidence": "0.9993",
"content": "The"
}],
"type": "pronunciation"
}, {
"id": 1,
"start_time": "0.37",
"end_time": "0.44",
"alternatives": [{
"confidence": "0.9981",
"content": "patient's"
}],
"type": "pronunciation"
}, {
"id": 2,
"start_time": "0.44",
"end_time": "0.52",
"alternatives": [{
"confidence": "1.0",
"content": "name"
}],
"type": "pronunciation"
}, {
"id": 3,
"start_time": "0.52",
"end_time": "0.92",
"alternatives": [{
"confidence": "1.0",
"content": "is"
}],
"type": "pronunciation"
}, {
"id": 4,
"start_time": "0.92",
"end_time": "0.9989",
"alternatives": [{
"confidence": "1.0",
"content": "Bertrand"
}],
"type": "pronunciation"
}, {
"id": 5,
"alternatives": [{
"confidence": "0.0",
"content": "."
}],
"type": "punctuation"
}],
"entities": [{
"content": "Bertrand",
"category": "PHI*-Personal*",
"startTime": 0.92,
"endTime": 1.2,
"confidence": 0.9989
}],
"audio_segments": [
{
"id": 0,
"transcript": "The patient's name is Bertrand.",
"start_time": "0.0",
"end_time": "0.9989",
"items": [
0,
1,
2,
3,
4,
5
]
}
]
},
"status": "COMPLETED"
}
배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 PHI를 식별하려면(AWS CLI)
-
다음 코드를 실행합니다.
aws transcribe start-medical-transcription-job \ --medical-transcription-job-name
my-medical-transcription-job-name
\ --language-code en-US \ --media MediaFileUri="s3://amzn-s3-demo-bucket
/my-input-files
/my-audio-file
.flac
" \ --output-bucket-nameamzn-s3-demo-bucket
\ --specialty PRIMARYCARE \ --typetype
\ # ChooseCONVERSATION
to transcribe a medical conversation. ChooseDICTATION
to transcribe a medical dictation. --content-identification-type PHI