PII 수정 및 식별 출력 예시 - Amazon Transcribe

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

PII 수정 및 식별 출력 예시

다음 예시는 배치 작업 및 스트리밍 작업의 편집된 출력 및 스트리밍 작업의 PII 식별을 보여줍니다.

콘텐츠 수정을 사용하는 트랜스크립션 작업은 두 가지 유형의 confidence 값을 생성합니다. 자동 음성 인식(ASR) 신뢰도는 pronunciation 또는 punctuation type을 갖는 항목이 특정 발화임을 나타냅니다. 다음 트랜스크립트 출력에서 단어 Goodconfidence1.0입니다. 이 신뢰도 값은 Amazon Transcribe 가이 트랜스크립트에 표현된 단어가 '양호'하다는 100% 확신을 가지고 있음을 나타냅니다. [PII] 태그의 confidence 값은 수정하도록 플래그가 지정된 음성이 실제로 PII라는 것의 신뢰도입니다. 다음 트랜스크립트 출력에서 confidence의는 Amazon Transcribe 가 트랜스크립트에서 수정한 개체가 PII임을 99.99% 확신함을 0.9999 나타냅니다.

편집된 출력(배치) 예시

{ "jobName": "my-first-transcription-job", "accountId": "111122223333", "isRedacted": true, "results": { "transcripts": [ { "transcript": "Good morning, everybody. My name is [PII], and today I feel like sharing a whole lot of personal information with you. Let's start with my Social Security number [PII]. My credit card number is [PII] and my C V V code is [PII]. I hope that Amazon Transcribe is doing a good job at redacting that personal information away. Let's check." } ], "items": [ { "id": 0, "start_time": "2.86", "end_time": "3.35", "alternatives": [ { "confidence": "1.0", "content": "Good" } ], "type": "pronunciation" }, Items removed for brevity { "id": 8, "start_time": "5.56", "end_time": "6.25", "alternatives": [ { "content": "[PII]", "redactions": [ { "confidence": "0.9999", "type": "NAME", "category": "PII" } ] } ], "type": "pronunciation" }, Items removed for brevity ], }, "status": "COMPLETED" }

비교를 위해 편집되지 않은 스크립트는 다음과 같습니다.

{ "jobName": "job id", "accountId": "111122223333", "isRedacted": false, "results": { "transcripts": [ { "transcript": "Good morning, everybody. My name is Mike, and today I feel like sharing a whole lot of personal information with you. Let's start with my Social Security number 000000000. My credit card number is 5555555555555555 and my C V V code is 000. I hope that Amazon Transcribe is doing a good job at redacting that personal information away. Let's check." } ], "items": [ { "id": 0, "start_time": "2.86", "end_time": "3.35", "alternatives": [ { "confidence": "1.0", "content": "Good" } ], "type": "pronunciation" }, Items removed for brevity { "id": 8, "start_time": "5.56", "end_time": "6.25", "alternatives": [ { "confidence": "0.9999", "content": "Mike", { ], "type": "pronunciation" }, Items removed for brevity ], }, "status": "COMPLETED" }

편집된 스트리밍 출력 예시

{ "TranscriptResultStream": { "TranscriptEvent": { "Transcript": { "Results": [ { "Alternatives": [ { "Transcript": "my name is [NAME]", "Items": [ { "Content": "my", "EndTime": 0.3799375, "StartTime": 0.0299375, "Type": "pronunciation" }, { "Content": "name", "EndTime": 0.5899375, "StartTime": 0.3899375, "Type": "pronunciation" }, { "Content": "is", "EndTime": 0.7899375, "StartTime": 0.5999375, "Type": "pronunciation" }, { "Content": "[NAME]", "EndTime": 1.0199375, "StartTime": 0.7999375, "Type": "pronunciation" } ], "Entities": [ { "Content": "[NAME]", "Category": "PII", "Type": "NAME", "StartTime" : 0.7999375, "EndTime" : 1.0199375, "Confidence": 0.9989 } ] } ], "EndTime": 1.02, "IsPartial": false, "ResultId": "12345a67-8bc9-0de1-2f34-a5b678c90d12", "StartTime": 0.0199375 } ] } } } }

PII 식별 출력 예시

PII 식별은 스트리밍 트랜스크립션 작업에 사용할 수 있는 추가 기능입니다. 식별된 PII는 각 세그먼트의 Entities 섹션에 나열되어 있습니다.

{ "TranscriptResultStream": { "TranscriptEvent": { "Transcript": { "Results": [ { "Alternatives": [ { "Transcript": "my name is mike", "Items": [ { "Content": "my", "EndTime": 0.3799375, "StartTime": 0.0299375, "Type": "pronunciation" }, { "Content": "name", "EndTime": 0.5899375, "StartTime": 0.3899375, "Type": "pronunciation" }, { "Content": "is", "EndTime": 0.7899375, "StartTime": 0.5999375, "Type": "pronunciation" }, { "Content": "mike", "EndTime": 0.9199375, "StartTime": 0.7999375, "Type": "pronunciation" } ], "Entities": [ { "Content": "mike", "Category": "PII", "Type": "NAME", "StartTime" : 0.7999375, "EndTime" : 1.0199375, "Confidence": 0.9989 } ] } ], "EndTime": 1.02, "IsPartial": false, "ResultId": "12345a67-8bc9-0de1-2f34-a5b678c90d12", "StartTime": 0.0199375 } ] } } } }