本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在即時串流中修訂或識別 PII
從串流轉錄中修訂個人身分識別資訊 (PII) 時, Amazon Transcribe 會使用 [PII]
取代文字記錄中每個已識別的 PII 執行個體。
可用於串流轉錄的其他選項是 PII 識別。當您啟用 PII 識別時,會將轉錄結果中的 PII Amazon Transcribe 標示在物件下方。Entities
如需輸出範例,請參閱 編輯流輸出範例 和 PII識別輸出範例。
使用以下英語方言可以使用以下英語方言對 PII 進行編輯和識別:澳大利亞語(en-AU
),英國(),美國(en-GB
)和西班牙美國方言(en-US
)。es-US
串流工作的 PII 識別和修訂只有在完成音訊區段的轉錄時才會執行。
PII 類型 | 描述 |
---|---|
ADDRESS |
實體地址,例如 100 Main Street, Anytown, USA 或 Suite #12, Building 123。地址可以包括街道、建築物、位置、城市、州、國家、縣、郵遞區號、分區、鄰里等。 |
ALL |
修訂或識別此表格中列出的所有 PII 類型。 |
BANK_ACCOUNT_NUMBER |
美國銀行帳戶號碼 這些通常介於 10-12 位數間,但是僅存在最後 4 位數字時, Amazon Transcribe 也可以識別銀行帳戶號碼。 |
BANK_ROUTING |
美國銀行帳戶的分行代碼。這些通常長 9 位數字,但是只有最後 4 位數字存在時, Amazon Transcribe 也可以識別路由號碼。 |
CREDIT_DEBIT_CVV |
VISA 上存在的 3 位數信用卡驗證碼(CVV) MasterCard,以及發現信用卡和借記卡。在美國運通信用卡或簽帳卡,是一個 4 位數的數字代碼。 |
CREDIT_DEBIT_EXPIRY |
信用卡或簽帳卡到期日 該數字通常為 4 位數,格式為月/年或 MM/YY。例如, Amazon Transcribe 可以識別到期日期,例如 2021 年 1 月 21 日、2021 年 1 月和 1 月。 |
CREDIT_DEBIT_NUMBER |
信用卡或簽帳卡號碼。這些數字的長度可以從 13 到 16 位數不等,但是當僅存在最後 4 位數字時, Amazon Transcribe 也可以識別信用卡或借記卡號碼。 |
EMAIL |
電子郵件位址,例如 efua.owusu@email.com。 |
NAME |
個人的姓名。此實體類型不包含標題,例如先生、太太、小姐或博士 Amazon Transcribe 不會將此實體類型套用至屬於組織或地址一部分的名稱。例如,將多約翰組織 Amazon Transcribe 識別為一個組織,而李四街作為一個地址。 |
PHONE |
電話號碼。此實體類型還包括傳真和呼叫器號碼。 |
PIN |
4 位數的個人識別號碼 (PIN),允許某人存取其銀行帳戶資訊。 |
SSN |
社會安全號碼(SSN)是一個 9 位數的號碼,發給美國公民,永久居民和臨時工作居民。 Amazon Transcribe 當只有最後 4 位數字時,還可以識別社會安全號碼。 |
您可以使用 AWS Management Console、 WebSocket或 HTTP/2 開始串流轉錄。
-
在導覽窗格中,選擇即時轉錄。向下捲動至內容移除設定,如果此欄位已最小化,請展開此欄位。
-
開啟 PII 識別與編輯。
-
選擇 僅限識別 或 識別與編輯,然後選擇您要在文字記錄中識別或編輯的 PII 實體類型。
-
您現在已準備好轉錄串流。選擇開始串流並開始說話。若要結束聽寫,選擇停止串流。
此範例會建立在串流中使用 PII 密文 (或 PII 識別) 的預先簽署 URL。 WebSocket 已加入分行符號以提高可讀性。如需搭配使用 WebSocket 串流的詳細資訊 Amazon Transcribe,請參閱設定 WebSocket 串流。如需參數詳細資訊,請參閱 StartStreamTranscription
。
GET wss://transcribestreaming.
us-west-2
.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE
%2F20220208
%2Fus-west-2
%2Ftranscribe
%2Faws4_request &X-Amz-Date=20220208
T235959
Z &X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US
&media-encoding=flac
&sample-rate=16000
&pii-entity-types=NAME
,ADDRESS
&content-redaction-type=PII (or &content-identification-type=PII)
您不能在相同的請求中同時使用 content-identification-type
和 content-redaction-type
。
您可以在 API 參考中找到參數定義;所有 AWS API 作業的共用參數會列在「一般參數」區段中。
此範例會建立啟用 PII 識別或 PII 修訂的 HTTP/2 請求。如需使用 HTTP/2 串流搭配使用的詳細資訊 Amazon Transcribe,請參閱。設定 HTTP/2 串流如需有關特定參數和標題的更多詳細資訊 Amazon Transcribe,請參閱StartStreamTranscription
。
POST /stream-transcription HTTP/2 host: transcribestreaming.
us-west-2
.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256:string
X-Amz-Date:20220208
T235959
Z Authorization: AWS4-HMAC-SHA256 Credential=access-key
/20220208
/us-west-2
/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code:en-US
x-amzn-transcribe-media-encoding:flac
x-amzn-transcribe-sample-rate:16000
x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types:transfer-encoding: chunked
NAME
,ADDRESS
您不能在相同的請求中同時使用 content-identification-type
和 content-redaction-type
。
您可以在 API 參考中找到參數定義;所有 AWS API 作業的共用參數會列在「一般參數」區段中。
注意
串流 PII 編修僅支援下列項目 AWS 區域:亞太區域 (首爾)、亞太區域 (雪梨)、亞太區域 (東京)、加拿大 (中部)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 和美國西部 (奧勒岡)。