在即時串流中修訂或識別 PII - Amazon Transcribe

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在即時串流中修訂或識別 PII

從串流轉錄中修訂個人身分識別資訊 (PII) 時, Amazon Transcribe 會使用 [PII] 取代文字記錄中每個已識別的 PII 執行個體。

可用於串流轉錄的其他選項是 PII 識別。當您啟用 PII 識別時,會將轉錄結果中的 PII Amazon Transcribe 標示在物件下方。Entities如需輸出範例,請參閱 編輯流輸出範例PII識別輸出範例

使用以下英語方言可以使用以下英語方言對 PII 進行編輯和識別:澳大利亞語(en-AU),英國(),美國(en-GB)和西班牙美國方言(en-US)。es-US

串流工作的 PII 識別和修訂只有在完成音訊區段的轉錄時才會執行。

Amazon Transcribe 可辨識串流轉錄的 PII 類型
PII 類型 描述
ADDRESS

實體地址,例如 100 Main Street, Anytown, USASuite #12, Building 123。地址可以包括街道、建築物、位置、城市、州、國家、縣、郵遞區號、分區、鄰里等。

ALL

修訂或識別此表格中列出的所有 PII 類型。

BANK_ACCOUNT_NUMBER

美國銀行帳戶號碼 這些通常介於 10-12 位數間,但是僅存在最後 4 位數字時, Amazon Transcribe 也可以識別銀行帳戶號碼。

BANK_ROUTING

美國銀行帳戶的分行代碼。這些通常長 9 位數字,但是只有最後 4 位數字存在時, Amazon Transcribe 也可以識別路由號碼。

CREDIT_DEBIT_CVV

VISA 上存在的 3 位數信用卡驗證碼(CVV) MasterCard,以及發現信用卡和借記卡。在美國運通信用卡或簽帳卡,是一個 4 位數的數字代碼。

CREDIT_DEBIT_EXPIRY

信用卡或簽帳卡到期日 該數字通常為 4 位數,格式為月/年或 MM/YY。例如, Amazon Transcribe 可以識別到期日期,例如 2021 年 1 月 21 日、2021 年 1 月和 1 月

CREDIT_DEBIT_NUMBER

信用卡或簽帳卡號碼。這些數字的長度可以從 13 到 16 位數不等,但是當僅存在最後 4 位數字時, Amazon Transcribe 也可以識別信用卡或借記卡號碼。

EMAIL

電子郵件位址,例如 efua.owusu@email.com

NAME

個人的姓名。此實體類型不包含標題,例如先生、太太、小姐或博士 Amazon Transcribe 不會將此實體類型套用至屬於組織或地址一部分的名稱。例如,將多約翰組織 Amazon Transcribe 識別為一個組織,而李四街作為一個地址。

PHONE

電話號碼。此實體類型還包括傳真和呼叫器號碼。

PIN

4 位數的個人識別號碼 (PIN),允許某人存取其銀行帳戶資訊。

SSN

社會安全號碼(SSN)是一個 9 位數的號碼,發給美國公民,永久居民和臨時工作居民。 Amazon Transcribe 當只有最後 4 位數字時,還可以識別社會安全號碼。

您可以使用 AWS Management Console、 WebSocket或 HTTP/2 開始串流轉錄。

  1. 登入 AWS Management Console

  2. 在導覽窗格中,選擇即時轉錄。向下捲動至內容移除設定,如果此欄位已最小化,請展開此欄位。

    Amazon Transcribe 控制台屏幕截圖:「實時轉錄」頁面。
  3. 開啟 PII 識別與編輯

    Amazon Transcribe 控制台屏幕截圖:擴展的「內容刪除設置」面板。
  4. 選擇 僅限識別識別與編輯,然後選擇您要在文字記錄中識別或編輯的 PII 實體類型。

    Amazon Transcribe 主控台螢幕擷取畫面:可選取的 PII 類型清單。
  5. 您現在已準備好轉錄串流。選擇開始串流並開始說話。若要結束聽寫,選擇停止串流

此範例會建立在串流中使用 PII 密文 (或 PII 識別) 的預先簽署 URL。 WebSocket 已加入分行符號以提高可讀性。如需搭配使用 WebSocket 串流的詳細資訊 Amazon Transcribe,請參閱設定 WebSocket 串流。如需參數詳細資訊,請參閱 StartStreamTranscription

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &pii-entity-types=NAME,ADDRESS &content-redaction-type=PII (or &content-identification-type=PII)

您不能在相同的請求中同時使用 content-identification-typecontent-redaction-type

您可以在 API 參考中找到參數定義;所有 AWS API 作業的共用參數會列在「一般參數」區段中。

此範例會建立啟用 PII 識別或 PII 修訂的 HTTP/2 請求。如需使用 HTTP/2 串流搭配使用的詳細資訊 Amazon Transcribe,請參閱。設定 HTTP/2 串流如需有關特定參數和標題的更多詳細資訊 Amazon Transcribe,請參閱StartStreamTranscription

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types: NAME,ADDRESS transfer-encoding: chunked

您不能在相同的請求中同時使用 content-identification-typecontent-redaction-type

您可以在 API 參考中找到參數定義;所有 AWS API 作業的共用參數會列在「一般參數」區段中。

注意

串流 PII 編修僅支援下列項目 AWS 區域:亞太區域 (首爾)、亞太區域 (雪梨)、亞太區域 (東京)、加拿大 (中部)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 和美國西部 (奧勒岡)。