リアルタイムストリームの PII の編集または識別 - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

リアルタイムストリームの PII の編集または識別

ストリーミング文字起こしから個人を特定できる情報 (PII) を編集する場合、 Amazon Transcribe は、お客様のトランスクリプトに特定された PII の各インスタンスを [PII] に置き換えます。

ストリーミング文字起こしに使用できる追加オプションとして、PII 識別があります。PII 識別をアクティブ化すると、 は文字起こ Amazon Transcribe し結果の PII に Entities オブジェクトのラベルを付けます。出力サンプルについては、「編集済みストリーミング出力の例」と「PII 識別出力の例」を参照してください。

ストリーミング文字起こしによる PII の編集と識別は、オーストラリア (en-AU)、英国 ()、米国 (en-GB)、スペイン語の米国 (en-US) の英語の方言で使用できますes-US

ストリーミングジョブの PII 識別とリダクションは、音声セグメントの完全な文字起こし時にのみ実行されます。

ストリーミング文字起こしで認識 Amazon Transcribe できる PII のタイプ
PII タイプ 説明
ADDRESS

実際の住所、米国、エニータウン市。メインストリート 100 番地や、ビル 123 番、スイート 12 番など。住所には、通り、ビル、場所、市区町村、州、国、郡、郵便番号、管区、近隣などを含めることができます。

ALL

この表に記載されているすべての PII のタイプを編集または特定します。

BANK_ACCOUNT_NUMBER

米国の銀行口座番号 この番号は通常 10~12 桁の長さですが、 Amazon Transcribe は下 4 桁のみの銀行口座番号も認識します。

BANK_ROUTING

米国の銀行口座の支店コード この番号は通常 9 桁の長さですが、 Amazon Transcribe は下 4 桁のみの支店コードも認識します。

CREDIT_DEBIT_CVV

VISA に存在する 3 桁のカード検証コード (CVV) MasterCard、Discover クレジットカードとデビットカード。American Express のクレジットカードまたはデビットカードでは、4 桁の数字コードです。

CREDIT_DEBIT_EXPIRY

クレジットカードまたはデビットカードの有効期限日 この番号は通常 4 桁で、「月/年」または「MM/YY」という形式になっています。例えば、 は 01/2101/2021、Jan 2021 などの有効期限を認識 Amazon Transcribe できます。

CREDIT_DEBIT_NUMBER

クレジットカードまたはデビットカードの番号。これらの番号の長さは 13 桁から 16 桁までさまざまですが、最後の 4 桁のみが存在する場合はクレジットカード番号またはデビットカード番号 Amazon Transcribe も認識されます。

EMAIL

efua.owusu@email.com などのメールアドレス。

NAME

個人の名前。このエンティティタイプには、Mr.、Mrs.、Miss、Dr. Amazon Transcribe does などのタイトルは含まれません。このエンティティタイプは、組織または住所の一部である名前には適用されません。例えば、 は John Doe Organization を組織として認識し、Jane Doe Street を住所として Amazon Transcribe 認識します。

PHONE

電話番号 このエンティティタイプには、ファックス番号とポケットベル番号も含まれます。

PIN

銀行口座情報へのアクセスを可能にする 4 桁の個人識別番号 (PIN)。

SSN

社会保障番号 (SSN) は、米国市民、永住者、および一時的な労働居住者に発行される 9 桁の番号です。 は、最後の 4 桁のみが存在する場合に社会保障番号 Amazon Transcribe も認識します。

ストリーミング文字起こしは AWS Management Console、、 WebSocket、または HTTP/2 を使用して開始できます。

  1. AWS Management Console にサインインします。

  2. ナビゲーションペインで、[リアルタイム文字起こし] を選択します。コンテンツ削除の設定 にスクロールして、最小化されている場合はこのフィールドを展開します。

    Amazon Transcribe コンソールのスクリーンショット:「リアルタイム文字起こし」ページ。
  3. PII の識別とリダクション」をオンに切り替えます。

    Amazon Transcribe コンソールのスクリーンショット: 展開された「コンテンツ削除設定」パネル。
  4. 識別のみ」または「識別とリダクション」を選択し、トランスクリプトで識別または編集したい PII エンティティタイプを選択します。

    Amazon Transcribe コンソールのスクリーンショット: 選択できる PII タイプのリスト。
  5. これで、ストリームを書き起こす準備ができました。[ストリーミングを開始する] を選択し、話し始めます。ディクテーションを終了するには、[ストリーミングを停止する] を選択します。

この例では、 WebSocket ストリームで PII リダクション (または PII 識別) を使用する署名付き URL を作成します。読みやすくするために、改行が追加されています。で WebSocket ストリームを使用する方法の詳細については、 Amazon Transcribe「」を参照してください WebSocket ストリームのセットアップ。パラメータの詳細については、「StartStreamTranscription」を参照してください。

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &pii-entity-types=NAME,ADDRESS &content-redaction-type=PII (or &content-identification-type=PII)

同じリクエストで content-identification-typecontent-redaction-type 両方を使用することはできません。

パラメータ定義は API リファレンス にあります。すべての API オペレーションに共通するパラメータは、「共通パラメータ」セクションに記載されています。 AWS

この例では、PII 識別または PII リダクションを有効にした状態で HTTP/2 リクエストを作成します。での HTTP/2 ストリーミングの使用の詳細については Amazon Transcribe、「」を参照してくださいHTTP/2 ストリームのセットアップ。に固有のパラメータとヘッダーの詳細については、 Amazon Transcribe「」を参照してくださいStartStreamTranscription

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types: NAME,ADDRESS transfer-encoding: chunked

同じリクエストで content-identification-typecontent-redaction-type 両方を使用することはできません。

パラメータ定義は API リファレンス にあります。すべての API オペレーションに共通するパラメータは、「共通パラメータ」セクションに記載されています。 AWS

注記

ストリーミングの PII リダクションは、 AWS リージョンアジアパシフィック (ソウル)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、カナダ (中部)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン) の でのみサポートされています。