翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
リアルタイムストリームの PII の編集または識別
ストリーミング文字起こしから個人を特定できる情報 (PII) を編集する場合、 Amazon Transcribe は、お客様のトランスクリプトに特定された PII の各インスタンスを [PII]
に置き換えます。
ストリーミング文字起こしに使用できる追加オプションとして、PII 識別があります。PII 識別をアクティブ化すると、 は文字起こ Amazon Transcribe し結果の PII に Entities
オブジェクトのラベルを付けます。出力サンプルについては、「編集済みストリーミング出力の例」と「PII 識別出力の例」を参照してください。
ストリーミング文字起こしによる PII の編集と識別は、オーストラリア (en-AU
)、英国 ()、米国 (en-GB
)、スペイン語の米国 (en-US
) の英語の方言で使用できますes-US
。
ストリーミングジョブの PII 識別とリダクションは、音声セグメントの完全な文字起こし時にのみ実行されます。
PII タイプ | 説明 |
---|---|
ADDRESS |
実際の住所、米国、エニータウン市。メインストリート 100 番地や、ビル 123 番、スイート 12 番など。住所には、通り、ビル、場所、市区町村、州、国、郡、郵便番号、管区、近隣などを含めることができます。 |
ALL |
この表に記載されているすべての PII のタイプを編集または特定します。 |
BANK_ACCOUNT_NUMBER |
米国の銀行口座番号 この番号は通常 10~12 桁の長さですが、 Amazon Transcribe は下 4 桁のみの銀行口座番号も認識します。 |
BANK_ROUTING |
米国の銀行口座の支店コード この番号は通常 9 桁の長さですが、 Amazon Transcribe は下 4 桁のみの支店コードも認識します。 |
CREDIT_DEBIT_CVV |
VISA に存在する 3 桁のカード検証コード (CVV) MasterCard、Discover クレジットカードとデビットカード。American Express のクレジットカードまたはデビットカードでは、4 桁の数字コードです。 |
CREDIT_DEBIT_EXPIRY |
クレジットカードまたはデビットカードの有効期限日 この番号は通常 4 桁で、「月/年」または「MM/YY」という形式になっています。例えば、 は 01/21、01/2021、Jan 2021 などの有効期限を認識 Amazon Transcribe できます。 |
CREDIT_DEBIT_NUMBER |
クレジットカードまたはデビットカードの番号。これらの番号の長さは 13 桁から 16 桁までさまざまですが、最後の 4 桁のみが存在する場合はクレジットカード番号またはデビットカード番号 Amazon Transcribe も認識されます。 |
EMAIL |
efua.owusu@email.com などのメールアドレス。 |
NAME |
個人の名前。このエンティティタイプには、Mr.、Mrs.、Miss、Dr. Amazon Transcribe does などのタイトルは含まれません。このエンティティタイプは、組織または住所の一部である名前には適用されません。例えば、 は John Doe Organization を組織として認識し、Jane Doe Street を住所として Amazon Transcribe 認識します。 |
PHONE |
電話番号 このエンティティタイプには、ファックス番号とポケットベル番号も含まれます。 |
PIN |
銀行口座情報へのアクセスを可能にする 4 桁の個人識別番号 (PIN)。 |
SSN |
社会保障番号 (SSN) は、米国市民、永住者、および一時的な労働居住者に発行される 9 桁の番号です。 は、最後の 4 桁のみが存在する場合に社会保障番号 Amazon Transcribe も認識します。 |
ストリーミング文字起こしは AWS Management Console、、 WebSocket、または HTTP/2 を使用して開始できます。
-
AWS Management Console
にサインインします。 -
ナビゲーションペインで、[リアルタイム文字起こし] を選択します。コンテンツ削除の設定 にスクロールして、最小化されている場合はこのフィールドを展開します。
-
「PII の識別とリダクション」をオンに切り替えます。
-
「識別のみ」または「識別とリダクション」を選択し、トランスクリプトで識別または編集したい PII エンティティタイプを選択します。
-
これで、ストリームを書き起こす準備ができました。[ストリーミングを開始する] を選択し、話し始めます。ディクテーションを終了するには、[ストリーミングを停止する] を選択します。
この例では、 WebSocket ストリームで PII リダクション (または PII 識別) を使用する署名付き URL を作成します。読みやすくするために、改行が追加されています。で WebSocket ストリームを使用する方法の詳細については、 Amazon Transcribe「」を参照してください WebSocket ストリームのセットアップ。パラメータの詳細については、「StartStreamTranscription
」を参照してください。
GET wss://transcribestreaming.
us-west-2
.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE
%2F20220208
%2Fus-west-2
%2Ftranscribe
%2Faws4_request &X-Amz-Date=20220208
T235959
Z &X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US
&media-encoding=flac
&sample-rate=16000
&pii-entity-types=NAME
,ADDRESS
&content-redaction-type=PII (or &content-identification-type=PII)
同じリクエストで content-identification-type
と content-redaction-type
両方を使用することはできません。
パラメータ定義は API リファレンス にあります。すべての API オペレーションに共通するパラメータは、「共通パラメータ」セクションに記載されています。 AWS
この例では、PII 識別または PII リダクションを有効にした状態で HTTP/2 リクエストを作成します。での HTTP/2 ストリーミングの使用の詳細については Amazon Transcribe、「」を参照してくださいHTTP/2 ストリームのセットアップ。に固有のパラメータとヘッダーの詳細については、 Amazon Transcribe「」を参照してくださいStartStreamTranscription
。
POST /stream-transcription HTTP/2 host: transcribestreaming.
us-west-2
.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256:string
X-Amz-Date:20220208
T235959
Z Authorization: AWS4-HMAC-SHA256 Credential=access-key
/20220208
/us-west-2
/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code:en-US
x-amzn-transcribe-media-encoding:flac
x-amzn-transcribe-sample-rate:16000
x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types:transfer-encoding: chunked
NAME
,ADDRESS
同じリクエストで content-identification-type
と content-redaction-type
両方を使用することはできません。
パラメータ定義は API リファレンス にあります。すべての API オペレーションに共通するパラメータは、「共通パラメータ」セクションに記載されています。 AWS
注記
ストリーミングの PII リダクションは、 AWS リージョンアジアパシフィック (ソウル)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、カナダ (中部)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン) の でのみサポートされています。