Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Expurgation ou identification des données d’identification personnelle (PII) dans un flux en temps réel
Lorsque vous expurgez des données d’identification personnelle (PII) d’une transcription en streaming, Amazon Transcribe remplace chaque instance identifiée de PII par [PII]
dans votre transcription.
L’identification des PII est une autre option disponible pour les transcriptions en streaming. Lorsque vous activez l'identification des informations personnelles, les Amazon Transcribe étiquette dans vos résultats de transcription sous un Entities
objet. Pour un exemple de sortie, consultez les sections Exemple de sortie de streaming expurgée et Exemple de sortie PII d'identification.
La rédaction et l'identification des informations personnelles à l'aide de transcriptions en streaming sont disponibles dans les dialectes anglais suivants : australien (en-AU
), britannique (), américain (en-GB
) et espagnol (dialecte américainen-US
) (). es-US
L’identification et l’expurgation des PII pour les tâches en streaming ne sont effectuées qu’après transcription complète des segments audio.
Type de PII | Description |
---|---|
ADDRESS |
Adresse physique, telle que 100 Main Street, Anytown, États-Unis ou Suite n°12, bâtiment 123. Une adresse peut inclure une rue, un bâtiment, un emplacement, une ville, un état, un pays, un comté, un code postal, une circonscription, un quartier, etc. |
ALL |
Expurgez ou identifiez tous les types de PII répertoriés dans ce tableau. |
BANK_ACCOUNT_NUMBER |
Numéro du compte bancaire aux États-Unis. Il s’agit généralement d’un numéro composé de 10 à 12 chiffres, mais Amazon Transcribe reconnaît également les numéros de compte bancaire lorsque seuls les 4 derniers chiffres sont présents. |
BANK_ROUTING |
Numéro d’acheminement du compte bancaire aux États-Unis. Il s’agit généralement d’un numéro à 9 chiffres, mais Amazon Transcribe reconnaît également les numéros de routage lorsque seuls les 4 derniers chiffres sont présents. |
CREDIT_DEBIT_CVV |
Code de vérification de carte (CVV) à 3 chiffres présent sur les cartes de crédit et de débit VISA et Discover. MasterCard Sur les cartes de crédit ou de débit American Express, il s’agit d’un code numérique à 4 chiffres. |
CREDIT_DEBIT_EXPIRY |
Date d’expiration d’une carte de crédit ou de débit. Ce numéro comporte généralement 4 chiffres et est au format mois/année ou MM/AA. Par exemple, Amazon Transcribe peut reconnaître des dates d'expiration telles que le 21/01, le 01/2021 et le 1er janvier 2021. |
CREDIT_DEBIT_NUMBER |
Numéro de carte de crédit ou de débit. La longueur de ces numéros peut varier de 13 à 16 chiffres, mais ils reconnaissent Amazon Transcribe également les numéros de carte de crédit ou de débit lorsque seuls les 4 derniers chiffres sont présents. |
EMAIL |
Adresse e-mail, telle que efua.owusu@email.com. |
NAME |
Nom d’une personne. Ce type d'entité n'inclut pas les titres, tels que M., Mme, Miss ou Dr. Il Amazon Transcribe n'applique pas ce type d'entité aux noms qui font partie d'organisations ou d'adresses. Par exemple, Amazon Transcribe reconnaît l'organisation John Doe en tant qu'organisation et Jane Doe Street en tant qu'adresse. |
PHONE |
Numéro de téléphone. Ce type d’entité inclut également les numéros de télécopieur et de pager. |
PIN |
Numéro d’identification personnel (PIN) à 4 chiffres qui permet à une personne d’accéder aux informations de son compte bancaire. |
SSN |
Un numéro de sécurité sociale (SSN) est un numéro à 9 chiffres délivré aux citoyens américains, aux résidents permanents et aux résidents actifs temporaires. Amazon Transcribe reconnaît également les numéros de sécurité sociale lorsque seuls les 4 derniers chiffres sont présents. |
Vous pouvez démarrer une transcription en streaming en utilisant le AWS Management Console WebSocket, ou HTTP/2.
-
Connectez-vous au AWS Management Console
. -
Dans le panneau de navigation, choisissez Transcription en temps réel. Faites défiler jusqu’à Paramètres de suppression de contenu et développez ce champ s’il est réduit.
-
Activez l’identification et l’expurgation des PII.
-
Sélectionnez Identification uniquement ou Identification et expurgation, puis sélectionnez les types d’entités de PII que vous souhaitez identifier ou expurger dans votre transcription.
-
Vous êtes prêt à transcrire votre flux. Sélectionnez Démarrer le streaming et commencez à parler. Pour mettre fin à votre dictée, sélectionnez Arrêter le streaming.
Cet exemple crée une URL présignée qui utilise la rédaction des informations personnelles (ou identification des informations personnelles) dans un flux. WebSocket Les sauts de ligne ont été ajoutés pour faciliter la lecture. Pour plus d'informations sur l'utilisation WebSocket des flux avec Amazon Transcribe, consultezConfiguration d'un WebSocket stream. Pour plus de détails sur les paramètres, consultez la section StartStreamTranscription
.
GET wss://transcribestreaming.
us-west-2
.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE
%2F20220208
%2Fus-west-2
%2Ftranscribe
%2Faws4_request &X-Amz-Date=20220208
T235959
Z &X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US
&media-encoding=flac
&sample-rate=16000
&pii-entity-types=NAME
,ADDRESS
&content-redaction-type=PII (or &content-identification-type=PII)
Vous ne pouvez pas utiliser à la fois content-identification-type
et content-redaction-type
dans la même demande.
Les définitions des paramètres se trouvent dans la référence d'API ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section Paramètres communs.
Cet exemple crée une requête HTTP/2 avec l’identification ou l’expurgation des PII activée. Pour plus d'informations sur l'utilisation du streaming HTTP/2 avec Amazon Transcribe, consultezConfiguration d'un flux HTTP /2. Pour plus de détails sur les paramètres et les en-têtes spécifiques à Amazon Transcribe, voir StartStreamTranscription
.
POST /stream-transcription HTTP/2 host: transcribestreaming.
us-west-2
.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256:string
X-Amz-Date:20220208
T235959
Z Authorization: AWS4-HMAC-SHA256 Credential=access-key
/20220208
/us-west-2
/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code:en-US
x-amzn-transcribe-media-encoding:flac
x-amzn-transcribe-sample-rate:16000
x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types:transfer-encoding: chunked
NAME
,ADDRESS
Vous ne pouvez pas utiliser à la fois content-identification-type
et content-redaction-type
dans la même demande.
Les définitions des paramètres se trouvent dans la référence d'API ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section Paramètres communs.
Note
La rédaction d'informations personnelles pour le streaming n'est prise en charge que dans les pays suivants Régions AWS : Asie-Pacifique (Séoul), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo), Canada (centre), UE (Francfort), UE (Irlande), UE (Londres), États-Unis est (Virginie du Nord), États-Unis est (Ohio) et États-Unis ouest (Oregon).