Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Un identifiant de données personnalisé est un ensemble de critères que vous définissez pour détecter les données sensibles dans les objets Amazon Simple Storage Service (Amazon S3). Lorsque vous créez un identifiant de données personnalisé, vous spécifiez une expression régulière (regex) qui définit un modèle de texte à associer à un objet S3. Vous pouvez également définir des séquences de caractères et une règle de proximité pour affiner les résultats. Les séquences de caractères peuvent être : des mots clés, qui sont des mots ou des phrases qui doivent se trouver à proximité du texte correspondant à l'expression régulière, ou des mots ignorés, qui sont des mots ou des phrases à exclure des résultats. En utilisant des identifiants de données personnalisés, vous pouvez compléter les identifiants de données gérés fournis par Amazon Macie et détecter les données sensibles qui reflètent les scénarios, les propriétés intellectuelles ou les données propriétaires propres à votre entreprise.
Par exemple, de nombreuses entreprises ont une syntaxe spécifique pour les employés IDs. L'une de ces syntaxes pourrait être : une majuscule indiquant si un employé est un employé à temps plein (F) ou à temps partiel (P), suivie d'un trait d'union (—), suivie d'une séquence de huit chiffres identifiant l'employé. Les exemples sont : F—12345678 pour un employé à temps plein, et P—87654321 pour un employé à temps partiel. Pour détecter les employés IDs qui utilisent cette syntaxe, vous pouvez créer un identifiant de données personnalisé qui spécifie l'expression régulière suivante :[A-Z]-\d{8}
. Pour affiner l'analyse et éviter les faux positifs, vous pouvez également configurer l'identifiant pour qu'il utilise des mots clés (employee
etemployee ID
) et une distance de correspondance maximale de 20 caractères. Avec ces critères, les résultats incluent du texte correspondant à l'expression régulière si le texte apparaît après le mot clé employé ou ID d'employé et que tout le texte se trouve à moins de 20 caractères de l'un de ces mots clés.
Pour découvrir comment les mots clés peuvent vous aider à trouver des données sensibles et à éviter les faux positifs, regardez la vidéo suivante :
Outre les critères de détection, vous pouvez éventuellement définir des paramètres de gravité personnalisés pour les résultats produits par un identifiant de données personnalisé. La gravité peut être basée sur le nombre d'occurrences de texte correspondant aux critères de détection de l'identifiant. Si vous ne spécifiez pas ces paramètres, Macie attribue automatiquement le niveau de gravité moyen à tous les résultats produits par l'identifiant. La gravité ne change pas en fonction du nombre d'occurrences de texte correspondant aux critères de détection de l'identifiant.
Pour obtenir des informations détaillées sur ces paramètres et sur d'autres paramètres, consultezOptions de configuration pour les identificateurs de données personnalisés.
Pour créer un identificateur de données personnalisé
Vous pouvez créer un identifiant de données personnalisé à l'aide de la console Amazon Macie ou de l'API Amazon Macie.
Suivez ces étapes pour créer un identifiant de données personnalisé à l'aide de la console Amazon Macie.
Pour créer un identificateur de données personnalisé
Ouvrez la console Amazon Macie à l'adresse. https://console.aws.amazon.com/macie/
-
Dans le volet de navigation, sous Settings (Paramètres), choisissez Custom data identifiers (Identificateurs de données personnalisés).
-
Sélectionnez Create (Créer).
-
Dans la zone Nom, saisissez un nom pour l'identificateur de données personnalisé. Le nom peut contenir jusqu'à 128 caractères.
-
Dans Description, entrez éventuellement une brève description de l'identifiant de données personnalisé. La description peut contenir jusqu'à 512 caractères.
Note
Évitez d'inclure des données sensibles dans le nom ou la description d'un identifiant de données personnalisé. Les autres utilisateurs de votre compte peuvent accéder au nom ou à la description, en fonction des actions qu'ils sont autorisés à effectuer dans Macie.
-
Pour Expression régulière, entrez l'expression régulière (regex) qui définit le modèle de texte à correspondre. L'expression régulière peut contenir jusqu'à 512 caractères.
Macie prend en charge un sous-ensemble de la syntaxe des modèles fournie par la bibliothèque Perl Compatible Regular Expressions (PCRE)
. Pour plus de détails et de conseils, consultez la section Critères de détection pour les identificateurs de données personnalisés. -
Pour les mots clés, entrez éventuellement jusqu'à 50 séquences de caractères (séparées par des virgules) pour définir un texte spécifique qui doit se trouver à proximité du texte correspondant au modèle regex.
Macie inclut une occurrence dans les résultats uniquement si le texte correspond au modèle regex et s'il se trouve dans la distance de correspondance maximale de l'un de ces mots clés. Chaque mot clé peut contenir de 3 à 90 caractères UTF-8. Les mots-clés ne sont pas sensibles à la casse.
-
Pour Ignorer les mots, entrez éventuellement jusqu'à 10 séquences de caractères (séparées par des virgules) qui définissent le texte spécifique à exclure des résultats.
Macie exclut une occurrence des résultats si le texte correspond au modèle regex mais qu'il contient l'un de ces mots ignorés. Chaque mot ignoré peut contenir de 4 à 90 caractères UTF-8. Les mots ignorés sont sensibles à la casse.
-
Pour Distance de correspondance maximale, entrez éventuellement le nombre maximum de caractères pouvant exister entre la fin d'un mot clé et la fin du texte correspondant au modèle regex.
Macie inclut une occurrence dans les résultats uniquement si le texte correspond au modèle regex et s'il se trouve à cette distance d'un mot clé complet. La distance peut être comprise entre 1 et 300 caractères. La distance par défaut est de 50 caractères.
-
Dans le champ Sévérité, choisissez le mode de détermination de la gravité des résultats relatifs aux données sensibles produits par l'identifiant de données personnalisé :
-
Pour attribuer automatiquement la gravité moyenne à tous les résultats, choisissez Utiliser une gravité moyenne pour un nombre quelconque de correspondances (par défaut). Avec cette option, Macie attribue automatiquement le niveau de gravité moyen à un résultat si l'objet S3 concerné contient une ou plusieurs occurrences de texte correspondant aux critères de détection.
-
Pour attribuer la gravité en fonction des seuils d'occurrence que vous spécifiez, choisissez Utiliser des paramètres personnalisés pour déterminer la gravité. Utilisez ensuite les options Seuil d'occurrences et Niveau de gravité pour spécifier le nombre minimum de correspondances qui doivent exister dans un objet S3 pour produire un résultat avec une gravité sélectionnée.
Vous pouvez spécifier jusqu'à trois seuils d'occurrence, un pour chaque niveau de gravité pris en charge par Macie : faible (le moins grave), moyen ou élevé (le plus sévère). Si vous en spécifiez plusieurs, les seuils doivent être classés par ordre croissant de gravité, en passant de faible à élevé. Si un objet S3 contient moins d'occurrences que le seuil le plus bas, Macie ne crée pas de résultat.
-
-
(Facultatif) Pour les balises, choisissez Ajouter une balise, puis entrez jusqu'à 50 balises à attribuer à l'identifiant de données personnalisé.
Un tag est un label que vous définissez et attribuez à certains types de AWS ressources. Chaque balise se compose d'une clé de balise obligatoire et d'une valeur de balise facultative. Les balises peuvent vous aider à identifier, à classer et à gérer les ressources de différentes manières, par exemple en fonction de leur objectif, de leur propriétaire, de leur environnement ou d'autres critères. Pour en savoir plus, consultez Marquer les ressources de Macie.
-
(Facultatif) Pour Evaluer, entrez jusqu'à 1 000 caractères dans la zone Exemple de données, puis choisissez Test pour tester les critères de détection. Macie évalue les exemples de données et indique le nombre d'occurrences de texte correspondant aux critères. Vous pouvez répéter cette étape autant de fois que vous le souhaitez pour affiner et optimiser les critères.
Note
Nous vous recommandons vivement de tester et d'affiner les critères de détection à l'aide d'échantillons de données. Les identificateurs de données personnalisés étant utilisés par les tâches de découverte de données sensibles, vous ne pouvez pas modifier un identifiant de données personnalisé après l'avoir créé. Cela permet de garantir que vous disposez d'un historique immuable des découvertes de données sensibles et des résultats de découverte.
-
Lorsque vous avez terminé, choisissez Submit (Soumettre).
Macie teste les paramètres et vérifie qu'il peut compiler l'expression régulière. En cas de problème avec un paramètre ou l'expression régulière, Macie affiche une erreur décrivant le problème. Une fois les problèmes résolus, vous pouvez enregistrer l'identifiant de données personnalisé.
Après avoir créé l'identifiant de données personnalisé, vous pouvez créer et configurer des tâches de découverte de données sensibles pour l'utiliser, ou l'ajouter à vos paramètres pour la découverte automatique de données sensibles.