Schéma de signalement de l'emplacement des données sensibles - Amazon Macie

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Schéma de signalement de l'emplacement des données sensibles

Amazon Macie utilise des JSON structures standardisées pour stocker des informations indiquant où se trouvent les données sensibles dans les objets Amazon Simple Storage Service (Amazon S3). Les structures sont utilisées pour les découvertes de données sensibles et les résultats de découverte de données sensibles. Pour les résultats de données sensibles, les structures font partie du JSON schéma des résultats. Pour consulter le JSON schéma complet des résultats, consultez la section Résultats du manuel Amazon Macie API Reference. Pour en savoir plus sur les résultats de découverte de données sensibles, consultezStockage et conservation des résultats de découverte de données sensibles.

Vue d'ensemble du schéma

Pour indiquer l'emplacement des données sensibles détectées par Amazon Macie dans un objet S3 concerné, le JSON schéma des découvertes de données sensibles et des résultats de découverte de données sensibles inclut un customDataIdentifiers objet et un sensitiveData objet. L'customDataIdentifiersobjet fournit des détails sur les données détectées par Macie à l'aide d'identifiants de données personnalisés. L'sensitiveDataobjet fournit des détails sur les données détectées par Macie à l'aide d'identifiants de données gérés.

Chaque customDataIdentifiers sensitiveData objet contient un ou plusieurs detections tableaux :

  • Dans un customDataIdentifiers objet, le detections tableau indique quels identificateurs de données personnalisés ont détecté les données et produit le résultat. Pour chaque identifiant de données personnalisé, le tableau indique également le nombre d'occurrences des données détectées par l'identifiant. Il peut également indiquer l'emplacement des données détectées par l'identifiant.

  • Dans un sensitiveData objet, un detections tableau indique les types de données sensibles détectées par Macie à l'aide d'identifiants de données gérés. Pour chaque type de données sensibles, le tableau indique également le nombre d'occurrences des données et peut indiquer leur emplacement.

Pour rechercher des données sensibles, un detections tableau peut inclure 1 à 15 occurrences objets. Chaque occurrences objet indique où Macie a détecté des occurrences individuelles d'un type spécifique de données sensibles.

Par exemple, le detections tableau suivant indique l'emplacement de trois occurrences de données sensibles (numéros de sécurité sociale américains) que Macie a trouvées dans un CSV fichier.

"sensitiveData": [ { "category": "PERSONAL_INFORMATION", "detections": [ { "count": 30, "occurrences": { "cells": [ { "cellReference": null, "column": 1, "columnName": "SSN", "row": 2 }, { "cellReference": null, "column": 1, "columnName": "SSN", "row": 3 }, { "cellReference": null, "column": 1, "columnName": "SSN", "row": 4 } ] }, "type": "USA_SOCIAL_SECURITY_NUMBER" }

L'emplacement et le nombre d'occurrencesobjets dans une detections matrice varient en fonction des catégories, des types et du nombre d'occurrences de données sensibles détectées par Macie au cours d'un cycle d'analyse automatique de découverte de données sensibles ou de l'exécution d'une tâche de découverte de données sensibles. Pour chaque cycle d'analyse ou exécution de tâche, Macie utilise un algorithme de recherche axé sur la profondeur pour renseigner les résultats obtenus avec des données de localisation pour 1 à 15 occurrences de données sensibles détectées par Macie dans les objets S3. Ces occurrences indiquent les catégories et les types de données sensibles que peuvent contenir un compartiment et un objet S3 concernés.

Un occurrences objet peut contenir les structures suivantes, selon le type de fichier ou le format de stockage de l'objet S3 concerné :

  • cellstableau — Ce tableau s'applique aux classeurs, CSV fichiers et TSV fichiers Microsoft Excel. Un objet de ce tableau indique une cellule ou un champ dans lequel Macie a détecté une occurrence de données sensibles.

  • lineRangestableau — Ce tableau s'applique aux fichiers de messages électroniques (EML) et aux fichiers texte non binaires autres que CSV les JSON lignes et les TSV fichiers, par exemple HTMLTXT, et les fichiers. JSON XML Un objet de ce tableau indique une ligne ou une plage de lignes incluses dans laquelle Macie a détecté une occurrence de données sensibles, ainsi que la position des données sur la ou les lignes spécifiées.

    Dans certains cas, un objet d'un lineRanges tableau indique l'emplacement d'une détection de données sensibles dans un type de fichier ou un format de stockage pris en charge par un autre type de tableau. Ces cas sont les suivants : une détection dans une section non structurée d'un fichier autrement structuré, tel qu'un commentaire dans un fichier ; une détection dans un fichier mal formé que Macie analyse en tant que texte brut ; et un TSV fichier CSV ou contenant un ou plusieurs noms de colonnes dans lesquels Macie a détecté des données sensibles.

  • offsetRangestableau — Ce tableau est réservé pour une utilisation future. Si ce tableau est présent, sa valeur est nulle.

  • pagestableau — Ce tableau s'applique aux fichiers Adobe Portable Document Format (PDF). Un objet de ce tableau indique une page dans laquelle Macie a détecté une occurrence de données sensibles.

  • recordstableau — Ce tableau s'applique aux conteneurs d'objets Apache Avro, aux fichiers Apache Parquet, aux JSON fichiers et aux fichiers JSON Lines. Pour les conteneurs d'objets Avro et les fichiers Parquet, un objet de ce tableau indique un index d'enregistrement et le chemin d'accès à un champ d'un enregistrement dans lequel Macie a détecté une occurrence de données sensibles. Pour les fichiers JSON et JSON lignes, un objet de ce tableau indique le chemin d'accès à un champ ou à un tableau dans lequel Macie a détecté une occurrence de données sensibles. Pour les fichiers JSON Lines, il indique également l'index de la ligne contenant les données.

Le contenu de ces tableaux varie en fonction du type de fichier ou du format de stockage de l'objet S3 concerné et de son contenu.

Détails du schéma et exemples

Amazon Macie adapte le contenu des JSON structures qu'il utilise pour indiquer où il a détecté des données sensibles dans des types spécifiques de fichiers et de contenus. Les rubriques suivantes expliquent et fournissent des exemples de ces structures.

Pour obtenir la liste complète des JSON structures pouvant être incluses dans une recherche de données sensibles, consultez la section Conclusions du manuel Amazon Macie API Reference.

Réseau de cellules

S'applique à : classeurs, CSV fichiers et TSV fichiers Microsoft Excel

Dans un cells tableau, un Cell objet indique une cellule ou un champ dans lequel Macie a détecté une occurrence de données sensibles. Le tableau suivant décrit l'objectif de chaque champ d'un Cell objet.

Champ Type Description
cellReference Chaîne Emplacement de la cellule, en tant que référence absolue à la cellule, qui contient l'occurrence. Ce champ s'applique uniquement aux classeurs Excel. Cette valeur est nulle pour les TSV fichiers CSV et.
column Entier Numéro de colonne de la colonne contenant l'occurrence. Pour un classeur Excel, cette valeur est en corrélation avec le ou les caractères alphabétiques d'un identifiant de colonne, par exemple, pour la colonne A, 1 pour la colonne B, 2 etc.
columnName Chaîne Le nom de la colonne contenant l'occurrence, s'il est disponible.
row Entier Numéro de ligne de la ligne contenant l'occurrence.

L'exemple suivant montre la structure d'un Cell objet qui indique l'emplacement d'une occurrence de données sensibles détectées par Macie dans un CSV fichier.

"cells": [ { "cellReference": null, "column": 3, "columnName": "SSN", "row": 5 } ]

Dans l'exemple précédent, le résultat indique que Macie a détecté des données sensibles dans le champ de la cinquième ligne de la troisième colonne (nommée SSN) du fichier.

L'exemple suivant montre la structure d'un Cell objet qui indique l'emplacement d'une occurrence de données sensibles détectées par Macie dans un classeur Excel.

"cells": [ { "cellReference": "Sheet2!C5", "column": 3, "columnName": "SSN", "row": 5 } ]

Dans l'exemple précédent, le résultat indique que Macie a détecté des données sensibles dans la feuille de calcul nommée Sheet2 dans le classeur. Dans cette feuille de travail, Macie a détecté des données sensibles dans la cellule de la cinquième ligne de la troisième colonne (colonne C, nommée SSN).

LineRangesréseau

S'applique aux fichiers de messages électroniques (EML) et aux fichiers texte non binaires autres que CSV les JSON lignes et les fichiers, par TSV exempleHTML, TXT et aux fichiers JSON XML

Dans un lineRanges tableau, un Range objet indique une ligne ou une plage inclusive de lignes dans laquelle Macie a détecté une occurrence de données sensibles, ainsi que la position des données sur la ou les lignes spécifiées.

Cet objet est souvent vide pour les types de fichiers pris en charge par d'autres types de tableaux d'occurrencesobjets. Les exceptions sont les suivantes :

  • Données contenues dans des sections non structurées d'un fichier autrement structuré, comme un commentaire dans un fichier.

  • Données contenues dans un fichier mal formé que Macie analyse sous forme de texte brut.

  • TSVFichier CSV ou contenant un ou plusieurs noms de colonnes dans lesquels Macie a détecté des données sensibles.

Le tableau suivant décrit l'objectif de chaque champ d'un Range objet d'un lineRanges tableau.

Champ Type Description
end Entier Nombre de lignes entre le début du fichier et la fin de l'occurrence.
start Entier Nombre de lignes entre le début du fichier et le début de l'occurrence.
startColumn Entier Le nombre de caractères, avec des espaces et à partir de 1, entre le début de la première ligne contenant l'occurrence (start) et le début de l'occurrence.

L'exemple suivant montre la structure d'un Range objet qui indique l'emplacement d'une occurrence de données sensibles détectées par Macie sur une seule ligne d'un TXT fichier.

"lineRanges": [ { "end": 1, "start": 1, "startColumn": 119 } ]

Dans l'exemple précédent, le résultat indique que Macie a détecté une occurrence complète de données sensibles (une adresse postale) dans la première ligne du fichier. Le premier caractère de l'occurrence est de 119 caractères (espaces compris) à partir du début de cette ligne.

L'exemple suivant montre la structure d'un Range objet qui indique l'emplacement d'une occurrence de données sensibles s'étendant sur plusieurs lignes d'un TXT fichier.

"lineRanges": [ { "end": 54, "start": 51, "startColumn": 1 } ]

Dans l'exemple précédent, le résultat indique que Macie a détecté une occurrence de données sensibles (une adresse postale) s'étendant sur les lignes 51 à 54 du fichier. Le premier caractère de l'occurrence est le premier caractère de la ligne 51 du fichier.

Tableau de pages

S'applique à : fichiers Adobe Portable Document Format (PDF)

Dans un pages tableau, un Page objet indique une page dans laquelle Macie a détecté une occurrence de données sensibles. L'objet contient un pageNumber champ. Le pageNumber champ stocke un entier qui indique le numéro de page de la page contenant l'occurrence.

L'exemple suivant montre la structure d'un Page objet qui indique l'emplacement d'une occurrence de données sensibles détectées par Macie dans un PDF fichier.

"pages": [ { "pageNumber": 10 } ]

Dans l'exemple précédent, le résultat indique que la page 10 du fichier contient l'occurrence.

Tableau d'enregistrements

S'applique à : les conteneurs d'objets Apache Avro, les fichiers Apache Parquet, JSON les fichiers et les fichiers JSON Lines

Pour un conteneur d'objets Avro ou un fichier Parquet, un Record objet d'un records tableau indique un index d'enregistrement et le chemin d'accès à un champ d'un enregistrement dans lequel Macie a détecté une occurrence de données sensibles. Pour les fichiers JSON et JSON lignes, un Record objet indique le chemin d'accès à un champ ou à un tableau dans lequel Macie a détecté une occurrence de données sensibles. Pour les fichiers JSON Lines, il indique également l'index de la ligne contenant l'occurrence.

Le tableau suivant décrit l'objectif de chaque champ d'un Record objet.

Champ Type Description
jsonPath Chaîne

Le chemin, sous forme d'JSONPathexpression, vers l'occurrence.

Pour un conteneur d'objets Avro ou un fichier Parquet, il s'agit du chemin d'accès au champ de l'enregistrement (recordIndex) qui contient l'occurrence. Pour un fichier JSON ou JSON Lines, il s'agit du chemin d'accès au champ ou au tableau contenant l'occurrence. Si les données sont une valeur dans un tableau, le chemin indique également quelle valeur contient l'occurrence.

Si Macie détecte des données sensibles dans le nom d'un élément du chemin, Macie omet le jsonPath champ d'un objet. Record Si le nom d'un élément de chemin dépasse 240 caractères, Macie tronque le nom en supprimant les caractères du début du nom. Si le chemin complet obtenu dépasse 250 caractères, Macie tronque également le chemin, en commençant par le premier élément du chemin, jusqu'à ce que le chemin contienne 250 caractères ou moins.

recordIndex Entier Pour un conteneur d'objets Avro ou un fichier Parquet, l'index d'enregistrement, à partir de 0, pour l'enregistrement contenant l'occurrence. Pour un fichier JSON Lines, l'index de ligne, à partir de 0, pour la ligne contenant l'occurrence. Cette valeur s'applique toujours 0 aux JSON fichiers.

L'exemple suivant montre la structure d'un Record objet qui indique l'emplacement d'une occurrence de données sensibles détectées par Macie dans un fichier Parquet.

"records": [ { "jsonPath": "$['abcdefghijklmnopqrstuvwxyz']", "recordIndex": 7663 } ]

Dans l'exemple précédent, le résultat indique que Macie a détecté des données sensibles dans l'enregistrement de l'index 7663 (numéro d'enregistrement 7664). Dans cet enregistrement, Macie a détecté des données sensibles dans le champ nomméabcdefghijklmnopqrstuvwxyz. Le JSON chemin complet vers le champ de l'enregistrement est$.abcdefghijklmnopqrstuvwxyz. Le champ est un descendant direct de l'objet racine (niveau externe).

L'exemple suivant montre également la structure d'un Record objet pour une occurrence de données sensibles détectées par Macie dans un fichier Parquet. Toutefois, dans cet exemple, Macie a tronqué le nom du champ contenant l'occurrence car le nom dépasse la limite de caractères.

"records": [ { "jsonPath": "$['...uvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz']", "recordIndex": 7663 } ]

Dans l'exemple précédent, le champ est un descendant direct de l'objet racine (niveau externe).

Dans l'exemple suivant, également pour une occurrence de données sensibles détectée par Macie dans un fichier Parquet, Macie a tronqué le chemin complet vers le champ contenant l'occurrence. Le chemin complet dépasse la limite de caractères.

"records": [ { "jsonPath": "$..usssn2.usssn3.usssn4.usssn5.usssn6.usssn7.usssn8.usssn9.usssn10.usssn11.usssn12.usssn13.usssn14.usssn15.usssn16.usssn17.usssn18.usssn19.usssn20.usssn21.usssn22.usssn23.usssn24.usssn25.usssn26.usssn27.usssn28.usssn29['abcdefghijklmnopqrstuvwxyz']", "recordIndex": 2335 } ]

Dans l'exemple précédent, le résultat indique que Macie a détecté des données sensibles dans l'enregistrement de l'index 2335 (numéro d'enregistrement 2336). Dans cet enregistrement, Macie a détecté des données sensibles dans le champ nomméabcdefghijklmnopqrstuvwxyz. Le JSON chemin complet vers le champ dans l'enregistrement est le suivant :

$['1234567890']usssn1.usssn2.usssn3.usssn4.usssn5.usssn6.usssn7.usssn8.usssn9.usssn10.usssn11.usssn12.usssn13.usssn14.usssn15.usssn16.usssn17.usssn18.usssn19.usssn20.usssn21.usssn22.usssn23.usssn24.usssn25.usssn26.usssn27.usssn28.usssn29['abcdefghijklmnopqrstuvwxyz']

L'exemple suivant montre la structure d'un Record objet qui indique l'emplacement d'une occurrence de données sensibles détectées par Macie dans un JSON fichier. Dans cet exemple, l'occurrence est une valeur spécifique d'un tableau.

"records": [ { "jsonPath": "$.access.key[2]", "recordIndex": 0 } ]

Dans l'exemple précédent, le résultat indique que Macie a détecté des données sensibles dans la deuxième valeur d'un tableau nommékey. Le tableau est un enfant d'un objet nomméaccess.

L'exemple suivant montre la structure d'un Record objet qui indique l'emplacement d'une occurrence de données sensibles détectées par Macie dans un fichier JSON Lines.

"records": [ { "jsonPath": "$.access.key", "recordIndex": 3 } ]

Dans l'exemple précédent, le résultat indique que Macie a détecté des données sensibles dans la troisième valeur (ligne) du fichier. Dans cette ligne, l'occurrence se trouve dans un champ nommékey, qui est un enfant d'un objet nomméaccess.