Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Classes et formats de stockage pris en charge
Pour vous aider à découvrir des données sensibles dans votre patrimoine de données Amazon Simple Storage Service (Amazon S3), Amazon Macie prend en charge la plupart des classes de stockage Amazon S3 et un large éventail de formats de fichiers et de stockage. Cette prise en charge s'applique à l'utilisation d'identifiants de données gérés et à l'utilisation d'identifiants de données personnalisés pour analyser les objets S3.
Pour que Macie puisse analyser un objet S3, celui-ci doit être stocké dans un compartiment Amazon S3 à usage général à l'aide d'une classe de stockage prise en charge. L'objet doit également utiliser un format de fichier ou de stockage pris en charge. Les rubriques de cette section répertorient les classes de stockage et les formats de fichiers et de stockage actuellement pris en charge par Macie.
Astuce
Bien que Macie soit optimisé pour Amazon S3, vous pouvez l'utiliser pour découvrir des données sensibles dans des ressources que vous stockez actuellement ailleurs. Vous pouvez le faire en déplaçant les données vers Amazon S3 de manière temporaire ou permanente. Par exemple, exportez des instantanés Amazon Relational Database Service ou Amazon Aurora vers Amazon S3 au format Apache Parquet. Ou exportez une table Amazon DynamoDB vers Amazon S3. Vous pouvez ensuite créer une tâche de découverte de données sensibles pour analyser les données dans Amazon S3.
Classes de stockage Amazon S3 prises en charge
Pour la découverte de données sensibles, Amazon Macie prend en charge les classes de stockage Amazon S3 suivantes :
-
Redondance réduite () RRS
-
S3 Glacier Instant Retrieval
-
Hiérarchisation intelligente S3
-
Accès peu fréquent à S3 One Zone (S3 One Zone‐IA)
-
S3 Standard
-
Accès standard et peu fréquent (S3 Standard‐IA)
Macie n'analyse pas les objets S3 qui utilisent d'autres classes de stockage Amazon S3, telles que S3 Glacier Deep Archive ou S3 Express One Zone. De plus, Macie n'analyse pas les objets stockés dans des compartiments de répertoire S3.
Si vous configurez une tâche de découverte de données sensibles pour analyser des objets S3 qui n'utilisent pas une classe de stockage Amazon S3 prise en charge, Macie ignore ces objets lors de l'exécution de la tâche. Macie n'essaie pas de récupérer ou d'analyser les données contenues dans les objets : les objets sont traités comme des objets inclassables. Un objet inclassable est un objet qui n'utilise aucune classe de stockage prise en charge ni aucun format de fichier ou de stockage pris en charge. Macie analyse uniquement les objets qui utilisent une classe de stockage et un format de fichier ou de stockage pris en charge.
De même, si vous configurez Macie pour effectuer la découverte automatique de données sensibles, les objets inclassables ne sont pas éligibles à la sélection et à l'analyse. Macie sélectionne uniquement les objets qui utilisent une classe de stockage Amazon S3 prise en charge et un format de fichier ou de stockage pris en charge.
Pour identifier les compartiments S3 qui stockent des objets inclassables, vous pouvez filtrer votre inventaire de compartiments S3. Pour chaque compartiment de votre inventaire, des champs indiquent le nombre et la taille de stockage totale des objets inclassables qu'il contient.
Pour obtenir des informations détaillées sur les classes de stockage fournies par Amazon S3, consultez la section Utilisation des classes de stockage Amazon S3 dans le guide de l'utilisateur d'Amazon Simple Storage Service.
Formats de fichiers et de stockage pris en charge
Lorsqu'Amazon Macie analyse un objet S3, Macie extrait la dernière version de l'objet auprès d'Amazon S3, puis effectue une inspection approfondie du contenu de l'objet. Cette inspection prend en compte le format de fichier ou de stockage des données. Macie peut analyser des données dans de nombreux formats différents, y compris les formats de compression et d'archivage couramment utilisés.
Lorsque Macie analyse les données d'un fichier compressé ou d'archive, Macie inspecte à la fois le fichier complet et son contenu. Pour inspecter le contenu du fichier, Macie décompresse le fichier, puis inspecte chaque fichier extrait utilisant un format pris en charge. Macie peut le faire pour jusqu'à 1 000 000 de fichiers et jusqu'à une profondeur imbriquée de 10 niveaux. Pour plus d'informations sur les quotas supplémentaires applicables à la découverte de données sensibles, consultezQuotas pour Macie.
Le tableau suivant répertorie et décrit les types de fichiers et de formats de stockage que Macie peut analyser pour détecter les données sensibles. Pour chaque type pris en charge, le tableau répertorie également les extensions de nom de fichier applicables.
Type de fichier ou de stockage | Description | Extensions de nom de fichier |
---|---|---|
Big Data |
Conteneurs d'objets Apache Avro et fichiers Apache Parquet |
.avro, .parquet |
Compression ou archivage |
GNUCompressez des archives, TAR des archives et des archives ZIP compressées |
.gz, .gzip, .tar, .zip |
Document |
Fichiers Adobe Portable Document Format, classeurs Microsoft Excel et documents Microsoft Word |
.doc, .docx, .pdf, .xls, .xlsx |
Message électronique |
Fichiers de courrier électronique dont le contenu est conforme aux exigences spécifiées par et IETF RFC pour les messages électroniques, tels que RFC2822 |
.eml |
Texte |
Fichiers texte non binaires. Exemples : fichiers de valeurs séparées par des virgules (CSV), fichiers de langage de balisage extensible (XML), fichiers de langage de balisage hypertexte (), fichiers de notation d' JavaScript objets (HTML), fichiers de JSON lignes, documents en texte brut, fichiers de valeurs séparées par des tabulations (JSON) et fichiers TSV YAML |
Selon le type de fichier texte non binaire : .csv, .htm, .html, .json, .jsonl, .tsv, .txt, .xml, .yaml, .yml, etc. |
Macie n'analyse pas les données contenues dans les images, le contenu audio, vidéo ou autre type de contenu multimédia.
Si vous configurez une tâche de découverte de données sensibles pour analyser des objets S3 qui n'utilisent aucun format de fichier ou de stockage pris en charge, Macie ignore ces objets lors de l'exécution de la tâche. Macie n'essaie pas de récupérer ou d'analyser les données contenues dans les objets : les objets sont traités comme des objets inclassables. Un objet inclassable est un objet qui n'utilise pas une classe de stockage Amazon S3 prise en charge ou un format de fichier ou de stockage pris en charge. Macie analyse uniquement les objets qui utilisent une classe de stockage et un format de fichier ou de stockage pris en charge.
De même, si vous configurez Macie pour effectuer la découverte automatique de données sensibles, les objets inclassables ne sont pas éligibles à la sélection et à l'analyse. Macie sélectionne uniquement les objets qui utilisent une classe de stockage Amazon S3 prise en charge et un format de fichier ou de stockage pris en charge.
Pour identifier les compartiments S3 qui stockent des objets inclassables, vous pouvez filtrer votre inventaire de compartiments S3. Pour chaque compartiment de votre inventaire, des champs indiquent le nombre et la taille de stockage totale des objets inclassables qu'il contient.