Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Localisation de votre liste d'inventaire
Lorsqu'une liste d'inventaire est publiée, les fichiers manifestes sont publiés dans l'emplacement suivant dans le compartiment de destination.
destination-prefix
//
amzn-s3-demo-source-bucket
config-ID
/YYYY-MM-DDTHH-MMZ
/manifest.jsondestination-prefix
//
amzn-s3-demo-source-bucket
config-ID
/YYYY-MM-DDTHH-MMZ
/manifest.checksumdestination-prefix
//
amzn-s3-demo-source-bucket
config-ID
/hive/dt=YYYY-MM-DD-HH-MM
/symlink.txt
-
est le préfixe de nom de la clé d'objet défini de manière facultative dans la configuration de l'inventaire. Vous pouvez utiliser ce préfixe pour regrouper tous les fichiers de liste d'inventaire dans un emplacement commun au sein du compartiment de destination.destination-prefix
-
est le compartiment source pour lequel la liste d'inventaire est effectuée. Le nom du compartiment source est ajouté pour éviter les collisions lorsque plusieurs rapports d'inventaire de différents compartiments source sont envoyés dans le même compartiment de destination.amzn-s3-demo-source-bucket
-
est ajouté pour éviter les collisions avec plusieurs rapports d'inventaire du même compartiment source qui sont envoyés dans le même compartiment de destination. Leconfig-ID
provient de la configuration de rapport d'inventaire et est le nom du rapport défini lors de la configuration.config-ID
-
est l'horodatage composé de l'heure de début et de la date à laquelle la génération de rapport d'inventaire a commencé à analyser le compartiment, par exemple,YYYY-MM-DDTHH-MMZ
2016-11-06T21-32Z
. -
manifest.json
est le fichier manifeste. -
manifest.checksum
est le MD5 hachage du contenu dumanifest.json
fichier. -
symlink.txt
est le Apache Hive-fichier manifeste compatible.
Les listes d'inventaire sont publiées sur une base quotidienne ou hebdomadaire dans l'emplacement suivant dans le compartiment de destination.
destination-prefix
//
amzn-s3-demo-source-bucket
config-ID
/data/example-file-name.csv.gz
...destination-prefix
//
amzn-s3-demo-source-bucket
config-ID
/data/example-file-name-1.csv.gz
-
est le préfixe de nom de la clé d'objet défini de manière facultative dans la configuration de l'inventaire. Vous pouvez utiliser ce préfixe pour regrouper tous les fichiers de liste d'inventaire dans un emplacement commun au sein du compartiment de destination.destination-prefix
-
est le compartiment source pour lequel la liste d'inventaire est effectuée. Le nom du compartiment source est ajouté pour éviter les collisions lorsque plusieurs rapports d'inventaire de différents compartiments source sont envoyés dans le même compartiment de destination.amzn-s3-demo-source-bucket
-
example-file-name
.csv.gz
est l'un des fichiers CSV d'inventaire. ORCles noms d'inventaire se terminent par l'extension du nom de fichier.orc
, et Parquet les noms d'inventaire se terminent par l'extension du nom de fichier.parquet
.
Manifeste d'inventaire
Les fichiers manifestes manifest.json
et symlink.txt
décrivent l'emplacement où les fichiers d'inventaire sont situés. Lorsqu'une nouvelle liste d'inventaire est fournie, elle est accompagnée d'un nouvel ensemble de fichiers manifestes. Ces fichiers peuvent s'écraser les uns les autres. Dans les compartiments soumis au contrôle de version, Amazon S3 crée de nouvelles versions des fichiers de manifeste.
Chaque manifeste contenu dans le fichier manifest.json
fournit des métadonnées et d'autres informations de base sur un inventaire. Les informations collectées sont les suivantes :
-
Nom de compartiment source
-
Nom du compartiment de destination
-
Version de l'inventaire
-
Horodatage de création, au format de date d'époque, composé de l'heure de début et de la date à laquelle le processus de génération de rapport d'inventaire a commencé à analyser le compartiment
-
Format et schéma des fichiers d'inventaire
-
Liste des fichiers d'inventaire se trouvant dans le compartiment de destination
Chaque fois qu'un manifest.json
fichier est écrit, il est accompagné d'un manifest.checksum
fichier qui est le MD5 hachage du contenu du manifest.json
fichier.
Exemple Manifeste d'inventaire dans un fichier manifest.json
Les exemples suivants montrent un manifeste d'inventaire dans un manifest.json
fichier pour CSVORC, et Parquet-inventaires formatés.
Le symlink.txt
fichier est un Apache Hive-fichier manifeste compatible qui permet Hive pour découvrir automatiquement les fichiers d'inventaire et leurs fichiers de données associés. Le Hive-le manifeste compatible fonctionne avec le Hive-services compatibles Athena et Amazon Redshift Spectrum. Il fonctionne également avec Hive-applications compatibles, y compris Presto
Important
L'interface symlink.txt
Apache Hive-le fichier manifeste compatible ne fonctionne pas actuellement avec AWS Glue.
Lire le symlink.txt
fichier avec Apache Hive