Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menemukan daftar inventaris
Saat daftar inventaris diterbitkan, file manifes akan diterbitkan ke lokasi berikut di dalam bucket tujuan.
destination-prefix
/source-bucket
/config-ID
/YYYY-MM-DDTHH-MMZ
/manifest.jsondestination-prefix
/source-bucket
/config-ID
/YYYY-MM-DDTHH-MMZ
/manifest.checksumdestination-prefix
/source-bucket
/config-ID
/hive/dt=YYYY-MM-DD-HH-MM
/symlink.txt
-
adalah awalan nama kunci objek yang ditentukan secara opsional didalam konfigurasi inventaris. Gunakan awalan ini untuk mengelompokkan semua file daftar inventaris di lokasi yang sama di dalam bucket tujuan.destination-prefix
-
adalah bucket sumber yang digunakan untuk daftar inventaris. Nama bucket sumber ditambahkan untuk mencegah benturan saat beberapa laporan inventaris dari bucket sumber yang berbeda dikirimkan ke bucket tujuan yang sama.source-bucket
-
ditambahkan untuk mencegah benturan dengan beberapa laporan inventaris dari bucket sumber yang sama yang dikirim ke bucket tujuan yang sama.config-ID
berasal dari konfigurasi laporan inventaris, dan merupakan nama untuk laporan yang ditentukan selama pengaturan.config-ID
-
adalah stempel waktu yang berisi waktu mulai dan tanggal saat proses pembuatan laporan inventaris memulai pemindaian bucket; misalnya,YYYY-MM-DDTHH-MMZ
2016-11-06T21-32Z
. -
manifest.json
adalah file manifes. -
manifest.checksum
adalah MD5 hash dari isimanifest.json
file. -
symlink.txt
adalah Apache Hive-file manifes yang kompatibel.
Daftar inventaris diterbitkan setiap hari atau setiap minggu ke lokasi berikut di dalam bucket tujuan.
destination-prefix
/source-bucket
/config-ID
/data/example-file-name.csv.gz
...destination-prefix
/source-bucket
/config-ID
/data/example-file-name-1.csv.gz
-
adalah awalan nama kunci objek yang ditentukan secara opsional di dalam konfigurasi inventaris. Gunakan awalan ini untuk mengelompokkan semua file daftar inventaris di lokasi yang sama di dalam bucket tujuan.destination-prefix
-
adalah bucket sumber yang digunakan untuk daftar inventaris. Nama bucket sumber ditambahkan untuk mencegah benturan saat beberapa laporan inventaris dari bucket sumber yang berbeda dikirimkan ke bucket tujuan yang sama.source-bucket
-
example-file-name
.csv.gz
adalah salah satu file CSV inventaris. ORCnama inventaris diakhiri dengan ekstensi nama file.orc
, dan Parquet nama inventaris diakhiri dengan ekstensi nama file.parquet
.
Manifes inventaris
File manifes manifest.json
dan symlink.txt
menjelaskan lokasi tempat file inventaris berada. Setiap kali ada daftar inventaris baru yang dikirimkan, daftar tersebut akan disertai dengan serangkaian file manifes baru. File-file ini mungkin akan saling menimpa. Di bucket dengan Penentuan Versi yang diaktifkan, Amazon S3 akan membuat versi baru dari file manifes tersebut.
Setiap manifes yang terdapat di dalam file manifest.json
menyediakan metadata dan informasi dasar lainnya tentang inventaris. Informasi ini mencakup hal-hal berikut:
-
Nama bucket sumber
-
Nama bucket tujuan
-
Versi inventaris
-
Pembuatan stempel waktu dengan format tanggal epoch yang terdiri dari waktu mulai dan tanggal saat proses pembuatan laporan inventaris memulai pemindaian bucket
-
Format dan skema file inventaris
-
Daftar file inventaris yang berada di dalam bucket tujuan
Setiap kali manifest.json
file ditulis, itu disertai dengan manifest.checksum
file yang merupakan MD5 hash dari konten manifest.json
file.
contoh Manifes inventaris di dalam file manifest.json
Contoh berikut menunjukkan manifes inventaris dalam manifest.json
file untukCSV,ORC, dan Parquet-inventaris yang diformat.
symlink.txt
File tersebut adalah Apache Hive-file manifes yang kompatibel yang memungkinkan Hive untuk secara otomatis menemukan file inventaris dan file data terkait mereka. Bagian Hive-Manifes yang kompatibel bekerja dengan Hive-layanan yang kompatibel Athena dan Amazon Redshift Spectrum. Ini juga bekerja dengan Hive-aplikasi yang kompatibel, termasuk Presto
penting
Sebuah symlink.txt
Apache Hive-file manifes yang kompatibel saat ini tidak berfungsi dengan AWS Glue.
Membaca symlink.txt
file dengan Apache Hive