Memuat file data

File sumber-data datang dalam format yang berbeda dan menggunakan berbagai algoritma kompresi. Saat memuat data dengan perintah COPY, Amazon Redshift memuat semua file yang direferensikan oleh awalan bucket Amazon S3. (Awalan adalah string karakter di awal nama kunci objek.) Jika awalan mengacu pada beberapa file atau file yang dapat dibagi, Amazon Redshift memuat data secara paralel, memanfaatkan arsitektur MPP Amazon Redshift. Ini membagi beban kerja di antara node di cluster. Sebaliknya, saat Anda memuat data dari file yang tidak dapat dibagi, Amazon Redshift dipaksa untuk melakukan pemuatan serial, yang jauh lebih lambat. Bagian berikut menjelaskan cara yang disarankan untuk memuat berbagai jenis file ke Amazon Redshift, tergantung pada format dan kompresi mereka.

Memuat data dari file yang dapat dibagi

File-file berikut dapat secara otomatis dibagi ketika data mereka dimuat:

file CSV yang tidak terkompresi
berkas kolumnar (parquet/ORC)

Amazon Redshift secara otomatis membagi file 128MB atau lebih besar menjadi beberapa bagian. File kolumnar, khususnya Parket dan ORC, tidak dibagi jika kurang dari 128MB. Redshift menggunakan irisan yang bekerja secara paralel untuk memuat data. Ini memberikan kinerja beban yang cepat.

Memuat data dari file yang tidak dapat dibagi

Jenis file seperti JSON, atau CSV, ketika dikompresi dengan algoritma kompresi lain, seperti GZIP, tidak secara otomatis dibagi. Untuk ini, kami sarankan untuk membagi data secara manual menjadi beberapa file yang lebih kecil yang ukurannya dekat, dari 1 MB hingga 1 GB setelah kompresi. Selain itu, buat jumlah file kelipatan dari jumlah irisan di cluster Anda. Untuk informasi selengkapnya tentang cara membagi data menjadi beberapa file dan contoh pemuatan data menggunakan COPY, lihat Memuat data dari Amazon S3.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Gunakan satu perintah COPY

Mengompresi file data Anda

Pilih preferensi cookie Anda

Sesuaikan preferensi cookie

Penting

Kinerja

Fungsional

Iklan

Tidak dapat menyimpan preferensi cookie

Memuat file data

Memuat data dari file yang dapat dibagi

Memuat data dari file yang tidak dapat dibagi

Apakah halaman ini membantu Anda?

Topik berikutnya:

Topik sebelumnya:

Perlu bantuan?