Operasi pemuatan data - Amazon Redshift

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Operasi pemuatan data

Kelola perilaku default operasi pemuatan untuk pemecahan masalah atau untuk mengurangi waktu muat dengan menentukan parameter berikut.

Parameter
COMPROWSnumrows

Menentukan jumlah baris yang akan digunakan sebagai ukuran sampel untuk analisis kompresi. Analisis dijalankan pada baris dari setiap irisan data. Misalnya, jika Anda menentukan COMPROWS 1000000 (1.000.000) dan sistem berisi empat irisan total, tidak lebih dari 250.000 baris untuk setiap irisan dibaca dan dianalisis.

Jika COMPROWS tidak ditentukan, ukuran sampel default menjadi 100.000 untuk setiap irisan. Nilai yang COMPROWS lebih rendah dari default 100.000 baris untuk setiap irisan secara otomatis ditingkatkan ke nilai default. Namun, kompresi otomatis tidak akan terjadi jika jumlah data yang dimuat tidak cukup untuk menghasilkan sampel yang berarti.

Jika COMPROWS jumlahnya lebih besar dari jumlah baris dalam file input, COPY perintah masih melanjutkan dan menjalankan analisis kompresi pada semua baris yang tersedia. Rentang yang diterima untuk argumen ini adalah angka antara 1000 dan 2147483647 (2.147.483.647).

COMPUPDATE[PRESET| {ON |TRUE} | {OFF|FALSE}]

Mengontrol apakah pengkodean kompresi diterapkan secara otomatis selama a. COPY

COMPUPDATEKapanPRESET, COPY perintah memilih pengkodean kompresi untuk setiap kolom jika tabel target kosong; bahkan jika kolom sudah memiliki pengkodean selain. RAW Saat ini pengkodean kolom yang ditentukan dapat diganti. Pengkodean untuk setiap kolom didasarkan pada tipe data kolom. Tidak ada data yang diambil sampelnya. Amazon Redshift secara otomatis menetapkan pengkodean kompresi sebagai berikut:

  • Kolom yang didefinisikan sebagai kunci pengurutan diberi RAW kompresi.

  • Kolom yang didefinisikan sebagai BOOLEANREAL,, atau tipe DOUBLE PRECISION data diberi RAW kompresi.

  • Kolom yang didefinisikan sebagai SMALLINTINTEGER,BIGINT,,DECIMAL,DATE,TIMESTAMP, atau TIMESTAMPTZ diberi AZ64 kompresi.

  • Kolom yang didefinisikan sebagai CHAR atau VARCHAR diberi LZO kompresi.

Ketika COMPUPDATE dihilangkan, COPY perintah memilih pengkodean kompresi untuk setiap kolom hanya jika tabel target kosong dan Anda belum menentukan pengkodean (selainRAW) untuk salah satu kolom. Pengkodean untuk setiap kolom ditentukan oleh Amazon Redshift. Tidak ada data yang diambil sampelnya.

COMPUPDATEKapan ON (atauTRUE), atau COMPUPDATE ditentukan tanpa opsi, COPY perintah menerapkan kompresi otomatis jika tabel kosong; bahkan jika kolom tabel sudah memiliki pengkodean selain. RAW Saat ini pengkodean kolom yang ditentukan dapat diganti. Pengkodean untuk setiap kolom didasarkan pada analisis data sampel. Untuk informasi selengkapnya, lihat Memuat tabel dengan kompresi otomatis.

COMPUPDATEKapan OFF (atauFALSE), kompresi otomatis dinonaktifkan. Pengkodean kolom tidak diubah.

Untuk informasi tentang tabel sistem untuk menganalisis kompresi, lihatSTL_ANALYZE_COMPRESSION.

IGNOREALLERRORS

Anda dapat menentukan opsi ini untuk mengabaikan semua kesalahan yang terjadi selama operasi pemuatan.

Anda tidak dapat menentukan IGNOREALLERRORS opsi jika Anda menentukan MAXERROR opsi. Anda tidak dapat menentukan IGNOREALLERRORS opsi untuk format kolumnar termasuk ORC dan Parket.

MAXERROR[AS] error_count

Jika beban mengembalikan jumlah kesalahan error_count atau lebih besar, beban gagal. Jika beban mengembalikan lebih sedikit kesalahan, itu berlanjut dan mengembalikan INFO pesan yang menyatakan jumlah baris yang tidak dapat dimuat. Gunakan parameter ini untuk memungkinkan pemuatan berlanjut ketika baris tertentu gagal dimuat ke dalam tabel karena kesalahan pemformatan atau ketidakkonsistenan lainnya dalam data.

Tetapkan nilai ini ke 0 atau 1 jika Anda ingin beban gagal segera setelah kesalahan pertama terjadi. Kata kunci AS adalah opsional. Nilai MAXERROR defaultnya adalah 0 dan batasnya adalah100000.

Jumlah aktual kesalahan yang dilaporkan mungkin lebih besar dari yang ditentukan MAXERROR karena sifat paralel Amazon Redshift. Jika ada node di cluster Amazon Redshift yang mendeteksi yang MAXERROR telah terlampaui, setiap node melaporkan semua kesalahan yang dialaminya.

NOLOAD

Memeriksa validitas file data tanpa benar-benar memuat data. Gunakan NOLOAD parameter untuk memastikan bahwa file data Anda dimuat tanpa kesalahan sebelum menjalankan pemuatan data yang sebenarnya. Berjalan COPY dengan NOLOAD parameter jauh lebih cepat daripada memuat data karena hanya mem-parsing file.

STATUPDATE[{ON |TRUE} | {OFF|FALSE}]

Mengatur komputasi otomatis dan penyegaran statistik pengoptimal di akhir perintah yang berhasil. COPY Secara default, jika STATUPDATE parameter tidak digunakan, statistik diperbarui secara otomatis jika tabel awalnya kosong.

Setiap kali memasukkan data ke dalam tabel nonempty secara signifikan mengubah ukuran tabel, kami sarankan memperbarui statistik baik dengan menjalankan ANALYZE perintah atau dengan menggunakan argumen STATUPDATE ON.

Dengan STATUPDATE ON (atauTRUE), statistik diperbarui secara otomatis terlepas dari apakah tabel awalnya kosong. Jika STATUPDATE digunakan, pengguna saat ini harus pemilik tabel atau superuser. Jika tidak STATUPDATE ditentukan, hanya INSERT izin yang diperlukan.

Dengan STATUPDATE OFF (atauFALSE), statistik tidak pernah diperbarui.

Untuk informasi tambahan, lihat Menganalisis tabel.