Gaya distribusi - Amazon Redshift

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Gaya distribusi

Saat Anda membuat tabel, Anda dapat menunjuk salah satu gaya distribusi berikut: AUTO, EVEN, KEY, atau ALL.

Jika Anda tidak menentukan gaya distribusi, Amazon Redshift menggunakan distribusi AUTO.

Distribusi AUTO

Dengan distribusi AUTO, Amazon Redshift menetapkan gaya distribusi optimal berdasarkan ukuran data tabel. Misalnya, jika gaya distribusi AUTO ditentukan, Amazon Redshift awalnya menetapkan gaya distribusi ALL ke tabel kecil. Saat tabel bertambah besar, Amazon Redshift mungkin mengubah gaya distribusi menjadi KEY, memilih kunci primer (atau kolom kunci primer komposit) sebagai kunci distribusi. Jika tabel bertambah besar dan tidak ada kolom yang cocok untuk menjadi kunci distribusi, Amazon Redshift mengubah gaya distribusi menjadi EVEN. Perubahan gaya distribusi terjadi di latar belakang dengan dampak minimal pada kueri pengguna.

Untuk melihat tindakan yang dilakukan Amazon Redshift secara otomatis untuk mengubah kunci distribusi tabel, lihat. SVL_AUTO_WORKER_ACTION Untuk melihat rekomendasi terkini mengenai mengubah kunci distribusi tabel, lihatSVV_ALTER_TABLE_RECOMMENDATIONS.

Untuk melihat gaya distribusi yang diterapkan ke tabel, kueri tampilan katalog sistem PG_CLASS_INFO. Untuk informasi selengkapnya, lihat Melihat gaya distribusi. Jika Anda tidak menentukan gaya distribusi dengan pernyataan CREATE TABLE, Amazon Redshift menerapkan distribusi AUTO.

Distribusi GENAP

Node pemimpin mendistribusikan baris di seluruh irisan dengan cara round-robin, terlepas dari nilai di kolom tertentu. Distribusi EVEN sesuai ketika tabel tidak berpartisipasi dalam gabungan. Ini juga tepat ketika tidak ada pilihan yang jelas antara distribusi KUNCI dan distribusi ALL.

Distribusi KUNCI

Baris didistribusikan sesuai dengan nilai dalam satu kolom. Node pemimpin menempatkan nilai yang cocok pada irisan simpul yang sama. Jika Anda mendistribusikan sepasang tabel pada kunci penggabungan, simpul pemimpin mengkolokasikan baris pada irisan sesuai dengan nilai di kolom penggabungan. Dengan cara ini, nilai yang cocok dari kolom umum disimpan secara fisik bersama.

SEMUA distribusi

Salinan seluruh tabel didistribusikan ke setiap node. Di mana distribusi EVEN atau distribusi KEY hanya menempatkan sebagian dari baris tabel pada setiap node, distribusi ALL memastikan bahwa setiap baris ditempatkan untuk setiap gabungan yang berpartisipasi dalam tabel.

Distribusi ALL mengalikan penyimpanan yang dibutuhkan dengan jumlah node di cluster, sehingga dibutuhkan waktu lebih lama untuk memuat, memperbarui, atau menyisipkan data ke dalam beberapa tabel. Distribusi ALL hanya sesuai untuk tabel bergerak relatif lambat; yaitu, tabel yang tidak sering diperbarui atau ekstensif. Karena biaya mendistribusikan ulang tabel kecil selama kueri rendah, tidak ada manfaat yang signifikan untuk mendefinisikan tabel dimensi kecil sebagai DISTSTYLE ALL.

catatan

Setelah Anda menentukan gaya distribusi untuk kolom, Amazon Redshift menangani distribusi data di tingkat cluster. Amazon Redshift tidak memerlukan atau mendukung konsep partisi data dalam objek database. Anda tidak perlu membuat spasi tabel atau menentukan skema partisi untuk tabel.

Dalam skenario tertentu, Anda dapat mengubah gaya distribusi tabel setelah dibuat. Untuk informasi selengkapnya, lihat ALTER TABLE. Untuk skenario ketika Anda tidak dapat mengubah gaya distribusi tabel setelah dibuat, Anda dapat membuat ulang tabel dan mengisi tabel baru dengan salinan mendalam. Lihat informasi yang lebih lengkap di Melakukan salinan yang dalam