Cluster yang disediakan Amazon Redshift - Amazon Redshift

Cluster dan node Gunakan EC2 untuk membuat cluster Anda Alarm ruang disk default Status klaster

Cluster yang disediakan Amazon Redshift

Gudang data Amazon Redshift adalah kumpulan sumber daya komputasi yang disebut node, yang diatur ke dalam grup yang disebut cluster. Setiap klaster menjalankan mesin Amazon Redshift dan berisi satu atau lebih database.

catatan

Saat ini, mesin Amazon Redshift versi 1.0 tersedia. Namun, saat mesin diperbarui, beberapa versi mesin Amazon Redshift mungkin tersedia untuk dipilih.

Cluster dan node di Amazon Redshift

Cluster Amazon Redshift terdiri dari node. Setiap cluster memiliki node pemimpin dan satu atau lebih node komputasi. Node pemimpin menerima kueri dari aplikasi klien, mem-parsing kueri, dan mengembangkan rencana eksekusi kueri. Node pemimpin kemudian mengoordinasikan eksekusi paralel dari rencana ini dengan node komputasi dan mengumpulkan hasil antara dari node ini. Kemudian akhirnya mengembalikan hasil kembali ke aplikasi klien.

Node komputasi menjalankan rencana eksekusi kueri dan mengirimkan data di antara mereka sendiri untuk melayani kueri ini. Hasil antara dikirim ke node pemimpin untuk agregasi sebelum dikirim kembali ke aplikasi klien. Untuk informasi selengkapnya tentang node pemimpin dan node komputasi, lihat Arsitektur sistem gudang data di Panduan Pengembang Database Amazon Redshift.

catatan

Saat membuat cluster di Amazon Redshift console (https://console.aws.amazon.com/redshiftv2/), Anda bisa mendapatkan rekomendasi konfigurasi klaster berdasarkan ukuran data dan karakteristik kueri. Untuk menggunakan kalkulator ukuran ini, cari Bantu saya memilih di konsol di AWS Wilayah yang mendukung jenis RA3 simpul. Untuk informasi selengkapnya, lihat Membuat klaster.

Saat Anda meluncurkan cluster, salah satu opsi yang Anda tentukan adalah tipe node. Tipe node menentukan CPU, RAM, kapasitas penyimpanan, dan tipe drive penyimpanan untuk setiap node.

Amazon Redshift menawarkan berbagai jenis node untuk mengakomodasi beban kerja Anda, dan sebaiknya pilih RA3 atau DC2 bergantung pada kinerja yang diperlukan, ukuran data, dan pertumbuhan data yang diharapkan.

RA3 node dengan penyimpanan terkelola memungkinkan Anda mengoptimalkan gudang data dengan menskalakan dan membayar komputasi dan penyimpanan terkelola secara independen. Dengan RA3, Anda memilih jumlah node berdasarkan persyaratan kinerja Anda dan hanya membayar untuk penyimpanan terkelola yang Anda gunakan. Ukuran RA3 klaster Anda berdasarkan jumlah data yang Anda proses setiap hari. Anda meluncurkan cluster yang menggunakan tipe RA3 node di virtual private cloud (VPC). Untuk informasi selengkapnya, lihat Membuat klaster yang disediakan Redshift atau workgroup Amazon Redshift Serverless di VPC.

Penyimpanan terkelola Amazon Redshift menggunakan besar, kinerja tinggi SSDs di setiap RA3 node untuk penyimpanan lokal yang cepat dan Amazon S3 untuk penyimpanan tahan lama jangka panjang. Jika data dalam node tumbuh melebihi ukuran lokal besar SSDs, penyimpanan terkelola Amazon Redshift secara otomatis membongkar data tersebut ke Amazon S3. Anda membayar tarif rendah yang sama untuk penyimpanan terkelola Amazon Redshift terlepas dari apakah data berada dalam kinerja tinggi atau Amazon SSDs S3. Untuk beban kerja yang membutuhkan penyimpanan yang terus bertambah, penyimpanan terkelola memungkinkan Anda secara otomatis menskalakan kapasitas penyimpanan gudang data Anda terpisah dari node komputasi.

DC2 node memungkinkan Anda untuk memiliki gudang data komputasi intensif dengan penyimpanan SSD lokal disertakan. Anda memilih jumlah node yang Anda butuhkan berdasarkan ukuran data dan persyaratan kinerja. DC2 node menyimpan data Anda secara lokal untuk kinerja tinggi, dan seiring bertambahnya ukuran data, Anda dapat menambahkan lebih banyak node komputasi untuk meningkatkan kapasitas penyimpanan cluster. Untuk kumpulan data di bawah 1 TB (terkompresi), kami merekomendasikan jenis DC2 node untuk kinerja terbaik dengan harga terendah. Jika Anda mengharapkan data Anda tumbuh, sebaiknya gunakan RA3 node sehingga Anda dapat mengukur komputasi dan penyimpanan secara independen untuk mencapai peningkatan harga dan kinerja. Anda meluncurkan cluster yang menggunakan tipe DC2 node di virtual private cloud (VPC). Untuk informasi selengkapnya, lihat Membuat klaster yang disediakan Redshift atau workgroup Amazon Redshift Serverless di VPC.

Jenis node tersedia dalam berbagai ukuran. Ukuran node dan jumlah node menentukan total penyimpanan untuk sebuah cluster. Untuk informasi selengkapnya, lihat Rincian tipe simpul.

Beberapa jenis node memungkinkan satu node (single-node) atau dua atau lebih node (multi-node). Jumlah minimum node untuk cluster dari beberapa jenis node adalah dua node. Pada cluster simpul tunggal, node dibagikan untuk fungsionalitas pemimpin dan komputasi. Cluster simpul tunggal tidak direkomendasikan untuk menjalankan beban kerja produksi. Pada cluster multi-node, node pemimpin terpisah dari node komputasi. Node pemimpin adalah tipe node yang sama dengan node komputasi. Anda hanya membayar untuk node komputasi.

Amazon Redshift menerapkan kuota ke sumber daya untuk setiap AWS akun di setiap Wilayah. AWS Kuota membatasi jumlah sumber daya yang dapat dibuat akun Anda untuk jenis sumber daya tertentu, seperti node atau snapshot, di dalam Wilayah. AWS Untuk informasi selengkapnya tentang kuota default yang berlaku untuk resource Amazon Redshift, lihat. Kuota dan batas di Amazon Redshift

Biaya cluster Anda tergantung pada AWS Region, tipe node, jumlah node, dan apakah node dicadangkan terlebih dahulu. Untuk informasi selengkapnya tentang biaya node, lihat halaman harga Amazon Redshift.

Rincian tipe simpul

Tabel berikut merangkum spesifikasi node untuk setiap jenis dan ukuran node. Judul dalam tabel memiliki arti ini:

vCPU adalah jumlah virtual CPUs untuk setiap node.
RAM adalah jumlah memori dalam gibibytes (GiB) untuk setiap node.
Irisan default per node adalah jumlah irisan di mana node komputasi dipartisi saat cluster dibuat atau diubah ukurannya dengan pengubahan ukuran klasik.

Jumlah irisan per node dapat berubah jika cluster diubah ukurannya menggunakan pengubahan ukuran elastis. Namun jumlah total irisan pada semua node komputasi di cluster tetap sama setelah mengubah ukuran elastis.

Saat Anda membuat cluster dengan operasi restore from snapshot, jumlah irisan cluster yang dihasilkan mungkin berubah dari cluster asli jika Anda mengubah jenis node.
Penyimpanan adalah kapasitas dan jenis penyimpanan untuk setiap node.
Rentang node adalah jumlah node minimum dan maksimum yang didukung Amazon Redshift untuk jenis dan ukuran node.

catatan
Anda mungkin dibatasi untuk node yang lebih sedikit tergantung pada kuota yang diterapkan ke AWS akun Anda di AWS Wilayah yang dipilih. Untuk informasi selengkapnya tentang kuota default yang berlaku untuk resource Amazon Redshift, lihat. Kuota dan batas di Amazon Redshift
Kapasitas total adalah kapasitas penyimpanan total untuk cluster jika Anda menggunakan jumlah maksimum node yang ditentukan dalam rentang node.

Tabel berikut menjelaskan spesifikasi untuk RA3 node.

Jenis simpul	vCPU	RAM (GiB)	Irisan default per node	Batas penyimpanan terkelola per node ¹	Rentang node dengan create cluster	Total kapasitas penyimpanan terkelola ²
ra3.large (simpul tunggal)	2	16	2	1 TB	1	1 TB ³
ra3.large (multi-node)	2	16	2	8 TB	2-16	128 TB
ra3.xlplus (simpul tunggal)	4	32	2	4 TB	1	4 TB ³
ra3.xlplus (multi-node)	4	32	2	32 TB	^{2—16 4}	^{1024 TB 4}
ra3.4xlarge	12	96	4	128 TB	^{2—32 5}	^{8192 TB 5}
ra3.16xlarge	48	384	16	128 TB	2—128	16,384 TB

¹ Batas penyimpanan untuk penyimpanan terkelola Amazon Redshift. Ini adalah batas yang sulit.

² Total batas penyimpanan terkelola adalah jumlah maksimum node dikalikan batas penyimpanan terkelola per node.

³ Untuk mengubah ukuran cluster simpul tunggal menjadi multi-node, hanya pengubahan ukuran klasik yang didukung.

⁴ Anda dapat membuat cluster dengan tipe node ra3.xlplus (multi-node) yang memiliki hingga 16 node. Untuk cluster multi-node, Anda dapat mengubah ukuran dengan mengubah ukuran elastis hingga maksimum 32 node.

⁵ Anda dapat membuat cluster dengan tipe node ra3.4xlarge dengan hingga 32 node. Anda dapat mengubah ukurannya dengan mengubah ukuran elastis hingga maksimum 64 node.

Tabel berikut menjelaskan spesifikasi untuk node komputasi padat.

Jenis simpul	vCPU	RAM (GiB)	Irisan default per node	Penyimpanan per node	Rentang simpul	Kapasitas total
dc2.large	2	15	2	160 GB NVMe -SSD	1—32	5.12 TB
dc2.8xlarge	32	244	16	2,56 TB NVMe -SSD	2—128	326 TB

catatan

Jenis node penyimpanan padat (DS2) tidak lagi tersedia.

Nama tipe node sebelumnya

Dalam rilis Amazon Redshift sebelumnya, jenis node tertentu memiliki nama yang berbeda. Anda dapat menggunakan nama sebelumnya di Amazon Redshift API dan. AWS CLI Namun, kami menyarankan Anda memperbarui skrip apa pun yang mereferensikan nama-nama tersebut untuk menggunakan nama saat ini sebagai gantinya. Nama saat ini dan sebelumnya adalah sebagai berikut.

Nama saat ini	Nama sebelumnya
ds2.xlarge	ds1.xlarge, dw.hs1.xlarge, dw1.xlarge
ds2.8xlarge	ds1.8xlarge, dw.hs1.8xlarge, dw1.8xlarge
dc1.large	dw2.large
dc1.8xlarge	dw2.8xlarge

Menentukan jumlah node

Karena Amazon Redshift mendistribusikan dan menjalankan kueri secara paralel di semua node komputasi klaster, Anda dapat meningkatkan kinerja kueri dengan menambahkan node ke cluster Anda. Ketika Anda menjalankan cluster dengan setidaknya dua node komputasi, data pada setiap node dicerminkan pada disk node lain untuk mengurangi risiko terjadinya kehilangan data.

Anda dapat memantau kinerja kueri di konsol Amazon Redshift dan dengan metrik Amazon CloudWatch . Anda juga dapat menambah atau menghapus node sesuai kebutuhan untuk mencapai keseimbangan antara harga dan kinerja untuk klaster Anda. Saat Anda meminta node tambahan, Amazon Redshift menangani semua detail penerapan, penyeimbangan beban, dan pemeliharaan data. Untuk informasi selengkapnya tentang kinerja klaster, lihatMemantau kinerja klaster Amazon Redshift.

Node cadangan sesuai untuk beban kerja produksi kondisi mapan, dan menawarkan diskon signifikan atas node sesuai permintaan. Anda dapat membeli node cadangan setelah menjalankan eksperimen dan proof-of-concepts memvalidasi konfigurasi produksi Anda. Untuk informasi selengkapnya, lihat Simpul terpesan.

Saat menjeda klaster, Anda menangguhkan penagihan sesuai permintaan selama klaster dijeda. Selama waktu jeda ini, Anda hanya membayar untuk penyimpanan cadangan. Ini membebaskan Anda dari perencanaan dan pembelian kapasitas gudang data di depan kebutuhan Anda, dan memungkinkan Anda mengelola lingkungan secara hemat biaya untuk tujuan pengembangan atau pengujian.

Untuk informasi tentang harga node sesuai permintaan dan cadangan, lihat harga Amazon Redshift.

Gunakan EC2 untuk membuat cluster Anda

Cluster Amazon Redshift berjalan di EC2 instans Amazon yang dikonfigurasi untuk jenis dan ukuran node Amazon Redshift yang Anda pilih. Untuk informasi selengkapnya tentang platform jaringan ini, lihat Platform yang Didukung di Panduan EC2 Pengguna Amazon.

catatan

Untuk mencegah masalah koneksi antara alat klien SQL dan database Amazon Redshift, sebaiknya lakukan salah satu dari dua hal. Anda dapat mengonfigurasi aturan masuk yang memungkinkan host untuk menegosiasikan ukuran paket. Atau, Anda dapat menonaktifkan bingkai jumbo TCP/IP dengan mengatur unit transmisi maksimum (MTU) ke 1500 pada antarmuka jaringan (NIC) instans Amazon Anda. EC2 Untuk informasi lebih lanjut tentang pendekatan ini, lihatKueri tampaknya hang dan terkadang gagal mencapai cluster.

Amazon Virtual Private Cloud (Amazon VPC)

Saat menggunakan Amazon VPC, kluster Anda berjalan di cloud pribadi virtual (VPC) yang secara logis diisolasi ke akun Anda. AWS Jika Anda menyediakan klaster Anda dengan Amazon VPC, Anda mengontrol akses ke klaster Anda dengan mengaitkan satu atau beberapa grup keamanan VPC dengan klaster. Untuk informasi selengkapnya, lihat Grup Keamanan untuk VPC Anda di Panduan Pengguna Amazon VPC.

Untuk membuat klaster di VPC, Anda harus terlebih dahulu membuat grup subnet klaster Amazon Redshift dengan memberikan informasi subnet VPC Anda, lalu berikan grup subnet saat meluncurkan cluster. Untuk informasi selengkapnya, lihat Subnet untuk sumber daya Redshift.

Untuk informasi selengkapnya tentang Amazon Virtual Private Cloud (Amazon VPC), lihat halaman detail produk Amazon VPC.

Alarm ruang disk default

Saat membuat klaster Amazon Redshift, Anda dapat mengonfigurasi CloudWatch alarm Amazon secara opsional untuk memantau persentase rata-rata ruang disk yang digunakan di semua node di cluster Anda. Kami akan menyebut alarm ini sebagai alarm ruang disk default.

Tujuan dari alarm ruang disk default adalah untuk membantu Anda memantau kapasitas penyimpanan cluster Anda. Anda dapat mengonfigurasi alarm ini berdasarkan kebutuhan gudang data Anda. Misalnya, Anda dapat menggunakan peringatan sebagai indikator bahwa Anda mungkin perlu mengubah ukuran klaster Anda. Anda dapat mengubah ukuran ke jenis node yang berbeda atau menambahkan node, atau mungkin untuk membeli node cadangan untuk ekspansi masa depan.

Alarm ruang disk default dipicu ketika penggunaan disk mencapai atau melebihi persentase tertentu untuk beberapa kali dan pada durasi tertentu. Secara default, alarm ini terpicu ketika persentase yang Anda tentukan tercapai, dan tetap pada atau di atas persentase itu selama lima menit atau lebih. Anda dapat mengedit nilai default setelah Anda meluncurkan cluster.

Saat CloudWatch alarm dipicu, Amazon Simple Notification Service (Amazon SNS) mengirimkan notifikasi ke penerima tertentu untuk memperingatkan mereka bahwa ambang batas persentase tercapai. Amazon SNS menggunakan topik untuk menentukan penerima dan pesan yang dikirim dalam pemberitahuan. Anda dapat menggunakan topik Amazon SNS yang ada; jika tidak, topik dibuat berdasarkan pengaturan yang Anda tentukan saat meluncurkan klaster. Anda dapat mengedit topik untuk alarm ini setelah Anda meluncurkan cluster. Untuk informasi selengkapnya tentang membuat topik Amazon SNS, lihat Memulai Layanan Pemberitahuan Sederhana Amazon.

Setelah Anda meluncurkan cluster, Anda dapat melihat dan mengedit alarm dari jendela Status cluster di bawah CloudWatch Alarm. Namanya percentage-disk-space-used-default-< > string. Anda dapat membuka alarm untuk melihat topik Amazon SNS yang terkait dengannya dan mengedit pengaturan alarm. Jika Anda tidak memilih topik Amazon SNS yang ada untuk digunakan, topik yang dibuat untuk Anda diberi nama < clustername >-default-alarm (< recipient >); misalnya, (notify@example.com). examplecluster-default-alarms

Untuk informasi selengkapnya tentang mengonfigurasi dan mengedit alarm ruang disk default, lihat Membuat klaster danMembuat alarm ruang disk.

catatan

Jika Anda menghapus cluster Anda, alarm yang terkait dengan cluster tidak akan dihapus tetapi tidak akan memicu. Anda dapat menghapus alarm dari CloudWatch konsol jika Anda tidak lagi membutuhkannya.

Status klaster

Status cluster menampilkan status cluster saat ini. Tabel berikut memberikan deskripsi untuk setiap status cluster.

Status	Deskripsi
`available`	Cluster berjalan dan tersedia.
`available, prep-for-resize`	Cluster sedang dipersiapkan untuk mengubah ukuran elastis. Cluster berjalan dan tersedia untuk kueri baca dan tulis, tetapi operasi klaster, seperti membuat snapshot, tidak tersedia.
`available, resize-cleanup`	Operasi pengubahan ukuran elastis menyelesaikan transfer data ke node cluster baru. Cluster berjalan dan tersedia untuk kueri baca dan tulis, tetapi operasi klaster, seperti membuat snapshot, tidak tersedia.
`cancelling-resize`	Operasi pengubahan ukuran sedang dibatalkan.
`creating`	Amazon Redshift membuat cluster. Untuk informasi selengkapnya, lihat Membuat klaster.
`deleting`	Amazon Redshift menghapus cluster. Untuk informasi selengkapnya, lihat Mematikan dan menghapus cluster.
`final-snapshot`	Amazon Redshift mengambil snapshot terakhir dari cluster sebelum menghapusnya. Untuk informasi selengkapnya, lihat Mematikan dan menghapus cluster.
`hardware-failure`	Cluster mengalami kegagalan perangkat keras. Jika Anda memiliki cluster simpul tunggal, simpul tidak dapat diganti. Untuk memulihkan klaster Anda, pulihkan snapshot. Untuk informasi selengkapnya, lihat Cuplikan dan cadangan Amazon Redshift.
`incompatible-hsm`	Amazon Redshift tidak dapat terhubung ke modul keamanan perangkat keras (HSM). Periksa konfigurasi HSM antara cluster dan HSM. Untuk informasi selengkapnya, lihat Enkripsi menggunakan modul keamanan perangkat keras.
`incompatible-network`	Ada masalah dengan konfigurasi jaringan yang mendasarinya. Pastikan VPC tempat Anda meluncurkan cluster ada dan pengaturannya benar. Untuk informasi selengkapnya, lihat Sumber daya Redshift dalam VPC.
`incompatible-parameters`	Ada masalah dengan satu atau lebih nilai parameter dalam grup parameter terkait, dan nilai parameter atau nilai tidak dapat diterapkan. Ubah grup parameter dan perbarui nilai yang tidak valid. Untuk informasi selengkapnya, lihat Grup parameter Amazon Redshift.
`incompatible-restore`	Ada masalah saat memulihkan cluster dari snapshot. Coba pulihkan cluster lagi dengan snapshot yang berbeda. Untuk informasi selengkapnya, lihat Cuplikan dan cadangan Amazon Redshift.
`modifying`	Amazon Redshift menerapkan perubahan pada cluster. Untuk informasi selengkapnya, lihat Mengubah klaster.
`paused`	Cluster dijeda. Untuk informasi selengkapnya, lihat Menjeda dan melanjutkan cluster.
`rebooting`	Amazon Redshift me-reboot cluster. Untuk informasi selengkapnya, lihat Melakukan boot ulang klaster.
`renaming`	Amazon Redshift menerapkan nama baru ke cluster. Untuk informasi selengkapnya, lihat Mengganti nama cluster.
`resizing`	Amazon Redshift mengubah ukuran cluster. Untuk informasi selengkapnya, lihat Mengubah ukuran cluster.
`rotating-keys`	Amazon Redshift memutar kunci enkripsi untuk cluster. Untuk informasi selengkapnya, lihat Rotasi kunci enkripsi.
`storage-full`	Cluster telah mencapai kapasitas penyimpanannya. Ubah ukuran cluster untuk menambahkan node atau untuk memilih ukuran node yang berbeda. Untuk informasi selengkapnya, lihat Mengubah ukuran cluster.
`updating-hsm`	Amazon Redshift memperbarui konfigurasi HSM.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Pemberian tag pada sumber daya

Pertimbangan untuk menggunakan cluster yang disediakan

Pilih preferensi cookie Anda

Sesuaikan preferensi cookie

Penting

Kinerja

Fungsional

Iklan

Tidak dapat menyimpan preferensi cookie

Cluster yang disediakan Amazon Redshift

catatan

Cluster dan node di Amazon Redshift

catatan

Rincian tipe simpul

catatan

catatan

Nama tipe node sebelumnya

Menentukan jumlah node

Gunakan EC2 untuk membuat cluster Anda

catatan

Amazon Virtual Private Cloud (Amazon VPC)

Alarm ruang disk default

catatan

Status klaster

Apakah halaman ini membantu Anda?

Topik berikutnya:

Topik sebelumnya:

Perlu bantuan?