Cluster yang disediakan Amazon Redshift - Amazon Redshift

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Cluster yang disediakan Amazon Redshift

Gudang data Amazon Redshift adalah kumpulan sumber daya komputasi yang disebut node, yang diatur ke dalam grup yang disebut cluster. Setiap klaster menjalankan mesin Amazon Redshift dan berisi satu atau lebih database.

catatan

Saat ini, mesin Amazon Redshift versi 1.0 tersedia. Namun, saat mesin diperbarui, beberapa versi mesin Amazon Redshift mungkin tersedia untuk dipilih.

Cluster dan node di Amazon Redshift

Cluster Amazon Redshift terdiri dari node. Setiap cluster memiliki node pemimpin dan satu atau lebih node komputasi. Node pemimpin menerima kueri dari aplikasi klien, mem-parsing kueri, dan mengembangkan rencana eksekusi kueri. Node pemimpin kemudian mengoordinasikan eksekusi paralel dari rencana ini dengan node komputasi dan mengumpulkan hasil antara dari node ini. Kemudian akhirnya mengembalikan hasil kembali ke aplikasi klien.

Node komputasi menjalankan rencana eksekusi kueri dan mengirimkan data di antara mereka sendiri untuk melayani kueri ini. Hasil antara dikirim ke node pemimpin untuk agregasi sebelum dikirim kembali ke aplikasi klien. Untuk informasi selengkapnya tentang node pemimpin dan node komputasi, lihat Arsitektur sistem gudang data di Panduan Pengembang Database Amazon Redshift.

catatan

Saat membuat cluster di Amazon Redshift console (https://console.aws.amazon.com/redshiftv2/), Anda bisa mendapatkan rekomendasi konfigurasi klaster berdasarkan ukuran data dan karakteristik kueri. Untuk menggunakan kalkulator ukuran ini, cari Bantu saya memilih di konsol di AWS Wilayah yang mendukung jenis RA3 simpul. Untuk informasi selengkapnya, lihat Membuat klaster.

Saat Anda meluncurkan cluster, salah satu opsi yang Anda tentukan adalah tipe node. Tipe node menentukanCPU,RAM, kapasitas penyimpanan, dan tipe drive penyimpanan untuk setiap node.

Amazon Redshift menawarkan berbagai jenis node untuk mengakomodasi beban kerja Anda, dan sebaiknya pilih RA3 atau DC2 bergantung pada kinerja yang diperlukan, ukuran data, dan pertumbuhan data yang diharapkan.

RA3node dengan penyimpanan terkelola memungkinkan Anda mengoptimalkan gudang data dengan menskalakan dan membayar komputasi dan penyimpanan terkelola secara independen. DenganRA3, Anda memilih jumlah node berdasarkan persyaratan kinerja Anda dan hanya membayar untuk penyimpanan terkelola yang Anda gunakan. Ukuran RA3 klaster Anda berdasarkan jumlah data yang Anda proses setiap hari. Anda meluncurkan cluster yang menggunakan tipe RA3 node di virtual private cloud (VPC). Anda tidak dapat meluncurkan RA3 cluster di EC2 -Classic. Untuk informasi selengkapnya, lihat Membuat klaster yang disediakan Redshift atau workgroup Amazon Redshift Tanpa Server di VPC.

Penyimpanan terkelola Amazon Redshift menggunakan besar, kinerja tinggi SSDs di setiap RA3 node untuk penyimpanan lokal yang cepat dan Amazon S3 untuk penyimpanan tahan lama jangka panjang. Jika data dalam node tumbuh melebihi ukuran lokal besarSSDs, penyimpanan terkelola Amazon Redshift secara otomatis membongkar data tersebut ke Amazon S3. Anda membayar tarif rendah yang sama untuk penyimpanan terkelola Amazon Redshift terlepas dari apakah data berada dalam kinerja tinggi atau Amazon SSDs S3. Untuk beban kerja yang membutuhkan penyimpanan yang terus bertambah, penyimpanan terkelola memungkinkan Anda secara otomatis menskalakan kapasitas penyimpanan gudang data Anda terpisah dari node komputasi.

DC2node memungkinkan Anda untuk memiliki gudang data komputasi intensif dengan penyimpanan lokal disertakan. SSD Anda memilih jumlah node yang Anda butuhkan berdasarkan ukuran data dan persyaratan kinerja. DC2node menyimpan data Anda secara lokal untuk kinerja tinggi, dan seiring bertambahnya ukuran data, Anda dapat menambahkan lebih banyak node komputasi untuk meningkatkan kapasitas penyimpanan cluster. Untuk kumpulan data di bawah 1 TB (terkompresi), kami merekomendasikan jenis DC2 node untuk kinerja terbaik dengan harga terendah. Jika Anda mengharapkan data Anda tumbuh, sebaiknya gunakan RA3 node sehingga Anda dapat mengukur komputasi dan penyimpanan secara independen untuk mencapai peningkatan harga dan kinerja. Anda meluncurkan cluster yang menggunakan tipe DC2 node di virtual private cloud (VPC). Anda tidak dapat meluncurkan DC2 cluster di EC2 -Classic. Untuk informasi selengkapnya, lihat Membuat klaster yang disediakan Redshift atau workgroup Amazon Redshift Tanpa Server di VPC.

Jenis node tersedia dalam berbagai ukuran. Ukuran node dan jumlah node menentukan total penyimpanan untuk sebuah cluster. Untuk informasi selengkapnya, lihat Rincian tipe simpul.

Beberapa jenis node memungkinkan satu node (single-node) atau dua atau lebih node (multi-node). Jumlah minimum node untuk cluster dari beberapa jenis node adalah dua node. Pada cluster simpul tunggal, node dibagikan untuk fungsionalitas pemimpin dan komputasi. Cluster simpul tunggal tidak direkomendasikan untuk menjalankan beban kerja produksi. Pada cluster multi-node, node pemimpin terpisah dari node komputasi. Node pemimpin adalah tipe node yang sama dengan node komputasi. Anda hanya membayar untuk node komputasi.

Amazon Redshift menerapkan kuota ke sumber daya untuk setiap AWS akun di setiap Wilayah. AWS Kuota membatasi jumlah sumber daya yang dapat dibuat akun Anda untuk jenis sumber daya tertentu, seperti node atau snapshot, di dalam Wilayah. AWS Untuk informasi selengkapnya tentang kuota default yang berlaku untuk resource Amazon Redshift, lihat. Kuota dan batas di Amazon Redshift

Biaya cluster Anda tergantung pada AWS Region, tipe node, jumlah node, dan apakah node dicadangkan terlebih dahulu. Untuk informasi selengkapnya tentang biaya node, lihat halaman harga Amazon Redshift.

Rincian tipe simpul

Tabel berikut merangkum spesifikasi node untuk setiap jenis dan ukuran node. Judul dalam tabel memiliki arti ini:

  • v CPU adalah jumlah virtual CPUs untuk setiap node.

  • RAMadalah jumlah memori dalam gibibytes (GiB) untuk setiap node.

  • Irisan default per node adalah jumlah irisan di mana node komputasi dipartisi saat cluster dibuat atau diubah ukurannya dengan pengubahan ukuran klasik.

    Jumlah irisan per node dapat berubah jika cluster diubah ukurannya menggunakan pengubahan ukuran elastis. Namun jumlah total irisan pada semua node komputasi di cluster tetap sama setelah mengubah ukuran elastis.

    Saat Anda membuat cluster dengan operasi restore from snapshot, jumlah irisan cluster yang dihasilkan mungkin berubah dari cluster asli jika Anda mengubah jenis node.

  • Penyimpanan adalah kapasitas dan jenis penyimpanan untuk setiap node.

  • Rentang node adalah jumlah node minimum dan maksimum yang didukung Amazon Redshift untuk jenis dan ukuran node.

    catatan

    Anda mungkin dibatasi untuk node yang lebih sedikit tergantung pada kuota yang diterapkan ke AWS akun Anda di AWS Wilayah yang dipilih. Untuk informasi selengkapnya tentang kuota default yang berlaku untuk resource Amazon Redshift, lihat. Kuota dan batas di Amazon Redshift

  • Kapasitas total adalah kapasitas penyimpanan total untuk cluster jika Anda menggunakan jumlah maksimum node yang ditentukan dalam rentang node.

Tabel berikut menjelaskan spesifikasi untuk RA3 node.

Jenis simpul v CPU RAM(GiB) Irisan default per node Batas penyimpanan terkelola per node 1 Rentang node dengan create cluster Total kapasitas penyimpanan terkelola 2
ra3.large (simpul tunggal) 2 16 2 1 TB 1 1 TB 3
ra3.large (multi-node) 2 16 2 8 TB 2-16 128 TB
ra3.xlplus (simpul tunggal) 4 32 2 4 TB 1 4 TB 3
ra3.xlplus (multi-node) 4 32 2 32 TB 2—16 4 1024 TB 4
ra3.4xlarge 12 96 4 128 TB 2—32 5 8192 TB 5
ra3.16xlarge 48 384 16 128 TB 2—128 16,384 TB

1 Batas penyimpanan untuk penyimpanan terkelola Amazon Redshift. Ini adalah batas yang sulit.

2 Total batas penyimpanan terkelola adalah jumlah maksimum node dikalikan batas penyimpanan terkelola per node.

3 Untuk mengubah ukuran cluster simpul tunggal menjadi multi-node, hanya pengubahan ukuran klasik yang didukung.

4 Anda dapat membuat cluster dengan tipe node ra3.xlplus (multi-node) yang memiliki hingga 16 node. Untuk cluster multi-node, Anda dapat mengubah ukuran dengan mengubah ukuran elastis hingga maksimum 32 node.

5 Anda dapat membuat cluster dengan tipe node ra3.4xlarge dengan hingga 32 node. Anda dapat mengubah ukurannya dengan mengubah ukuran elastis hingga maksimum 64 node.

Tabel berikut menjelaskan spesifikasi untuk node komputasi padat.

Jenis simpul v CPU RAM(GiB) Irisan default per node Penyimpanan per node Rentang simpul Kapasitas total
dc2.large 2 15 2 160 GB NVMe - SSD 1—32 5,12 TB
dc2.8xlarge 32 244 16 2,56 TB NVMe - SSD 2—128 326 TB
catatan

Jenis node penyimpanan padat (DS2) tidak lagi tersedia.

Nama tipe node sebelumnya

Dalam rilis Amazon Redshift sebelumnya, jenis node tertentu memiliki nama yang berbeda. Anda dapat menggunakan nama sebelumnya di Amazon Redshift API dan. AWS CLI Namun, kami menyarankan Anda memperbarui skrip apa pun yang mereferensikan nama-nama tersebut untuk menggunakan nama saat ini sebagai gantinya. Nama saat ini dan sebelumnya adalah sebagai berikut.

Nama saat ini Nama sebelumnya
ds2.xlarge ds1.xlarge, dw.hs1.xlarge, dw1.xlarge
ds2.8xlarge ds1.8xlarge, dw.hs1.8xlarge, dw1.8xlarge
dc1.large dw2.large
dc1.8xlarge dw2.8xlarge

Menentukan jumlah node

Karena Amazon Redshift mendistribusikan dan menjalankan kueri secara paralel di semua node komputasi klaster, Anda dapat meningkatkan kinerja kueri dengan menambahkan node ke cluster Anda. Ketika Anda menjalankan cluster dengan setidaknya dua node komputasi, data pada setiap node dicerminkan pada disk node lain untuk mengurangi risiko terjadinya kehilangan data.

Anda dapat memantau kinerja kueri di konsol Amazon Redshift dan dengan metrik Amazon CloudWatch . Anda juga dapat menambah atau menghapus node sesuai kebutuhan untuk mencapai keseimbangan antara harga dan kinerja untuk klaster Anda. Saat Anda meminta node tambahan, Amazon Redshift menangani semua detail penerapan, penyeimbangan beban, dan pemeliharaan data. Untuk informasi selengkapnya tentang kinerja klaster, lihatMemantau kinerja klaster Amazon Redshift.

Node cadangan sesuai untuk beban kerja produksi kondisi mapan, dan menawarkan diskon signifikan atas node sesuai permintaan. Anda dapat membeli node cadangan setelah menjalankan eksperimen dan proof-of-concepts memvalidasi konfigurasi produksi Anda. Untuk informasi selengkapnya, lihat Simpul terpesan.

Saat menjeda klaster, Anda menangguhkan penagihan sesuai permintaan selama klaster dijeda. Selama waktu jeda ini, Anda hanya membayar untuk penyimpanan cadangan. Ini membebaskan Anda dari perencanaan dan pembelian kapasitas gudang data di depan kebutuhan Anda, dan memungkinkan Anda mengelola lingkungan secara hemat biaya untuk tujuan pengembangan atau pengujian.

Untuk informasi tentang harga node sesuai permintaan dan cadangan, lihat harga Amazon Redshift.

Gunakan EC2 - VPC saat Anda membuat cluster

Cluster Amazon Redshift berjalan di EC2 instans Amazon yang dikonfigurasi untuk jenis dan ukuran node Amazon Redshift yang Anda pilih. Buat cluster Anda menggunakan EC2 -VPC. Jika Anda masih menggunakan EC2 -Classic, kami sarankan Anda menggunakan EC2 - VPC untuk mendapatkan peningkatan kinerja dan keamanan. Untuk informasi selengkapnya tentang platform jaringan ini, lihat Platform yang Didukung di Panduan EC2 Pengguna Amazon. Pengaturan AWS akun Anda menentukan apakah EC2 - VPC atau EC2 -Classic tersedia untuk Anda.

catatan

Untuk mencegah masalah koneksi antara alat SQL klien dan database Amazon Redshift, sebaiknya lakukan salah satu dari dua hal. Anda dapat mengonfigurasi aturan masuk yang memungkinkan host untuk menegosiasikan ukuran paket. Atau, Anda dapat menonaktifkan frame jumbo TCP /IP dengan menyetel unit transmisi maksimum (MTU) ke 1500 pada antarmuka jaringan (NIC) instans Amazon EC2 Anda. Untuk informasi lebih lanjut tentang pendekatan ini, lihatKueri tampaknya hang dan terkadang gagal mencapai cluster.

EC2-VPC

Saat menggunakan EC2 -VPC, cluster Anda berjalan di cloud pribadi virtual (VPC) yang secara logis diisolasi ke AWS akun Anda. Jika Anda menyediakan klaster di EC2 -VPC, Anda mengontrol akses ke klaster dengan mengaitkan satu atau beberapa grup VPC keamanan dengan klaster. Untuk informasi selengkapnya, lihat Grup Keamanan untuk Anda VPC di Panduan VPC Pengguna Amazon.

Untuk membuat klaster di aVPC, Anda harus terlebih dahulu membuat grup subnet klaster Amazon Redshift dengan memberikan informasi subnet AndaVPC, lalu berikan grup subnet saat meluncurkan cluster. Untuk informasi selengkapnya, lihat Subnet untuk sumber daya Redshift.

Untuk informasi selengkapnya tentang Amazon Virtual Private Cloud (AmazonVPC), lihat halaman detail VPC produk Amazon.

Alarm ruang disk default

Saat membuat klaster Amazon Redshift, Anda dapat mengonfigurasi CloudWatch alarm Amazon secara opsional untuk memantau persentase rata-rata ruang disk yang digunakan di semua node di cluster Anda. Kami akan menyebut alarm ini sebagai alarm ruang disk default.

Tujuan dari alarm ruang disk default adalah untuk membantu Anda memantau kapasitas penyimpanan cluster Anda. Anda dapat mengonfigurasi alarm ini berdasarkan kebutuhan gudang data Anda. Misalnya, Anda dapat menggunakan peringatan sebagai indikator bahwa Anda mungkin perlu mengubah ukuran klaster Anda. Anda dapat mengubah ukuran ke jenis node yang berbeda atau menambahkan node, atau mungkin untuk membeli node cadangan untuk ekspansi masa depan.

Alarm ruang disk default dipicu ketika penggunaan disk mencapai atau melebihi persentase tertentu untuk beberapa kali dan pada durasi tertentu. Secara default, alarm ini terpicu ketika persentase yang Anda tentukan tercapai, dan tetap pada atau di atas persentase itu selama lima menit atau lebih. Anda dapat mengedit nilai default setelah Anda meluncurkan cluster.

Saat CloudWatch alarm dipicu, Amazon Simple Notification Service (AmazonSNS) mengirimkan pemberitahuan ke penerima tertentu untuk memperingatkan mereka bahwa ambang batas persentase tercapai. Amazon SNS menggunakan topik untuk menentukan penerima dan pesan yang dikirim dalam pemberitahuan. Anda dapat menggunakan SNS topik Amazon yang ada; jika tidak, topik dibuat berdasarkan pengaturan yang Anda tentukan saat meluncurkan klaster. Anda dapat mengedit topik untuk alarm ini setelah Anda meluncurkan cluster. Untuk informasi selengkapnya tentang membuat SNS topik Amazon, lihat Memulai Layanan Pemberitahuan Sederhana Amazon.

Setelah Anda meluncurkan cluster, Anda dapat melihat dan mengedit alarm dari jendela Status cluster di bawah CloudWatch Alarm. Namanya percentage-disk-space-used -default-<string>. Anda dapat membuka alarm untuk melihat SNS topik Amazon yang terkait dengannya dan mengedit pengaturan alarm. Jika Anda tidak memilih SNS topik Amazon yang ada untuk digunakan, topik yang dibuat untuk Anda diberi nama <clustername>-default-alarm (<recipient>); misalnya, examplecluster-default-alarms (notify@example.com).

Untuk informasi selengkapnya tentang mengonfigurasi dan mengedit alarm ruang disk default, lihat Membuat klaster danMembuat alarm ruang disk.

catatan

Jika Anda menghapus cluster Anda, alarm yang terkait dengan cluster tidak akan dihapus tetapi tidak akan memicu. Anda dapat menghapus alarm dari CloudWatch konsol jika Anda tidak lagi membutuhkannya.

Status klaster

Status cluster menampilkan status cluster saat ini. Tabel berikut memberikan deskripsi untuk setiap status cluster.

Status Deskripsi
available Cluster berjalan dan tersedia.
available, prep-for-resize Cluster sedang dipersiapkan untuk mengubah ukuran elastis. Cluster berjalan dan tersedia untuk kueri baca dan tulis, tetapi operasi klaster, seperti membuat snapshot, tidak tersedia.
available, resize-cleanup Operasi pengubahan ukuran elastis menyelesaikan transfer data ke node cluster baru. Cluster berjalan dan tersedia untuk kueri baca dan tulis, tetapi operasi klaster, seperti membuat snapshot, tidak tersedia.
cancelling-resize Operasi pengubahan ukuran sedang dibatalkan.
creating Amazon Redshift membuat cluster. Untuk informasi selengkapnya, lihat Membuat klaster.
deleting Amazon Redshift menghapus cluster. Untuk informasi selengkapnya, lihat Mematikan dan menghapus cluster.
final-snapshot Amazon Redshift mengambil snapshot terakhir dari cluster sebelum menghapusnya. Untuk informasi selengkapnya, lihat Mematikan dan menghapus cluster.
hardware-failure

Cluster mengalami kegagalan perangkat keras.

Jika Anda memiliki cluster simpul tunggal, simpul tidak dapat diganti. Untuk memulihkan klaster Anda, pulihkan snapshot. Untuk informasi selengkapnya, lihat Cuplikan dan cadangan Amazon Redshift.

incompatible-hsm Amazon Redshift tidak dapat terhubung ke modul keamanan perangkat keras ()HSM. Periksa HSM konfigurasi antara cluster danHSM. Untuk informasi selengkapnya, lihat Enkripsi menggunakan modul keamanan perangkat keras.
incompatible-network Ada masalah dengan konfigurasi jaringan yang mendasarinya. Pastikan bahwa VPC di mana Anda meluncurkan cluster ada dan pengaturannya benar. Untuk informasi selengkapnya, lihat Sumber daya Pergeseran Merah di a VPC.
incompatible-parameters Ada masalah dengan satu atau lebih nilai parameter dalam grup parameter terkait, dan nilai parameter atau nilai tidak dapat diterapkan. Ubah grup parameter dan perbarui nilai yang tidak valid. Untuk informasi selengkapnya, lihat Grup parameter Amazon Redshift.
incompatible-restore Ada masalah saat memulihkan cluster dari snapshot. Coba pulihkan cluster lagi dengan snapshot yang berbeda. Untuk informasi selengkapnya, lihat Cuplikan dan cadangan Amazon Redshift.
modifying Amazon Redshift menerapkan perubahan pada cluster. Untuk informasi selengkapnya, lihat Mengubah klaster.
paused Cluster dijeda. Untuk informasi selengkapnya, lihat Menjeda dan melanjutkan cluster.
rebooting Amazon Redshift me-reboot cluster. Untuk informasi selengkapnya, lihat Melakukan boot ulang klaster.
renaming Amazon Redshift menerapkan nama baru ke cluster. Untuk informasi selengkapnya, lihat Mengganti nama cluster.
resizing Amazon Redshift mengubah ukuran cluster. Untuk informasi selengkapnya, lihat Mengubah ukuran cluster.
rotating-keys Amazon Redshift memutar kunci enkripsi untuk cluster. Untuk informasi selengkapnya, lihat Rotasi kunci enkripsi.
storage-full Cluster telah mencapai kapasitas penyimpanannya. Ubah ukuran cluster untuk menambahkan node atau untuk memilih ukuran node yang berbeda. Untuk informasi selengkapnya, lihat Mengubah ukuran cluster.
updating-hsm Amazon Redshift memperbarui konfigurasi. HSM