Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Ikhtisar Amazon Redshift Spectrum
Topik ini menjelaskan detail penggunaan Redshift Spectrum untuk membaca secara efisien dari Amazon S3.
Amazon Redshift Spectrum berada di server Amazon Redshift khusus yang independen dari cluster Anda. Amazon Redshift mendorong banyak tugas komputasi intensif, seperti pemfilteran predikat dan agregasi, ke lapisan Redshift Spectrum. Dengan demikian, kueri Redshift Spectrum menggunakan kapasitas pemrosesan klaster Anda jauh lebih sedikit daripada kueri lainnya. Redshift Spectrum juga berskala cerdas. Berdasarkan permintaan kueri Anda, Redshift Spectrum berpotensi menggunakan ribuan instance untuk memanfaatkan pemrosesan paralel besar-besaran.
Anda membuat tabel Redshift Spectrum dengan mendefinisikan struktur untuk file Anda dan mendaftarkannya sebagai tabel dalam katalog data eksternal. Katalog data eksternal dapat berupa AWS Glue, katalog data yang disertakan dengan Amazon Athena, atau metastore Apache Hive Anda sendiri. Anda dapat membuat dan mengelola tabel eksternal baik dari Amazon Redshift menggunakan perintah bahasa definisi data (DDL) atau menggunakan alat lain yang terhubung ke katalog data eksternal. Perubahan pada katalog data eksternal segera tersedia untuk salah satu cluster Amazon Redshift Anda.
Secara opsional, Anda dapat mempartisi tabel eksternal pada satu atau lebih kolom. Mendefinisikan partisi sebagai bagian dari tabel eksternal dapat meningkatkan kinerja. Peningkatan terjadi karena pengoptimal kueri Amazon Redshift menghilangkan partisi yang tidak berisi data untuk kueri.
Tampilan terwujud pada tabel Spectrum dapat sangat meningkatkan biaya dan kinerja. Untuk informasi selengkapnya, lihat Tampilan terwujud pada tabel danau data eksternal di Amazon Redshift Spectrum.
Setelah tabel Redshift Spectrum Anda telah ditentukan, Anda dapat menanyakan dan menggabungkan tabel seperti yang Anda lakukan pada tabel Amazon Redshift lainnya. Redshift Spectrum tidak mendukung operasi pembaruan pada tabel eksternal. Anda dapat menambahkan tabel Redshift Spectrum ke beberapa cluster Amazon Redshift dan menanyakan data yang sama di Amazon S3 dari cluster mana pun di Wilayah yang sama. AWS Saat Anda memperbarui file data Amazon S3, data akan segera tersedia untuk kueri dari salah satu cluster Amazon Redshift Anda.
Katalog AWS Glue Data yang Anda akses mungkin dienkripsi untuk meningkatkan keamanan. Jika AWS Glue katalog dienkripsi, Anda memerlukan kunci AWS Key Management Service (AWS KMS) AWS Glue untuk mengakses katalog. AWS Glue AWS Glue enkripsi katalog tidak tersedia di semua AWS Wilayah. Untuk daftar AWS Wilayah yang didukung, lihat Enkripsi dan Akses Aman AWS Glue di Panduan AWS Glue Pengembang.Untuk informasi selengkapnya tentang enkripsi Katalog AWS Glue Data, lihat Mengenkripsi Katalog AWS Glue Data Anda di Panduan AWS Glue Pengembang.
catatan
Anda tidak dapat melihat detail untuk tabel Redshift Spectrum menggunakan sumber daya yang sama dengan yang Anda gunakan untuk tabel Amazon Redshift standar, PG_TABLE_DEF seperti,, PG_CLASS, atau STV_TBL_PERM information_schema. Jika alat intelijen bisnis atau analitik Anda tidak mengenali tabel eksternal Redshift Spectrum, konfigurasikan aplikasi Anda ke kueri SVV_EXTERNAL_TABLES dan. SVV_EXTERNAL_COLUMNS
Wilayah Spektrum Pergeseran Merah Amazon
Redshift Spectrum tersedia di Wilayah AWS tempat Amazon Redshift tersedia, kecuali ditentukan lain dalam dokumentasi khusus Wilayah. Untuk Wilayah AWS ketersediaan di Wilayah komersial, lihat Titik akhir layanan untuk Redshift API di. Referensi Umum Amazon Web