Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pertimbangan saat menggunakan integrasi nol-ETL dengan Amazon Redshift
Pertimbangan berikut berlaku untuk integrasi nol-ETL dengan Amazon Redshift.
-
Gudang data Amazon Redshift target Anda harus memenuhi prasyarat berikut:
-
Menjalankan Amazon Redshift Tanpa Server atau tipe node. RA3
-
Terenkripsi (jika menggunakan klaster yang disediakan).
-
Memiliki sensitivitas kasus diaktifkan.
-
-
Jika Anda menghapus sumber yang merupakan sumber integrasi resmi untuk gudang data Amazon Redshift, semua integrasi terkait akan masuk ke status.
FAILED
Data yang direplikasi sebelumnya tetap ada di database Amazon Redshift Anda dan dapat ditanyakan. -
Database tujuan adalah read-only. Anda tidak dapat membuat tabel, tampilan, atau tampilan terwujud dalam database tujuan. Namun, Anda dapat menggunakan tampilan terwujud pada tabel lain di gudang data target.
-
Tampilan terwujud didukung saat digunakan dalam kueri lintas basis data. Untuk informasi tentang membuat tampilan terwujud dengan data yang direplikasi melalui integrasi nol-ETL, lihat. Menanyakan data yang direplikasi dengan tampilan terwujud
-
Secara default, Anda dapat menanyakan tabel hanya di gudang data target yang berada dalam
Synced
status. Untuk menanyakan tabel di negara bagian lain, atur parameter databaseQUERY_ALL_STATES
keTRUE
. Untuk informasi tentang pengaturanQUERY_ALL_STATES
, lihat MEMBUAT DATABASE dan MENGUBAH DATABASE di Panduan Pengembang Database Amazon Redshift. Untuk informasi selengkapnya tentang status database Anda, lihat SVV_INTEGRATION_TABLE_STATE di Panduan Pengembang Database Amazon Redshift. -
Amazon Redshift hanya menerima karakter UTF-8, jadi mungkin tidak menghormati pemeriksaan yang ditentukan dalam sumber Anda. Aturan penyortiran dan perbandingan mungkin berbeda, yang pada akhirnya dapat mengubah hasil kueri.
-
Integrasi nol-ETL dibatasi hingga 50 per target gudang data Amazon Redshift.
-
Tabel dalam sumber integrasi harus memiliki kunci utama. Jika tidak, tabel Anda tidak dapat direplikasi ke gudang data target di Amazon Redshift.
Untuk informasi tentang cara menambahkan kunci utama ke Amazon Aurora PostgreSQL, lihat Menangani tabel tanpa kunci utama saat membuat integrasi Amazon Aurora PostgreSQL Zero-ETL dengan Amazon Redshift di Blog Database
.AWS Untuk informasi tentang cara menambahkan kunci utama ke Amazon Aurora MySQL atau RDS untuk MySQL, lihat Menangani tabel tanpa kunci utama saat membuat Amazon Aurora MySQL atau Amazon RDS untuk MySQL for MySQL atau integrasi Nol-ETL MySQL dengan Amazon Redshift di Blog Database .AWS -
Anda dapat menggunakan pemfilteran data untuk integrasi Aurora Zero-ETL untuk menentukan ruang lingkup replikasi dari cluster Aurora DB sumber ke gudang data Amazon Redshift target. Daripada mereplikasi semua data ke target, Anda dapat menentukan satu atau lebih filter yang secara selektif menyertakan atau mengecualikan tabel tertentu agar tidak direplikasi. Untuk informasi selengkapnya, lihat Pemfilteran data untuk integrasi Aurora Zero-ETL dengan Amazon Redshift di Panduan Pengguna Amazon Aurora.
-
Untuk integrasi Aurora PostgreSQL Zero-ETL dengan Amazon Redshift, Amazon Redshift mendukung maksimum 100 database dari Aurora PostgreSQL. Setiap database mereplikasi dari sumber ke target secara independen.
-
Integrasi nol-ETL tidak mendukung transformasi saat mereplikasi data dari penyimpanan data transaksional ke Amazon Redshift. Data direplikasi apa adanya dari basis data sumber. Namun, Anda dapat menerapkan transformasi pada data yang direplikasi di Amazon Redshift.
-
Integrasi nol-ETL berjalan di Amazon Redshift menggunakan koneksi paralel. Ini berjalan menggunakan kredensil pengguna yang membuat database dari integrasi. Saat kueri berjalan, penskalaan konkurensi tidak berlaku untuk koneksi ini selama sinkronisasi (tulis). Pembacaan penskalaan konkurensi (dari klien Amazon Redshift) berfungsi untuk objek yang disinkronkan.
-
Anda dapat mengatur integrasi nol-ETL untuk mengontrol frekuensi replikasi data ke Amazon Redshift.
REFRESH_INTERVAL
Untuk informasi selengkapnya, lihat MEMBUAT DATABASE dan MENGUBAH DATABASE di Panduan Pengembang Database Amazon Redshift.
Pertimbangan saat menggunakan mode riwayat pada target
Pertimbangan berikut berlaku saat menggunakan mode riwayat pada database target. Untuk informasi selengkapnya, lihat Modus sejarah.
Saat Anda menjatuhkan tabel pada sumber, tabel pada target tidak dijatuhkan, tetapi diubah menjadi
DroppedSource
status. Anda dapat menjatuhkan atau mengganti nama tabel dari database Amazon Redshift.Saat Anda memotong tabel pada sumber, penghapusan dijalankan pada tabel target. Misalnya, jika semua catatan terpotong pada sumber, catatan yang sesuai pada kolom
_record_is_active
target diubah menjadi.false
Saat Anda menjalankan tabel TRUNCATE SQL pada tabel target, baris riwayat aktif ditandai tidak aktif dengan stempel waktu yang sesuai.
Ketika baris dalam tabel diatur ke tidak aktif, itu dapat dihapus setelah penundaan singkat (sekitar 10 menit). Untuk menghapus baris yang tidak aktif, sambungkan ke database nol-ETL Anda dengan editor kueri v2 atau klien SQL lainnya.
Anda hanya dapat menghapus baris tidak aktif dari tabel dengan mode riwayat aktif. Misalnya, perintah SQL yang mirip dengan berikut ini hanya menghapus baris yang tidak aktif.
delete from schema.user_table where _record_delete_time <= '2024-09-10 12:34:56'
Ini setara dengan perintah SQL seperti berikut ini.
delete from schema.user_table where _record_delete_time <= '2024-09-10 12:34:56' and _record_is_active = False
Saat mematikan mode riwayat untuk tabel, semua data historis disimpan ke tabel yang diberi nama
<schema>.<table-name>_historical_<timestamp>
sementara tabel asli bernama<schema>.<table-name>
disegarkan.Ketika tabel dengan mode riwayat aktif dikecualikan dari replikasi menggunakan filter tabel, semua baris ditetapkan sebagai tidak aktif dan diubah menjadi
DroppedSource
status. Untuk informasi selengkapnya tentang filter tabel, lihat Pemfilteran data untuk integrasi Aurora Zero-ETL dengan Amazon Redshift di Panduan Pengguna Amazon Aurora.Mode riwayat hanya dapat dialihkan ke
true
ataufalse
untuk tabel dalamSynced
keadaan.
Pertimbangan ketika sumber integrasi nol-ETL adalah Aurora atau Amazon RDS
Pertimbangan berikut berlaku untuk integrasi Aurora dan Amazon RDS Zero-ETL dengan Amazon Redshift.
-
Anda dapat menggunakan pemfilteran data untuk Aurora dan RDS untuk integrasi MySQL Zero-ETL untuk menentukan ruang lingkup replikasi dari cluster DB sumber ke gudang data Amazon Redshift target. Daripada mereplikasi semua data ke target, Anda dapat menentukan satu atau lebih filter yang secara selektif menyertakan atau mengecualikan tabel tertentu agar tidak direplikasi. Untuk informasi selengkapnya, lihat Pemfilteran data untuk integrasi Aurora Zero-ETL dengan Amazon Redshift di Panduan Pengguna Amazon Aurora.
-
Tabel dalam sumber integrasi harus memiliki kunci utama. Jika tidak, tabel Anda tidak dapat direplikasi ke gudang data target di Amazon Redshift.
Untuk informasi tentang cara menambahkan kunci utama ke Amazon Aurora PostgreSQL, lihat Menangani tabel tanpa kunci utama saat membuat integrasi Amazon Aurora PostgreSQL Zero-ETL dengan Amazon Redshift di Blog Database
.AWS Untuk informasi tentang cara menambahkan kunci utama ke Amazon Aurora MySQL atau RDS untuk MySQL, lihat Menangani tabel tanpa kunci utama saat membuat Amazon Aurora MySQL atau Amazon RDS untuk MySQL for MySQL atau integrasi Nol-ETL MySQL dengan Amazon Redshift di Blog Database .AWS -
Panjang maksimum tipe data Amazon Redshift VARCHAR adalah 65.535 byte. Ketika konten dari sumber tidak sesuai dengan batas ini, replikasi tidak dilanjutkan dan tabel dimasukkan ke dalam keadaan gagal. Anda dapat mengatur parameter database
TRUNCATECOLUMNS
TRUE
untuk memotong konten agar sesuai dengan kolom. Untuk informasi tentang pengaturanTRUNCATECOLUMNS
, lihat MEMBUAT DATABASE dan MENGUBAH DATABASE di Panduan Pengembang Database Amazon Redshift.Untuk informasi selengkapnya tentang perbedaan tipe data antara sumber integrasi nol-ETL dan database Amazon Redshift, lihat Perbedaan tipe data antara Aurora dan Amazon Redshift di Panduan Pengguna Amazon Aurora.
Untuk sumber Aurora, lihat juga Batasan di Panduan Pengguna Amazon Aurora.
Untuk sumber Amazon RDS, lihat juga Batasan dalam Panduan Pengguna Amazon RDS.
Pertimbangan ketika sumber integrasi nol-ETL adalah DynamoDB
Pertimbangan berikut berlaku untuk integrasi DynamoDB Zero-ETL dengan Amazon Redshift.
Nama tabel dari DynamoDB lebih besar dari 127 karakter tidak didukung.
Data dari integrasi DynamoDB Zero-ETL memetakan ke kolom tipe data SUPER di Amazon Redshift.
Nama kolom untuk kunci partisi atau kunci sortir yang lebih besar dari 127 karakter tidak didukung.
Integrasi nol-ETL dari DynamoDB dapat memetakan ke hanya satu database Amazon Redshift.
Untuk kunci partisi dan sortir, presisi dan skala maksimum adalah (38,18). Tipe data numerik pada DynamoDB mendukung presisi maksimum hingga 38. Amazon Redshift juga mendukung presisi maksimum 38, tetapi presisi/skala desimal default pada Amazon Redshift adalah (38,10). Itu berarti nilai nilai skala dapat terpotong.
Untuk integrasi nol-ETL yang berhasil, atribut individual (terdiri dari nama+nilai) dalam item DynamoDB, tidak boleh lebih besar dari 64 KB.
Pada aktivasi, integrasi nol-ETL mengekspor tabel DynamoDB lengkap untuk mengisi database Amazon Redshift. Waktu yang dibutuhkan untuk proses awal ini untuk menyelesaikan tergantung pada ukuran tabel DynamoDB. Integrasi nol-ETL kemudian secara bertahap mereplikasi pembaruan dari DynamoDB ke Amazon Redshift menggunakan ekspor tambahan DynamoDB. Ini berarti data DynamoDB yang direplikasi di Amazon Redshift disimpan secara otomatis. up-to-date
Saat ini, latensi minimum untuk integrasi DynamoDB Zero-ETL adalah 15 menit. Anda dapat meningkatkannya lebih lanjut dengan menetapkan non-nol
REFRESH_INTERVAL
untuk integrasi nol-ETL. Untuk informasi selengkapnya, lihat MEMBUAT DATABASE dan MENGUBAH DATABASE di Panduan Pengembang Database Amazon Redshift.
Untuk sumber Amazon DynamoDB, lihat juga Prasyarat dan batasan di Panduan Pengembang Amazon DynamoDB.
Pertimbangan ketika sumber integrasi nol-ETL adalah aplikasi, seperti, Salesforce, SAP,, dan Zendesk ServiceNow
Pertimbangan berikut berlaku untuk sumber adalah aplikasi, seperti, Salesforce, SAP ServiceNow, dan Zendesk dengan Amazon Redshift.
Nama tabel dan nama kolom dari sumber aplikasi yang lebih besar dari 127 karakter tidak didukung.
-
Panjang maksimum tipe data Amazon Redshift VARCHAR adalah 65.535 byte. Ketika konten dari sumber tidak sesuai dengan batas ini, replikasi tidak dilanjutkan dan tabel dimasukkan ke dalam keadaan gagal. Anda dapat mengatur parameter database
TRUNCATECOLUMNS
TRUE
untuk memotong konten agar sesuai dengan kolom. Untuk informasi tentang pengaturan,TRUNCATECOLUMNS
lihat MEMBUAT DATABASE dan MENGUBAH DATABASE di Panduan Pengembang Database Amazon Redshift. Latensi minimum untuk integrasi nol-ETL dengan aplikasi adalah 1 jam. Anda dapat meningkatkannya lebih lanjut dengan menetapkan non-nol
REFRESH_INTERVAL
untuk integrasi nol-ETL. Untuk informasi selengkapnya, lihat MEMBUAT DATABASE dan MENGUBAH DATABASE di Panduan Pengembang Database Amazon Redshift.
Untuk sumber integrasi nol-ETL dengan aplikasi, lihat juga integrasi nol-ETL di Panduan Pengembang.AWS Glue