Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menambahkan data ke RDSdatabase sumber dan menanyakannya di Amazon Redshift
Untuk menyelesaikan pembuatan ETL integrasi nol yang mereplikasi data dari Amazon RDS Amazon Redshift, Anda harus membuat database tujuan di Amazon Redshift.
Pertama, hubungkan ke klaster atau grup kerja Amazon Redshift Anda dan buat basis data dengan referensi ke pengidentifikasi integrasi Anda. Kemudian, Anda dapat menambahkan data ke RDSdatabase sumber Anda dan melihatnya direplikasi di Amazon Redshift.
Topik
Membuat database tujuan di Amazon Redshift
Sebelum Anda dapat mulai mereplikasi data ke Amazon Redshift, setelah Anda membuat integrasi, Anda harus membuat basis data tujuan di gudang data target Anda. Basis data tujuan ini harus menyertakan referensi ke pengidentifikasi integrasi. Anda dapat menggunakan konsol Amazon Redshift atau Editor kueri v2 untuk membuat basis data.
Untuk petunjuk cara membuat basis data tujuan, lihat Membuat basis data tujuan di Amazon Redshift.
Menambahkan data ke database sumber
Setelah mengonfigurasi integrasi, Anda dapat menambahkan beberapa data ke RDSdatabase yang ingin Anda replikasi ke gudang data Amazon Redshift Anda.
catatan
Ada perbedaan antara tipe data di Amazon RDS Amazon dan Amazon Redshift. Untuk tabel pemetaan jenis data, lihat Perbedaan tipe data antara database RDS dan Amazon Redshift.
Pertama, sambungkan ke database sumber menggunakan SQL klien My SQL pilihan Anda. Untuk petunjuk, silakan lihat Menghubungkan ke instans DB yang menjalankan mesin SQL database Saya.
Kemudian, buat tabel dan masukkan urutan data sampel.
penting
Pastikan tabel memiliki kunci primer. Jika tidak, tabel tidak dapat direplikasi ke gudang data target.
Contoh berikut menggunakan utilitas My SQL Workbench
CREATE DATABASE
my_db
; USEmy_db
; CREATE TABLEbooks_table
(ID int NOT NULL, Title VARCHAR(50) NOT NULL, Author VARCHAR(50) NOT NULL, Copyright INT NOT NULL, Genre VARCHAR(50) NOT NULL, PRIMARY KEY (ID)); INSERT INTObooks_table
VALUES (1, 'The Shining', 'Stephen King', 1977, 'Supernatural fiction');
Menanyakan data Amazon RDS Anda di Amazon Redshift
Setelah Anda menambahkan data ke RDSdatabase , itu direplikasi ke Amazon Redshift dan siap untuk ditanyakan.
Untuk mengueri data yang direplikasi
-
Buka konsol Amazon Redshift dan pilih Editor kueri v2 dari panel navigasi kiri.
-
Hubungkan ke klaster atau grup kerja Anda dan pilih basis data tujuan Anda (yang Anda buat dari integrasi) dari menu dropdown (destination_database dalam contoh ini). Untuk petunjuk cara membuat basis data tujuan, lihat Membuat basis data tujuan di Amazon Redshift.
-
Gunakan SELECT pernyataan untuk menanyakan data Anda. Dalam contoh ini, Anda dapat menjalankan perintah berikut untuk memilih semua data dari tabel yang Anda buat di RDSdatabase sumber :
SELECT * from
my_db
."books_table
";-
adalah nama skema basis data RDS.my_db
-
adalah nama tabel RDS.books_table
-
Anda juga dapat menanyakan data menggunakan klien baris perintah. Sebagai contoh:
destination_database=# select * from
my_db
."books_table
"; ID | Title | Author | Copyright | Genre | txn_seq | txn_id ----+–------------+---------------+-------------+------------------------+----------+--------+ 1 | The Shining | Stephen King | 1977 | Supernatural fiction | 2 | 12192
catatan
Untuk kepekaan huruf besar/kecil, gunakan tanda kutip ganda (" ") untuk nama skema, tabel, dan kolom. Untuk informasi selengkapnya, lihat enable_case_sensitive_identifier.
Perbedaan tipe data antara database RDS dan Amazon Redshift
Tabel berikut menunjukkan pemetaan RDS untuk SQL tabel Saya yang Postgre ke tipe data Amazon Redshift yang sesuai. Amazon RDS saat ini hanya mendukung tipe data ini untuk integrasi nol. ETL
Jika tabel di database sumber Anda menyertakan tipe data yang tidak didukung, tabel akan tidak sinkron dan tidak dapat dikonsumsi oleh target Amazon Redshift. Streaming dari sumber ke target berlanjut, tetapi tabel dengan jenis data yang tidak didukung tidak tersedia. Untuk memperbaiki tabel dan membuatnya tersedia di Amazon Redshift, Anda harus mengembalikan perubahan yang melanggar secara manual, lalu menyegarkan integrasi dengan menjalankan ALTER DATABASE...INTEGRATION
REFRESH
.
RDSuntuk SQL Saya SQL
RDSuntuk SQL Aurora Saya | Jenis data Amazon Redshift | Deskripsi | Batasan |
---|---|---|---|
INT | INTEGER | Bilangan bulat empat byte bertanda | Tidak ada |
SMALLINT | SMALLINT | Bilangan bulat dua byte bertanda | Tidak ada |
TINYINT | SMALLINT | Bilangan bulat dua byte bertanda | Tidak ada |
MEDIUMINT | INTEGER | Bilangan bulat empat byte bertanda | Tidak ada |
BIGINT | BIGINT | Bilangan bulat delapan byte bertanda | Tidak ada |
INT UNSIGNED | BIGINT | Bilangan bulat delapan byte bertanda | Tidak ada |
TINYINT UNSIGNED | SMALLINT | Bilangan bulat dua byte bertanda | Tidak ada |
MEDIUMINT UNSIGNED | INTEGER | Bilangan bulat empat byte bertanda | Tidak ada |
BIGINT UNSIGNED | DECIMAL(20,0) | Numerik persis dari presisi yang dapat dipilih | Tidak ada |
DECIMAL(p, s) = NUMERIC (p, s) | DECIMAL(p, s) | Numerik persis dari presisi yang dapat dipilih |
Presisi lebih besar dari 38 dan penskalaan lebih besar dari 37 tidak didukung |
DECIMAL(p, s) UNSIGNED = NUMERIC (p, s) UNSIGNED | DECIMAL(p, s) | Numerik persis dari presisi yang dapat dipilih |
Presisi lebih besar dari 38 dan penskalaan lebih besar dari 37 tidak didukung |
FLOAT4/REAL | REAL | Angka floating-point presisi tunggal | Tidak ada |
FLOAT4/REAL UNSIGNED | REAL | Angka floating-point presisi tunggal | Tidak ada |
DOUBLE/REAL/FLOAT8 | DOUBLE PRECISION | Angka floating-point presisi ganda | Tidak ada |
DOUBLE/REAL/FLOAT8 UNSIGNED | DOUBLE PRECISION | Angka floating-point presisi ganda | Tidak ada |
BIT(n) | VARBYTE(8) | Nilai biner dengan panjang variabel | Tidak ada |
BINARY(n) | VARBYTE(n) | Nilai biner dengan panjang variabel | Tidak ada |
VARBINARY(n) | VARBYTE(n) | Nilai biner dengan panjang variabel | Tidak ada |
CHAR(n) | VARCHAR(n) | Nilai string dengan panjang variabel | Tidak ada |
VARCHAR(n) | VARCHAR(n) | Nilai string dengan panjang variabel | Tidak ada |
TEXT | VARCHAR(65535) | Nilai string panjang variabel hingga 65.535 karakter | Tidak ada |
TINYTEXT | VARCHAR(255) | Nilai string panjang variabel hingga 255 karakter | Tidak ada |
MEDIUMTEXT | VARCHAR(65535) | Nilai string panjang variabel hingga 65.535 karakter | Tidak ada |
LONGTEXT | VARCHAR(65535) | Nilai string panjang variabel hingga 65.535 karakter | Tidak ada |
ENUM | VARCHAR(1020) | Nilai string panjang variabel hingga 1.020 karakter | Tidak ada |
SET | VARCHAR(1020) | Nilai string panjang variabel hingga 1.020 karakter | Tidak ada |
DATE | DATE | Tanggal kalender (tahun, bulan, hari) | Tidak ada |
DATETIME | TIMESTAMP | Tanggal dan waktu (tanpa zona waktu) | Tidak ada |
TIMESTAMP(p) | TIMESTAMP | Tanggal dan waktu (tanpa zona waktu) | Tidak ada |
TIME | VARCHAR(18) | Nilai string panjang variabel hingga 18 karakter | Tidak ada |
YEAR | VARCHAR(4) | Nilai string panjang variabel hingga 4 karakter | Tidak ada |
JSON | SUPER | Data atau dokumen semi-terstruktur sebagai nilai | Tidak ada |