Memilih ukuran terbaik untuk contoh replikasi - AWS Layanan Migrasi Database

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memilih ukuran terbaik untuk contoh replikasi

Memilih instans replikasi yang sesuai tergantung pada beberapa faktor kasus penggunaan Anda. Untuk membantu memahami bagaimana sumber daya instans replikasi digunakan, lihat diskusi berikut. Ini mencakup skenario umum CDC tugas beban penuh +.

Selama tugas beban penuh, AWS DMS memuat tabel satu per satu. Secara default, delapan tabel dimuat sekaligus. AWS DMS menangkap perubahan yang sedang berlangsung pada sumber selama tugas pemuatan penuh sehingga perubahan dapat diterapkan nanti pada titik akhir target. Perubahan disimpan dalam memori; jika memori yang tersedia habis, perubahan disimpan ke disk. Ketika tugas beban penuh selesai untuk tabel, AWS DMS segera terapkan perubahan cache ke tabel target.

Setelah semua perubahan ter-cache yang tertunda untuk sebuah tabel telah diterapkan, titik akhir target berada dalam keadaan konsisten secara transaksi. Pada titik ini, target sinkron dengan titik akhir sumber sehubungan dengan perubahan cache terakhir. AWS DMS kemudian mulai replikasi berkelanjutan antara sumber dan target. Untuk melakukannya, AWS DMS mengambil operasi perubahan dari log transaksi sumber dan menerapkannya ke target dengan cara yang konsisten secara transaksional. (Proses ini mengasumsikan penerapan yang dioptimalkan batch tidak dipilih). AWS DMS mengalirkan perubahan yang sedang berlangsung melalui memori pada instance replikasi, jika memungkinkan. Jika tidak, AWS DMS tulis perubahan pada disk pada instance replikasi hingga dapat diterapkan pada target.

Anda dapat mengontrol bagaimana instans replikasi menangani pemrosesan perubahan, dan bagaimana memori digunakan dalam proses tersebut. Untuk informasi lebih lanjut tentang cara mengatur pemrosesan perubahan, lihat Mengubah pengaturan penyetelan pemrosesan.

Faktor yang perlu dipertimbangkan

Memori dan ruang disk adalah faktor kunci dalam memilih contoh replikasi yang sesuai untuk kasus penggunaan Anda. Berikut ini, Anda dapat menemukan diskusi tentang karakteristik kasus penggunaan untuk menganalisis untuk memilih contoh replikasi.

  • Database dan ukuran tabel

    Volume data membantu menentukan konfigurasi tugas untuk mengoptimalkan kinerja beban penuh. Misalnya, untuk dua skema 1 TB, Anda dapat mempartisi tabel menjadi empat tugas 500 GB dan menjalankannya secara paralel. Paralelisme yang mungkin tergantung pada CPU sumber daya yang tersedia dalam contoh replikasi. Itu sebabnya ide yang baik memahami ukuran database dan tabel Anda untuk mengoptimalkan kinerja beban penuh. Ini membantu menentukan jumlah tugas yang mungkin Anda miliki.

  • Benda besar

    Tipe data yang ada dalam lingkup migrasi Anda dapat memengaruhi kinerja. Khususnya, objek besar (LOBs) memengaruhi kinerja dan konsumsi memori. Untuk memigrasikan LOB nilai, AWS DMS lakukan proses dua langkah. Pertama, AWS DMS masukkan baris ke target tanpa LOB nilai. Kedua, AWS DMS perbarui baris dengan LOB nilainya. Ini berdampak pada memori, jadi penting untuk mengidentifikasi LOB kolom di sumber dan menganalisis ukurannya.

  • Frekuensi beban dan ukuran transaksi

    Frekuensi beban dan transaksi per detik (TPS) mempengaruhi penggunaan memori. Tingginya jumlah TPS atau aktivitas bahasa manipulasi data (DML) menyebabkan penggunaan memori yang tinggi. Ini terjadi karena DMS cache perubahan sampai diterapkan ke target. SelamaCDC, ini mengarah pada pertukaran (menulis ke disk fisik karena memori meluap), yang menyebabkan latensi.

  • Tombol tabel dan integritas referensial

    Informasi tentang kunci tabel menentukan CDC mode (batch apply atau transactional apply) yang Anda gunakan untuk memigrasi data. Secara umum, penerapan transaksional lebih lambat daripada penerapan batch. Untuk transaksi jangka panjang, mungkin ada banyak perubahan untuk bermigrasi. Saat Anda menggunakan aplikasi transaksional, AWS DMS mungkin memerlukan lebih banyak memori untuk menyimpan perubahan dibandingkan dengan penerapan batch. Jika Anda memigrasikan tabel tanpa kunci utama, penerapan batch akan gagal dan DMS tugas dipindahkan ke mode penerapan transaksional. Ketika integritas referensial aktif di antara tabel selamaCDC, AWS DMS menggunakan penerapan transaksional secara default. Untuk informasi selengkapnya tentang penerapan batch dibandingkan dengan penerapan transaksional, lihat Bagaimana cara menggunakan fitur DMS batch apply untuk meningkatkan kinerja CDC replikasi? .

Gunakan metrik ini untuk menentukan apakah Anda memerlukan instance replikasi untuk dioptimalkan komputasi atau memori dioptimalkan.

Masalah umum

Anda mungkin menghadapi masalah umum berikut yang menyebabkan pertentangan sumber daya pada instance replikasi selama migrasi. Untuk informasi tentang metrik instance replikasi, lihat. Metrik instans replikasi

  • Jika memori dalam contoh replikasi menjadi tidak mencukupi, ini menghasilkan penulisan data ke disk. Membaca dari disk dapat menyebabkan latensi, yang dapat Anda hindari dengan mengukur instance replikasi dengan memori yang cukup.

  • Ukuran disk yang ditetapkan untuk instance replikasi bisa lebih kecil dari yang dibutuhkan. Ukuran disk digunakan ketika data dalam memori tumpah; itu juga digunakan untuk menyimpan log tugas. Maksimal IOPS tergantung padanya juga.

  • Menjalankan beberapa tugas atau tugas dengan paralelisme tinggi memengaruhi CPU konsumsi instance replikasi. Ini memperlambat pemrosesan tugas dan menghasilkan latensi.

Praktik terbaik

Pertimbangkan dua praktik terbaik yang paling umum ini saat mengukur contoh replikasi. Untuk informasi selengkapnya, lihat Praktik terbaik AWS Database Migration Service.

  1. Ukurlah beban kerja Anda dan pahami apakah itu padat komputer atau intensif memori. Berdasarkan ini, Anda dapat menentukan kelas dan ukuran instance replikasi:

    • AWS DMS proses LOBs dalam memori. Operasi ini membutuhkan cukup banyak memori.

    • Jumlah tugas dan jumlah utas memengaruhi CPU konsumsi. Hindari menggunakan lebih dari delapan MaxFullLoadSubTasks selama operasi beban penuh.

  2. Tingkatkan ruang disk yang ditetapkan ke instance replikasi saat Anda memiliki beban kerja yang tinggi selama beban penuh. Melakukan hal ini memungkinkan instance replikasi menggunakan maksimum yang IOPS ditetapkan untuk itu.

Pedoman sebelumnya tidak mencakup semua skenario yang mungkin. Penting untuk mempertimbangkan secara spesifik kasus penggunaan khusus Anda ketika Anda menentukan ukuran instance replikasi Anda.

Tes sebelumnya menunjukkan CPU dan memori bervariasi dengan beban kerja yang berbeda. Khususnya, LOBs mempengaruhi memori, dan jumlah tugas atau paralelisme mempengaruhi. CPU Setelah migrasi Anda berjalan, pantauCPU, memori yang dapat dibebaskan, penyimpanan gratis, dan instance IOPS replikasi Anda. Berdasarkan data yang Anda kumpulkan, Anda dapat menambah atau mengurangi ukuran instans replikasi Anda sesuai kebutuhan.