Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Praktik terbaik untuk pergeseran zona ARC
Kami merekomendasikan praktik terbaik berikut untuk menggunakan pergeseran zona untuk pemulihan multi-AZ di. ARC
Topik
- Perencanaan kapasitas dan pra-penskalaan
Pastikan bahwa Anda telah merencanakan, dan baik pra-skala atau dapat skala otomatis, kapasitas yang cukup untuk mengakomodasi beban ekstra yang dikenakan pada Availability Zone saat Anda memulai pergeseran zona. Dengan arsitektur berorientasi pemulihan, rekomendasi tipikal adalah untuk pra-skala kapasitas komputasi untuk memasukkan ruang kepala yang cukup untuk melayani lalu lintas puncak Anda ketika salah satu dari (biasanya) tiga replika Anda offline.
Saat Anda memulai pergeseran zona untuk sumber daya yang didukung dan lalu lintas digeser dari AZ, kapasitas yang digunakan aplikasi Anda untuk permintaan layanan akan dihapus. Anda harus memastikan bahwa Anda telah merencanakan pergeseran lalu lintas dari AZ dan dapat melanjutkan permintaan layanan di sisanyaAZs.
- Batasi waktu klien tetap terhubung ke titik akhir Anda
-
Ketika Amazon Application Recovery Controller (ARC) mengalihkan lalu lintas dari gangguan, misalnya, dengan menggunakan zonal shift atau zonal autoshift, mekanisme yang ARC digunakan untuk memindahkan lalu lintas aplikasi Anda adalah pembaruan. DNS DNSPembaruan menyebabkan semua koneksi baru diarahkan menjauh dari lokasi yang rusak.
Namun, klien dengan koneksi terbuka yang sudah ada sebelumnya mungkin terus membuat permintaan terhadap lokasi yang rusak sampai klien terhubung kembali. Untuk memastikan pemulihan yang cepat, kami sarankan Anda membatasi jumlah waktu klien tetap terhubung ke titik akhir Anda.
- Uji mulai pergeseran zona, terlebih dahulu
Uji secara teratur memindahkan lalu lintas dari Availability Zones untuk aplikasi Anda dengan memulai pergeseran zona. Rencanakan dan jalankan pergeseran zona awal, sebaiknya di lingkungan pengujian dan produksi, sebagai bagian dari pengujian failover reguler untuk memulihkan aplikasi Anda jika terjadi bencana. Pengujian rutin adalah bagian penting untuk memastikan bahwa Anda siap dan memiliki kepercayaan diri untuk mengurangi masalah ketika peristiwa operasional terjadi.
- Pastikan bahwa semua Availability Zone sehat dan mengambil lalu lintas
Pergeseran zona bekerja dengan menandai sumber daya, yaitu replika aplikasi, sebagai tidak sehat di Availability Zone. Ini berarti bahwa sangat penting untuk memastikan bahwa sumber daya dalam aplikasi Anda umumnya sehat dan secara aktif mengambil lalu lintas di Availability Zone di suatu Wilayah. Kami menyarankan Anda memiliki dasbor untuk melacak ini, termasuk, misalnya, metrik Elastic Load Balancing untuk target yang tidak sehat bytesProcessed dan per Availability Zone.
Pertimbangkan untuk memantau kesehatan sumber daya Anda dari Wilayah kedua yang berdekatan. Keuntungan dari pendekatan ini adalah dapat lebih mewakili pengalaman pengguna akhir Anda, dan juga mengurangi risiko aplikasi dan pemantauan Anda terkena dampak bencana yang sama pada saat yang bersamaan.
- Gunakan API operasi pesawat data untuk pemulihan bencana
Untuk memulai pergeseran zona saat Anda perlu memulihkan aplikasi dengan cepat, dengan sedikit dependensi, sebaiknya gunakan AWS Command Line Interface atau dengan tindakan pergeseran zona, API dengan kredensi yang disimpan sebelumnya, jika memungkinkan. Anda juga dapat memulai pergeseran zona di AWS Management Console, untuk kemudahan penggunaan. Tetapi ketika pemulihan yang cepat dan andal sangat penting, operasi pesawat data adalah pilihan yang lebih baik. Untuk informasi lebih lanjut, lihat Panduan API Referensi Pergeseran Zonal.
- Memindahkan lalu lintas dengan pergeseran zona hanya sementara
Pergeseran zona memindahkan lalu lintas dari Availability Zone secara sementara, untuk mengurangi penurunan nilai. Anda harus mengembalikan sumber daya untuk aplikasi ke layanan segera setelah Anda mengambil tindakan untuk memperbaiki masalah. Ini memastikan bahwa keseluruhan aplikasi Anda dikembalikan ke keadaan semula yang sepenuhnya berlebihan dan tangguh.