Praktik terbaik untuk pergeseran zona ARC - Pengontrol Pemulihan Aplikasi Amazon (ARC)

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Praktik terbaik untuk pergeseran zona ARC

Kami merekomendasikan praktik terbaik berikut untuk menggunakan pergeseran zona untuk pemulihan multi-AZ di. ARC Pergeseran zona biasanya menghilangkan kapasitas dari aplikasi langsung, jadi penting untuk berhati-hati saat Anda menggunakannya dalam produksi.

Topik

Perencanaan kapasitas dan pra-penskalaan

Pastikan bahwa Anda telah merencanakan, dan baik pra-skala atau dapat skala otomatis, kapasitas yang cukup untuk mengakomodasi beban ekstra yang dikenakan pada Availability Zone saat Anda memulai pergeseran zona. Dengan arsitektur berorientasi pemulihan, rekomendasi tipikal adalah untuk pra-skala kapasitas komputasi untuk memasukkan ruang kepala yang cukup untuk melayani lalu lintas puncak Anda ketika salah satu dari (biasanya) tiga replika Anda offline.

Ketika Anda memulai pergeseran zona untuk sumber daya penyeimbang beban tunggal, misalnya, kapasitas satu Availability Zone dihapus sementara dari belakang penyeimbang beban. Bergantung pada pergeseran zona yang Anda mulai dan bagaimana penyeimbang beban Anda dikonfigurasi, Anda harus memastikan bahwa Anda telah merencanakan dengan cermat untuk mengelola peningkatan beban pada Availability Zone yang tersisa.

Batasi waktu klien tetap terhubung ke titik akhir Anda

Ketika Amazon Application Recovery Controller (ARC) mengalihkan lalu lintas dari gangguan, misalnya, dengan menggunakan zonal shift atau zonal autoshift, mekanisme yang ARC digunakan untuk memindahkan lalu lintas aplikasi Anda adalah pembaruan. DNS DNSPembaruan menyebabkan semua koneksi baru diarahkan menjauh dari lokasi yang rusak.

Namun, klien dengan koneksi terbuka yang sudah ada sebelumnya mungkin terus membuat permintaan terhadap lokasi yang rusak sampai klien terhubung kembali. Untuk memastikan pemulihan yang cepat, kami sarankan Anda membatasi jumlah waktu klien tetap terhubung ke titik akhir Anda.

Jika Anda menggunakan Application Load Balancer, Anda dapat menggunakan keepalive opsi untuk mengonfigurasi berapa lama koneksi berlanjut. Untuk informasi selengkapnya, lihat durasi keepalive HTTP klien di Panduan Pengguna Application Load Balancer.

Secara default, Application Load Balancers menetapkan nilai durasi keepalive HTTP klien menjadi 3600 detik, atau 1 jam. Kami menyarankan agar Anda menurunkan nilai agar sesuai dengan sasaran waktu pemulihan untuk aplikasi Anda, misalnya, 300 detik. Saat Anda memilih waktu durasi keepalive HTTP klien, pertimbangkan bahwa nilai ini adalah pertukaran antara menghubungkan kembali lebih sering secara umum, yang dapat memengaruhi latensi, dan lebih cepat memindahkan semua klien dari AZ atau Wilayah yang terganggu.

Uji mulai pergeseran zona, terlebih dahulu

Uji secara teratur memindahkan lalu lintas dari Availability Zones untuk aplikasi Anda dengan memulai pergeseran zona. Rencanakan dan jalankan pergeseran zona awal, sebaiknya di lingkungan pengujian dan produksi, sebagai bagian dari pengujian failover reguler untuk memulihkan aplikasi Anda jika terjadi bencana. Pengujian rutin adalah bagian penting untuk memastikan bahwa Anda siap dan memiliki kepercayaan diri untuk mengurangi masalah ketika peristiwa operasional terjadi.

Pastikan bahwa semua Availability Zone sehat dan mengambil lalu lintas

Pergeseran zona bekerja dengan menandai sumber daya, yaitu replika aplikasi, sebagai tidak sehat di Availability Zone. Ini berarti bahwa sangat penting untuk memastikan bahwa target dalam penyeimbang beban untuk aplikasi Anda umumnya sehat dan secara aktif mengambil lalu lintas di Availability Zone di suatu Wilayah. Kami menyarankan Anda memiliki dasbor untuk melacak ini, termasuk, misalnya, metrik Elastic Load Balancing untuk target yang tidak sehat bytesProcessed dan per Availability Zone.

Pertimbangkan untuk memantau kesehatan sumber daya Anda dari Wilayah kedua yang berdekatan. Keuntungan dari pendekatan ini adalah dapat lebih mewakili pengalaman pengguna akhir Anda, dan juga mengurangi risiko aplikasi dan pemantauan Anda terkena dampak bencana yang sama pada saat yang sama (“nasib bersama”).

Gunakan API operasi pesawat data untuk pemulihan bencana

Untuk memulai pergeseran zona saat Anda perlu memulihkan aplikasi dengan cepat, dengan sedikit dependensi, sebaiknya gunakan AWS Command Line Interface atau dengan tindakan pergeseran zona, API dengan kredensi yang disimpan sebelumnya, jika memungkinkan. Anda juga dapat memulai pergeseran zona di AWS Management Console, untuk kemudahan penggunaan. Tetapi ketika pemulihan yang cepat dan andal sangat penting, operasi pesawat data adalah pilihan yang lebih baik. Untuk informasi lebih lanjut, lihat Panduan API Referensi Pergeseran Zonal.

Memindahkan lalu lintas dengan pergeseran zona hanya sementara

Pergeseran zona memindahkan lalu lintas dari Availability Zone secara sementara, untuk mengurangi penurunan nilai. Anda harus mengembalikan sumber daya untuk aplikasi ke layanan segera setelah Anda mengambil tindakan untuk memperbaiki masalah. Ini memastikan bahwa keseluruhan aplikasi Anda dikembalikan ke keadaan semula yang sepenuhnya berlebihan dan tangguh.