Menguji pemulihan bencana - Pemulihan Bencana Beban Kerja di AWS: Pemulihan di Cloud

Menguji pemulihan bencana

Uji implementasi pemulihan bencana untuk memvalidasi implementasi dan uji failover secara teratur ke Wilayah DR beban kerja Anda untuk memastikan RTO dan RPO terpenuhi.

Pola yang harus dihindari adalah mengembangkan jalur pemulihan yang jarang dieksekusi. Misalnya, Anda mungkin memiliki penyimpanan data sekunder yang digunakan untuk kueri hanya-baca. Ketika Anda menulis ke sebuah penyimpanan data dan penyimpanan data utamanya gagal, Anda sebaiknya melakukan failover ke penyimpanan data sekunder. Jika Anda tidak sering menguji failover ini, Anda mungkin menemukan bahwa asumsi Anda tentang kemampuan penyimpanan data sekunder tidak benar. Kapasitas sekunder, yang mungkin sudah cukup ketika terakhir diuji, mungkin tidak lagi dapat menoleransi beban di bawah skenario ini, atau kuota layanan di wilayah sekunder mungkin tidak cukup.

Pengalaman kami telah menunjukkan bahwa satu-satunya pemulihan kesalahan yang efektif adalah jalur yang sering Anda uji. Itulah mengapa memiliki sejumlah kecil jalur pemulihan adalah pilihan terbaik.

Anda dapat menetapkan pola pemulihan dan secara teratur mengujinya. Jika Anda memiliki jalur pemulihan yang kompleks atau kritis, Anda masih perlu secara teratur menjalankan failover dalam produksi untuk memvalidasi bahwa jalur pemulihan berfungsi.

Kelola pergeseran konfigurasi di Wilayah DR. Pastikan infrastruktur, data, dan konfigurasi Anda sudah sesuai dengan kebutuhan di Wilayah DR. Misalnya, periksa apakah AMI dan kuota layanan sudah terbaru.

Anda dapat memanfaatkan AWS Config untuk terus memantau dan mencatat konfigurasi sumber daya AWS Anda. AWS Config dapat mendeteksi pergeseran dan memicu AWS Systems Manager Automation untuk memperbaiki pergeseran dan mengaktifkan alarm. AWS CloudFormation juga dapat mendeteksi pergeseran dalam tumpukan yang telah Anda deploy.