Ketersediaan tinggi bukanlah pemulihan bencana - Pemulihan Bencana Beban Kerja di AWS: Pemulihan di Cloud

Ketersediaan tinggi bukanlah pemulihan bencana

Ketersediaan dan pemulihan bencana bergantung pada sejumlah praktik terbaik yang sama, seperti pemantauan kegagalan, deployment ke sejumlah lokasi, dan failover otomatis. Namun, Ketersediaan berfokus pada komponen beban kerja, sedangkan pemulihan bencana berfokus pada salinan diskret dari seluruh beban kerja. Pemulihan bencana memiliki sasaran yang berbeda dari Ketersediaan, yakni mengukur waktu pemulihan setelah peristiwa berskala lebih besar yang memenuhi syarat sebagai bencana. Anda harus terlebih dahulu memastikan beban kerja Anda memenuhi sasaran ketersediaan Anda, karena arsitektur yang berketersediaan tinggi akan memungkinkan Anda memenuhi kebutuhan pelanggan jika terjadi peristiwa yang berdampak pada ketersediaan. Strategi pemulihan bencana Anda memerlukan pendekatan yang berbeda dari ketersediaan, dengan fokus pada deployment sistem diskret ke sejumlah lokasi, sehingga Anda dapat melakukan failover seluruh beban kerja jika diperlukan.

Anda harus mempertimbangkan ketersediaan beban kerja Anda dalam perencanaan pemulihan bencana, karena akan memengaruhi pendekatan yang Anda ambil. Beban kerja yang berjalan pada instans Amazon EC2 tunggal dalam satu Zona Ketersediaan tidak memiliki ketersediaan tinggi. Jika masalah banjir lokal memengaruhi Zona Ketersediaan tersebut, skenario ini memerlukan failover ke AZ lain untuk memenuhi sasaran DR. Bandingkan skenario ini dengan beban kerja yang berketersediaan tinggi yang di-deploy dengan strategi multi-lokasi aktif/aktif saat beban kerja di-deploy di sejumlah Wilayah aktif, dan semua Wilayah ini melayani lalu lintas produksi. Dalam hal ini, bahkan dalam peristiwa yang tidak mungkin terjadi seperti bencana besar yang mengganggu seluruh Wilayah, strategi DR dapat dicapai dengan merutekan semua lalu lintas ke Wilayah yang tersisa.

Cara Anda melakukan pendekatan data juga berbeda antara ketersediaan dan pemulihan bencana. Pertimbangkan solusi penyimpanan yang terus mereplikasi ke situs lain untuk mencapai ketersediaan tinggi (seperti beban kerja multi-situs aktif/aktif). Jika satu file atau sejumlah file dihapus atau rusak pada perangkat penyimpanan utama, perubahan destruktif tersebut dapat direplikasi ke perangkat penyimpanan sekunder. Dalam skenario ini, meskipun ada ketersediaan tinggi, kemampuan failover jika terjadi penghapusan atau kerusakan data akan dirugikan. Sebagai gantinya, pencadangan point-in-time juga diperlukan sebagai bagian dari strategi DR.