REL09-BP01 Mengidentifikasi dan mencadangkan semua data yang perlu dicadangkan, atau mereproduksi data dari sumber - Pilar Keandalan

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

REL09-BP01 Mengidentifikasi dan mencadangkan semua data yang perlu dicadangkan, atau mereproduksi data dari sumber

Pahami dan gunakan kemampuan-kemampuan pencadangan sumber daya dan layanan data yang digunakan oleh beban kerja. Sebagian besar layanan menyediakan kemampuan untuk mencadangkan data beban kerja.

Hasil yang diinginkan: Sumber data telah diidentifikasi dan diklasifikasikan berdasarkan tingkat kekritisan. Kemudian, buat strategi untuk pemulihan data berdasarkanRPO. Strategi ini melibatkan pencadangan sumber-sumber data, atau memiliki kemampuan untuk memproduksi ulang data dari sumber yang lain. Dalam kasus kehilangan data, strategi yang diterapkan memungkinkan pemulihan atau reproduksi data dalam yang ditentukan RPO danRTO.

Fase kematangan cloud: Dasar

Anti-pola umum:

  • Tidak mengetahui semua sumber data untuk beban kerja serta tingkat kekritisannya.

  • Tidak melakukan pencadangan sumber data kritis.

  • Melakukan pencadangan hanya beberapa sumber data tanpa menggunakan tingkat kekritisan sebagai kriteria.

  • Tidak ditentukanRPO, atau frekuensi cadangan tidak dapat memenuhiRPO.

  • Tidak mengevaluasi apakah cadangan diperlukan atau apakah data dapat diproduksi ulang dari sumber yang lain.

Manfaat menerapkan praktik terbaik ini: Mengidentifikasi tempat-tempat yang memerlukan pencadangan dan mengimplementasikan mekanisme untuk membuat cadangan, atau mampu memproduksi ulang data dari sumber eksternal, semuanya dapat meningkatkan kemampuan untuk memulihkan dan mengembalikan data selama pemadaman.

Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan: Tinggi

Panduan implementasi

Semua penyimpanan AWS data menawarkan kemampuan cadangan. Layanan seperti Amazon RDS dan Amazon DynamoDB juga mendukung pencadangan otomatis yang point-in-time memungkinkan pemulihan PITR (), yang memungkinkan Anda memulihkan cadangan kapan saja hingga lima menit atau kurang sebelum waktu saat ini. Banyak AWS layanan menawarkan kemampuan untuk menyalin cadangan ke yang lain. Wilayah AWS AWS Backup adalah alat yang memberi Anda kemampuan untuk memusatkan dan mengotomatiskan perlindungan data di seluruh AWS layanan. AWS Elastic Disaster Recoverymemungkinkan Anda menyalin beban kerja server penuh dan mempertahankan perlindungan data berkelanjutan dari on-premise, cross-AZ atau Cross-region, dengan Recovery Point Objective () yang diukur dalam hitungan detik. RPO

Amazon S3 dapat digunakan sebagai tujuan cadangan untuk sumber data yang dikelola sendiri dan AWS dikelola. AWS layanan seperti AmazonEBS, AmazonRDS, dan Amazon DynamoDB telah membangun kemampuan untuk membuat cadangan. Perangkat lunak pencadangan pihak ketiga juga dapat digunakan.

Data lokal dapat dicadangkan ke AWS Cloud penggunaan AWS Storage Gatewayatau AWS DataSync. Bucket Amazon S3 dapat digunakan untuk menyimpan data ini di AWS. Amazon S3 menawarkan beberapa tingkatan penyimpanan seperti Amazon S3 Glacier atau S3 Glacier Deep Archive untuk mengurangi biaya penyimpanan data.

Anda mungkin dapat memenuhi kebutuhan pemulihan data Anda dengan memproduksi ulang data dari sumber yang lain. Misalnya, node ElastiCache replika Amazon atau replika RDS baca Amazon dapat digunakan untuk mereproduksi data jika primer hilang. Dalam kasus di mana sumber seperti ini dapat digunakan untuk memenuhi Tujuan Titik Pemulihan (RPO) dan Tujuan Waktu Pemulihan (RTO), Anda mungkin tidak memerlukan cadangan. Contoh lain, jika bekerja dengan AmazonEMR, mungkin tidak perlu membuat cadangan penyimpanan HDFS data Anda, selama Anda dapat mereproduksi data ke Amazon EMR dari Amazon S3.

Ketika memilih strategi pencadangan, pertimbangkan waktu yang diperlukan untuk melakukan pemulihan data. Waktu yang diperlukan untuk melakukan pemulihan data tergantung pada tipe cadangan (untuk kasus strategi pencadangan), atau kompleksitas mekanisme produksi ulang data. Kali ini harus termasuk dalam RTO beban kerja.

Langkah-langkah implementasi

  1. Mengidentifikasi semua sumber daya untuk beban kerja. Data dapat disimpan pada sejumlah sumber daya seperti basis data, volume, filesystem, sistem pencatatan log, dan penyimpanan objek. Lihat bagian Sumber Daya untuk menemukan dokumen terkait pada berbagai AWS layanan tempat data disimpan, dan kemampuan cadangan yang disediakan layanan ini.

  2. Klasifikasikan sumber data berdasarkan tingkat kekritisan. Set data yang berbeda akan memiliki tingkat kekritisan yang berbeda untuk suatu beban kerja, sehingga memiliki persyaratan ketahanan yang berbeda pula. Misalnya, beberapa data mungkin kritis dan memerlukan RPO mendekati nol, sementara data lain mungkin kurang kritis dan dapat mentolerir kehilangan data yang lebih tinggi RPO dan beberapa. Demikian pula, kumpulan data yang berbeda mungkin memiliki RTO persyaratan yang berbeda juga.

  3. Gunakan AWS atau layanan pihak ketiga untuk membuat cadangan data. AWS Backupadalah layanan terkelola yang memungkinkan pembuatan cadangan berbagai sumber data di. AWSAWS Elastic Disaster Recoverymenangani replikasi data sub-detik otomatis ke file. Wilayah AWS Sebagian besar AWS layanan juga memiliki kemampuan asli untuk membuat cadangan. Mereka AWS Marketplace memiliki banyak solusi yang menyediakan kemampuan ini juga. Lihat Sumber Daya yang disebutkan di bawah ini untuk mendapatkan informasi tentang cara membuat cadangan data dari berbagai layanan AWS .

  4. Untuk data yang tidak dicadangkan, bangun mekanisme produksi ulang data. Anda mungkin memilih untuk tidak mencadangkan data yang dapat diproduksi ulang dari sumber yang lain karena berbagai alasan. Mungkin terdapat situasi di mana produksi ulang data dari sumber yang lain saat diperlukan lebih murah daripada membuat cadangan, karena mungkin ada biaya-biaya yang timbul terkait penyimpanan cadangan. Contoh lain adalah di mana memulihkan dari cadangan membutuhkan waktu lebih lama daripada mereproduksi data dari sumber, yang mengakibatkan pelanggaran. RTO Pada situasi-situasi demikian, pertimbangkan semua kompromi dan bangun sebuah proses yang ditetapkan dengan baik terkait bagaimana data dapat diproduksi ulang dari sumber-sumber ini saat pemulihan data diperlukan. Misalnya, jika Anda telah memuat data dari Amazon S3 ke gudang data (seperti Amazon Redshift), MapReduce atau cluster (seperti EMR Amazon) untuk melakukan analisis pada data tersebut, ini mungkin merupakan contoh data yang dapat direproduksi dari sumber lain. Selama hasil analisis ini disimpan di suatu tempat atau dapat direproduksi, Anda tidak akan mengalami kehilangan data karena kegagalan di gudang data atau cluster. MapReduce Contoh lain yang dapat direproduksi dari sumber termasuk cache (seperti Amazon ElastiCache) atau replika RDS baca.

  5. Buat jadwal pencadangan data. Membuat cadangan sumber data adalah proses periodik dan frekuensinya harus bergantung pada. RPO

Tingkat upaya untuk Rencana Implementasi: Sedang

Sumber daya

Praktik-Praktik Terbaik Terkait:

REL13-BP01 Menentukan tujuan pemulihan untuk downtime dan kehilangan data

REL13-BP02 Gunakan strategi pemulihan yang ditentukan untuk memenuhi tujuan pemulihan

Dokumen terkait:

Video terkait:

Contoh terkait: