REL09-BP01 バックアップが必要なすべてのデータを特定してバックアップする、またはソースからデータを再現する - 信頼性の柱

REL09-BP01 バックアップが必要なすべてのデータを特定してバックアップする、またはソースからデータを再現する

ワークロードが使用するデータサービスとリソースのバックアップ機能を理解し、使用します。ほとんどのサービスは、ワークロードデータをバックアップする機能を提供します。

期待される成果: データソースが識別され、重要性に基づいて分類されます。次に、RPO に基づいてデータ復旧戦略を確立します。この戦略には、これらのデータソースをバックアップするか、他のソースからデータを再生成する能力を持つことが含まれます。データを喪失した場合は、実装された戦略によって、定義された RPO および RTO 内でデータを復旧または再生成できます。

クラウド成熟フェーズ: 基礎

一般的なアンチパターン:

  • ワークロードのすべてのデータソースとそれらの重要性を認識していない。

  • 重要なデータソースのバックアップを取っていない。

  • 重要性を評価基準として使用せずに、一部のデータソースのみのバックアップを取る。

  • RPO が定義されていないか、バックアップの頻度が RPO を満たしていない。

  • バックアップが必要かどうか、またはデータを他のソースから再生成できるかどうかを評価していない。

このベストプラクティスを活用するメリット: バックアップが必要な場所を特定し、バックアップを作成するメカニズムを実装するか、外部ソースからデータを再生成できるようにすることで、停止時にデータを復元し、復旧する能力が高まります。

このベストプラクティスを活用しない場合のリスクレベル:

実装のガイダンス

すべての AWS データストアは、バックアップ機能を備えています。Amazon RDS や Amazon DynamoDB などのサービスは、ポイントインタイムリカバリ (PITR) を有効にする自動バックアップを追加でサポートします。これにより、現在時刻の 5 分前までの任意の時刻に、バックアップを復元することができます。多くの AWS のサービスでは、バックアップを別の AWS リージョンにコピーできます。AWS Backup は、AWS のサービス間でデータ保護を一元化および自動化する機能を提供するツールです。AWS Elastic Disaster Recovery では、完全なサーバーワークロードをコピーし、オンプレミス、クロス AZ、またはクロスリージョンの継続的なデータ保護を維持し、目標復旧時点 (RPO) を秒単位で測定できます。

Amazon S3 をセルフマネージドデータソースおよび AWS マネージドデータソースのバックアップ先として使用できます。Amazon EBS、Amazon RDS、Amazon DynamoDB などの AWS サービスには、バックアップを作成する機能が組み込まれています。サードパーティーのバックアップソフトウェアも使用できます。

AWS Storage Gateway または AWS DataSync を使用して、オンプレミスのデータを AWS クラウドにバックアップできます。Amazon S3 バケットを使用して、このデータを AWS に保存できます。Amazon S3 は、Amazon S3 Glacier や S3 Glacier Deep Archive などの複数のストレージ階層を提供し、データストレージのコストを削減します。

他のソースからデータを再生成することによって、データリカバリのニーズを満たすこともできます。例えば、Amazon ElastiCache レプリカノードまたは Amazon RDS リードレプリカを使用して、プライマリを喪失した場合にデータを再現できます。このようなソースを使用して目標復旧時点 (RPO) と目標復旧時間 (RTO) を満たせる場合は、バックアップが不要な可能性があります。別の例として、Amazon EMR を使用している場合、Amazon S3 から Amazon EMR にデータを再現できる限り、HDFS データストアをバックアップする必要がない可能性があります。

バックアップ戦略を選択するときは、データの復旧にかかる時間を考慮してください。データの復旧に必要な時間は、バックアップの種類 (バックアップ戦略の場合) やデータ再生成メカニズムの複雑さに応じて異なります。この時間は、ワークロードの RTO 以内である必要があります。

実装手順

  1. ワークロードのすべてのデータソースを特定する。データは、データベースボリュームファイルシステムログ記録システムオブジェクトストレージなどの多数のリソースに保管できます。「リソース」セクションを参照して、データが保管されているさまざまな AWS のサービスに関する関連ドキュメントと、これらのサービスが提供するバックアップ機能を確認してください。

  2. 重要性に基づいてデータソースを分類する。データセットごとにワークロードに対する重要度が異なるため、回復力の要件も異なります。例えば、一部のデータは重要度が高く、ゼロに近い RPO を必要とするかもしれませんが、その他のデータは重要度が低く、より高い RPO や部分的なデータ損失に耐えられるかもしれません。同様に、データセットごとに RTO の要件も異なります。

  3. AWS またはサードパーティーのサービスを使用して、データのバックアップを作成しますAWS Backup は、AWS でさまざまなデータソースのバックアップを作成できるマネージドサービスです。AWS Elastic Disaster Recovery は、AWS リージョンへの 1 秒未満の自動データ複製を処理します。AWS サービスのほとんどは、バックアップを作成する機能をネイティブで備えています。AWS Marketplace には、これらの機能を提供する多数のソリューションも用意されています。以下に記載されている「リソース」を参照して、さまざまな AWS のサービスからデータバックアップを作成する方法に関する情報を確認してください。

  4. バックアップしないデータにデータ再生成メカニズムを確立する。さまざまな理由から、他のソースから再現できるデータはバックアップしないという選択をすることもあるでしょう。バックアップの保管にコストがかかるため、バックアップを作成するよりも、必要なときにソースからデータを再現したほうが安いという状況もあるかもしれません。別の例は、バックアップからの復元にかかる時間が、ソースからデータを再現するよりも長く、結果として RTO に反する場合です。このような状況では、トレードオフを考慮して、データ復旧が必要なときにこれらのソースからデータを再現する方法について、十分に定義されたプロセスを確立してください。例えば、データの分析を行うために、Amazon S3 からデータウェアハウス (Amazon Redshift など)、または MapReduce クラスター (Amazon EMR など) にデータをロードしてある場合、これは他のソースから再現できるデータの例にあてはまるかもしれません。これらの分析結果がどこかに保管されているか再現可能である限り、データウェアハウスまたは MapReduce クラスターで発生した障害によって、データが失われることはありません。ソースから再現できる例としては他にも、キャッシュ (Amazon ElastiCache など) や RDS リードレプリカなどが挙げられます。

  5. データをバックアップするサイクルを確立する。データソースのバックアップ作成は定期的なプロセスであり、頻度は RPO に依存します。

実装計画に必要な工数レベル:

リソース

関連するベストプラクティス:

REL13-BP01 ダウンタイムやデータ損失に関する復旧目標を定義する

REL13-BP02 復旧目標を満たすため、定義された復旧戦略を使用する

関連ドキュメント:

関連動画:

関連する例: