SUS04-BP03 ポリシーを使用してデータセットのライフサイクルを管理する
すべてのデータのライフサイクルを管理し、自動的に削除を実行することで、ワークロードに必要なストレージの総量を最小限に抑えます。
一般的なアンチパターン:
-
データを手動で削除する。
-
ワークロードデータは削除しない。
-
データ保持やアクセス要件に基づいて、よりエネルギー効率の高いストレージ階層にデータを移動することがない。
このベストプラクティスを活用するメリット: データライフサイクルポリシーを使用すると、ワークロード内の効率的なデータアクセスと保持が保証されます。
このベストプラクティスを活用しない場合のリスクレベル: 中
実装のガイダンス
データセットには通常、そのライフサイクルにおいて異なる保持要件とアクセス要件があります。例えば、限られた期間のみ頻繁にデータセットにアクセスする必要があるアプリケーションもあります。その後、それらのデータセットにアクセスすることはほとんどありません。データストレージと計算の経時的な効率を向上させるには、データの経時的な処理方法を定義するルールであるライフサイクルポリシーを実装します。
ライフサイクル設定ルールを使用すると、特定のストレージサービスに対して、データセットをよりエネルギー効率の高いストレージ層に移行する、アーカイブする、または削除するように指示できます。このプラクティスにより、アクティブなデータの保存と取得が最小限に抑えられ、エネルギー消費量が低下します。さらに、古いデータのアーカイブや削除などのプラクティスは、規制コンプライアンスとデータガバナンスをサポートします。
実装手順
-
データ分類の使用: ワークロード内のデータセットを分類します。
-
処理規則の定義: データクラスごとに処理手順を定義します。
-
自動化の有効化: ライフサイクルルールを適用するための自動ライフサイクルポリシーを設定します。さまざまな AWS ストレージサービスの自動ライフサイクルポリシーを設定する方法の例を次に示します。
ストレージサービス 自動ライフサイクルポリシーを設定する方法 Amazon S3 ライフサイクルを使用すると、オブジェクトのライフサイクル全体を管理できます。アクセスパターンが不明、変更中、または予測不可能な場合は、Amazon S3 Intelligent-Tiering を使用できます。これにより、アクセスパターンがモニタリングされ、アクセスされていないオブジェクトが低コストのアクセス階層に自動的に移動します。Amazon S3 ストレージレンズメトリクスを活用して、ライフサイクル管理の最適化の機会とギャップを特定できます。
Amazon Data Lifecycle Manager を使用して、EBS スナップショットと Amazon EBS-backed AMI の作成、保持、削除を自動化できます。
Amazon EFS のライフサイクル管理では、ファイルシステムのファイルストレージが自動的に管理されます。
Amazon ECR ライフサイクルポリシーでは、年数またはカウントに基づいたイメージの有効期限を使用してコンテナイメージのクリーンアップを自動化できます。
オブジェクトの MediaStore コンテナ内保存期間を管理する、オブジェクトのライフサイクルポリシーを作成することができます。
-
未使用アセットの削除: 未使用のボリューム、スナップショット、保存期間を過ぎたデータを削除します。削除には、Amazon DynamoDB の有効期限や Amazon CloudWatch Logs 保持などのネイティブサービス機能を活用します。
-
集約と圧縮: ライフサイクルルールに基づいて、該当する場合はデータを集約および圧縮します。
リソース
関連ドキュメント:
関連動画: