將資料庫叢集資料匯出至 Amazon S3 - Amazon Aurora

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將資料庫叢集資料匯出至 Amazon S3

您可以將資料從即時 Amazon Aurora 資料庫叢集匯出至 Amazon S3 儲存貯體。匯出程序會在背景中執行,不會影響您作用中資料庫叢集的效能。

根據預設,會匯出資料庫叢集中的所有資料。但是,您可以選擇匯出特定資料庫、結構描述或資料表集。

Amazon Aurora 會複製資料庫叢集、從複製品中擷取資料,並將資料存放在 Amazon S3 儲存貯體中。資料會以壓縮且一致的 Apache Parquet 格式存放。個別拼合地板檔案的大小通常為 1—10 MB。

匯出 Aurora My SQL 版本 2 和版本 3 的快照資料可獲得的更快效能不適用於匯出資料庫叢集資料。如需詳細資訊,請參閱將資料庫叢集快照資料匯出至 Amazon S3

無論您匯出全部或部分資料,都需支付匯出整個資料庫叢集的費用。如需詳細資訊,請參閱 Amazon Aurora 定價頁面

匯出資料後,您可以直接透過 Amazon Athena 或 Amazon Redshift Spectrum 等工具分析匯出後的資料。如需使用雅典娜讀取實木地板資料的詳細資訊,請參閱 Amazon Athena 使用者指南 SerDe中的鑲木地板。如需有關使用 Redshift 頻譜讀取實木地板資料的詳細資訊,請參閱 Amazon Redshift料庫COPY開發人員指南中的單欄式資料格式

功能可用性和支援會因每個資料庫引擎的特定版本以及 AWS 區域而有所不同。如需將資料庫叢集資料匯出至 S3 功能之版本和區域可用性的詳細資訊,請參閱 支援將叢集資料匯出至 Amazon S3 的區域和 Aurora 資料庫引擎

您可以使用下列程序,將資料庫叢集資料匯出至 Amazon S3 儲存貯體。如需詳細資訊,請參閱下列各節。

匯出資料庫叢集資料的概觀
  1. 識別您要匯出其資料的資料庫叢集。

  2. 設定對 Amazon S3 儲存貯體的存取。

    「儲存貯體」是 Amazon S3 物件或檔案的容器。如要提供存取儲存貯體的資訊,請採取下列步驟:

    1. 識別要匯出資料庫叢集資料的目標 S3 儲存貯體。S3 儲存貯體必須與資料庫叢集位於相同的 AWS 區域。如需詳細資訊,請參閱識別要匯出的 Amazon S3 儲存貯體

    2. 建立 AWS Identity and Access Management (IAM) 角色,授與 S3 儲存貯體的資料庫叢集匯出任務存取權。如需詳細資訊,請參閱使用IAM角色提供對 Amazon S3 儲存貯體的存取

  3. 建立伺服器端加密 AWS KMS key 的對稱加密。叢集匯出任務會使用此KMS金鑰,在將匯出資料寫入 S3 時設定 AWS KMS 伺服器端加密。

    KMS金鑰原則必須同時包含kms:CreateGrantkms:DescribeKey權限。如需在 Amazon Aurora 中使用KMS金鑰的詳細資訊,請參閱AWS KMS key 管理

    如果您的KMS金鑰原則中有拒絕陳述式,請務必明確排除 AWS 服務主體export.rds.amazonaws.com

    您可以在 AWS 帳戶中使用KMS金鑰,也可以使用跨帳戶KMS金鑰。如需詳細資訊,請參閱使用跨帳戶 AWS KMS key

  4. 使用主控台或start-export-taskCLI命令將資料庫叢集匯出到 Amazon S3。如需詳細資訊,請參閱建立資料庫叢集匯出工作

  5. 若要存取 Amazon S3 儲存貯體中您匯出的資料,請參閱《Amazon Simple Storage Service 使用者指南》中的上傳、下載及管理物件

在以下各節中了解如何設定、匯出、監視、取消和疑難排解資料庫叢集匯出任務。