本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
將資料庫叢集資料匯出至 Amazon S3
您可以將資料從即時 Amazon Aurora 資料庫叢集匯出至 Amazon S3 儲存貯體。匯出程序會在背景中執行,不會影響您作用中資料庫叢集的效能。
根據預設,會匯出資料庫叢集中的所有資料。但是,您可以選擇匯出特定資料庫、結構描述或資料表集。
Amazon Aurora 會複製資料庫叢集、從複製品中擷取資料,並將資料存放在 Amazon S3 儲存貯體中。資料會以壓縮且一致的 Apache Parquet 格式存放。個別拼合地板檔案的大小通常為 1—10 MB。
匯出 Aurora My SQL 版本 2 和版本 3 的快照資料可獲得的更快效能不適用於匯出資料庫叢集資料。如需詳細資訊,請參閱將資料庫叢集快照資料匯出至 Amazon S3。
無論您匯出全部或部分資料,都需支付匯出整個資料庫叢集的費用。如需詳細資訊,請參閱 Amazon Aurora 定價頁面
匯出資料後,您可以直接透過 Amazon Athena 或 Amazon Redshift Spectrum 等工具分析匯出後的資料。如需使用雅典娜讀取實木地板資料的詳細資訊,請參閱 Amazon Athena 使用者指南 SerDe中的鑲木地板。如需有關使用 Redshift 頻譜讀取實木地板資料的詳細資訊,請參閱 Amazon Redshift 資料庫COPY開發人員指南中的單欄式資料格式。
功能可用性和支援會因每個資料庫引擎的特定版本以及 AWS 區域而有所不同。如需將資料庫叢集資料匯出至 S3 功能之版本和區域可用性的詳細資訊,請參閱 支援將叢集資料匯出至 Amazon S3 的區域和 Aurora 資料庫引擎。
您可以使用下列程序,將資料庫叢集資料匯出至 Amazon S3 儲存貯體。如需詳細資訊,請參閱下列各節。
匯出資料庫叢集資料的概觀
-
識別您要匯出其資料的資料庫叢集。
-
設定對 Amazon S3 儲存貯體的存取。
「儲存貯體」是 Amazon S3 物件或檔案的容器。如要提供存取儲存貯體的資訊,請採取下列步驟:
-
識別要匯出資料庫叢集資料的目標 S3 儲存貯體。S3 儲存貯體必須與資料庫叢集位於相同的 AWS 區域。如需詳細資訊,請參閱識別要匯出的 Amazon S3 儲存貯體。
-
建立 AWS Identity and Access Management (IAM) 角色,授與 S3 儲存貯體的資料庫叢集匯出任務存取權。如需詳細資訊,請參閱使用IAM角色提供對 Amazon S3 儲存貯體的存取。
-
-
建立伺服器端加密 AWS KMS key 的對稱加密。叢集匯出任務會使用此KMS金鑰,在將匯出資料寫入 S3 時設定 AWS KMS 伺服器端加密。
KMS金鑰原則必須同時包含
kms:CreateGrant
和kms:DescribeKey
權限。如需在 Amazon Aurora 中使用KMS金鑰的詳細資訊,請參閱AWS KMS key 管理。如果您的KMS金鑰原則中有拒絕陳述式,請務必明確排除 AWS 服務主體
export.rds.amazonaws.com
。您可以在 AWS 帳戶中使用KMS金鑰,也可以使用跨帳戶KMS金鑰。如需詳細資訊,請參閱使用跨帳戶 AWS KMS key。
-
使用主控台或
start-export-task
CLI命令將資料庫叢集匯出到 Amazon S3。如需詳細資訊,請參閱建立資料庫叢集匯出工作。 -
若要存取 Amazon S3 儲存貯體中您匯出的資料,請參閱《Amazon Simple Storage Service 使用者指南》中的上傳、下載及管理物件。
在以下各節中了解如何設定、匯出、監視、取消和疑難排解資料庫叢集匯出任務。