本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
資料庫叢集匯出的考量
請參閱以下各節,了解將資料庫叢集資料匯出至 Amazon S3 時的限制、檔案命名慣例以及資料轉換和儲存。
限制
將資料庫叢集資料匯出至 Amazon S3 時有下列限制:
-
您無法同時針對相同的資料庫叢集執行多個匯出任務。這同時適用於完整和部分匯出。
-
每個最多可以有五個同時進行的資料庫快照匯出工作 AWS 帳戶.
-
Aurora Serverless v1 資料庫叢集不支援匯出至 S3。
-
我的 Aurora SQL 和 Aurora Postgre 僅針對佈建的引擎模式SQL支援匯出至 S3。
-
匯出至 S3 不支援包含冒號 (:) 的 S3 前置詞。
-
在匯出過程中,S3 檔案路徑中的以下字元將轉換為底線 (_):
\ ` " (space)
-
如果資料庫、結構描述或資料表的名稱中包含下列字元以外的字元,則不支援部分匯出。不過,您可以匯出整個資料庫叢集。
-
拉丁字母 (A–Z)
-
數字 (0–9)
-
美元符號 ($)
-
底線 (_)
-
-
資料庫資料表資料欄名稱不支援空格 ( ) 和某些字元。資料行名稱中具備下列字元的資料表會在匯出時跳過:
, ; { } ( ) \n \t = (space)
-
匯出時會略過名稱中具備斜線 (/) 的表格。
-
匯出期間會略過 Aurora Postgre SQL 暫時和未記錄的資料表。
-
如果資料包含接近BLOB或CLOB大於 500 MB 的大型物件 (例如或),則匯出會失敗。
-
如果資料表包含接近或大於 2 GB 的大型資料列,則在匯出期間會略過該資料表。
-
對於部分匯出,
ExportOnly
清單的大小上限為 200 KB。 -
強烈建議您對每個匯出任務使用唯一的名稱。如果不使用唯一的任務名稱,可能會收到下列錯誤訊息:
ExportTaskAlreadyExistsFault:呼叫 StartExportTask作業時發生錯誤 (ExportTaskAlreadyExists):具有 ID 的匯出工作
xxxxx
已存在。 -
由於某些資料表可能會略過,因此建議您在匯出之後驗證資料中的資料列和資料表計數。
檔案命名慣例
特定表格的匯出資料會以
的格式儲存,其中基本前綴如下:base_prefix
/files
export_identifier
/database_name
/schema_name
.table_name
/
例如:
export-1234567890123-459/rdststcluster/mycluster.DataInsert_7ADB5D19965123A2/
輸出檔案使用下列命名慣例,其中 partition_index
是字母數字:
partition_index
/part-00000-random_uuid
.format-based_extension
例如:
1/part-00000-c5a881bb-58ff-4ee6-1111-b41ecff340a3-c000.gz.parquet a/part-00000-d7a881cc-88cc-5ab7-2222-c41ecab340a4-c000.gz.parquet
檔案命名慣例可能會有所變更。因此,在讀取目標資料表時,建議您讀取資料表基本字首內的所有內容。
資料轉換和存放格式
將資料庫叢集匯出到 Amazon S3 儲存貯體時,Amazon Aurora 會以實際複合地板格式轉換、匯出和存放資料。如需詳細資訊,請參閱匯出至 Amazon S3 儲存貯體時的資料轉換。