資料庫叢集匯出的考量 - Amazon Aurora

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

資料庫叢集匯出的考量

請參閱以下各節,了解將資料庫叢集資料匯出至 Amazon S3 時的限制、檔案命名慣例以及資料轉換和儲存。

限制

將資料庫叢集資料匯出至 Amazon S3 時有下列限制:

  • 您無法同時針對相同的資料庫叢集執行多個匯出任務。這同時適用於完整和部分匯出。

  • 每個最多可以有五個同時進行的資料庫快照匯出工作 AWS 帳戶.

  • Aurora Serverless v1 資料庫叢集不支援匯出至 S3。

  • 我的 Aurora SQL 和 Aurora Postgre 僅針對佈建的引擎模式SQL支援匯出至 S3。

  • 匯出至 S3 不支援包含冒號 (:) 的 S3 前置詞。

  • 在匯出過程中,S3 檔案路徑中的以下字元將轉換為底線 (_):

    \ ` " (space)
  • 如果資料庫、結構描述或資料表的名稱中包含下列字元以外的字元,則不支援部分匯出。不過,您可以匯出整個資料庫叢集。

    • 拉丁字母 (A–Z)

    • 數字 (0–9)

    • 美元符號 ($)

    • 底線 (_)

  • 資料庫資料表資料欄名稱不支援空格 ( ) 和某些字元。資料行名稱中具備下列字元的資料表會在匯出時跳過:

    , ; { } ( ) \n \t = (space)
  • 匯出時會略過名稱中具備斜線 (/) 的表格。

  • 匯出期間會略過 Aurora Postgre SQL 暫時和未記錄的資料表。

  • 如果資料包含接近BLOB或CLOB大於 500 MB 的大型物件 (例如或),則匯出會失敗。

  • 如果資料表包含接近或大於 2 GB 的大型資料列,則在匯出期間會略過該資料表。

  • 對於部分匯出,ExportOnly清單的大小上限為 200 KB。

  • 強烈建議您對每個匯出任務使用唯一的名稱。如果不使用唯一的任務名稱,可能會收到下列錯誤訊息:

    ExportTaskAlreadyExistsFault:呼叫 StartExportTask作業時發生錯誤 (ExportTaskAlreadyExists):具有 ID 的匯出工作 xxxxx 已存在。

  • 由於某些資料表可能會略過,因此建議您在匯出之後驗證資料中的資料列和資料表計數。

檔案命名慣例

特定表格的匯出資料會以 base_prefix/files 的格式儲存,其中基本前綴如下:

export_identifier/database_name/schema_name.table_name/

例如:

export-1234567890123-459/rdststcluster/mycluster.DataInsert_7ADB5D19965123A2/

輸出檔案使用下列命名慣例,其中 partition_index 是字母數字:

partition_index/part-00000-random_uuid.format-based_extension

例如:

1/part-00000-c5a881bb-58ff-4ee6-1111-b41ecff340a3-c000.gz.parquet a/part-00000-d7a881cc-88cc-5ab7-2222-c41ecab340a4-c000.gz.parquet

檔案命名慣例可能會有所變更。因此,在讀取目標資料表時,建議您讀取資料表基本字首內的所有內容。

資料轉換和存放格式

將資料庫叢集匯出到 Amazon S3 儲存貯體時,Amazon Aurora 會以實際複合地板格式轉換、匯出和存放資料。如需詳細資訊,請參閱匯出至 Amazon S3 儲存貯體時的資料轉換