COPY從單欄式資料格式 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

COPY從單欄式資料格式

COPY可以使用下列單欄格式從 Amazon S3 載入資料:

  • ORC

  • Parquet

如需使用COPY單欄式資料格式的範例,請參閱。COPY例子

COPY支援具有下列考量的欄式格式資料:

  • Amazon S3 存儲桶必須在相同 AWS 區域作為 Amazon Redshift 數據庫。

  • 若要透過VPC端點存取 Amazon S3 資料,請按照 Amazon Redshift 理指南中的增強型VPC路由使用 Amazon Redshift Spectrum 中所述,使用IAM政策和IAM角色來設定存取。

  • COPY不會自動套用壓縮編碼。

  • 僅支援下列COPY參數:

  • 如果在載入時COPY遇到錯誤,指令會失敗。ACCEPTANYDATE而且MAXERROR不支援單欄式資料類型。

  • 錯誤訊息會傳送至用SQL戶端。_ _ ERRORS 和 STL LOAD STL _ 中記錄了一些錯誤ERROR。

  • COPY將值插入目標資料表的資料行,順序與資料欄資料檔中出現的資料行相同。目標資料表的欄數和資料檔案的欄數必須相符。

  • 如果您為COPY作業指定的檔案包含下列其中一個副檔名,我們會將資料解壓縮,而不需要新增任何參數:

    • .gz

    • .snappy

    • .bz2

  • COPY從實木複合地板和ORC文件格式使用 Redshift 頻譜和存儲桶訪問。若要使COPY用這些格式,請確保沒有IAM政策阻止使用 Amazon S3 預先簽署URLs。由 Amazon Redshift URLs 生成的預先簽署有效期為 1 小時,因此 Amazon Redshift 有足夠的時間從 Amazon S3 存儲桶加載所有文件。系統會針對COPY從單欄式資料格式掃描的每個檔案產生唯一的預先簽署URL。對於包含s3:signatureAge動作的值區政策,請務必將值設定為至少 3,600,000 毫秒。如需詳細資訊,請參閱搭配增強型VPC路由使用 Amazon Redshift Spectrum