使用COPY指令載入資料表 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用COPY指令載入資料表

該COPY命令利用 Amazon Redshift 大規模 parallel 處理 (MPP) 架構,從 Amazon S3 上的檔案、DynamoDB 表格或從一個或多個遠端主機的文字輸出讀取和載入資料。

在學習COPY命令的所有選項之前,建議您先學習載入 Amazon S3 資料的基本選項。Amazon Redshift 入門指南展示了使用預設IAM角色載入 Amazon S3 資料的COPY命令的簡單使用方法。如需詳細資訊,請參閱步驟 4:將資料從 Amazon S3 載入到亞馬遜紅移

注意

強烈建議您使用COPY指令載入大量資料。使用個別INSERT陳述式來填入資料表可能會非常慢。或者,如果您的數據已經存在於其他 Amazon Redshift 數據庫表中,請使用 INSERTINTO... SELECT或 CREATE TABLE AS 以提高性能。如需詳細資訊,請參閱 INSERTCREATETABLE作為

若要從其他人載入資料 AWS 資源,Amazon Redshift 必須具有存取資源和執行必要動作的權限。

若要授與或撤銷使用COPY命令將資料載入資料表的權限,請授與或撤銷INSERT權限。

您的資料必須採用適當的格式,才能載入至您的 Amazon Redshift 資料表。本節介紹在載入之前準備和驗證資料的準則,以及在執行COPY陳述式之前驗證陳述式的準則。

為了保護檔案中的資訊,您可以先加密資料檔案,然後再將資料檔案上傳到 Amazon S3 儲存貯體;COPY會在資料執行載入時解密資料。您也可以對使用者提供暫時的安全性登入資料,來限制對您的載入資料的存取。暫時安全性登入資料提供加強的安全性,因為有效期限較短,且過期之後不能重複使用。

Amazon Redshift 內建的功能可以快速載COPY入未壓縮、分隔的資料。但您可以使用 gzip、lzop 或 bzip2 壓縮檔案來節省上傳檔案的時間。

如果COPY查詢中包含下列關鍵字,則不支援自動分割未壓縮資料:ESCAPEREMOVEQUOTES、和FIXEDWIDTH。但是支持CSV關鍵字。

協助確保傳輸中的資料安全 AWS 在雲端中,Amazon Redshift 使用硬體SSL加速與 Amazon S3 或 Amazon DynamoDB 進行通訊,以進行COPYUNLOAD、備份和還原操作。

直接從 Amazon DynamoDB 資料表載入您的資料表時,您可以選擇控制所使用的 Amazon DynamoDB 佈建輸送量。

您可以選擇性地COPY分析輸入資料,並自動將最佳壓縮編碼套用至資料表,做為載入程序的一部分。