使用命令列將資料複製到亞馬遜紅移 - AWS Data Pipeline

AWS Data Pipeline 不再提供給新客戶。現有客戶 AWS Data Pipeline 可繼續正常使用此服務。進一步了解

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用命令列將資料複製到亞馬遜紅移

本教學將示範如何將資料從 Amazon S3 複製到亞馬遜紅移。您將在 Amazon Redshift 中建立新的資料表,然後使用AWS Data Pipeline從公有 Amazon S3 儲存貯體 (其中包含 CSV 格式的範例輸入資料) 將資料傳輸到此資料表。日誌會儲存到您擁有的 Amazon S3 儲存貯體。

Amazon S3 是一種可讓您將資料存放在雲端的網路服務。如需詳細資訊,請參閱 Amazon Simple Storage Service 使用者指南。亞馬遜紅移是雲中的一種數據倉庫服務。如需詳細資訊,請參閱亞馬遜紅移管理指南

先決條件

開始之前,您必須完成下列步驟:

  1. 安裝和設定命令列介面 (CLI)。如需詳細資訊,請參閱存取 AWS Data Pipeline

  2. 確定已命名DataPipelineDefaultRoleDataPipelineDefaultResourceRole存在的 IAM 角色。主AWS Data Pipeline控台會自動為您建立這些角色。如果您至少沒有使用AWS Data Pipeline主控台一次,則必須手動建立這些角色。如需詳細資訊,請參閱AWS Data Pipeline 的 IAM 角色

  3. 在 Amazon Redshift 中設定COPY命令,因為當您在中執行複製作業時,需要使用這些相同的選項。AWS Data Pipeline如需相關資訊,請參閱 在您開始之前:設定 COPY 選項並載入資料

  4. 設置一個亞馬遜紅移數據庫。如需詳細資訊,請參閱設定管道、建立安全群組,以及建立 Amazon Redshift 叢集