開始使用 Amazon Redshift Spectrum - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

開始使用 Amazon Redshift Spectrum

在本教學課程中,您將了解如何使用 Amazon Redshift Spectrum 直接從 Amazon S3 上的檔案查詢資料。如果您已經有叢集和SQL用戶端,您可以用最少的設定完成本教學課程。

注意

Redshift Spectrum 查詢會產生額外費用。在本教學中執行範例查詢的成本是名目成本。如需定價的相關資訊,請參閱 Amazon Redshift Spectrum 定價

必要條件

若要使用 Redshift 頻譜,您需要一個 Amazon Redshift 叢集和連線到叢集的用SQL戶端,以便您可以執行命SQL令。叢集與 Amazon S3 中的資料檔案必須在相同的 AWS 區域。

如需如何建立 Amazon Redshift 叢集的相關資訊,請參閱亞馬遜 Redshift 開始使用 Amazon Redshift 佈建的資料倉儲門指南。如需連線到叢集的方式的相關資訊,請參閱亞馬遜 Redshift 入門指南中的連線到 Amazon Redshift 資料倉儲

在下面的一些範例中,範例資料位於美國東部 (維吉尼亞北部) 區域 (us-east-1),因此您需要一個同樣位於 us-east-1 中的叢集。或者,您可以使用 Amazon S3 將資料物件從下列儲存貯體和資料夾複製到叢集所在的儲存貯體: AWS 區域

  • s3://redshift-downloads/tickit/spectrum/customers/*

  • s3://redshift-downloads/tickit/spectrum/sales_partition/*

  • s3://redshift-downloads/tickit/spectrum/sales/*

  • s3://redshift-downloads/tickit/spectrum/salesevent/*

執行類似下列的 Amazon S3 命令,將位於美國東部 (維吉尼亞北部) 的範例資料複製到您的 AWS 區域。執行命令之前,請在儲存貯體中建立儲存貯體和資料夾,以符合 Amazon S3 複製命令。Amazon S3 複製命令的輸出會確認檔案已複製到 bucket-name 在你想要的 AWS 區域。

aws s3 cp s3://redshift-downloads/tickit/spectrum/ s3://bucket-name/tickit/spectrum/ --copy-props none --recursive

開始使用 Redshift 頻譜使用 AWS CloudFormation

除了下列步驟之外,您還可以存取 Redshift 頻譜 DataLake AWS CloudFormation 範本以建立包含可查詢的 Amazon S3 儲存貯體的堆疊。如需詳細資訊,請參閱啟動您的 AWS CloudFormation 堆疊,然後在 Amazon S3 中查詢您的資料

逐步開始使用 Redshift Spectrum

若要開始使用 Amazon Redshift Spectrum,請遵循這些步驟: