

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用新的資料來源建立資料集
<a name="creating-data-sets-new"></a>

當您根據 Amazon RDS、Amazon Redshift 或 Amazon EC2 等 AWS 服務建立資料集時，從該來源取用資料時，可能會產生資料傳輸費用。這些費用也可能有所不同，取決於該 AWS 資源是否位於您為 AWS 區域 Amazon Quick 帳戶選擇的家中。如需定價的詳細資訊，請參閱該服務的定價頁面。

當建立新的資料庫資料集時，您可以選取一個資料表、聯結數個資料表或建立 SQL 查詢，以擷取您要的資料。您也可以變更資料集是使用直接查詢，還是將資料儲存在 [SPICE](spice.md) 中。

**建立新資料集**

1. 若要建立資料集，請在**資料**頁面上選擇**新增資料集**。然後，您可以根據現有資料集或資料來源建立資料集，或連線至新的資料來源並以該資料來源作為資料集的基礎。

1. 提供資料來源的連線資訊：
   + 如果是本機文字檔或 Microsoft Excel 檔案，您只需識別檔案位置並上傳檔案。
   + 如果是 Amazon S3，請提供清單檔案，以識別您想要使用的檔案或儲存貯體，同時匯入目標檔案的設定。
   + 對於 Amazon Athena，會傳回您 AWS 帳戶的所有 Athena 資料庫。不需額外的登入資料。
   + 如果是 Salesforce，請提供連線時所需的登入資料。
   + 如果是 Amazon Redshift、Amazon RDS、Amazon EC2 或其他資料庫資料來源，請提供託管資料的伺服器和資料庫資訊。同時請提供該資料庫執行個體的有效憑證。

# 從資料庫建立資料集
<a name="create-a-database-data-set"></a>

以下程序逐步引導您連線到資料庫資料來源和建立資料集。若要從 Amazon Quick 帳戶自動探索的 AWS 資料來源建立資料集，請使用 [從自動探索的 Amazon Redshift 叢集或 Amazon RDS 執行個體建立資料集](#create-a-data-set-autodiscovered)。若要從任何其他資料庫資料來源建立資料集，請使用 [使用非自動探索之資料庫建立資料集](#create-a-data-set-database)。

## 從自動探索的 Amazon Redshift 叢集或 Amazon RDS 執行個體建立資料集
<a name="create-a-data-set-autodiscovered"></a>

請依下列程序建立到自動探索之 AWS 資料來源的連線。

**建立與自動探索 AWS 資料來源的連線**

1. 檢查 [資料來源配額](data-source-limits.md)，確保您的目標資料表或查詢不超過資料來源配額。

1. 確認您打算使用的資料庫登入資料具有[所需的許可](required-permissions.md)中所述的適當許可。

1. 請遵循 中的指示，確定您已設定叢集或執行個體進行 Amazon Quick 存取[網路和資料庫組態需求](configure-access.md)。

1. 在 Amazon Quick Start 頁面上，選擇**資料**。

1. 選擇**建立**，然後選擇**新增資料集**。

1. 根據您要連線 AWS 的服務，選擇 **RDS** **或 Redshift 自動探索**圖示。

1. 輸入資料來源的連線資訊，如下所示：
   + 針對**資料來源名稱**，輸入資料來源的名稱。
   + 針對 **Instance ID (執行個體 ID)**，選擇您想要連線的執行個體或叢集名稱。
   + **資料庫名稱**會顯示叢集或執行個體的**執行個體 ID** 的預設資料庫。若要在該叢集或執行個體上使用不同的資料庫，請輸入其名稱。
   + 對於**使用者名稱**，輸入有權執行下列動作之使用者帳戶的使用者名稱：
     + 存取目標資料庫。
     + 讀取想要使用之資料庫中的任何資料表 (即對其執行 `SELECT` 陳述式)。
   + 對於**密碼**，輸入您剛才輸入的帳戶之密碼。

1. 選擇 **Validate connection (驗證連線)** 來驗證您的連線資訊是否正確。

1. 如果連線有效，請選擇 **Create data source (建立資料來源)**。否則，請更正連線資訊，然後嘗試再次驗證。
**注意**  
Amazon Quick 使用 Secure Sockets Layer (SSL) 自動保護與 Amazon RDS 執行個體和 Amazon Redshift 叢集的連線。您不須採取任何行動即可啟用它。

1. 選擇下列其中一項：
   + **自訂 SQL**

     在下一個畫面上，您可以選擇透過 **Use custom SQL (使用自訂 SQL)** 選項來編寫查詢。這樣做會開啟名為 **Enter custom SQL query (輸入自訂 SQL 查詢)** 的畫面，您可以在這裡輸入查詢的名稱，再輸入 SQL。如需最佳結果，請在 SQL 編輯器中編寫查詢，然後將它貼至這個視窗。在您命名並輸入查詢之後，您可以選擇 **Edit/Preview data (編輯/預覽資料)** 或 **Confirm query (確認查詢)**。選擇 **Edit/Preview data (編輯/預覽資料)**，來立即前往資料準備。選擇 **Confirm query (確認查詢)**，來驗證 SQL 並確保沒有錯誤。
   + **選擇表格**

     若要連線到特定的資料表，對於**結構描述：包含資料表集**，選擇**選取**，然後選擇結構描述。在某些情況下，資料庫中只有一個結構描述，這時會自動選擇該結構描述，不會顯示結構描述選擇選項。

     若要在建立分析之前準備資料，您可以選擇 **Edit/Preview data (編輯/預覽資料)** 來開啟資料準備。如果想要聯結到多個資料表，請使用此選項。

     否則，在選擇資料表之後，選擇 **Select (選取)**。

1. 請選擇下列其中一個選項：
   + 在建立分析前準備資料。若要執行此作業，請選擇 **Edit/Preview data (編輯/預覽資料)**，為所選表格開啟資料準備。如需資料準備的詳細資訊，請參閱[準備資料集範例](preparing-data-sets.md)。
   + 依資料表資料現況建立資料集和分析，並將資料集資料匯入 SPICE，以改善效能 (建議)。若要執行此作業，請檢查資料表大小和 SPICE 指示器，查看您是否有足夠的容量。

     如果有足夠的 SPICE 容量，請選擇**匯入至 SPICE 以進行更快速的分析**，然後選擇**視覺化**以建立分析。
**注意**  
如果想要使用 SPICE，但沒有足夠的空間，請選擇**編輯/預覽資料**。在準備資料期間，您可以移除資料集中的欄位，以減少其大小。您也可以套用篩選條件或編寫 SQL 查詢，減少傳回的列或欄數。如需資料準備的詳細資訊，請參閱[準備資料集範例](preparing-data-sets.md)。
   + 若要依資料表資料現況建立資料集和分析，並直接從資料庫查詢資料，請選擇**直接查詢您的資料**選項。然後選擇 **Visualize (視覺化)** 建立分析。

## 使用非自動探索之資料庫建立資料集
<a name="create-a-data-set-database"></a>

請依下列程序建立到除自動探索之 Amazon Redshift 叢集或 Amazon RDS 執行個體以外的任意資料庫的連線。這類資料庫包括位於不同 的 Amazon Redshift 叢集和 Amazon RDS 執行個體， AWS 區域 或與不同 AWS 帳戶相關聯。還包括在內部部署、在 Amazon EC2 中或其他可存取的環境中的 MariaDB、Microsoft SQL Server、MySQL、Oracle 和 PostgreSQL 執行個體。

**建立到非自動探索之 Amazon Redshift 叢集或 RDS 執行個體的資料庫的連線**

1. 檢查 [資料來源配額](data-source-limits.md)，確保您的目標資料表或查詢不超過資料來源配額。

1. 確認您打算使用的資料庫登入資料具有[所需的許可](required-permissions.md)中所述的適當許可。

1. 請遵循 中的指示，確定您已設定叢集或執行個體進行 Amazon Quick 存取[網路和資料庫組態需求](configure-access.md)。

1. 在 Amazon Quick Start 頁面上，選擇**管理資料**。

1. 選擇**建立**，然後選擇**新增資料集**。

1. 如果您想要連接到另一個 中的 Amazon Redshift 叢集 AWS 區域 或與不同的 AWS 帳戶相關聯，請選擇 **Redshift 手動連線**圖示。或者，選擇適當的資料庫管理系統圖示，以連線到 Amazon Aurora、MariaDB、Microsoft SQL Server、MySQL、Oracle 或 PostgreSQL 的執行個體。

1. 輸入資料來源的連線資訊，如下所示：
   + 針對**資料來源名稱**，輸入資料來源的名稱。
   + 針對**資料庫伺服器**，輸入下列其中一個值：
     + 對於 Amazon Redshift 叢集或 Amazon RDS 執行個體，請輸入叢集或執行個體的端點 (不含連接埠號碼)。例如，如果端點值為 `clustername.1234abcd.us-west-2.redshift.amazonaws.com:1234`，則輸入 `clustername.1234abcd.us-west-2.redshift.amazonaws.com`。您可以從叢集上的**端點**欄位或 AWS 主控台中的執行個體詳細資訊頁面取得端點值。
     + 對於 MariaDB、Microsoft SQL Server、MySQL、Oracle 或 PostgreSQL 的 Amazon EC2 執行個體，請輸入公有 DNS 地址。您可以在 Amazon EC2 主控台的執行個體詳細資訊窗格，從**公有 DNS** 欄位取得公有 DNS 值。
     + 對於 MariaDB、Microsoft SQL Server、MySQL、Oracle 或 PostgreSQL 的非 Amazon EC2 執行個體，請輸入資料庫伺服器的主機名稱或公有 IP 地址。如果您使用 Secure Sockets Layer (SSL) 建立安全連線 (建議)，您可能需要提供主機名稱以符合 SSL 憑證所需的資訊。如需公認憑證的清單，請參閱 [Amazon Quick SSL 和 CA 憑證](configure-access.md#ca-certificates)。
   + 針對**連接埠**，輸入叢集或執行個體用於連線的連接埠。
   + 針對**資料庫名稱**，輸入您要使用的資料庫名稱。
   + 對於**使用者名稱**，輸入有權執行下列動作之使用者帳戶的使用者名稱：
     + 存取目標資料庫。
     + 讀取想要使用之資料庫中的任何資料表 (即對其執行 `SELECT` 陳述式)。
   + 對於**密碼**，請輸入與您輸入之帳戶關聯的密碼。

1. (選用) 如果您連線的不是 Amazon Redshift 叢集，而且*不*想要安全連線，請務必清除**啟用 SSL**。「強烈建議維持勾選」**，因為不安全的連線很可能遭到破壞。

   如需有關目標執行個體如何使用 SSL 保護連線的詳細資訊，請參閱目標資料庫管理系統的文件。Amazon Quick 不接受自我簽署的 SSL 憑證為有效。如需公認憑證的清單，請參閱 [Amazon Quick SSL 和 CA 憑證](configure-access.md#ca-certificates)。

   Amazon Quick 會使用 SSL 自動保護與 Amazon Redshift 叢集的連線。您不須採取任何行動即可啟用它。

   有些資料庫，例如 Presto 和 Apache Spark，必須符合其他要求，Amazon Quick 才能連線。如需詳細資訊，請參閱[使用 Presto 建立資料來源](create-a-data-source-presto.md)或[使用 Apache Spark 建立資料來源](create-a-data-source-spark.md)。

1. (選用) 選擇 **Validate connection (驗證連線)** 來驗證您的連線資訊是否正確。

1. 如果連線有效，請選擇 **Create data source (建立資料來源)**。否則，請更正連線資訊，然後嘗試再次驗證。

1. 選擇下列其中一項：
   + **自訂 SQL**

     在下一個畫面上，您可以選擇透過 **Use custom SQL (使用自訂 SQL)** 選項來編寫查詢。這樣做會開啟名為 **Enter custom SQL query (輸入自訂 SQL 查詢)** 的畫面，您可以在這裡輸入查詢的名稱，再輸入 SQL。如需最佳結果，請在 SQL 編輯器中編寫查詢，然後將它貼至這個視窗。在您命名並輸入查詢之後，您可以選擇 **Edit/Preview data (編輯/預覽資料)** 或 **Confirm query (確認查詢)**。選擇 **Edit/Preview data (編輯/預覽資料)**，來立即前往資料準備。選擇 **Confirm query (確認查詢)**，來驗證 SQL 並確保沒有錯誤。
   + **選擇表格**

     若要連線到特定的資料表，對於**結構描述：包含資料表集**，選擇**選取**，然後選擇結構描述。在某些情況下，資料庫中只有一個結構描述，這時會自動選擇該結構描述，不會顯示結構描述選擇選項。

     若要在建立分析之前準備資料，您可以選擇 **Edit/Preview data (編輯/預覽資料)** 來開啟資料準備。如果想要聯結到多個資料表，請使用此選項。

     否則，在選擇資料表之後，選擇 **Select (選取)**。

1. 請選擇下列其中一個選項：
   + 在建立分析前準備資料。若要執行此作業，請選擇 **Edit/Preview data (編輯/預覽資料)**，為所選表格開啟資料準備。如需資料準備的詳細資訊，請參閱[準備資料集範例](preparing-data-sets.md)。
   + 依資料表資料現況建立資料集和分析，並將資料集資料匯入 SPICE，以改善效能 (建議)。若要執行此作業，請檢查資料表大小和 SPICE 指示器，查看您是否有足夠的空間。

     如果有足夠的 SPICE 容量，請選擇**匯入至 SPICE 以進行更快速的分析**，然後選擇**視覺化**以建立分析。
**注意**  
如果想要使用 SPICE，但沒有足夠的空間，請選擇**編輯/預覽資料**。在準備資料期間，您可以移除資料集中的欄位，以減少其大小。您也可以套用篩選條件或編寫 SQL 查詢，減少傳回的列或欄數。如需資料準備的詳細資訊，請參閱[準備資料集範例](preparing-data-sets.md)。
   + 依資料表資料現況建立資料集和分析，並直接從資料庫查詢資料。若要執行此作業，請選擇 **Directly query your data (直接查詢您的資料)** 選項。然後選擇 **Visualize (視覺化)** 建立分析。