從資料庫建立資料集 - Amazon QuickSight

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

從資料庫建立資料集

以下程序逐步引導您連線到資料庫資料來源和建立資料集。若要從 Amazon QuickSight 帳戶自動探索的 AWS 資料來源建立資料集,請使用 從自動探索的 Amazon Redshift 叢集或 Amazon RDS執行個體建立資料集。若要從任何其他資料庫資料來源建立資料集,請使用 使用非自動探索之資料庫建立資料集

從自動探索的 Amazon Redshift 叢集或 Amazon RDS執行個體建立資料集

請依下列程序建立到自動探索之 AWS 資料來源的連線。

若要建立與自動探索之 AWS 資料來源的連線
  1. 檢查 資料來源配額,確保您的目標資料表或查詢不超過資料來源配額。

  2. 確認您打算使用的資料庫登入資料具有所需的 許可中所述的適當許可。

  3. 請確定您已按照 中的指示設定 Amazon QuickSight 存取的叢集或執行個體網路和資料庫組態需求

  4. 在 Amazon QuickSight 開始頁面上,選擇資料集

  5. 資料集頁面上,選擇新建資料集

  6. 建立資料集頁面的 FROMNEWDATASOURCES區段中,選擇 RDSRedshift Auto-discovered 圖示,視您要連線 AWS 的服務而定。

  7. 輸入資料來源的連線資訊,如下所示:

    • 針對 Data source name (資料來源名稱),輸入資料來源的名稱。

    • 針對 Instance ID (執行個體 ID),選擇您想要連線的執行個體或叢集名稱。

    • Database name (資料庫名稱) 會顯示叢集或執行個體的 Instance ID (執行個體 ID) 的預設資料庫。若要在該叢集或執行個體上使用不同的資料庫,請輸入其名稱。

    • 對於 UserName,輸入具有執行下列動作之許可的使用者帳戶的使用者名稱:

      • 存取目標資料庫。

      • 讀取想要使用之資料庫中的任何表格 (即對其執行 SELECT 陳述式)。

    • 對於密碼,輸入您剛才輸入的帳戶之密碼。

  8. 選擇 Validate connection (驗證連線) 來驗證您的連線資訊是否正確。

  9. 如果連線有效,請選擇 Create data source (建立資料來源)。否則,請更正連線資訊,然後嘗試再次驗證。

    注意

    Amazon 使用 Secure Sockets Layer () QuickSight 自動保護 Amazon RDS執行個體和 Amazon Redshift 叢集的連線SSL。您不須採取任何行動即可啟用它。

  10. 選擇下列其中一項:

    • 自訂 SQL

      在下一個畫面上,您可以選擇使用自訂SQL選項撰寫查詢。這樣做會開啟名為輸入自訂SQL查詢 的畫面,您可以在其中輸入查詢的名稱,然後輸入 SQL。若要獲得最佳結果,請在SQL編輯器中編寫查詢,然後將其貼到此視窗中。在您命名並輸入查詢之後,您可以選擇 Edit/Preview data (編輯/預覽資料)Confirm query (確認查詢)。選擇 Edit/Preview data (編輯/預覽資料),來立即前往資料準備。選擇確認查詢以驗證 SQL ,並確保沒有錯誤。

    • 選擇表格

      若要連線到特定的資料表,對於結構描述:包含資料表集,選擇選取,然後選擇結構描述。在某些情況下,資料庫中只有一個結構描述,這時會自動選擇該結構描述,不會顯示結構描述選擇選項。

      若要在建立分析之前準備資料,您可以選擇 Edit/Preview data (編輯/預覽資料) 來開啟資料準備。如果想要聯結到多個資料表,請使用此選項。

      否則,在選擇資料表之後,選擇 Select (選取)

  11. 請選擇下列其中一個選項:

    • 在建立分析前準備資料。若要執行此作業,請選擇 Edit/Preview data (編輯/預覽資料),為所選表格開啟資料準備。如需資料準備的詳細資訊,請參閱準備資料集範例

    • 使用資料表資料原樣建立資料集和分析,並將資料集資料匯入 SPICE 以提升效能 (建議)。若要執行此操作,請檢查資料表大小和 SPICE 指示器,以查看您是否有足夠的容量。

      如果您有足夠的 SPICE 容量,選擇匯入至 SPICE 以加速分析 ,然後選擇視覺化 來建立分析。

      注意

      如果您想要使用 SPICE 而您沒有足夠的空間,請選擇編輯/預覽資料 。在準備資料期間,您可以移除資料集中的欄位,以減少其大小。您也可以套用篩選條件或寫入SQL查詢,以減少傳回的資料列或資料欄數。如需資料準備的詳細資訊,請參閱準備資料集範例

    • 若要依資料表資料現況建立資料集和分析,並直接從資料庫查詢資料,請選擇直接查詢您的資料選項。然後選擇 Visualize (視覺化) 建立分析。

使用非自動探索之資料庫建立資料集

使用下列程序建立與自動探索的 Amazon Redshift 叢集或 Amazon RDS執行個體以外任何資料庫的連線。此類資料庫包括位於不同 或與其他 AWS 帳戶相關聯的 Amazon Redshift 叢集和 AWS 區域 Amazon RDS執行個體。它們也包括內部部署、Amazon 或某些其他可存取環境中的 MariaDB EC2、Microsoft SQL ServerSQL、My 、Oracle 和 PostgreSQL 執行個體。

建立非自動探索 Amazon Redshift 叢集或RDS執行個體的資料庫連線
  1. 檢查 資料來源配額,確保您的目標資料表或查詢不超過資料來源配額。

  2. 確認您打算使用的資料庫登入資料具有所需的 許可中所述的適當許可。

  3. 請確定您已按照 中的指示設定 Amazon QuickSight 存取的叢集或執行個體網路和資料庫組態需求

  4. 在 Amazon QuickSight 開始頁面上,選擇管理資料

  5. 資料集頁面上,選擇新建資料集

  6. 建立資料集頁面的 FROMNEWDATASOURCES區段中,如果您想要連線至另一個叢集中的 Amazon Redshift 叢集, AWS 區域 或與不同 AWS 帳戶相關聯,請選擇 Redshift 手動連線圖示。或選擇適當的資料庫管理系統圖示,以連線至 Amazon Aurora、MariaDB 、Microsoft SQL Server、My SQL、Oracle 或 Postgre 的執行個體SQL。

  7. 輸入資料來源的連線資訊,如下所示:

    • 針對 Data source name (資料來源名稱),輸入資料來源的名稱。

    • 針對 Database server (資料庫伺服器),輸入下列其中一個值:

      • 對於 Amazon Redshift 叢集或 Amazon RDS執行個體,輸入不含連接埠號碼的叢集或執行個體端點。例如,如果端點值為 clustername.1234abcd.us-west-2.redshift.amazonaws.com:1234,則輸入 clustername.1234abcd.us-west-2.redshift.amazonaws.com。您可以從 AWS 主控台中叢集或執行個體詳細資訊頁面上的端點欄位取得端點值。

      • 對於 MariaDB 、Microsoft SQL Server、My 、SQLOracle 或 Postgre 的 Amazon EC2執行個體SQL,輸入公有DNS地址。您可以從 Amazon EC2主控台的執行個體詳細資訊窗格中的公DNS有欄位取得公有DNS值。

      • 對於 MariaDB 、Microsoft SQL Server、My 、SQLOracle 或 Postgre 的非 Amazon EC2執行個體SQL,輸入資料庫伺服器的主機名稱或公有 IP 地址。如果您使用 Secure Sockets Layer (SSL) 進行安全連線 (建議),您可能需要提供主機名稱以符合SSL憑證所需的資訊。如需公認憑證的清單,請參閱 QuickSight SSL 和 CA 憑證

    • 針對 Port (連接埠),輸入叢集或執行個體用於連線的連接埠。

    • 針對 Database name (資料庫名稱),輸入您要使用的資料庫名稱。

    • 對於 UserName,輸入具有執行下列動作之許可的使用者帳戶的使用者名稱:

      • 存取目標資料庫。

      • 讀取想要使用之資料庫中的任何表格 (即對其執行 SELECT 陳述式)。

    • 對於密碼,請輸入與您輸入之帳戶關聯的密碼。

  8. (選用) 如果您要連線到 Amazon Redshift 叢集以外的任何項目,而且您不想有安全連線,請確定啟用SSL已清除。「強烈建議維持勾選」,因為不安全的連線很可能遭到破壞。

    如需目標執行個體如何使用 SSL 來保護連線的詳細資訊,請參閱目標資料庫管理系統的文件。Amazon QuickSight 不接受自我簽署SSL憑證為有效。如需公認憑證的清單,請參閱 QuickSight SSL 和 CA 憑證

    Amazon 使用 QuickSight 自動保護 Amazon Redshift 叢集的連線SSL。您不須採取任何行動即可啟用它。

    有些資料庫,例如 Presto 和 Apache Spark,必須符合其他要求,Amazon QuickSight 才能連線。如需詳細資訊,請參閱使用 Presto 建立資料來源使用 Apache Spark 建立資料來源

  9. (選用) 選擇 Validate connection (驗證連線) 來驗證您的連線資訊是否正確。

  10. 如果連線有效,請選擇 Create data source (建立資料來源)。否則,請更正連線資訊,然後嘗試再次驗證。

  11. 選擇下列其中一項:

    • 自訂 SQL

      在下一個畫面上,您可以選擇使用自訂SQL選項撰寫查詢。這樣做會開啟名為輸入自訂SQL查詢 的畫面,您可以在其中輸入查詢的名稱,然後輸入 SQL。若要獲得最佳結果,請在SQL編輯器中編寫查詢,然後將其貼到此視窗中。在您命名並輸入查詢之後,您可以選擇 Edit/Preview data (編輯/預覽資料)Confirm query (確認查詢)。選擇 Edit/Preview data (編輯/預覽資料),來立即前往資料準備。選擇確認查詢以驗證 SQL ,並確保沒有錯誤。

    • 選擇表格

      若要連線到特定的資料表,對於結構描述:包含資料表集,選擇選取,然後選擇結構描述。在某些情況下,資料庫中只有一個結構描述,這時會自動選擇該結構描述,不會顯示結構描述選擇選項。

      若要在建立分析之前準備資料,您可以選擇 Edit/Preview data (編輯/預覽資料) 來開啟資料準備。如果想要聯結到多個資料表,請使用此選項。

      否則,在選擇資料表之後,選擇 Select (選取)

  12. 請選擇下列其中一個選項:

    • 在建立分析前準備資料。若要執行此作業,請選擇 Edit/Preview data (編輯/預覽資料),為所選表格開啟資料準備。如需資料準備的詳細資訊,請參閱準備資料集範例

    • 使用資料表資料建立資料集和分析,並將資料集資料匯入 SPICE 以提升效能 (建議)。若要執行此操作,請檢查資料表大小和 SPICE 指示器,以查看您是否有足夠的空間。

      如果您有足夠的 SPICE 容量,選擇匯入至 SPICE 以加速分析 ,然後選擇視覺化 來建立分析。

      注意

      如果您想要使用 SPICE 而您沒有足夠的空間,請選擇編輯/預覽資料 。在準備資料期間,您可以移除資料集中的欄位,以減少其大小。您也可以套用篩選條件或寫入SQL查詢,以減少傳回的資料列或資料欄數。如需資料準備的詳細資訊,請參閱準備資料集範例

    • 依資料表資料現況建立資料集和分析,並直接從資料庫查詢資料。若要執行此作業,請選擇 Directly query your data (直接查詢您的資料) 選項。然後選擇 Visualize (視覺化) 建立分析。