本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
將 Lambda 資料來源連接器 (例如 AthenaHiveMetastoreFunction
) 部署到您的帳戶之後,您即可設定 Athena 以使用它。在這個步驟中,您需建立資料來源名稱,以便在參考外部 Hive 中繼存放區的 Athena 查詢中使用。
使用現有 Lambda 函數,將 Athena 連接至您的 Hive 中繼存放區
前往 https://console.aws.amazon.com/athena/
開啟 Athena 主控台。 如果未顯示主控台的導覽窗格,請選擇左側的展開選單。
-
選擇資料來源和目錄。
-
在資料來源和目錄頁面上,選擇建立資料來源。
-
在 Choose a data source (選擇資料來源) 頁面上,針對 Data source (資料來源) 選擇 S3 - Apache Hive metastore (S3 - Apache Hive 中繼存放區)。
-
選擇 Next (下一步)。
-
在 Data source details (資料來源詳細資訊) 區段中,當您從 Athena 查詢資料來源 (例如
MyHiveMetastore
),請於 Data Source Name (資料來源名稱) 輸入要在 SQL 陳述式中使用的名稱。名稱最多可包含 127 個字元,且在您的帳戶中必須是唯一的。建立後便無法變更。有效字元包括 a-z、A-Z、0-9、_ (底線)、@ (at 符號) 和 - (連字號)。Athena 已保留名稱awsdatacatalog
、hive
、jmx
和system
,這些名稱不能用於資料來源名稱。 -
在 Connection details (連線詳細資訊) 區段中,使用 Select or enter a Lambda function (選取或輸入 Lambda 函數) 方塊,以選擇您剛才建立的函數名稱。隨即顯示 Lambda 函數的 ARN。
-
(選用) 在 Tags (標籤) 中,新增要與此資料來源相關聯的鍵值對。如需標籤的詳細資訊,請參閱標記 Athena 資源。
-
選擇 Next (下一步)。
-
在 Review and create (檢閱並建立) 頁面上,檢閱資料來源詳細資訊,然後選擇 Create data source (建立資料來源)。
-
該頁面的 Data source details (資料來源詳細資訊) 區段顯示了有關新連接器的資訊。
您現在可以使用您指定的 Data source name (資料來源名稱),在 Athena 的 SQL 查詢中指定參考 Hive 中繼存放區。
在您的 SQL 查詢中使用下列範例中的語法,將
ehms-catalog
取代為您先前指定的資料來源名稱。SELECT * FROM ehms-catalog.CustomerData.customers
-
若要檢視、編輯或刪除您建立的資料來源,請參閱管理您的資料來源。