本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
版本備註
依發行日期描述 Amazon Athena 功能、改善項目和錯誤修正。
2024 年 Athena 版本備註
2024 年 10 月 30 日
發佈 2024-10-30
Athena 發行JDBC驅動程式 3.3.0 版。如需此版本驅動程式的詳細資訊,請參閱 Amazon Athena JDBC 3.x 版本備註。若要下載 JDBC 3.x 驅動程式,請參閱 JDBC 3.x 驅動程式下載。
2024 年 8 月 23 日
發佈 2024-09-05
Athena 宣布下列事項:
-
使用傳遞查詢查詢聯合檢視 – 檢視現在支援聯合傳遞查詢。如需詳細資訊,請參閱查詢聯合檢視。
-
多個傳遞查詢 – 您現在可以在相同的查詢執行中執行多個聯合傳遞查詢。如需詳細資訊,請參閱使用同盟傳遞查詢。
-
Iceberg 資料表OPTIMIZE修正 – 修正在 Iceberg 資料表
OPTIMIZE
上執行時,在重寫具有關聯刪除檔案的資料檔案時,無法移除「刪除」檔案的問題。如需詳細資訊,請參閱OPTIMIZE。 -
Parquet LZ4和LZO寫入支援 – Athena 不再支援寫入使用 LZ4或 LZO 格式壓縮的 Parquet 檔案。仍然支援這些壓縮格式的讀取。如需有關 Athena 中壓縮格式的資訊,請參閱 在 Athena 使用壓縮。
2024 年 7 月 29 日
發佈 2024-07-29
Athena 發行JDBC驅動程式 3.2.2 版。如需此版本驅動程式的詳細資訊,請參閱 Amazon Athena JDBC 3.x 版本備註。若要下載 JDBC 3.x 驅動程式,請參閱 JDBC 3.x 驅動程式下載。
2024 年 7 月 26 日
發佈 2024-08-01
Athena 宣布下列改進。
-
Delta Lake 資料表刪除向量支援 – Athena 現在支援讀取具有刪除向量 的
Delta Lake 資料表。如需詳細資訊,請參閱查詢 Linux 基礎三角洲湖表。
2024 年 7 月 3 日
發佈 2024-07-03
Athena 發行JDBC驅動程式 3.2.1 版。如需此版本驅動程式的詳細資訊,請參閱 Amazon Athena JDBC 3.x 版本備註。若要下載 JDBC 3.x 驅動程式,請參閱 JDBC 3.x 驅動程式下載。
2024 年 6 月 26 日
發佈 2024-06-26
佈建的容量現在已普遍在南美洲 (聖保羅) 和歐洲 (西班牙) 區域提供。佈建的容量可讓您在完全受管的運算容量上執行SQL查詢,並提供工作負載管理功能,協助您排定優先順序、控制和擴展最重要的互動式工作負載。您可以隨時新增容量以增加可同時執行的查詢數量、控制哪些工作負載使用該容量,以及在工作負載之間共用容量。
如需詳細資訊,請參閱管理查詢處理能力。如需定價資訊,請造訪 Amazon Athena 定價
2024 年 5 月 10 日
發佈 2024-07-15
Athena 發布了下列功能以及強化功能。
-
Delta Lake – Athena 新增了最佳化功能,可從檢查點檔案中篩選出不需要的項目。這些最佳化可大幅改善參考許多 Parquet 資料檔案之大型檢查點檔案的查詢效能。
如需搭配使用 Linux Foundation Delta Lake 資料表與 Athena 的詳細資訊,請參閱 查詢 Linux 基礎三角洲湖表。
2024 年 4 月 26 日
發佈 2024-04-26
Athena 發行JDBC驅動程式 3.2.0 版。如需此版本驅動程式的詳細資訊,請參閱 Amazon Athena JDBC 3.x 版本備註。若要下載 JDBC 3.x 驅動程式,請參閱 JDBC 3.x 驅動程式下載。
2024 年 4 月 24 日
發佈 2024-04-24
Athena 發布下列修復和改善。
-
Parquet – Athena 現在支援 Parquet 中的向後相容讀取,用於未包含在清單或映射群組中的未註釋、重複的原始欄位。此變更可防止無提示地傳回不正確的結果,並改善結構描述不相符的錯誤訊息。
如需詳細資訊,請參閱 . GitHubcom 上的支援 Parquet 中未註釋重複原始欄位的向後相容讀取
。 -
Iceberg OPTIMIZE – 解決了在子
WHERE
句中使用非分割區金鑰篩選條件時導致資料遺失的OPTIMIZE
查詢問題。如需詳細資訊,請參閱OPTIMIZE。
2024 年 4 月 16 日
發佈 2024-04-16
使用新的 Amazon Athena 聯合查詢傳遞功能,直接在基礎資料來源上執行整個查詢。聯合傳遞查詢可協助您利用原始資料來源的唯一函數、查詢語言和效能功能。例如,您可以使用 PartiQL 語言 在 DynamoDB 上執行 Athena 查詢。當您想要執行彙總、聯結或叫用 Athena 中無法使用之資料來源函數的SELECT
查詢時,聯合傳遞查詢也很有用。使用傳遞查詢可以減少 Athena 處理的資料量,並縮短查詢時間。
如需詳細資訊,請參閱使用同盟傳遞查詢。若要將您目前使用的連接器升級至最新版本,請參閱 更新資料來源連接器。
2024 年 4 月 10 日
發佈 2024-04-10
Athena 發布了下列功能以及強化功能。
ODBC 1.2.3.1000 驅動程式
ODBC Athena 的 1.2.3.1000 驅動程式版本。
解決的問題︰
-
Proxy 伺服器連線問題 – 在沒有根憑證的情況下使用 Proxy 伺服器時,連接器無法建立連線。
如需詳細資訊,以及下載 ODBC 1.x 驅動程式、版本備註和文件,請參閱 Athena ODBC 1.x 驅動程序。
JDBC 2.1.5 驅動程式
JBDC Athena 的 2.1.5 驅動程式版本。
更新和增強功能:
-
更新 AWS Java SDK 以使用 1.12.687 版。
-
更新了 Jackson 程式庫以使用 2.16.0 版。
-
更新 Logback 程式庫以使用 1.3.14 版。
如需詳細資訊,以及下載 JDBC 2.x 驅動程式、版本備註和文件,請參閱 Athena JDBC 2.x 驅動程式。
2024 年 4 月 8 日
發佈 2024-04-08
Athena 宣佈推出ODBC驅動程式 2.0.3.0 版。如需詳細資訊,請參閱 2.0.3.0 版本備註。若要下載新的 ODBC v2 驅動程式,請參閱 ODBC 2.x 驅動程式下載。如需連線資訊,請參閱 Amazon Athena ODBC 2.x。
2024 年 3 月 15 日
發佈 2024-03-18
Amazon Athena 宣佈 SQL Athena 在加拿大西部 (卡加利) 區域推出。
如需每個 中 AWS 服務 可用 的完整清單 AWS 區域,請參閱AWS 依區域 提供服務
2024 年 2 月 15 日
發佈 2024-02-15
Athena 發行JDBC驅動程式 3.1.0 版。
Amazon Athena JDBC驅動程式 3.1.0 版新增了對 Microsoft Active Directory Federation Services (AD FS) Windows 整合身分驗證和表單型身分驗證的支援。3.1.0 版本也包含其他次要改進和錯誤修正。
若要下載 JDBC v3 驅動程式,請參閱 JDBC 3.x 驅動程式下載。
2024 年 1 月 31 日
發佈 2024-01-31
Athena 發布了下列功能以及強化功能。
-
Hudi 升級 – 您現在可以使用 Athena SQL查詢 Hudi 0.14.0 資料表。如需使用 Athena SQL查詢 Hudi 資料表的相關資訊,請參閱 查詢阿帕奇胡迪數據集。
2023 年 Athena 版本備註
2023 年 12 月 14 日
2023-12-14 發布者
Athena 發布下列修復和改善。
Athena 發行JDBC驅動程式 2.1.3 版。驅動程式可解決下列問題:
-
改進了日誌記錄,以避免與 Spring Boot 和 Gradle 應用程式日誌記錄發生衝突。
-
使用
executeBatch()
JDBC方法插入記錄時,驅動程式錯誤地僅插入一個記錄。由於 Athena 不支援批次執行查詢,驅動程式現在會在您使用executeBatch()
時報告錯誤。若要解決該限制,您可在迴圈中提交單一查詢。
若要下載新的JDBC驅動程式、版本備註和文件,請參閱 Athena JDBC 2.x 驅動程式。
2023 年 12 月 9 日
2023-12-09 發布
已發行 Athena 的 ODBC 1.2.1.1000 驅動程式。
功能和增強功能:
-
更新RStudio支援 – ODBC驅動程式現在支援 RStudio macOS 。
-
單一型錄和結構描述支援 – 連接器現在可以傳回單一型錄和結構描述。如需詳細資訊,請參閱可下載的安裝和設定指南。
解決的問題︰
-
準備好的陳述式 – 執行含有參數陣列 (使用欄式結構描述) 的準備好的陳述式時,連接器會傳回不正確的查詢結果。
-
資料欄大小 – 選取
$file_modified_time
系統資料欄時,連接器傳回不正確的資料欄大小。 -
SQLPrepare – 在
SELECT
查詢SQLPrepare
中繫結與 相關的參數時,連接器傳回錯誤。
如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱Athena ODBC 1.x 驅動程序。
2023 年 12 月 7 日
2023-12-07 發布
Athena 宣佈推出ODBC驅動程式 2.0.2.1 版。如需詳細資訊,請參閱 2.0.2.1 版本備註。若要下載新的 ODBC v2 驅動程式,請參閱 ODBC 2.x 驅動程式下載。如需連線資訊,請參閱 Amazon Athena ODBC 2.x。
2023 年 12 月 5 日
2023-12-05 發布
您現在可以建立使用 AWS IAM Identity Center 身分驗證模式的 Athena SQL工作群組。這些工作群組支援 Identity Center 的受信任IAM身分傳播功能。受信任的身分傳播允許在 Amazon Athena 和 Amazon EMR Studio 等 AWS 分析服務中使用身分。
如需詳細資訊,請參閱使用已啟用IAM身分識別中心的 Athena。
2023 年 11 月 28 日
2023-11-28 發布
您現在可在Amazon S3 Express 單區域儲存類別
如需詳細資訊,請參閱查詢 S3 Express One Zone 資料。
2023 年 11 月 27 日
2023-11-27 發布
Athena 發布了下列功能以及強化功能。
-
Glue Data Catalog 檢視 – Glue Data Catalog 檢視提供 Amazon Athena 和 Amazon Redshift 等 AWS 服務的單一通用檢視。在 Glue Data Catalog 檢視中,存取許可由建立檢視的使用者定義,而不是查詢檢視的使用者。這些檢視提供更大的存取控制權、協助確保完整的記錄、提供增強的安全性,以及防止存取基礎資料表。
如需詳細資訊,請參閱在 Athena 中使用 Data Catalog 檢視。
-
CloudTrail Lake 支援 – 您現在可以使用 Amazon Athena 分析 AWS CloudTrail Lake 中的資料。 AWS CloudTrail Lake 是 的受管資料湖 CloudTrail ,可用於彙總、固定儲存和分析活動日誌,以進行稽核、安全性和操作調查。若要從 Athena 查詢 CloudTrail Lake 活動日誌,您不需要移動資料或建置個別的資料處理管道。不需要ETL任何操作。
若要開始使用,請在 CloudTrail Lake 中啟用資料聯合。當您與 共用 CloudTrail Lake 事件資料存放區中繼資料時 AWS Glue Data Catalog, 會 CloudTrail 建立必要的 AWS Glue Data Catalog 資源,並將資料註冊至 AWS Lake Formation。在 Lake Formation 中,您可以指定可使用 Athena 查詢事件資料儲存的使用者和角色。
如需詳細資訊,請參閱《AWS CloudTrail 使用者指南》中的啟用 Lake 查詢聯合。
2023 年 11 月 17 日
2023-11-17 發布
Athena 發布了下列功能以及強化功能。
功能
-
成本型最佳化工具 – Athena 使用 的統計資料,宣布成本型最佳化的一般可用性 AWS Glue。若要最佳化 Athena 中的查詢SQL,您可以請求 Athena 收集 中資料表的資料表或資料欄層級統計資料 AWS Glue。如果查詢中的所有資料表都有統計資訊,Athena 會使用這些統計資訊來檢查替代的執行計畫,並選取可能速度最快的執行計畫。
如需詳細資訊,請參閱使用成本最佳化處理程式。
-
Amazon EMR Studio 整合 – 您現在可以在 Amazon EMR Studio 中使用 Athena,而不必直接使用 Athena 主控台。透過 Amazon 中的 Athena 整合EMR,您可以執行下列任務:
-
執行 Athena SQL查詢
-
檢視查詢結果
-
檢視查詢歷史記錄
-
檢視儲存的查詢
-
進行參數化查詢
-
檢視資料目錄的資料庫、資料表和檢視
如需詳細資訊,請參閱 AWS 服務 與 Athena 的集成主題中的 Amazon EMR Studio。
-
-
巢狀存取控制 – Athena 宣布支援針對巢狀資料的 Lake Formation 存取控制。在 Lake Formation 中,您可以在具有
struct
資料類型的巢狀資料欄上定義和套用資料篩選條件。您可以使用資料篩選來限制使用者對巢狀資料欄子結構的存取。如需有關如何為巢狀資料建立資料篩選條件的資訊,請參閱《AWS Lake Formation 開發人員指南》中的建立資料篩選條件。 -
佈建的容量用量指標 – Athena 宣布容量保留的新 CloudWatch 指標。您可以使用新的指標來追蹤DPUs您已佈建的數目,以及查詢DPUs所使用的數目。查詢完成時,您也可以檢視使用的DPUs查詢數目。
如需詳細資訊,請參閱使用 監控 Athena 查詢指標 CloudWatch。
改善項目
-
錯誤訊息變更 –
Insufficient Lake Formation permissions
錯誤訊息現在會讀取Table not found
或Schema not found
。此變更是為了防止惡意行為者從錯誤訊息推斷出資料表或資料庫資源的存在。
2023 年 11 月 16 日
2023-11-16 發布
Athena 發行了新的JDBC驅動程式,可改善從相容SQL開發和商業智慧應用程式連線至、查詢和視覺化資料的體驗。新驅動程式很容易升級。該驅動程式可以直接從 Amazon S3 讀取查詢結果,讓您更快取得查詢結果。
如需詳細資訊,請參閱Athena JDBC 3.x 驅動程式。
2023 年 10 月 31 日
2023-10-31 發布
Amazon Athena 宣布佈建容量的保留時間為 1 小時。從今天開始,您可以保留佈建的容量並在一小時後釋放。這項變更可讓您更輕鬆地針對需求隨時間變化的工作負載,實現成本最佳化。
佈建的容量是 Athena 的一項功能,可提供工作負載管理功能,協助您優先處理、控制和擴展最重要的互動式工作負載。您可以隨時新增容量以增加可同時執行的查詢數量、控制哪些工作負載使用該容量,以及在工作負載之間共用容量。
如需詳細資訊,請參閱管理查詢處理能力。如需定價資訊,請造訪 Amazon Athena 定價
2023 年 10 月 25 日
2023-10-26 發布
Athena 發布了下列修復和改善。
jackson-core 套件 – 數值大於 1000 個字元JSON的文字現在將失敗。此項修復解決了安全性問題 sonatype-2022-6438
2023 年 10 月 17 日
2023-10-17 發布
Athena 宣佈推出ODBC驅動程式 2.0.2.0 版。如需詳細資訊,請參閱 2.0.2.0 版本備註。若要下載新的 ODBC v2 驅動程式,請參閱 ODBC 2.x 驅動程式下載。如需連線資訊,請參閱 Amazon Athena ODBC 2.x。
2023 年 9 月 26 日
2023-09-26 發布
Athena 發布了下列功能以及改善項目。
-
適用於 Delta Lake 資料表的 Lake Formation 讀取支援。如需有關將 Delta Lake 資料表與 Athena 配合使用的詳細資訊,請參閱 查詢 Linux 基礎三角洲湖表。
2023 年 8 月 23 日
2023-08-23 發布
Amazon Athena 宣佈 SQL Athena 在以色列 (特拉維夫) 區域推出。
如需每個 中 AWS 服務 可用 的完整清單 AWS 區域,請參閱AWS 依區域 提供服務
2023 年 8 月 10 日
2023-08-10 發布
Athena 發布下列修復和改善。
ODBC 驅動程式 2.0.1.1 版
Athena 宣佈推出ODBC驅動程式 2.0.1.1 版。如需詳細資訊,請參閱 2.0.1.1 版本備註。若要下載新的 ODBC v2 驅動程式,請參閱 ODBC 2.x 驅動程式下載。如需連線資訊,請參閱 Amazon Athena ODBC 2.x。
JDBC 驅動程式 2.1.1 版
Athena 發行JDBC驅動程式 2.1.1 版。驅動程式可解決下列問題:
-
使用包含規則表達式的陳述式建立資料表時發生的錯誤。
-
造成
ApplicationName
連線參數套用不正確的問題。
若要下載新的JDBC驅動程式、版本備註和文件,請參閱 Connect 到 Amazon Athena JDBC。
2023 年 7 月 31 日
2023-07-31 發布
Amazon Athena 宣佈 Athena 在其他 SQL中的可用性 AWS 區域。
此版本擴展了 Athena 的可用性SQL,包括亞太區域 (海德拉巴)、亞太區域 (墨爾本)、歐洲 (西班牙) 和歐洲 (蘇黎世)。
如需每個 中 AWS 服務 可用 的完整清單 AWS 區域,請參閱AWS 依區域 提供服務
2023 年 7 月 27 日
2023-07-27 發布
Athena 發行 Google BigQuery 連接器版本 2023.30.1。此版本的連接器可減少查詢執行時間,並新增針對 BigQuery私有端點查詢的支援。
如需 Google BigQuery 連接器的相關資訊,請參閱 Amazon Athena 谷歌 BigQuery 連。如需有關更新現有資料來源連接器的資訊,請參閱 更新資料來源連接器。
2023 年 7 月 24 日
2023-07-24 發布
Athena 發布下列修復和改善。
-
含聯集的查詢 – 改善含聯集的特定查詢的效能。
-
聯結類型比較 – 修正了包含兩種不同類型之間比較的
JOIN
陳述式的潛在查詢失敗。 -
巢狀資料欄上的子查詢 – 修正了當子查詢與巢狀資料欄相關聯時,與查詢失敗相關的問題。
-
Iceberg 檢視 – 修正了 Apache Iceberg 檢視中時間戳記欄精度的相容性問題。現在,無論資料欄是在 Athena 引擎版本 2 還是 Athena 引擎版本 3 上建立的,具有時間戳記欄的 Iceberg 檢視皆可讀取。
2023 年 7 月 20 日
2023-07-20 發布
Athena 發行JDBC驅動程式 2.1.0 版。該驅動程式包含新的增強功能並解決了問題。
增強功能
下列 Jackson
-
jackson-annotations 2.15.2 (先前為 2.14.0)
-
jackson-core 2.15.2 (先前為 2.14.0)
-
jackson-databind 2.15.2 (先前為 2.14.0)
已解決問題
-
修正使用 sql2o
程式庫時傳遞陣列參數的問題。
如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena JDBC。
2023 年 7 月 13 日
2023-09-19 發布
Athena 發布了下列功能以及強化功能。
-
EXPLAIN ANALYZE – 新增對 輸出的佇列、分析、規劃和執行時間的支援
EXPLAIN ANALYZE
。 -
EXPLAIN –
EXPLAIN
輸出現在會顯示查詢包含彙總時的統計資料。 -
Parquet Hive SerDe – 新增
parquet.ignore.statistics
屬性,以在讀取 Parquet 資料時忽略處理統計資料。如需相關資訊,請參閱 忽略木地板統計。
如需 EXPLAIN
和 EXPLAIN ANALYZE
的更多相關資訊,請參閱使用EXPLAIN和 EXPLAIN ANALYZE Athena。如需 Parquet Hive 的詳細資訊 SerDe,請參閱 木地板 SerDe。
2023 年 7 月 3 日
2023-07-25 發布
截至 2023 年 7 月 3 日,Athena 開始從 CloudTrail 日誌中編輯查詢字串。查詢字串現在的值為 ***OMITTED***
。進行此變更是為了防止意外揭露可能包含敏感資訊的資料表名稱或篩選條件值。如果您先前依賴 CloudTrail 日誌來存取完整的查詢字串,我們建議您使用 Athena::GetQueryExecution
API並從responseElements.queryExecutionId
CloudTrail 日誌傳遞 的值。如需詳細資訊,請參閱 Amazon Athena API參考 中的 GetQueryExecution動作。
2023 年 6 月 30 日
2023-06-30 發布
Athena 查詢編輯器現在支援預先輸入的程式碼建議,以獲得更快的查詢編寫體驗。您現在可以使用下列功能,以增強的準確度和更高的效率撰寫SQL查詢:
-
當您輸入時,將會即時顯示關鍵字、本機變數、程式碼片段和目錄項目。
-
當您輸入資料庫名稱或資料表名稱,並在其後加上一個點時,編輯器會輕鬆顯示可供選擇的資料表和資料欄清單。
-
將滑鼠游標移至程式碼片段建議上時,該概要會顯示程式碼片段語法和用法的簡要概觀。
-
為提高程式碼可讀性,關鍵字及其醒目提示規則也已更新,符合 Trino 和 Hive 的最新語法。
此功能預設為啟用。您可以在程式碼編輯器偏好設定中啟用或停用功能。
若要嘗試 Athena 查詢編輯器中的 typeahead 程式碼建議,請造訪位於 的 Athena 主控台https://console.aws.amazon.com/athena/
2023 年 6 月 29 日
2023-06-29 發布
-
Athena 宣佈推出ODBC驅動程式 2.0.1.0 版。如需詳細資訊,請參閱 2.0.1.0 版本備註。若要下載新的 ODBC v2 驅動程式,請參閱 ODBC 2.x 驅動程式下載。如需連線資訊,請參閱 Amazon Athena ODBC 2.x。
-
Athena 及其功能
現已在中東 (UAE) 區域提供。如需每個 中 AWS 服務 可用 的完整清單 AWS 區域,請參閱AWS 依區域 提供服務 。
2023 年 6 月 28 日
2023-06-28 發布
您現在可以使用 Amazon Athena 查詢從 S3 Glacier Flexible Retrieval (舊稱 Glacier) 和 S3 Glacier Deep Archive Amazon S3 儲存類別中還原的物件。您可基於每個資料表設定此功能。此功能僅支援 Athena 引擎版本 3 上的 Apache Hive 資料表。
如需詳細資訊,請參閱查詢還原的 Amazon S3 冰川物件。
2023 年 6 月 12 日
2023-06-12 發布
Athena 發布下列修復和改善。
-
Parquet Reader 時間戳記 – 新增了對 Parquet Reader
讀取時間戳記為 bigint
(millis) 的支援 此更新提供與 Athena 引擎版本 2 中相同的支援。 -
EXPLAIN ANALYZE – 將實體輸入讀取時間新增至 的查詢統計資料和輸出
EXPLAIN ANALYZE
。如需EXPLAIN ANALYZE
的資訊,請參閱「使用EXPLAIN和 EXPLAIN ANALYZE Athena」。 -
INSERT – 改善使用 寫入 的資料表的查詢效能
INSERT
。如需INSERT
的資訊,請參閱「INSERT INTO」。 -
Delta Lake 資料表 – 已修正 Delta Lake 資料表上
DROP TABLE
的問題,此問題可防止其在並行修改時完全被刪除。
2023 年 6 月 8 日
2023-06-08 發布
Amazon Athena for Apache Spark 發布了下列新版功能。
-
支援自訂 Java 程式庫和組態 – 您現在可以在 Athena 中為 Apache Spark 工作階段使用您自己的 Java 套件和自訂組態。使用 Spark 屬性透過 Athena 主控台、 或 Athena 指定
.jar
檔案 AWS CLI、套件或其他自訂組態API。如需詳細資訊,請參閱使用星火屬性來指定自定義配置。 -
支援 Apache Hudi、Apache Iceberg 和 Delta Lake 資料表 – Athena for Spark 現在支援 Apache Iceberg、Apache Hudi 和 Linux Foundation Delta Lake 開放原始碼資料湖儲存資料表格式。如需詳細資訊,請參閱 在 Athena 中使用非蜂巢表格格式進行 Spark 及在 Athena for Spark 中使用 在 Athena 使用阿帕奇冰山表的星火、在 Athena 使用阿帕奇胡迪表的星火 和 在 Athena 使用 Linux 基礎三角洲湖表的星火 資料表的個別主題。
-
Apache Spark 的加密支援 – 在 Athena for Spark 中,您現在可以對 Spark 節點之間傳輸中的資料以及 Spark 儲存在磁碟上的本機靜態資料啟用加密功能。若要啟用 Spark 加密,您可以使用 Athena 主控台、 AWS CLI或 Athena API。如需詳細資訊,請參閱啟用阿帕奇星火加密。
如需有關 Amazon Athena for Apache Spark 的詳細資訊,請參閱 在 Amazon Athena 使用 Apache 星火。
2023 年 6 月 2 日
2023-06-02 發布
您現在可以在 Athena 中刪除容量保留,並使用 AWS CloudFormation 範本來指定 Athena 容量保留。
-
刪除容量保留 – 您現在可以刪除 Athena 中已取消的容量保留。必須先取消保留,然後才可將其刪除。刪除容量保留會立即從您的帳戶中移除保留。刪除的保留無法再被 參考,包括其 ARN。若要刪除保留,您可以使用 Athena 主控台或 Athena API。如需詳細資訊,請參閱 刪除容量保留 Amazon Athena 使用者指南中的 和 Amazon Athena 參考 DeleteCapacityReservation中的 。 Amazon Athena API
-
使用容量保留 AWS CloudFormation 範本 – 您現在可以使用 AWS CloudFormation 範本來使用
AWS::Athena::CapacityReservation
資源指定 Athena 容量保留。如需詳細資訊,請參閱 AWS CloudFormation 使用者指南中的 AWS::Athena::CapacityReservation。
如需有關使用容量保留在 Athena 佈建容量的詳細資訊,請參閱 管理查詢處理能力。
2023 年 5 月 25 日
2023-05-25 發布
Athena 已發布可改善聯合查詢效能的資料來源連接器更新。全新的下推最佳化和動態篩選功能,可在來源資料庫 (而非 Athena) 中執行更多作業。這些最佳化可降低查詢執行期和減少掃描的資料量。這些改進需要 Athena 引擎版本 3。
下列連接器已更新:
如需有關升級資料來源連接器的資訊,請參閱 更新資料來源連接器。
2023 年 5 月 18 日
2023-05-18 發布
您現在可以將 AWS PrivateLink 用於 IPv6 Amazon Athena 的傳入連線。
Amazon Athena 已透過網際網路通訊協定第 6 版 (IPv6) 端點擴充對傳入連線的支援,以包含 AWS PrivateLink
網路的快速成長耗盡了網際網路通訊協定第 4 版 (IPv4) 地址的可用性。IPv6 會多次增加可用地址的數量,因此您不再需要管理 中的重疊地址空間VPCs。透過此版本,您現在可以將IPv6解決的優勢與 的安全性和效能優勢相結合 AWS PrivateLink。
若要以程式設計方式連線至 AWS 服務,您可以使用 AWS CLI
2023 年 5 月 15 日
2023-05-15 發布
Athena 宣布推出 DynamoDB 、 CloudWatch Logs、 CloudWatch Metrics 和 的 Apache Spark DataSourceV2 (DSV2) 連接器 AWS CMDB。使用新的DSV2連接器,使用 Spark 查詢這些資料來源。DSV2 連接器使用與其對應的 Athena 聯合連接器相同的參數。DSV2 連接器直接在 Spark 工作者上執行,不需要部署 Lambda 函數即可使用。
如需詳細資訊,請參閱使用 Apache 星火的資料來源連接器。
2023 年 5 月 10 日
2023-05-10 發布
已發行 Athena 的 ODBC 1.1.20 驅動程式。
功能和增強功能:
-
Lake Formation 端點覆寫支援。
-
ADFS 身分驗證外掛程式具有用於設定 Relying Party 值 () 的新參數
LoginToRP
。 -
AWS 程式庫更新。
錯誤修正:
-
當
SQLPrepare()
方法提交失敗時,準備好的陳述式解除配置失敗。 -
將 C 類型轉換為 類型時,繫結預備陳述SQL式參數時發生錯誤。
-
當
EXPLAIN
和EXPLAIN ANALYZE
查詢使用SQLPrepare()
和SQLExecute()
時,無法傳回資料。
如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena ODBC。
2023 年 5 月 8 日
2023-05-08 發布
Athena 發布下列修復和改善。
-
更新了 Hudi 整合 – Athena 更新了其與 Apache Hudi 的整合。您現在可以使用 Athena 查詢 Hudi 0.12.2 資料表,且現在支援 Hudi 資料表的 Hudi 中繼資料清單。如需詳細資訊,請參閱 查詢阿帕奇胡迪數據集 及 使用 Hudi 中繼資料以改善效能。
-
時間戳記轉換修正 – 將時間戳記轉換的處理修正為精確度較低的資料類型。先前,Athena 引擎第 3 版錯誤地將值四捨五入為目標類型,而不是在轉換期間予以截斷。
下列範例說明了修正之前的不正確處理。
範例 1:從時間戳記 (以微秒為單位) 轉換為毫秒
範例資料
A, 2020-06-10 15:55:23.383 B, 2020-06-10 15:55:23.382 C, 2020-06-10 15:55:23.383345 D, 2020-06-10 15:55:23.383945 E, 2020-06-10 15:55:23.383345734 F, 2020-06-10 15:55:23.383945278
下列查詢會嘗試擷取符合特定值的時間戳記。
SELECT * FROM table WHERE timestamps.col = timestamp'2020-06-10 15:55:23.383'
此查詢已傳回下列結果。
A, 2020-06-10 15:55:23.383 C, 2020-06-10 15:55:23.383 E, 2020-06-10 15:55:23.383
在修正之前,Athena 沒有包含值
2020-06-10 15:55:23.383945
或2020-06-10 15:55:23.383945278
,因為它們已四捨五入為2020-06-10 15:55:23.384
。範例 2:從時間戳記轉換至最新
下列查詢已傳回錯誤的結果。
SELECT date(timestamp '2020-12-31 23:59:59.999')
結果
2021-01-01
在修正之前,Athena 將值四捨五入,因此這一天有所進展。這些值現被截斷,而不是四捨五入。
2023 年 4 月 28 日
2023-04-28 發布
您現在可以在 Amazon Athena 上使用容量保留,在完全受管的運算容量上執行SQL查詢。
佈建的容量可聽工作負載管理功能,協助您優先處理序、控制和擴展最重要的互動式工作負載。您可以隨時新增容量以增加可同時執行的查詢數量、控制哪些工作負載使用該容量,以及在工作負載之間共用容量。
如需詳細資訊,請參閱管理查詢處理能力。如需定價資訊,請造訪 Amazon Athena 定價
2023 年 4 月 17 日
2023-04-17 發布
Athena 發行JDBC驅動程式 2.0.36 版。該驅動程式包含新的功能並解決了問題。
新功能
-
您現在可以搭配使用可自訂的依賴方識別符與 AD FS 身分驗證。
-
您現在可以將使用連接器的應用程式名稱新增至使用者代理程式字串。
已解決問題
-
修正使用
getSchema()
擷取不存在的結構描述時發生的錯誤。
如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena JDBC。
2023 年 4 月 14 日
2023-06-20 發布
Athena 發布下列修復和改善。
-
當您將字串轉換為時間戳時,日期和時間或時區之間需要一個空格。如需詳細資訊,請參閱從字串轉換為時間戳記時,日期和時間值之間需要的空格。
-
移除時間戳記精確度處理方式的重大變更。為了維持 Athena 引擎版本 2 和 Athena 引擎版本 3 之間的一致性,時間戳記精確度現在預設為毫秒 (而非微秒)。
-
Athena 現在會在執行查詢時持續強制執行查詢輸出儲存貯體的存取權。請確保執行StartQueryExecution動作的所有IAM主體都具有查詢輸出儲存貯體的 S3:GetBucketLocation 許可。
2023 年 4 月 4 日
2023-04-04 發布
您現已可用 Amazon Athena 來建立和查詢聯合資料來源上的檢視。使用單一聯合檢視來查詢多個外部資料表或資料子集。這可簡化SQL必要的 ,並讓您靈活地將資料來源從必須使用 SQL 來查詢資料的終端使用者混淆。
2023 年 3 月 30 日
2023-03-30 發布
Amazon Athena 宣佈在其他 AWS 區域推出 Amazon Athena for Apache Spark。
此版本擴展了 Amazon Athena for Apache Spark 的可用性,包括亞太區域 (孟買)、亞太區域 (新加坡)、亞太區域 (雪梨) 和歐洲 (法蘭克福)。
如需有關 Amazon Athena for Apache Spark 的詳細資訊,請參閱 在 Amazon Athena 使用 Apache 星火。
2023 年 3 月 28 日
2023-03-28 發布
Athena 發布下列修復和改善。
-
在對
GetQueryExecution
和BatchGetQueryExecution
Athena API動作的回應中,新subStatementType
欄位會顯示執行的查詢類型 (例如SELECT
、、INSERT
UNLOAD
、CREATE_TABLE
或CREATE_TABLE_AS_SELECT
)。 -
已修正 Apache Hive 寫入作業未正確加密資訊清單檔案的錯誤。
-
Athena 引擎版本 3 現在可以正確處理
approx_percentile
函數中的NaN
和Infinity
值。approx_percentile
函數會傳回給定百分比的資料集的近似百分位數。Athena 引擎版本 2 錯誤地將
NaN
視為大於Infinity
的值。Athena 引擎版本 3 現在會根據其他分析和統計函數中度這些值的處理方式來處理NaN
和Infinity
。以下幾點更詳細地說明了新行為。-
如果
NaN
在資料集中存在,則 Athena 會傳回NaN
。 -
如果
NaN
不存在,但Infinity
存在,Athena 會將Infinity
視為一個非常大的數值。 -
如果存在多個
Infinity
值,Athena 會將它們視為相同的非常大的數值。如有必要,Athena 會輸出Infinity
。 -
如果單一資料集同時具有
Infinity
和-Double.MAX_VALUE
,且百分位數結果為-Double.MAX_VALUE
,Athena 便會傳回-Infinity
。 -
如果單一資料集同時具有
Infinity
和Double.MAX_VALUE
,且百分位數結果為Double.MAX_VALUE
,Athena 便會傳回Infinity
。 -
若要從計算中排除
Infinity
和NaN
,請使用is_finite()
函數,如下列範例所示。approx_percentile(x, 0.5) FILTER (WHERE is_finite(x))
-
2023 年 3 月 27 日
2023-03-27 發布
您現在可以在 Amazon Athena 中指定 Athena SQL工作群組的最低加密層級。此功能可確保 Athena SQL工作群組中所有查詢的結果,都會以您指定的加密層級加密,或高於您指定的加密層級。您可以選擇多種層級的加密強度來保護您的資料。若要設定所需的最低加密層級,您可以使用 Athena 主控台、 AWS CLI、 API或 SDK。
最低加密功能不適用於已啟用 Apache Spark 的工作群組。如需詳細資訊,請參閱規劃工作群組的最低加密。
2023 年 3 月 17 日
2023-03-17 發布
Athena 發布下列修復和改善。
-
已修正 Amazon Athena DynamoDB 連接器的問題,導致查詢失敗,且錯誤訊息
KeyConditionExpressions 必須每個金鑰只包含一個條件
。此問題是因為 Athena 引擎版本 3 能夠比 Athena 引擎版本 2 下推更多類型的述詞。在 Athena 引擎版本 3 中,類似
some_column LIKE 'someprefix%
的子句會被下推為在指定資料欄上套用下限和上限的篩選條件述詞。Athena 引擎版本 2 沒有下推這些述詞。在 Athena 引擎版本 3 中,如果some_column
是排序索引鍵資料欄,引擎會將篩選條件述詞下推至 DynamoDB 連接器。接著,篩選條件述詞會進一步下推至 DynamoDB 服務。由於 DynamoDB 在排序索引鍵上不支援多個篩選條件,因此 DynamoDB 會傳回錯誤。若要修正此問題,請將您的 Amazon Athena DynamoDB 連接器更新至 2023.11.1 版。如需有關更新連接器的說明,請參閱 更新資料來源連接器。
2023 年 3 月 8 日
2023-03-08 發布
Athena 發布下列修復和改善。
-
修正聯合查詢的問題,該問題會造成時間戳記述詞值以微秒而非毫秒傳送。
2023 年 2 月 15 日
2023-02-15 發布
Athena 發布下列修復和改善。
2023 年 1 月 31 日
2023 年 1 月 31 日發布
您現在可使用 Amazon Athena 在 Google Cloud Storage 中查詢資料。與 Amazon S3 一樣,Google Cloud Storage 是一項受管服務,可將資料存放在儲存貯體中。使用適用於 Google Cloud Storage 的 Athena 連接器,對外部資料執行互動式聯合查詢。
如需詳細資訊,請參閱Amazon Athena Google Cloud Storage 連接器。
2023 年 1 月 20 日
2023 年 1 月 20 日發布
您現在可以查看 Athena 壓縮支援的擴充文件。已針對 Hive 資料表壓縮、Iceberg 資料表壓縮 和 ZSTD壓縮層級 新增單獨主題。
如需詳細資訊,請參閱在 Athena 使用壓縮。
2023 年 1 月 3 日
2023-01-03 發布
Athena 發布下列更新:
-
Hive 中繼存放區的其他命令 – 您可以使用 Athena 連線到自我管理的 Apache Hive 中繼存放區作為中繼資料目錄,並查詢存放在 Amazon S3 中的資料。在此版本中,您可以使用
CREATE TABLE AS
(CTAS)INSERT INTO
、 和 12 個額外的 Data Definition Language (DDL) 命令與 Apache Hive Metastore 互動。您可以使用此擴充SQL的功能集,直接從 Athena 管理您的 Hive Metastore 結構描述。如需詳細資訊,請參閱使用外部蜂巢元存儲。
-
JDBC 驅動程式 2.0.35 版 – Athena 發行JDBC驅動程式 2.0.35 版。2.0.35 JDBC 驅動程式包含下列更新:
-
驅動程式現在會針對 Jackson JSON 剖析器使用下列程式庫。
-
jackson-annotations 2.14.0 (先前為 2.13.2)
-
jackson-core 2.14.0 (先前為 2.13.2)
-
jackson-databind 2.14.0 (先前為 2.13.2.2)
-
-
已停止支援 4.1 JDBC版。
如需詳細資訊並且要下載新的驅動程式、版本備註和文件,請參閱 Connect 到 Amazon Athena JDBC。
-
2022 年 Athena 版本備註
2022 年 12 月 14 日
2022-12-14 發布
您現在可以使用 Amazon Athena 連接器讓 Kafka 對串流資料執行SQL查詢。例如,您可以在 Amazon Managed Streaming for Apache Kafka (Amazon MSK) 中對即時串流資料執行分析查詢,並將其與 Amazon S3 中資料湖中的歷史資料聯結。
適用於 Kafka 的 Amazon Athena 連接器支援多個串流引擎的查詢。您可以使用 Athena 在 Amazon MSK佈建的無伺服器叢集、自我管理的 Kafka 部署和 Confluent Cloud 中的串流資料上執行SQL查詢。
如需詳細資訊,請參閱Amazon Athena MSK 連接器。
2022 年 12 月 2 日
2022-12-02 發布
Athena 發行JDBC驅動程式 2.0.34 版。2.0.34 JDBC 驅動程式包含下列新功能和已解決的問題:
-
查詢結果重複使用支援 – 您現在可以在指定的時間限制內重複使用先前執行的查詢的結果,而不是讓 Athena 在每次執行查詢時重新計算結果。如需詳細資訊,請參閱安裝和組態指南,可從JDBC下載頁面 和 取得在 Athena 中重複使用查詢。
-
Ec2InstanceMetadata support – JDBC驅動程式現在支援使用IAM執行個體設定檔 的 Ec2InstanceMetadata 身分驗證方法。
-
基於字元的里外狀況修正 – 修正了查詢包含某些語言字元時發生的例外狀況。
-
漏洞修正 – 修正與連接器封裝的 AWS 相依性相關的漏洞。
如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena JDBC。
2022 年 11 月 30 日
2022-11-30 發布
您現在可以在 Athena 上以互動方式建立和執行 Apache Spark 應用程式和與 Jupyter 相容的筆記本。使用 Spark 在 Athena 上執行資料分析,而不必規劃、設定或管理資源。提交 Spark 程式碼進行處理並直接接收結果。在 Amazon Athena 主控台中使用筆記本的簡化體驗,以使用 Python 或 使用 Athena 筆電 APIs 開發 Apache Spark 應用程式。
Amazon Athena 上的 Apache Spark 是無伺服器,並提供自動的隨需擴展,可提供即時啟動運算,以滿足不斷變化的資料量和處理需求。
如需詳細資訊,請參閱在 Amazon Athena 使用 Apache 星火。
2022 年 11 月 18 日
2022-11-18 發布
您現在可以使用IBM適用於 Db2 的 Amazon Athena 連接器從 Athena 查詢 Db2。例如,您可以在 Db2 上的資料倉儲和 Amazon S3 中的資料湖上執行分析查詢。
Amazon Athena Db2 連接器透過 Lambda 環境變數公開數個組態選項。如需有關組態選項、參數、連接字串、部署和限制的詳細資訊,請參閱 Amazon Athena IBM Db2 連接器。
2022 年 11 月 17 日
2022-11-17 發布
Athena 引擎版本 3 的 Apache Iceberg 支援現在提供下列增強型ACID交易功能:
-
ORC 和 Avro 支援 – 使用 Apache Avro
和 Apache ORC 資料列和資料欄型檔案格式建立 Iceberg 資料表。對這些格式的支援即為對 Parquet 現有支援的補充。 -
MERGE INTO – 使用
MERGE INTO
命令來有效率地合併大規模資料。 將INSERT
、UPDATE
和DELETE
操作MERGE INTO
合併為一個交易。這可減少資料管道的處理負荷,且SQL寫入所需時間更短。如需詳細資訊,請參閱 更新冰山表數據 和 合併為。 -
CTAS 和 VIEW支援 – 搭配 Iceberg 資料表使用
CREATE TABLE AS SELECT
(CTAS) 和CREATE VIEW
陳述式。如需詳細資訊,請參閱 CREATE TABLE AS 和 CREATE VIEW 以及 CREATE DIALECT VIEW。 -
VACUUM 支援 – 您可以使用
VACUUM
陳述式刪除不再需要的快照和資料,以最佳化您的資料湖。您可以使用此功能來改善讀取效能,並符合法規要求,例如 GDPR。如需詳細資訊,請參閱 優化冰山表 和 VACUUM。
這些新功能需要 Athena 引擎版本 3,並且適用於支援 Athena 的所有區域。您可以搭配 Athena 主控台
如需有關在 Athena 中使用 Iceberg 的詳細資訊,請參閱 查詢 Apache Iceberg 資料表。
2022 年 11 月 14 日
2022-11-14 發布
Amazon Athena 現在支援端點用於傳入連線,您可以使用這些IPv6連線透過 叫用 Athena 函數IPv6。您可以使用此功能來滿足IPv6合規要求。它也不需要額外的聯網設備來處理 IPv4和 之間的地址轉換IPv6。
若要使用此功能,請將應用程式設定為使用新的 Athena 雙堆疊端點,這同時支援 IPv4和 IPv6。雙堆疊端點使用該格式 athena.
。例如,美國東部 (維吉尼亞北部) 區域的雙堆疊端點是 region
.api.awsathena.us-east-1.api.aws
。
當您向雙堆疊 Athena 端點提出請求時,該端點會根據網路和用戶端使用的通訊協定解析為 IPv6或 IPv4地址。若要以程式設計方式連線至 AWS 服務,您可以使用 AWS CLI
如需有關服務端點的詳細資訊,請參閱 AWS 服務端點。若要進一步了解 Athena 的服務端點,請參閱 AWS 文件中的 Amazon Athena 端點和配額。
您可以使用新的 Athena 雙堆疊端點進行傳入連線,且無需額外付費。雙堆疊端點通常可用於所有 AWS 區域。
2022 年 11 月 11 日
2022-11-11 發布
Athena 發布下列修復和改善。
-
擴充的 Lake Formation 精細存取控制 – 您現在可以在 Athena 查詢中對以任何支援檔案或資料表格式儲存的資料使用 AWS Lake Formation
精細存取控制政策。您可以在 Lake Formation 中使用精細存取控制,使用資料篩選條件來限制對查詢結果中資料的存取,從而達到資料欄層級、資料列層級和儲存格層級安全性。在 Athena 中支援的資料表格式包括 Apache Iceberg、Apache Hudi 和 Apache Hive。Athena 支援的所有區域均提供擴充的精細存取控制功能。擴充的資料表和檔案格式支援需要 Athena 引擎版本 3,這可提供新功能和改進的查詢效能 ,但不會變更您在 Lake Formation 中設定精細存取控制政策的方式。 在 Athena 中使用此擴充的精細存取控制有下列考量:
-
EXPLAIN – Lake Formation 中定義的資料列或儲存格篩選資訊和查詢統計資料資訊不會顯示在
EXPLAIN
和 的輸出中EXPLAIN ANALYZE
。如需有關 Athena 中的EXPLAIN
的詳細資訊,請參閱 使用EXPLAIN和 EXPLAIN ANALYZE Athena。 -
外部 Hive 中繼存放區 – Apache Hive 隱藏資料欄,無法用於精細存取控制篩選,而且精細存取控制不支援 Apache Hive 隱藏系統資料表。如需詳細資訊,請參閱 使用外部蜂巢元存儲 主題中的 考量與限制。
-
查詢統計資料 – 當查詢具有 Lake Formation 中定義的資料列層級篩選條件時,Athena 查詢統計資料不會顯示階段層級輸入和輸出資料列計數和資料大小資訊。如需查看 Athena 查詢統計資料的相關資訊,請參閱 檢視已完成查詢的統計資料和執行詳細和 GetQueryRuntimeStatistics。
-
工作群組 – 同一 Athena 工作群組中的使用者可以看到 Lake Formation 精細存取控制設定為可供工作群組存取的資料。如需有關使用 Athena 查詢向 Lake Formation 註冊的資料的詳細資訊,請參閱 使用 Athena 查詢註冊的資料 AWS Lake Formation。
如需有關在 Lake Formation 中使用精細定義存取控制的詳細資訊,請參閱 AWS 大數據部落格中的使用 AWS Lake Formation管理精細定義存取控制
。 -
-
Athena 聯合查詢 – Athena 聯合查詢現在會保留
struct
物件中欄位名稱的原始大小寫。先前,struct
欄位名稱會自動變成小寫。
2022 年 11 月 8 日
2022-11-08 發布
您現在可以使用查詢結果重複使用快取功能,進而加速 Athena 中的重複查詢。重複查詢與最近提交的SQL查詢相同,會產生相同的結果。當您需要執行相同的多個查詢時,結果重複使用快取可以減少產生結果所需的時間。結果重複使用快取也會減少掃描的位元組數,進而降低成本。
如需詳細資訊,請參閱在 Athena 中重複使用查詢。
2022 年 10 月 13 日
2022 年 10 月 13 日發布
Athena 宣布推出 Athena 引擎版本 3。
Athena 已升級其SQL查詢引擎,以包含 Trino
如需詳細資訊,請參閱Athena 引擎版本 3。
2022 年 10 月 10 日
2022 年 10 月 10 日發布
Athena 發行JDBC驅動程式 2.0.33 版。2.0.33 JDBC 驅動程式包含下列變更:
-
新的驅動程式版本、JDBC版本和外掛程式名稱屬性已新增至憑證提供者類別中的使用者代理字串。
-
錯誤訊息已更正且新增了必要的資訊。
-
現在,如果連線關閉或 Athena 的預備陳述式執行失敗,則系統會取消配置預備陳述式。
如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena JDBC。
2022 年 9 月 23 日
2022 年 9 月 26 日發布
Amazon Athena Neptune 連接器現在支援不區分大小寫的資料欄和資料表名稱比對。
-
Neptune 資料來源連接器可以解析 Neptune 資料表上使用大小寫的資料欄名稱,即使 AWS Glue中資料表的資料欄名稱都是小寫也一樣。若要啟用此行為,請在 Neptune 連接器 Lambda 函數上將
enable_caseinsensitivematch
環境變數設定為true
。 -
由於 僅 AWS Glue 支援小寫資料表名稱,因此當您為 Neptune 建立 AWS Glue 資料表時,請指定 AWS Glue 資料表參數
"glabel" =
。table_name
如需有關 Neptune 連接器的詳細資訊,請參閱 Amazon Athena Neptune 連接器。
2022 年 9 月 13 日
2022 年 9 月 13 日發布
Athena 發布下列修復和改善。
-
外部 Hive 中繼存放區 – 當
WHERE
子句包含不存在於外部 Hive 中繼存放區 () 的分割區時,Athena 現在會傳回,NULL
而不是擲回例外狀況EHMS。新行為符合 AWS Glue Data Catalog的行為。 -
參數化查詢 - 參數化查詢中的值現在可轉換為
DOUBLE
資料類型。 -
Apache Iceberg - 在 Amazon S3 儲存貯體中啟用 Object Lock (物件鎖定) 時,對 Iceberg 資料表的寫入操作現在會成功。
2022 年 8 月 31 日
2022 年 8 月 31 日發布
Amazon Athena 宣佈 Athena 及其功能
此版本擴展了 Athena 在亞太區域的可用性,以包含亞太區域 (香港)、亞太區域 (雅加達)、亞太區域 (孟買)、亞太區域 (大阪)、亞太區域 (首爾)、亞太區域 (新加坡)、亞太區域 (新加坡)、亞太區域 (雪梨) 和亞太區域 (東京)。如需在這些和其他區域中的可用 AWS 服務 完整清單,請參閱 AWS 區域區域服務清單
2022 年 8 月 23 日
2022-08-23 發布
Athena Query Federation 的 2022.32.1
-
已新增對 Amazon Athena Oracle 資料來源連接器的支援,以用於 Amazon RDS執行個體的 SSL型連線。支援僅限於 Transport Layer Security (TLS) 通訊協定,以及用戶端對伺服器的身分驗證。由於 Amazon 不支援相互身分驗證RDS,因此更新不包含對相互身分驗證的支援。
如需詳細資訊,請參閱Amazon Athena Oracle 連接器。
2022 年 8 月 3 日
2022-08-03 發布
Athena 發行JDBC驅動程式 2.0.32 版。2.0.32 JDBC 驅動程式包含下列變更:
-
傳送至 Athena 的
User-Agent
字串SDK已延伸,以包含驅動程式版本、JDBC規格版本和身分驗證外掛程式的名稱。 -
修正未提供任何
CheckNonProxyHost
參數值時,系統擲回的NullPointerException
。 -
已修正在身分驗證外掛程式中
login_url
BrowserSaml剖析 的問題。 -
修正
UseProxyforIdp
參數設為true
時所發生的代理主機問題。
如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena JDBC。
2022 年 8 月 1 日
2022-08-01 發布
Athena 宣佈改進 Athena Query Federation SDK和 Athena 預先建置的資料來源連接器。改善項目包括:
-
結構化剖析 –
GlueFieldLexer
修正 Athena Query Federation 中的剖析問題SDK,以防止某些複雜的結構顯示其所有資料。此問題影響 Athena Query Federation 上建置的連接器SDK。 -
AWS Glue 資料表 – 新增了對資料表中 AWS Glue
set
和decimal
資料欄類型的額外支援。 -
DynamoDB 連接器 – 新增了忽略 DynamoDB 屬性名稱上大小寫的功能。如需詳細資訊,請參閱 Amazon Athena DynamoDB 連接器 頁面之 參數 區段的
disable_projection_and_casing
。
如需詳細資訊,請參閱 上的 Athena Query Federation 版本 v2022.30.2
2022 年 7 月 21 日
2022-07-21 發布
您現在可以在 Athena 主控台中使用效能指標和互動式視覺化查詢分析工具來對您的查詢進行分析和除錯。查詢效能資料和執行詳細資訊可協助您找出查詢中的瓶頸、檢查每個查詢階段的運算子和統計資料、追蹤階段之間流動的資料量,以及驗證查詢述詞的影響。您現在可以:
-
只要按一下,即可存取您查詢的分散式和邏輯執行計劃。
-
在階段執行之前,探索每個階段的操作。
-
使用在佇列、規劃和執行階段所花費時間的指標,將已完成查詢的效能視覺化。
-
針對您的查詢所處理和輸出的資料列數和來源資料數量,取得相關資訊。
-
查看以情境呈現並採用互動式圖形格式的查詢的精細執行詳細資訊。
-
使用精確的階段層級執行詳細資訊,來了解查詢過程中的資料流。
-
使用新的 以程式設計方式分析查詢效能資料APIs,以取得查詢執行期統計資料 ,也在今天發佈。
若要了解如何在查詢上使用這些功能,請觀看影片教學課程,在 AWS YouTube 頻道上使用新查詢分析工具最佳化 Amazon Athena 查詢
如需說明文件,請參閱 檢視SQL查詢的執行計畫 和 檢視已完成查詢的統計資料和執行詳細。
2022 年 7 月 11 日
2022-07-11 發布
您現在可以直接從 Athena 主控台執行參數化查詢,API無需事先準備SQL陳述式。
當您在 Athena 主控台中執行具有問號形式參數的查詢時,使用者介面現在會提示您直接輸入參數值。如此一來,每次您想要執行查詢時,就不需要在查詢編輯器中修改字面值。
如果您使用增強型查詢執行 API,您現在可以在單一呼叫中提供執行參數及其值。
如需詳細資訊,請參閱本使用者指南中的 使用參數化查詢 以及 AWS
大數據部落格文章Use Amazon Athena parameterized queries to provide data as a service
2022 年 7 月 8 日
2022-07-08 發布
Athena 發布下列修復和改善。
-
修正導致查詢失敗的 SageMaker端點 (UDF) 資料
DATE
欄轉換處理問題。
2022 年 6 月 6 日
2022-06-06 發布
Athena 發行JDBC驅動程式 2.0.31 版。2.0.31 JDBC 驅動程式包含下列變更:
-
log4j 相依性問題 – 已解決因 log4j 相依性所引起的
找不到驅動程式類別
錯誤訊息。
如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena JDBC。
2022 年 5 月 25 日
2022 年 5 月 25 日發布
Athena 發布下列修復和改善。
-
Iceberg 支援
-
推出跨區域查詢支援。現在,您可以在與您正在使用 AWS 區域 的 不同的 中查詢 Iceberg AWS 區域 資料表。中國區域不支援跨區域查詢。
-
推出對伺服器端加密組態的支援。現在您可以使用 SSE-S3/SSE-KMS 加密來自 Amazon S3 中 Iceberg 寫入操作的資料。
如需有關在 Athena 中使用 Apache Iceberg 的詳細資訊,請參閱查詢 Apache Iceberg 資料表。
-
-
JDBC 2.0.30 驅動程式版本
Athena 的 JDBC 2.0.30 驅動程式有下列改進:
-
修復了影響參數化準備陳述式的資料爭用問題。
-
修復了 Gradle 建置環境中發生的應用程式啟動問題。
若要下載 JDBC 2.0.30 驅動程式、版本備註和文件,請參閱 Connect 到 Amazon Athena JDBC。
-
2022 年 5 月 6 日
2022-05-06 發布
已發行 Athena 的 JDBC 2.0.29 和 ODBC 1.1.17 驅動程式。
這些驅動程式包括下列變更:
-
已更新SAML外掛程式瀏覽器啟動程序。
如需有關這些變更以及下載新驅動程式、版本備註和文件的詳細資訊,請參閱Connect 到 Amazon Athena JDBC和Connect 到 Amazon Athena ODBC。
2022 年 4 月 22 日
2022-04-22 發布
Athena 發布下列修復和改善。
-
修正分割區索引和篩選功能
中的問題,其中滿足以下條件時會發生分割快取: -
partition_filtering.enabled
金鑰在 AWS Glue 資料表的資料表屬性true
中設定為 。 -
可以採用不同的分割區篩選條件值多次使用相同的資料表。
-
2022 年 4 月 21 日
2022-04-21 發布
您現在可以使用 Amazon Athena 對新資料來源執行聯合查詢,包括 Google BigQuery、Azure Synapse 和 Snowflake。新的資料來源連接器包括:
如需 Athena 支援的資料來源完整清單,請參閱可用資料來源連接器。
為了更輕鬆地瀏覽可用來源並連接到資料,您現在可以從 Athena 主控台中更新的 Data Sources (資料來源) 螢幕搜尋、排序及篩選可用的連接器。
若要瞭解有關查詢聯合來源的資訊,請參閱 使用 Amazon Athena 聯合查詢 和 使用聯合查詢。
2022 年 4 月 13 日
2022-04-13 發布
Athena 發行JDBC驅動程式 2.0.28 版。2.0.28 JDBC 驅動程式包含下列變更:
-
JWT 支援 – 驅動程式現在支援 JSON Web 權杖 (JWT) 進行身分驗證。如需有關JWT搭配JDBC驅動程式使用 的資訊,請參閱安裝和組態指南,可從JDBC驅動程式頁面 下載。
-
更新的 Log4j 程式庫 – JDBC驅動程式現在使用下列 Log4j 程式庫:
-
Log4j-api 2.17.1 (先前為 2.17.0)
-
Log4j-core 2.17.1 (先前為 2.17.0)
-
Log4j-jcl 2.17.2
-
-
其他改進 – 新驅動程式還包含以下改進和錯誤修正:
-
Athena 準備的陳述式功能現在可透過 使用JDBC。如需預備陳述式的資訊,請參閱使用參數化查詢。
-
Athena JDBC SAML 聯合現已在中國區域起作用。
-
其他次要改進。
-
如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena JDBC。
2022 年 3 月 30 日
2022-03-30 發布
Athena 發布下列修復和改善。
-
跨區域查詢 – 您現在可以使用 Athena 查詢位於 Amazon S3 儲存貯體中的資料, AWS 區域 包括亞太區域 (香港)、中東 (巴林)、非洲 (開普敦) 和歐洲 (米蘭)。中國區域不支援跨區域查詢。
-
如需可用的 AWS 區域 Athena 清單,請參閱 Amazon Athena 端點和配額 。
-
如需啟用預設為停用 AWS 區域 的 的相關資訊,請參閱啟用區域 。
-
如需有關跨區域查詢的資訊,請參閱 跨地區查詢。
-
2022 年 3 月 18 日
2022-03-18 發布
Athena 發布下列修復和改善。
-
動態篩選 – 透過有效地將篩選條件套用於相應資料的每條記錄,改善了整數欄的動態篩選。
-
Iceberg – 修復寫入大於 2GB 的 Iceberg Parquet 檔案時導致故障的問題。
-
未壓縮輸出 – CREATE TABLE陳述式現在支援編寫未壓縮的檔案。若要編寫未壓縮檔案,請使用下列語法:
-
CREATE TABLE (文字檔案或 JSON) – 在 中
TBLPROPERTIES
,指定write.compression = NONE
。 -
CREATE TABLE (Parquet) – 在 中
TBLPROPERTIES
,指定parquet.compression = UNCOMPRESSED
。 -
CREATE TABLE (ORC) – 在 中
TBLPROPERTIES
,指定orc.compress = NONE
。
-
-
壓縮 – 修復了使用非預設壓縮方法時以一種格式建立壓縮檔案,但使用另一種壓縮格式檔案副檔名的文字檔案資料表插入問題。
-
Avro – 修復了從 Avro 檔案讀取固定類型的小數時發生的問題。
2022 年 3 月 2 日
2022-03-02 發布
Athena 發布了下列功能以及強化功能。
2022 年 2 月 23 日
2022-02-23 發布
Athena 發布下列修復和效能改善。
-
記憶體處理改善,以強化效能並減少記憶體錯誤。
-
Athena 現在會讀取存放於條紋頁尾的時區資訊的ORC時間戳記資料欄,並在頁尾中寫入具有時區 (UTC) ORC的檔案。這只會在非ORCUTC時區環境中建立要讀取ORC的檔案時,才會影響時間戳記讀取的行為。
-
修復導致次優查詢計畫的錯誤的符號連結資料表大小估算。
-
現在可以在 Athena 主控台中從 Hive 中繼存放區資料來源查詢橫向展開檢視。
-
改善 Simple Storage Service (Amazon S3) 讀取錯誤訊息,以包含更詳細的 Simple Storage Service (Amazon S3) 錯誤代碼資訊。
-
已修正導致 ORC 格式的輸出檔案與 Apache Hive 3.1 不相容的問題。
-
已修正導致某些 DML和 DDL查詢中具有引號的資料表名稱失敗的問題。
2022 年 2 月 15 日
2022-02-15 發布
Amazon Athena 已增加所有 AWS 區域中的作用中DML查詢配額。作用中查詢包括執行中和佇列中的查詢。透過此變更,您現在可以擁有比以前更多處於作用中狀態的DML查詢。
如需 Athena 服務配額的相關資訊,請參閱Service Quotas。有關使用 Athena 的區域中的查詢配額,請參閱 AWS 一般參考 中的 Amazon Athena 端點和配額。
若要監控配額用量,您可以使用 CloudWatch 用量指標。Athena 在 AWS/Usage
命名空間中發布 ActiveQueryCount
指標。如需詳細資訊,請參閱使用 監控 Athena 用量指標 CloudWatch。
查看您的用量後,您可以使用 Service Quotas
2022 年 2 月 14 日
2022-02-14 發布
此版本會將ErrorType
子欄位新增至 Athena GetQueryExecutionAPI動作中的AthenaError回應物件。
雖然現有的 ErrorCategory
欄位顯示失敗查詢的一般來源 (系統、使用者或其他),但新的 ErrorType
欄位會提供發生的錯誤的更詳細資訊。結合這兩個欄位中的資訊,以取得查詢失敗原因的洞察。
如需詳細資訊,請參閱Athena 錯誤目錄。
2022 年 2 月 9 日
2022-02-09 發布
舊版 Athena 主控台無法再使用。Athena 的新版主控台可支援舊版主控台的所有功能,但具有更好用的新型介面,內含的新功能可改進查詢開發、分析資料和管理使用情況等體驗。若要使用新的 Athena 主控台,請造訪 https://console.aws.amazon.com/athena/
2022 年 2 月 8 日
2022-02-08 發布
預期的儲存貯體擁有者 – 作為新增的安全措施,您現在可以選擇性地指定您預期成為 Athena 中查詢結果輸出位置儲存貯體擁有者的 AWS 帳戶 ID。如果查詢結果儲存貯體擁有者的帳戶 ID 與您在此處指定的 ID 不符,則嘗試輸出到儲存貯體的動作會失敗並產生 Simple Storage Service (Amazon S3) 許可錯誤。您可在客戶端或工作群組層級進行此設定。
如需詳細資訊,請參閱指定查詢結果位置。
2022 年 1 月 28 日
2022-01-28 發布
Athena 推出下列引擎強化功能。
-
Apache Hudi – 在 Hudi 讀取時合併 (MOR) 資料表上的快照查詢現在可以讀取有
INT64
資料類型的時間戳記資料欄。 -
UNION 查詢 – 多次掃描相同資料表的特定
UNION
查詢的效能改善和資料掃描減少。 -
分區查詢 – 篩選條件只使用各分割區資料欄的分區值時提高查詢效能。
-
分割區投影強化功能
-
現在篩選條件已可使用分區值來查詢
injected
類型的資料欄。如需詳細資訊,請參閱注入類型。 -
篩選條件只使用諸如
CHAR
或VARCHAR
等字串型資料欄分區值來進行查詢的效能已經改進。
-
2022 年 1 月 13 日
2022-01-13 發布
已發行 Athena 的 JDBC 2.0.27 和 ODBC 1.1.15 驅動程式。
2.0.27 JDBC 驅動程式包含下列變更:
-
驅動程式已更新,可檢索外部目錄。
-
延伸驅動程式版本編號現在包含在
user-agent
字串中,作為 Athena API呼叫的一部分。
1.1.15 ODBC 驅動程式包含下列變更:
-
透過第二次呼叫
SQLParamData()
來修正問題。
如需有關這些變更以及下載新驅動程式、版本備註和文件的詳細資訊,請參閱Connect 到 Amazon Athena JDBC和Connect 到 Amazon Athena ODBC。
2021 年 Athena 版本備註
2021 年 11 月 26 日
2021-11-26 發布
Athena 宣佈公開預覽 Athena ACID交易,將寫入、刪除、更新和時間行程操作新增至 Athena SQL的資料操作語言 (DML)。Athena ACID交易可讓多個並行使用者對 Amazon S3 資料進行可靠的資料列層級修改。Athena ACID交易以 Apache Iceberg
Athena SQL ACID交易和熟悉的語法可簡化業務和法規資料的更新。例如,若要回應資料清除請求,您可以執行 SQLDELETE
操作。若要進行手動記錄更正,您可以使用單一 UPDATE
陳述式。若要復原最近刪除的資料,您可以使用 SELECT
陳述式發布時間歷程查詢。Athena 交易可透過 Athena 的主控台、API操作ODBC和JDBC驅動程式進行。
如需詳細資訊,請參閱使用 Athena ACID 交易。
2021 年 11 月 24 日
2021-11-24 發布
Athena 宣布支援讀取和寫入ZStandard
如需有關 Athena 中資料壓縮的資訊,請參閱在 Athena 使用壓縮。
2021 年 11 月 22 日
2021-11-22 發布
您現在可以從 Amazon Athena 主控台管理 AWS Step Functions 工作流程,更輕鬆地建置可擴展的資料處理管道、根據自訂商業邏輯執行查詢、自動化管理和提醒任務等。
Step Functions 現已與 Athena 的升級主控台整合在一起,您可以使用它來查看調用 Athena 的狀態機器的互動式工作流程圖。若要開始使用,請在左邊的導覽窗格中選擇工作流程。如果現有的狀態機器具有 Athena 查詢功能,請選擇該狀態機器以查看互動式工作流程圖。如果您是 Step Functions 的新手,一開始可使用 Athena 主控台啟動範例專案並自訂該專案,使其配合您的使用案例的需求。
如需詳細資訊,請參閱使用 Amazon Athena 和 建置和協調ETL管道 AWS Step Functions
2021 年 11 月 18 日
2021-11-18 發布
Athena 發布了新版功能和強化功能。
-
支援 spill-to-disk包含
DISTINCT
、ORDER BY
或兩者的彙總查詢,如下列範例所示:SELECT array_agg(orderstatus ORDER BY orderstatus) FROM orders GROUP BY orderpriority, custkey
-
解決了使用
DISTINCT
的查詢的記憶體處理問題。為了避免在使用DISTINCT
查詢時出現這個規模的查詢用盡了資源
等錯誤訊息,請選擇低基數的DISTINCT
,或是減少查詢的資料大小。 -
不指定特定資料欄的
SELECT COUNT(*)
查詢透過僅保留計數而不使用資料列緩衝提高了效能並改進記憶體使用率。 -
採用了下列字串函數。
-
translate(source, from, to)
– 傳回source
字串,其中包含在from
字串中的字元會替換成to
字串中的對應字元。如果from
字串包含重複項目,則只使用第一個項目。如果from
字串中沒有source
字元,則會複製source
字元而不轉譯。如果檢索出from
字串中的字元大於to
字串的長度,則最後產生的字串會省略該字元。 -
concat_ws(string0, array(varchar))
– 傳回串連的數列,使用string0
作為分隔符號。如果string0
為 NULL,則傳回值為 NULL。會略過數列中的任何 NULL 值。
-
-
修復了因嘗試存取
struct
中缺少的子欄位而發生查詢失敗的錯誤。查詢現在會在缺少子欄位時傳回 NULL 值。 -
修復了小數資料類型雜湊不一致的問題。
-
修復了分割區中資料欄過多而導致資源用盡的問題。
2021 年 11 月 17 日
2021-11-17 發布
Amazon Athena
查詢已分割的資料表時,Athena 會檢索可用的資料表分割區,並篩選出與您的查詢相關的一小部分資料。隨著新資料和分割區的增加,處理分割區需要更長的時間,執行查詢的時間可能會增加。為了最佳化分割區的處理並提高對高度已分割的資料表的查詢效能,Athena 現已支援 AWS Glue 分割區檢索。
如需詳細資訊,請參閱使用 AWS Glue 分區索引和篩選優化查詢。
2021 年 11 月 16 日
2021-11-16 發布
全新和改進的 Amazon Athena
-
使用新版的分頁列來重新排列、導覽或關閉多個查詢索引標籤。
-
透過改進和文字格式,更輕鬆地讀取SQL和編輯查詢。
-
除了下載完整的結果集之外,還可將查詢結果複製到剪貼簿。
-
將查詢的歷史記錄、已儲存的查詢和工作群組加以排序,然後選擇要顯示或隱藏的資料欄。
-
使用簡化的界面,設定資料來源和工作群組所需的點選次數更少。
-
設定用於顯示查詢結果、查詢歷史記錄、換行等功能的偏好設定。
-
利用新的改良版鍵盤快速鍵和嵌入式產品文件提高您的工作效率。
隨著今天的宣佈,新版主控台
如果需要,您可以登入 AWS 帳戶、選擇 Amazon Athena ,然後從左側的導覽面板取消選取新 Athena 體驗,以使用較早的主控台。
2021 年 11 月 12 日
2021-11-12 發布
您現已可用 Amazon Athena 對位於 AWS 帳戶 (非您自己所有) 的資料來源執行聯合查詢。到目前為止,查詢此資料需要資料來源及其連接器使用 AWS 帳戶 與查詢資料的使用者相同的 。
若您是資料管理員,可透過與資料分析師的帳戶共用資料連接器來啟用跨帳戶的聯合查詢。若您是資料分析師,可將資料管理員與您共用的資料連接器加到您的帳戶中。對原始帳戶中連接器的組態變更會自動套用於共用連接器。
如需有關啟用跨帳戶聯合查詢的資訊,請參閱啟用跨帳戶聯合查詢。若要瞭解有關查詢聯合來源的資訊,請參閱 使用 Amazon Athena 聯合查詢 和 使用聯合查詢。
2021 年 11 月 2 日
2021-11-02 發布
您現在可以使用 Athena 中的 EXPLAIN ANALYZE
陳述式來檢視SQL查詢的每個操作的分散式執行計畫和成本。
如需詳細資訊,請參閱使用EXPLAIN和 EXPLAIN ANALYZE Athena。
2021 年 10 月 29 日
2021-10-29 發布
Athena 發行 JDBC 2.0.25 和 ODBC 1.1.13 驅動程式,並宣布功能和改進。
JDBC 和ODBC驅動程式
已發行 Athena 的 JDBC 2.0.25 和 ODBC 1.1.13 驅動程式。這兩個驅動程式都支援瀏覽器SAML多重要素身分驗證,可設定為與任何 SAML 2.0 供應商搭配使用。
2.0.25 JDBC 驅動程式包含下列變更:
-
支援瀏覽器SAML身分驗證。驅動程式包含瀏覽器SAML外掛程式,可設定為與任何 SAML 2.0 供應商搭配使用。
-
支援 AWS Glue API 呼叫。您可使用
GlueEndpointOverride
參數來覆寫 AWS Glue 端點。 -
com.simba.athena.amazonaws
類路徑已改為com.amazonaws
。
1.1.13 ODBC 驅動程式包含下列變更:
-
支援瀏覽器SAML身分驗證。驅動程式包含瀏覽器SAML外掛程式,可設定為與任何 SAML 2.0 供應商搭配使用。如需如何搭配ODBC驅動程式使用瀏覽器SAML外掛程式的範例,請參閱 使用 ODBC SAML 2.0 和 Okta 身分識別提供者設定單一登入。
-
您現在可以在使用 ADFS、Azure AD 或 Browser Azure AD 進行身分驗證時,設定角色工作階段持續時間。
如需有關這些變更以及其他變更和下載新驅動程式、版本備註和文件的詳細資訊,請參閱Connect 到 Amazon Athena JDBC和Connect 到 Amazon Athena ODBC。
功能和改進
Athena 發布了下列功能以及強化功能。
-
已推出新版最佳化規則,可避免在某些情況下重複掃描資料表。
2021 年 10 月 4 日
2021-10-04 發布
Athena 發布了下列功能以及強化功能。
-
SQL OFFSET –
SELECT
陳述式現在支援 SQLOFFSET
子句。如需詳細資訊,請參閱SELECT。 -
CloudWatch 用量指標 – Athena 現在會在
AWS/Usage
命名空間中發佈ActiveQueryCount
指標。如需詳細資訊,請參閱使用 監控 Athena 用量指標 CloudWatch。 -
查詢規劃 – 已修正在極少數情況下可能導致查詢規劃逾時的錯誤。
2021 年 9 月 16 日
2021-09-16 發布
Athena 發布了下列新版功能以及強化功能。
功能
-
新增CTAS了使用
write_compression
資料表屬性在 中指定文字檔案和JSON壓縮的支援。您也可以在 中指定 Parquet 和 ORC 格式CTAS的write_compression
屬性。如需詳細資訊,請參閱CTAS表格性質。 -
BZIP2 壓縮格式現在支援寫入文字檔案和JSON檔案。如需有關 Athena 中壓縮格式的資訊,請參閱在 Athena 使用壓縮。
改善項目
-
已修正無法將身分資訊傳送至 UDF Lambda 函數的錯誤。
-
修復了帶有分離篩選條件的述詞下推問題。
-
修復了小數類型的雜湊問題。
-
修復了不必要的統計數字收集問題。
-
刪除了不一致的錯誤訊息。
-
藉由在工作節點中套用動態分割區剪清除來改善廣播聯結效能。
-
針對聯合查詢:
-
已更改組態以減少聯合查詢時發生
CONSTRAINT_VIOLATION
錯誤。
-
2021 年 9 月 15 日
2021-09-15 發布
您現已可使用新版的 Amazon Athena 主控台 (預覽版)。新的 Athena JDBC驅動程式已發行。
Athena 主控台預覽版
您現在可以從 Amazon Athena
若要切換至新的主控台
立即開始使用新版主控台
Athena JDBC驅動程式 2.0.24
Athena 宣佈 Athena 的JDBC驅動程式 2.0.24 版的可用性。此版本更新了所有憑據提供者的代理支援。驅動程式現已支援 NonProxyHosts
連接屬性不支援的所有主機的代理身分驗證。
為了方便起見,此版本包含驅動程式的下載,JDBC包含 和不包含 AWS SDK。此JDBC驅動程式版本可讓您同時在專案中內嵌 AWS-SDK 和 Athena JDBC驅動程式。
如需詳細資訊並且要下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena JDBC。
2021 年 8 月 31 日
2021-08-31 發布
Athena 宣佈下列功能增強和錯誤修正。
-
Athena 聯合增強功能 – Athena 已新增對地圖類型的支援,以及作為 Athena Query Federation SDK
的一部分對複雜類型的更佳支援。此版本也包含一些記憶體增強功能和效能最佳化。 -
新的錯誤類別 – 引入了
USER
和SYSTEM
錯誤訊息中的錯誤類別。這些類別可協助您區分可自行修正的錯誤 (USER
),以及可能需要 Athena 支援協助的錯誤 (SYSTEM
)。 -
聯合查詢錯誤訊息 – 更新了聯合查詢相關錯誤的
USER_ERROR
分類。 -
JOIN – 修正 spill-to-disk相關錯誤和記憶體問題,以提高效能並減少
JOIN
操作中的記憶體錯誤。
2021 年 8 月 12 日
2021-08-12 發布
已發行 Athena 的 ODBC 1.1.12 驅動程式。此版本修正了 SQLPrepare()
、SQLGetInfo()
以及 EndpointOverride
的相關問題。
若要下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena ODBC。
2021 年 8 月 6 日
2021-08-06 發布
Amazon Athena 宣佈 Athena 及其功能
此版本擴展了 Athena 在亞太區域的可用性,以包含亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (大阪)、亞太區域 (首爾)、亞太區域 (新加坡)、亞太區域 (新加坡)、亞太區域 (雪梨) 和亞太區域 (東京)。如需這些和其他區域中 AWS 服務 可用的完整清單,請參閱 AWS 區域 al Services List
2021 年 8 月 5 日
2021-08-05 發布
您可以使用 UNLOAD
陳述式,將SELECT
查詢的輸出寫入 PARQUET、ORC、 AVRO和 JSON 格式。
如需詳細資訊,請參閱UNLOAD。
2021 年 7 月 30 日
2021-07-30 發布
Athena 宣佈下列功能增強和錯誤修正。
-
動態篩選和分割區剔除 – 改善項目可提高效能並降低某些查詢中的掃描資料量,如下列範例所示。
此範例假設
Table_B
是未分割的資料表,其檔案大小加起來小於 20 MB。針對這樣的查詢,從Table_A
讀取的資料更少且查詢完成更快。SELECT * FROM Table_A JOIN Table_B ON Table_A.date = Table_B.date WHERE Table_B.column_A = "value"
-
ORDER BY 搭配 LIMIT,DISTINCT搭配 LIMIT - 使用
ORDER BY
或DISTINCT
後接子LIMIT
句的查詢效能改善。 -
S3 Glacier Deep Archive 檔案 – 當 Athena 查詢一個混合 S3 Glacier Deep Archive 檔案和非 S3 Glacier 檔案的資料表時,Athena 現在會替您略過 S3 Glacier Deep Archive 檔案。先前,您需手動將這些檔案從查詢位置移動,否則查詢會失敗。如果您想要使用 Athena 查詢 S3 Glacier Deep Archive 儲存空間中的物件,則必須將其還原。如需詳細資訊,請參閱《Simple Storage Service (Amazon S3) 使用者指南》中的還原已封存的物件。
-
修正CTAS
bucketed_by
資料表屬性建立的空白檔案未正確加密的錯誤。
2021 年 7 月 21 日
2021-07-21 發布
透過 2021 年 7 月發行的 Microsoft Power BI 桌面版
由於連接器使用您現有的ODBC資料來源名稱 (DSN) 來連線至 Athena 並執行查詢,因此需要 Athena ODBC驅動程式。若要下載最新的ODBC驅動程式,請參閱 Connect 到 Amazon Athena ODBC。
如需詳細資訊,請參閱使用 Amazon Athena 電源 BI 連接器。
2021 年 7 月 16 日
2021-07-16 發布
Amazon Athena 已經更新了與 Apache Hudi 的整合。Hudi 是一個開源資料管理架構,用於簡化 Simple Storage Service (Amazon S3) 資料湖中的增量資料處理。更新的整合可讓您使用 Athena 查詢透過 Amazon EMR、Apache Spark、Apache Hive 或其他相容服務管理的 Hudi 0.8.0 資料表。此外,Athena 現在支援兩項其他功能: (MoR ) 資料表上的 Merge-on-Read快照查詢和引導資料表上的讀取支援。
Apache Hudi 提供記錄層級的資料處理,可協助您簡化變更資料擷取 (CDC) 管道的開發、遵守 GDPR驅動的更新和刪除,以及更妥善地管理來自需要資料插入和事件更新的感應器或裝置的串流資料。0.8.0 版本可以更容易地將大型 Parquet 資料表遷移至 Hudi,而無需複製資料,因此您可以透過 Athena 查詢和分析它們。您可以使用 Athena 適用於快照查詢的新支援,以近乎即時的方式檢視串流資料表更新。
若要進一步了解如何搭配 Athena 使用 Hudi,請參閱查詢阿帕奇胡迪數據集。
2021 年 7 月 8 日
2021-07-08 發布
已發行 Athena 的 ODBC 1.1.11 驅動程式。ODBC 驅動程式現在可以使用 JSON Web 權杖 () 驗證連線JWT。在 Linux 上,Workgroup (工作群組) 屬性的預設值已設定為 Primary (主要)。
如需詳細資訊並且要下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena ODBC。
2021 年 7 月 1 日
2021-07-01 發布
2021 年 7 月 1 日,預覽工作群組的特殊處理已結束。雖然 AmazonAthenaPreviewFunctionality
工作群組會保留其名稱,但是不再具有特殊狀態。您可以繼續使用 AmazonAthenaPreviewFunctionality
工作群組來檢視、修改、組織和執行查詢。不過,使用先前預覽版功能的查詢現在受標準 Athena 帳單條款與條件的約束。如需帳單資訊,請參閱 Amazon Athena 定價
2021 年 6 月 23 日
2021-06-23 發布
已發行 Athena 的 JDBC 2.0.23 和 ODBC 1.1.10 驅動程式。兩個驅動程式都提供改善的讀取效能和支援EXPLAIN陳述式和參數化查詢 。
EXPLAIN
陳述式會顯示SQL查詢的邏輯或分散式執行計畫。透過參數化查詢,可以採用執行時提供的不同值多次使用相同的查詢。
此JDBC版本也新增了對 Active Directory Federation Services 2019 的支援,以及 的自訂端點覆寫選項 AWS STS。ODBC 版本會修正IAM設定檔憑證的問題。
如需詳細資訊並且要下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena JDBC和Connect 到 Amazon Athena ODBC。
2021 年 5 月 12 日
2021-05-12 發布
您現在可以使用 Amazon Athena 從非您自己的帳戶註冊 AWS Glue 目錄。設定 所需的IAM許可後 AWS Glue,您可以使用 Athena 執行跨帳戶查詢。
如需詳細資訊,請參閱 從其他帳戶註冊資料目錄 和 設定跨帳戶存取 AWS Glue 資料目錄。
2021 年 5 月 10 日
2021-05-10 發布
已發行 Athena 的ODBC驅動程式 1.1.9.1001 版。此版本修正了使用 Azure Active Directory (AD) 時所產生的 BrowserAzureAD
身分驗證類型問題。
若要下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena ODBC。
2021 年 5 月 5 日
2021-05-05 發布
您現在可以在聯合查詢中使用 Amazon Athena Vertica 連接器,從 Athena 查詢 Vertica 資料來源。例如,您可以在 Vertica 上的資料倉儲和 Simple Storage Service (Amazon S3) 中的資料湖上執行分析查詢。
若要部署 Athena Vertica 連接器,請造訪 中的 AthenaVerticaConnector
Amazon Athena Vertica 連接器透過 Lambda 環境變數公開數個組態選項。如需有關組態選項、參數、連接字串、部署和限制的詳細資訊,請參閱 Amazon Athena Vertica 連接器。
如需使用 Vertica 連接器的深入資訊,請參閱 AWS 大數據部落格 中的使用 Athena 聯合查詢在 Amazon Athena 中查詢 Vertica 資料來源SDK
2021 年 4 月 30 日
2021-04-30 發布
已發行 Athena JDBC 的驅動程式 2.0.21 和 ODBC 1.1.9。這兩個版本都支援使用 Azure Active Directory (AD) 進行SAML身分驗證,以及使用 進行SAML身分驗證 PingFederate。此JDBC版本也支援參數化查詢。如需有關 Athena 中參數化查詢的資訊,請參閱使用參數化查詢。
若要下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena JDBC和Connect 到 Amazon Athena ODBC。
2021 年 4 月 29 日
2021-04-29 發布
Amazon Athena 宣佈在中國 (北京) 和中國 (寧夏) 區域提供 Athena 引擎版本 2。
如需有關 Athena 引擎版本 2 的資訊,請參閱Athena 引擎版本 2。
2021 年 4 月 26 日
2021-04-26 發布
Athena 引擎版本 2 中的視窗值函數現在支援 IGNORE NULLS
和 RESPECT NULLS
。
如需詳細資訊,請參閱 Presto 文件中的值函數
2021 年 4 月 21 日
2021-04-21 發布
Amazon Athena 宣佈在歐洲 (米蘭) 和非洲 (開普敦) 區域提供 Athena 引擎版本 2。
如需有關 Athena 引擎版本 2 的資訊,請參閱Athena 引擎版本 2。
2021 年 4 月 5 日
2021-04-05 發布
EXPLAIN 陳述式
您現在可以使用 Athena 中的 EXPLAIN
陳述式來檢視SQL查詢的執行計畫。
如需詳細資訊,請參閱 使用EXPLAIN和 EXPLAIN ANALYZE Athena 和 瞭解 Athena EXPLAIN 聲明結果。
SQL 查詢中的SageMaker Machine Learning模型
使用 Amazon 的機器學習模型推論 SageMaker 現在已全面適用於 Amazon Athena 。在SQL查詢中使用機器學習模型,透過叫用SQL查詢中的函數來簡化複雜的任務,例如異常偵測、客戶群組分析和時間序列預測。
如需詳細資訊,請參閱搭配 Amazon Athena 使用 Machine Learning (ML)。
使用者定義的函數 (UDF)
使用者定義的函數 (UDFs) 現在已全面可用於 Athena。使用 UDFs 來利用自訂函數,在單一SQL查詢中處理記錄或記錄群組。
如需詳細資訊,請參閱使用用戶定義的函數查詢。
2021 年 3 月 30 日
2021-03-30 發布
Amazon Athena 宣佈在亞太區域 (香港) 和中東 (巴林) 區域中提供 Athena 引擎版本 2。
如需有關 Athena 引擎版本 2 的資訊,請參閱Athena 引擎版本 2。
2021 年 3 月 25 日
2021-03-25 發布
Amazon Athena 宣佈在歐洲 (斯德哥爾摩) 區域提供 Athena 引擎版本 2。
如需有關 Athena 引擎版本 2 的資訊,請參閱Athena 引擎版本 2。
2021 年 3 月 5 日
2021-03-05 發布
Amazon Athena 宣佈在加拿大 (中部)、歐洲 (法蘭克福) 和南美洲 (聖保羅) 區域中提供 Athena 引擎版本 2。
如需有關 Athena 引擎版本 2 的資訊,請參閱Athena 引擎版本 2。
2021 年 2 月 25 日
2021-02-25 發布
Amazon Athena 宣佈在亞太區域 (首爾)、亞太區域 (新加坡)、亞太區域 (雪梨)、歐洲 (倫敦) 和歐洲 (巴黎) 區域全面提供 Athena 引擎版本 2。
如需有關 Athena 引擎版本 2 的資訊,請參閱Athena 引擎版本 2。
2020 年 Athena 版本備註
2020 年 12 月 16 日
2020-12-16 發布
Amazon Athena 宣佈 Athena 引擎第 2 版、Athena 聯合查詢和其他 AWS PrivateLink 區域的可用性。
Athena 引擎版本 2 和 Athena 聯合查詢
Amazon Athena 宣佈在亞太區域 (孟買)、亞太區域 (東京)、歐洲 (愛爾蘭) 和美國西部 (加利佛尼亞北部) 區域全面提供 Athena 引擎版本 2 和 Athena 聯合查詢。Athena 引擎版本 2 和聯合查詢已在美國東部 (維吉尼亞北部)、美國東部 (俄亥俄州) 和美國西部 (奧勒岡) 區域提供。
如需詳細資訊,請參閱 Athena 引擎版本 2 和 使用 Amazon Athena 聯合查詢。
AWS PrivateLink
AWS PrivateLink 歐洲 (斯德哥爾摩) 區域現在支援 for Athena。如需 AWS PrivateLink 適用於 Athena 的資訊,請參閱 使用界面VPC端點 Connect 到 Amazon Athena。
2020 年 11 月 24 日
2020-11-24 發布
已發行 Athena JDBC 的驅動程式 2.0.16 和 ODBC 1.1.6。這些版本支援在帳戶層級 Okta Verify 多重要素驗證 (MFA)。您也可以使用 Okta MFA 將SMS身分驗證和 Google Authenticator 身分驗證設定為因素。
若要下載新的驅動程式、版本備註和文件,請參閱Connect 到 Amazon Athena JDBC和Connect 到 Amazon Athena ODBC。
2020 年 11 月 11 日
2020-11-11 發布
Amazon Athena 宣佈在美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 和美國西部 (奧勒岡) 區域全面提供 Athena 引擎版本 2 和聯合查詢。
Athena 引擎版本 2
Amazon Athena 宣佈在美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 和美國西部 (奧勒岡) 區域全面提供新的查詢引擎版本,即 Athena 引擎版本 2。
Athena 引擎第 2 版包含效能增強功能和新功能,例如 Parquet 格式資料的結構描述演進支援、其他地理空間函數、支援讀取巢狀結構描述以降低成本,以及 JOIN和 AGGREGATE操作中的效能增強功能。
-
如需有關改善功能、重大變更和錯誤修正的資訊,請參閱Athena 引擎版本 2。
-
如需有關如何升級的資訊,請參閱變更 Athena 引擎版本。
-
如需有關測試查詢的資訊,請參閱在引擎版本升級之前測試查詢。
聯合SQL查詢
現在,您可以在美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 和美國西部 (奧勒岡) 區域使用 Athena 的聯合查詢,不需要使用 AmazonAthenaPreviewFunctionality
工作群組。
使用聯合SQL查詢跨關聯式、非關聯式、物件式和自訂資料來源執行SQL查詢。透過聯合查詢,您可以提交單一SQL查詢,以掃描在內部部署執行或託管在雲端的多個來源的資料。
要跨應用程式對資料執行分析極為複雜,而且耗費時間,原因如下:
-
分析所需的資料通常分佈在關聯式、金鑰值、文件、記憶體內、搜尋、圖形、物件、時間序列和分類帳資料儲存中。
-
為了分析這些來源中的資料,分析師建置了複雜的通道來擷取、轉換和載入至資料倉儲中,以便可以查詢資料。
-
若要從各種來源存取資料,需要學習新的程式設計語言和資料存取結構。
Athena 中的聯合SQL查詢可讓使用者從任何位置查詢就地資料,以消除此複雜性。分析人員可以使用熟悉的SQL建構來跨多個資料來源JOIN
進行快速分析,並將結果存放在 Amazon S3 中以供後續使用。
資料來源連接器
若要處理聯合查詢,Athena 會使用在 AWS Lambda
自訂資料來源連接器
開發人員可以使用 Athena Query Federation SDK
後續步驟
-
若要進一步了解聯合查詢功能,請參閱使用 Amazon Athena 聯合查詢。
-
若要開始使用現有的連接器,請參閱部署連接器並連接至資料來源。
-
若要了解如何使用 Athena Query Federation 建置自己的資料來源連接器SDK,請參閱 上的 Athena Connector 範例
GitHub。
2020 年 10 月 22 日
2020-10-22 發布
您現在可以使用 呼叫 Athena AWS Step Functions。 AWS Step Functions 可以直接使用 Amazon States 語言 控制某些 AWS 服務 。 https://docs.aws.amazon.com/step-functions/latest/dg/concepts-amazon-states-language.html您可以搭配 Athena 使用 Step Functions 來啟動和停止查詢執行、取得查詢結果、執行臨機操作或排程的資料查詢,以及從 Simple Storage Service (Amazon S3) 中的資料湖擷取結果。
如需詳細資訊,請參閱《AWS Step Functions 開發人員指南》中的使用 Step Functions 呼叫 Athena。
2020 年 7 月 29 日
2020-07-29 發布
已發行JDBC驅動程式 2.0.13 版。此版本支援使用向 Athena 、Okta 服務註冊的多個資料目錄進行身分驗證,以及VPC端點的連線。
若要下載並使用新版驅動程式,請參閱Connect 到 Amazon Athena JDBC。
2020 年 7 月 9 日
2020-07-09 發布
Amazon Athena 新增了對查詢壓縮 Hudi 資料集的支援, AWS CloudFormation 並新增AWS::Athena::DataCatalog
資源,用於建立、更新或刪除您在 Athena 中註冊的資料目錄。
查詢 Apache Hudi 資料集
Apache Hudi 是一個開源資料管理架構,可簡化增量資料的處理。Amazon Athena 現在支援在以 Simple Storage Service (Amazon S3) 為基礎的資料湖中查詢 Apache Hudi 資料集的讀取最佳化檢視。
如需詳細資訊,請參閱查詢阿帕奇胡迪數據集。
AWS CloudFormation Data Catalog 資源
若要使用 Amazon Athena 的聯合查詢功能查詢任何資料來源,您必須先在 Athena 中註冊資料目錄。您現在可以使用 AWS CloudFormation AWS::Athena::DataCatalog
資源來建立、更新或刪除您在 Athena 中註冊的資料目錄。
如需詳細資訊,請參閱 AWS CloudFormation 使用者指南中的 AWS::Athena::DataCatalog。
2020 年 6 月 1 日
2020-06-01 發布
使用 Apache Hive 中繼存放區作為中繼目錄搭配 Amazon Athena
除了使用 Athena 搭配 AWS Glue Data Catalog 之外,您現在還可以將 Apache 連接至一或多個 Apache Hive 中繼存放區。
若要連接至自我託管的 Hive 中繼存放區,您需要一個 Athena Hive 中繼存放區連接器。Athena 提供參考實作連接器供您使用。連接器在您的帳戶中會作為 AWS Lambda 函數執行。
如需詳細資訊,請參閱使用外部蜂巢元存儲。
2020 年 5 月 21 日
2020-05-21 發布
Amazon Athena 新增了對分割區投影的支援。使用分割區投影可加速高度分割資料表的查詢處理,並自動化分割區管理。如需詳細資訊,請參閱搭配 Amazon Athena 使用分割區投影。
2020 年 4 月 1 日
2020-04-01 發布
除了美國東部 (維吉尼亞北部) 區域之外,Amazon Athena 聯合查詢 、使用者定義函數 (UDFs)、機器學習推論 和外部 Hive 中繼存放區功能現在可在亞太區域 (孟買)、歐洲 (愛爾蘭) 和美國西部 (奧勒岡) 區域預覽使用。
2020 年 3 月 11 日
2020-03-11 發布
Amazon Athena 現在會發佈查詢狀態轉換的 Amazon EventBridge 事件。當查詢在狀態 -- 之間轉換時,例如,從執行到終端狀態,例如成功或取消 -- Athena 將查詢狀態變更事件發佈到 EventBridge。該事件包含有關查詢狀態轉換的資訊。如需詳細資訊,請參閱使用 監控 Athena 查詢事件 EventBridge。
2020 年 3 月 6 日
2020-03-06 發布
您現在可以使用 AWS CloudFormation AWS::Athena::WorkGroup
資源建立和更新 Amazon Athena 工作群組。如需詳細資訊,請參閱 AWS CloudFormation 使用者指南中的 AWS::Athena::WorkGroup。
2019 年 Athena 版本備註
2019 年 11 月 26 日
2019-12-17 發布
Amazon Athena 新增支援跨關聯式、非關聯式、物件式和自訂資料來源執行SQL查詢、在SQL查詢中調用機器學習模型、使用者定義函數 (UDFs) (預覽)、使用 Apache Hive Metastore 作為中繼資料目錄搭配 Amazon Athena (預覽),以及四個其他查詢相關指標。
聯合SQL查詢
使用聯合SQL查詢跨關聯式、非關聯式、物件式和自訂資料來源執行SQL查詢。
您現在可以使用 Athena 的聯合查詢來掃描儲存在關聯式、非關聯式、物件和自訂資料來源中的資料。透過聯合查詢,您可以提交單一SQL查詢,從內部部署或託管的多個來源掃描資料。
要跨應用程式對資料執行分析極為複雜,而且耗費時間,原因如下:
-
分析所需的資料通常分佈在關聯式、金鑰值、文件、記憶體內、搜尋、圖形、物件、時間序列和分類帳資料儲存中。
-
為了分析這些來源中的資料,分析師建置了複雜的通道來擷取、轉換和載入至資料倉儲中,以便可以查詢資料。
-
若要從各種來源存取資料,需要學習新的程式設計語言和資料存取結構。
Athena 中的聯合SQL查詢可讓使用者從任何位置查詢就地資料,以消除此複雜性。分析人員可以使用熟悉的SQL建構來跨多個資料來源JOIN
進行快速分析,並將結果存放在 Amazon S3 中以供後續使用。
資料來源連接器
Athena 使用在 AWS Lambda
自訂資料來源連接器
開發人員可以使用 Athena Query Federation SDK
預覽可用性
Athena 聯合查詢在美國東部 (維吉尼亞北部) 區域以預覽模式提供。
後續步驟
-
若要開始預覽,請遵循 Athena 預覽功能 FAQ
中的指示。 -
若要進一步了解聯合查詢功能,請參閱使用 Amazon Athena 聯合查詢 (預覽)。
-
若要開始使用現有的連接器,請參閱部署連接器並連接至資料來源。
-
若要了解如何使用 Athena Query Federation 建置自己的資料來源連接器SDK,請參閱 上的 Athena Connector 範例
GitHub。
在SQL查詢中調用Machine Learning模型
您現在可以叫用機器學習模型,直接從您的 Athena 查詢進行推論。在SQL查詢中使用機器學習模型的功能,使得複雜的任務如異常偵測、客戶群組分析和銷售預測,就像在SQL查詢中叫用函數一樣簡單。
ML 模型
您可以使用 Amazon SageMaker
預覽可用性
Athena 的機器學習 (ML) 功能目前已在美國東部 (維吉尼亞北部) 區域以預覽模式提供。
後續步驟
-
若要開始預覽,請遵循 Athena 預覽功能 FAQ
中的指示。 -
若要進一步了解機器學習功能,請參閱搭配 Amazon Athena 使用機器學習 (ML) (預覽)。
使用者定義的函數 (UDFs) (預覽)
您現在可以撰寫自訂純量函數,並在 Athena 查詢中叫用它們。您可以使用 Athena Query Federation SDKSELECT
和 FILTER
子句。您可以在相同的查詢UDFs中叫用多個 。
預覽可用性
Athena UDF功能在美國東部 (維吉尼亞北部) 區域以預覽模式提供。
後續步驟
-
若要開始預覽,請遵循 Athena 預覽功能 FAQ
中的指示。 -
若要進一步了解,請參閱利用使用者定義函數來查詢 (預覽)。
-
如需UDF實作範例,請參閱 上的 Amazon Athena UDF Connector
GitHub。 -
若要了解如何使用 Athena Query Federation 撰寫自己的函數SDK,請參閱UDF使用 Lambda 建立和部署 。
使用 Apache Hive 中繼存放區作為中繼目錄搭配 Amazon Athena (預覽)
除了使用 Athena 搭配 AWS Glue Data Catalog 之外,您現在還可以將 Apache 連接至一或多個 Apache Hive 中繼存放區。
中繼存放區連接器
若要連接至自我託管的 Hive 中繼存放區,您需要一個 Athena Hive 中繼存放區連接器。Athena 提供參考實作
預覽可用性
Hive 中繼存放區功能在美國東部 (維吉尼亞北部) 區域以預覽模式提供。
後續步驟
-
若要開始預覽,請遵循 Athena 預覽功能 FAQ
中的指示。 -
若要進一步了解此功能,請造訪我們的針對外部 Hive 中繼存放區使用 Athena 資料連接器 (預覽)。
新的查詢相關指標
Athena 現在發布可協助您了解 Amazon Athena
-
Query Planning Time (查詢規劃時間) – 規劃查詢所花費的時間。這包括從資料來源擷取資料表分割區所花費的時間。
-
Query Queuing Time (查詢佇列時間) – 查詢在佇列中等待資源的時間。
-
Service Processing Time (服務處理時間) – 查詢引擎完成處理後寫入結果所需的時間。
-
Total Execution Time (總執行期) – Athena 執行查詢所花費的時間。
若要使用這些新的查詢指標,您可以建立自訂儀表板、在 中設定指標警示和觸發條件 CloudWatch,或直接從 Athena 主控台使用預先填入的儀表板。
後續步驟
如需詳細資訊,請參閱使用 CloudWatch 指標 監控 Athena 查詢。
2019 年 11 月 12 日
2019-12-17 發布
Amazon Athena 現已在中東 (巴林) 區域提供。
2019 年 11 月 8 日
2019-12-17 發布
Amazon Athena 現已在美國西部 (加利佛尼亞北部) 區域和歐洲 (巴黎) 區域提供。
2019 年 10 月 8 日
2019-12-17 發布
Amazon Athena
若要建立介面VPC端點以連線至 Athena,您可以使用 AWS Management Console 或 AWS Command Line Interface (AWS CLI)。如需建立介面端點的詳細資訊,請參閱建立界面端點。
當您使用介面VPC端點時,您的 VPC和 Athena 之間的通訊APIs是安全的,並且會保留在 AWS 網路內。使用此功能無需支付額外的 Athena 費用。需支付介面VPC端點費用
若要進一步了解此功能,請參閱使用介面VPC端點 連線至 Amazon Athena。
2019 年 9 月 19 日
2019-12-17 發布
Amazon Athena 新增了對使用 INSERT INTO
陳述式將新資料插入現有資料表的支援。您可以根據在來源表格上執行的 SELECT
查詢陳述式,或根據提供作為查詢陳述式一部分的一組值,將新資料行插入目的地表格。支援的資料格式包括 Avro、JSON、ORC、Parquet 和文字檔案。
INSERT INTO
陳述式也可以協助您簡化ETL程序。例如,您可以在單一查詢INSERT INTO
中使用 從JSON格式為 的來源資料表中選取資料,並以 Parquet 格式寫入目的地資料表。
INSERT INTO
陳述式會根據 SELECT
階段中掃描的位元組數收費,類似於 Athena 針對 SELECT
查詢的收費方式。如需詳細資訊,請參閱 Amazon Athena 定價
如需使用 的詳細資訊INSERT INTO
,包括支援的格式 SerDes 和範例,請參閱 Athena 使用者指南INSERTINTO中的 。
2019 年 9 月 12 日
2019-12-17 發布
Amazon Athena 現已在亞太區域 (香港) 區域提供。
2019 年 8 月 16 日
2019-12-17 發布
Amazon Athena
當 Simple Storage Service (Amazon S3) 儲存貯體設定為 Requester Pays (申請者付款) 時,請求者 (而非儲存貯體擁有者) 會支付 Simple Storage Service (Amazon S3) 請求與資料傳輸的費用。在 Athena 中,工作群組管理員現在可以設定工作群組設定,以允許工作群組成員查詢 S3 申請者付款儲存貯體。
如需有關如何為您的工作群組設定 Requester Pays (申請者付款) 設定的資訊,請參閱《Amazon Athena 使用者指南》中的建立工作群組。如需有關申請者付款儲存貯體的詳細資訊,請參閱《Amazon Simple Storage Service 開發人員指南》中的申請者付款儲存貯體。
2019 年 8 月 9 日
2019-12-17 發布
Amazon Athena 現在支援強制執行 AWS Lake Formation
您可以在下列 中使用此功能 AWS 區域:美國東部 (俄亥俄)、美國東部 (維吉尼亞北部)、美國西部 (奧勒岡)、亞太區域 (東京) 和歐洲 (愛爾蘭)。使用此功能無須額外付費。
如需使用此功能的詳細資訊,請參閱 使用 Athena 查詢註冊的資料 AWS Lake Formation 一文。如需有關 AWS Lake Formation的詳細資訊,請參閱《AWS Lake Formation
2019 年 6 月 26 日
Amazon Athena 現在已在歐洲 (斯德哥爾摩) 區域提供。如需支援區域的清單,請參閱 AWS 區域 和節點。
2019 年 5 月 24 日
2019-05-24 發布
Amazon Athena 現已在 AWS GovCloud (美國東部) 和 AWS GovCloud (美國西部) 區域提供。如需支援區域的清單,請參閱 AWS 區域 和節點。
2019 年 3 月 5 日
2019-03-05 發布
Amazon Athena 現已在加拿大 (中部) 區域提供。如需支援區域的清單,請參閱 AWS 區域 和節點。已發行支援 Athena 工作群組的新版本ODBC驅動程式。如需詳細資訊,請參閱ODBC驅動程式版本備註
若要下載ODBC驅動程式 1.0.5 版及其文件,請參閱 Connect 到 Amazon Athena ODBC。如需有關此版本的資訊,請參閱ODBC驅動程式版本備註
若要搭配ODBC驅動程式使用工作群組,請在連線字串中設定新的連線屬性 Workgroup
,如下列範例所示:
Driver=Simba Athena ODBC Driver;AwsRegion=[Region];S3OutputLocation=[S3Path];AuthenticationType=IAM Credentials;UID=[YourAccessKey];PWD=[YourSecretKey];Workgroup=[WorkgroupName]
如需詳細資訊,請在ODBC驅動程式安裝和組態指南 1.0.5 版
此驅動程式版本可讓您使用 Athena API工作群組動作來建立和管理工作群組,以及使用 Athena API標籤動作來新增、列出或移除工作群組上的標籤。在開始之前,請確定您在 IAM 中具有工作群組和標籤上動作的資源層級許可。
如需詳細資訊,請參閱:
如果您使用JDBC驅動程式或 AWS SDK,請升級至驅動程式和 的最新版本SDK,這兩者都已包含對 Athena 中工作群組和標籤的支援。如需詳細資訊,請參閱Connect 到 Amazon Athena JDBC。
2019 年 2 月 22 日
2019-02-22 發布
對 Amazon Athena 中的工作群組新增了標籤支援。每個標記皆包含由您定義的金鑰和值。當您標記工作群組時,您可以指派自訂中繼資料給它。您可以使用 AWS 標記最佳實務 ,將標籤新增至工作群組,以協助分類標籤。您可以使用標籤來限制存取工作群組和追蹤成本。例如,為每個成本中心建立工作群組。然後,您可以將標籤新增到工作群組,以追蹤每個成本中心的 Athena 花費。如需詳細資訊,請參閱《AWS Billing and Cost Management 使用者指南》中的使用標籤計費。
您可以使用 Athena 主控台或 API操作來使用標籤。如需詳細資訊,請參閱標籤 Athena 資源。
在 Athena 主控台中,您可以將一或多個標籤新增到每個工作群組,並依標籤來搜尋。工作群組是 Athena 中的 IAM控制資源。在 中IAM,您可以限制誰可以在您建立的工作群組上新增、移除或列出標籤。您也可以使用具有選用標籤參數CreateWorkGroup
API的操作,將一或多個標籤新增至工作群組。若要新增、移除或列出標籤,請使用 TagResource
、UntagResource
和 ListTagsForResource
。如需詳細資訊,請參閱使用API和 AWS CLI 標記操作。
若要允許使用者在建立工作群組時新增標籤,請確定您已將 TagResource
和 CreateWorkGroup
API動作的IAM許可授予每位使用者。如需詳細資訊和範例,請參閱 使用標籤式IAM存取控制原則。
當您在工作群組上使用標籤時,JDBC驅動程式不會有任何變更。如果您建立新的工作群組並使用JDBC驅動程式或 AWS SDK,請升級至最新版本的驅動程式和 SDK。如需相關資訊,請參閱 Connect 到 Amazon Athena JDBC。
2019 年 2 月 18 日
2019-02-18 發布
新增能夠在工作群組中執行查詢來控制查詢成本。如需相關資訊,請參閱 使用工作群組來控制查詢存取和成本。改善了 Athena 中使用的 JSON OpenX SerDe ,修正了 Athena 未忽略轉換至GLACIER
儲存類別的物件的問題,並新增了查詢 Network Load Balancer 日誌的範例。
進行下列變更:
-
新增支援工作群組。使用工作群組來區隔使用者、團隊、應用程式或工作負載,以及對每個查詢或整個工作群組可以處理的資料量設定限制。由於工作群組作為IAM資源,您可以使用資源層級許可來控制對特定工作群組的存取。您也可以在 Amazon 中檢視查詢相關指標 CloudWatch,在違反這些閾值時,透過設定掃描資料量的限制、建立閾值和觸發動作來控制查詢成本,例如 Amazon SNS警示。如需詳細資訊,請參閱 使用工作群組來控制查詢存取和成本 和 使用 CloudWatch 和 EventBridge 來監控查詢和控制成本。
工作群組是 IAM 資源。如需 中工作群組相關動作、資源和條件的完整清單IAM,請參閱服務授權參考 中的 Amazon Athena 的動作、資源和條件金鑰。建立新工作群組之前,請確定您使用工作群組IAM政策 和 AWS 受管政策: AmazonAthenaFullAccess。
您可以在主控台中使用工作群組,搭配工作群組API操作 或搭配JDBC驅動程式使用。如需有關建立工作群組的資訊,請參閱建立工作群組。若要下載具有工作群組支援的JDBC驅動程式,請參閱 Connect 到 Amazon Athena JDBC。
如果您搭配JDBC驅動程式使用工作群組,則必須使用
Workgroup
組態參數在連線字串中設定工作群組名稱,如下列範例所示:jdbc:awsathena://AwsRegion=
<AWSREGION>
;UID=<ACCESSKEY>
; PWD=<SECRETKEY>
;S3OutputLocation=s3://amzn-s3-demo-bucket/<athena-output>
-<AWSREGION>
/; Workgroup=<WORKGROUPNAME>
;您執行SQL陳述式或JDBCAPI呼叫驅動程式的方式不會有任何變更。驅動程式會將工作群組名稱傳遞給 Athena。
如需工作群組所造成差異的相關資訊,請參閱使用 Athena 工作群組 APIs和對工作群組錯誤進行故障診斷。
-
已改善 Athena 中使用的 JSON OpenX SerDe 。改善功能包括 (但不限於) 下列各項:
-
支援
ConvertDotsInJsonKeysToUnderscores
屬性。設定為 時TRUE
,允許 SerDe 將金鑰名稱中的點取代為底線。例如,如果JSON資料集包含名稱為 的金鑰"a.b"
,您可以使用此屬性來定義要在 Athena"a_b"
中的資料欄名稱。預設值為FALSE
。在預設情況下,Athena 在資料欄名稱中不允許點。 -
支援
case.insensitive
屬性。根據預設,Athena 要求JSON資料集中的所有金鑰使用小寫。使用WITH SERDE PROPERTIES ("case.insensitive"= FALSE;)
可讓您在資料中使用區分大小寫的索引鍵名稱。預設值為TRUE
。設定為 時TRUE
, 會將所有大寫資料欄 SerDe 轉換為小寫。
如需詳細資訊,請參閱OpenX JSON SerDe。
-
-
修正了 Athena 在處理依 Simple Storage Service (Amazon S3) 生命週期政策而存檔到 Glacier 的 Simple Storage Service (Amazon S3) 物件時傳回
"access denied"
錯誤訊息這個問題。修正此問題後,Athena 會忽略轉換到GLACIER
儲存類別的物件。Athena 不支援從GLACIER
儲存類別來查詢資料。如需詳細資訊,請參閱 Amazon Simple Storage Service 使用者指南中的 Amazon S3 考量和 轉換至 Storage Class (物件存檔)。 GLACIER
-
新增了查詢 Network Load Balancer 存取日誌的範例,這些日誌會接收有關 Transport Layer Security (TLS) 請求的資訊。如需詳細資訊,請參閱查詢 Network Load Balancer 記錄。
2018 年 Athena 版本備註
2018 年 11 月 20 日
2018-11-20 發布
已發行 JDBC和ODBC驅動程式的新版本,支援API使用 AD FS 和 SAML 2.0 (安全宣告標記語言 2.0) 聯合存取 Athena。如需詳細資訊,請參閱JDBC驅動程式版本備註
在此版本中,支援 Active Directory Federation Service (AD FS 3.0) 聯合存取 Athena。存取是透過支援 2.0 SAML 的 JDBC或 ODBC驅動程式版本建立。如需設定聯合存取 Athena 的相關資訊API,請參閱 啟用對 Athena 的聯合存取 API。
若要下載JDBC驅動程式 2.0.6 版及其文件,請參閱 Connect 到 Amazon Athena JDBC。如需有關此版本的資訊,請參閱JDBC驅動程式版本備註
若要下載ODBC驅動程式 1.0.4 版及其文件,請參閱 Connect 到 Amazon Athena ODBC。如需有關此版本的資訊,ODBC驅動程式版本備註
如需 中 SAML 2.0 支援的詳細資訊 AWS,請參閱 IAM 使用者指南 中的關於 SAML2.0 聯合。
2018 年 10 月 15 日
2018-10-15 發布
如果您已升級至 AWS Glue Data Catalog,有兩個新功能可提供支援:
-
資料目錄中繼資料的加密。如果您選擇加密資料目錄中的中繼資料,您必須將特定的政策新增至 Athena。如需詳細資訊,請參閱存取 AWS Glue Data Catalog中的加密中繼資料。
-
存取 中 資源的精細許可 AWS Glue Data Catalog。您現在可以定義身分型 (IAM) 政策,以限制或允許從 Athena 中使用的 Data Catalog 存取特定資料庫和資料表。如需詳細資訊,請參閱設定對資料庫和資料表的存取 AWS Glue Data Catalog。
注意
資料位於 Amazon S3 儲存貯體中,而其存取權取決於 控制從 Athena 對 Amazon S3 的存取。若要存取資料庫和資料表中的資料,請繼續對存放資料的 Simple Storage Service (Amazon S3) 儲存貯體使用存取控制政策。
2018 年 10 月 10 日
2018-10-10 發布
Athena 支援 CREATE TABLE AS SELECT
,它會根據 SELECT
查詢陳述式的結果建立資料表。如需詳細資訊,請參閱從查詢結果建立資料表 (CTAS)。
建立CTAS查詢之前,請務必在 Athena 文件中了解其行為。它包含有關在 Amazon S3 中儲存查詢結果的位置資訊、儲存CTAS查詢結果的支援格式清單、您可以建立的分割區數量,以及支援的壓縮格式。如需詳細資訊,請參閱CTAS查詢的考量和限制。
使用CTAS查詢來:
-
在一個步驟中從查詢結果建立資料表。
-
使用範例 在 Athena 主控台 中建立CTAS查詢。如需語法的相關資訊,請參閱 CREATE TABLE AS 。
-
將查詢結果轉換為其他儲存格式,例如 PARQUET、ORC、JSON、 AVRO和 TEXTFILE。如需詳細資訊,請參閱 CTAS查詢的考量和限制 和 使用單欄式儲存格式。
2018 年 9 月 6 日
2018-09-06 發布
發行了新版ODBC驅動程式 (1.0.3 版)。預設情況下,新版本的ODBC驅動程式串流結果,而不是分頁結果,允許商業智慧工具更快地擷取大型資料集。此版本也包含「SSL與代理伺服器搭配使用」的改進、錯誤修正和更新的文件。如需詳細資訊,請參閱驅動程式的版本備註
如需下載ODBC驅動程式 1.0.3 版及其文件,請參閱 Connect 到 Amazon Athena ODBC。
此新版本的ODBC驅動程式提供串流結果功能。它也可以與JDBC驅動程式搭配使用。如需有關串流結果的資訊,請參閱ODBC驅動程式安裝和組態指南
ODBC 驅動程式 1.0.3 版是舊版驅動程式的插入式取代。建議您遷移到最新的驅動程式。
重要
若要使用ODBC驅動程式 1.0.3 版,請遵循下列要求:
-
連接埠 444 保持開放給傳出流量。
-
在 Athena 的政策清單中新增
athena:GetQueryResultsStream
政策動作。此政策動作不會直接與 公開,API而且只會與 ODBC和 JDBC驅動程式搭配使用,作為串流結果支援的一部分。如需政策範例,請參閱 AWS 受管政策: AWSQuicksightAthenaAccess。
2018 年 8 月 23 日
2018-08-23 發布
新增了對這些 DDL相關功能的支援,並修正了幾個錯誤,如下所示:
-
對於 Parquet 的資料,增加支援
BINARY
和DATE
資料類型,對於 Avro 的資料,增加支援DATE
和TIMESTAMP
資料類型。 -
在DDL查詢
DOUBLE
中新增了對INT
和 的支援。INTEGER
是 的別名INT
,而DOUBLE PRECISION
是 的別名DOUBLE
。 -
已改進
DROP DATABASE
和DROP TABLE
查詢的效能。 -
當資料儲存貯體是空的時,不再於 Simple Storage Service (Amazon S3) 中建立
_$folder$
物件。 -
修正在未提供分割區值時
ALTER TABLE ADD PARTITION
擲出錯誤的問題。 -
修正在陳述式中指定合格名稱之後
DROP TABLE
檢查分割區時忽略資料庫名稱的問題。
如需有關 Athena 中支援的資料類型的詳細資訊,請參閱Amazon Athena 中的資料類型。
如需有關 Athena、JDBC驅動程式和 Java 資料類型之間類型之間支援的資料類型映射的資訊,請參閱JDBC驅動程式安裝和組態指南
2018 年 8 月 16 日
2018-08-16 發布
已發行JDBC驅動程式 2.0.5 版。預設情況下,新版本的JDBC驅動程式串流結果,而不是分頁結果,允許商業智慧工具更快地擷取大型資料集。相較於舊版JDBC驅動程式,有下列效能改善:
-
在擷取不超過 10K 個資料行時,效能增加大約 2 倍。
-
在擷取超過 10K 個資料行時,效能增加大約 5-6 倍。
串流結果功能僅適用於JDBC驅動程式。它不適用於ODBC驅動程式。您無法將其與 Athena 搭配使用API。如需有關串流結果的資訊,請參閱JDBC驅動程式安裝和組態指南
如需下載JDBC驅動程式 2.0.5 版及其文件,請參閱 Connect 到 Amazon Athena JDBC。
JDBC 驅動程式 2.0.5 版是舊版驅動程式 (2.0.2) 的插入式取代。為了確保您可以使用JDBC驅動程式 2.0.5 版,請將athena:GetQueryResultsStream
政策動作新增至 Athena 的政策清單。此政策動作不會直接與 公開,API而且只會與JDBC驅動程式搭配使用,作為串流結果支援的一部分。如需政策範例,請參閱 AWS 受管政策: AWSQuicksightAthenaAccess。如需有關從 2.0.2 版遷移至驅動程式 2.0.5 版的詳細資訊,請參閱JDBC驅動程式遷移指南
如果您是從 1.x 驅動程式遷移到 2.x 驅動程式,您需要將現有的設定遷移到新的設定。強烈建議您遷移到最新版的驅動程式。如需詳細資訊,請參閱JDBC驅動程式遷移指南
2018 年 8 月 7 日
2018-08-07 發布
您現在可以將 Amazon Virtual Private Cloud 流量日誌直接儲存在 Amazon S3 格式中,您可以在 Athena 中查詢這些GZIP日誌。如需詳細資訊,請參閱 查詢 Amazon VPC 流程日誌和 Amazon VPC Flow Logs 現在可以交付至 S3
2018 年 6 月 5 日
2018-06-05 發布
支援檢視
新增了對檢視的支援。您現在可以在 Athena 中使用 CREATE VIEW 以及 CREATE DIALECT VIEW、DESCRIBE VIEW、DROP VIEW、SHOW CREATE VIEW 和 SHOW VIEWS。您在查詢中每次參考檢視時,定義該檢視的查詢就會執行。如需詳細資訊,請參閱使用檢視。
改善和更新錯誤訊息
-
將 GSON 2.8.0 程式庫包含在 中 CloudTrail SerDe,以解決 的問題, CloudTrail SerDe 並啟用JSON字串剖析。
-
增強 Athena for Parquet 中的分割區結構描述驗證,在某些情況下,允許重新排序資料欄ORC,以驗證 。這可讓 Athena 更妥善地處理結構描述隨時間演進的變化,以及 AWS Glue Crawler 新增的資料表。如需詳細資訊,請參閱處理架構更新。
-
增加對
SHOW VIEWS
的剖析支援。 -
對最常見的錯誤訊息做出以下改進:
-
當 SerDe 無法剖析 Athena 查詢中的資料欄時,將
內部錯誤訊息
取代為描述性錯誤訊息。以前,Athena 在剖析錯誤的情況下會發出內部錯誤。新的錯誤訊息會讀取:"HIVE_BAD_DATA: 剖析欄位 0 的欄位值時發生錯誤:java.lang.String 無法轉換為 org.openx.data.jsonserde.json。JSONObject"
。 -
新增更多詳細資訊以改善有關許可不足的錯誤訊息。
-
錯誤修正
修正以下錯誤:
-
修正內部可能將
REAL
轉譯為FLOAT
資料類型的問題。這可改善與 AWS Glue 爬蟲程式 (傳回FLOAT
資料類型) 之間的整合。 -
已修正 Athena 未將 AVRO
DECIMAL
(邏輯類型) 轉換為DECIMAL
類型的問題。 -
修正了以
WHERE
子句參考TIMESTAMP
資料類型的值來查詢 Parquet 資料時,Athena 未傳回結果的問題。
2018 年 5 月 17 日
2018-05-17 發布
將 Athena 中的查詢並行配額從 5 提高到了 20。這表示您一次可以提交和執行最多 20 個 DDL
查詢和 20 個 SELECT
查詢。請注意,DDL
和 SELECT
查詢有個別的並行配額。
Athena 中的並行配額定義為可同時提交到服務的查詢次數。您一次最多可以提交 20 個相同類型 (DDL
或 SELECT
) 的查詢。如果您提交的查詢超過並行查詢配額,Athena API會顯示錯誤訊息。
當您將查詢提交到 Athena 之後,它會根據整體服務負載和傳入的請求數量,指派資源來處理查詢。我們會持續監控並調整服務,讓您的查詢能夠儘快處理。
如需相關資訊,請參閱 Service Quotas。這是可調整的配額。您可以使用 Service Quotas 主控台
2018 年 4 月 19 日
2018-04-19 發布
已發行新版JDBC驅動程式 (2.0.2 版),並支援將ResultSet
資料傳回為陣列資料類型、改善和錯誤修正。如需詳細資訊,請參閱驅動程式的版本備註
如需下載新JDBC驅動程式 2.0.2 版及其文件的相關資訊,請參閱 Connect 到 Amazon Athena JDBC。
JDBC 驅動程式的最新版本為 2.0.2。如果您是從 1.x 驅動程式遷移到 2.x 驅動程式,您需要將現有的設定遷移到新的設定。強烈建議您遷移到最新的驅動程式。
如需有關新版本驅動程式中引入的變更、版本差異和範例的資訊,請參閱JDBC驅動程式遷移指南
2018 年 4 月 6 日
2018-04-06 發布
在 Athena 主控台中使用自動完成輸入查詢。
2018 年 3 月 15 日
2018-03-15 發布
新增直接從 CloudTrail 主控台自動建立 CloudTrail 日誌檔案 Athena 資料表的功能。如需相關資訊,請參閱 使用 CloudTrail 主控台為 CloudTrail 日誌建立 Athena 資料表 。
2018 年 2 月 2 日
2018-02-12 發布
新增針對使用 GROUP BY
子句的記憶體密集型查詢,安全地將中繼資料卸載到磁碟的支援。這可以改善這類查詢的可靠性,防止 "Query resource exhausted"
(「查詢資源耗盡」) 錯誤。
2018 年 1 月 19 日
2018-01-19 發布
Athena 使用開源分散式查詢引擎 Presto 來執行查詢。
使用 Athena 時,不需要管理版本。我們以透明方式將 Athena 中的基礎引擎升級到基於 Presto 0.172 版的版本。您不需要進行任何動作。
透過這次升級,您現在可以使用 Presto 0.172 函數和運算子,包括 Athena 中的 Presto 0.172 lambda 表達式。
此版本的主要更新 (包括社群貢獻的修正) 包括:
-
支援忽略標頭。您在定義資料表時可以使用
skip.header.line.count
屬性,以允許 Athena 忽略標頭。這適用於使用 LazySimpleSerDe和 Open CSV SerDe的查詢,而不適用於 Grok 或 Regex 的查詢 SerDes。 -
在
STRING
函數中支援CHAR(n)
資料類型。CHAR(n)
的範圍是[1.255]
,而VARCHAR(n)
的範圍是[1,65535]
。 -
支援相互關聯的子查詢。
-
支援 Presto Lambda 表達式和函數。
-
提升
DECIMAL
類型和運算子的效能。 -
支援篩選的彙總,例如
SELECT sum(col_name) FILTER
,其中id > 0
。 -
降低
DECIMAL
、TINYINT
、SMALLINT
和REAL
資料類型的述詞。 -
支援量化比較述詞:
ALL
、ANY
和SOME
。 -
新增函數:
arrays_overlap()
、 array_except()
、 levenshtein_distance()
、 codepoint()
、 skewness()
、 kurtosis()
和 typeof()
。 -
新增另一版的
from_unixtime()
函數,可接受時區引數。 -
新增
bitwise_and_agg()
和 bitwise_or_agg()
彙總函數。 -
新增了
xxhash64()
和 to_big_endian_64()
函數。 -
已新增對使用具有JSON路徑下標的反斜線逸出雙引號或反斜線至
json_extract()
和 json_extract_scalar()
函數的支援。對於任何使用反斜線的叫用,這使得語意改變,因為反斜線在以前視為一般字元。
如需有關函數和運算子的詳細資訊,請參閱本指南中的 DML 查詢、函數和運算子,以及 Presto 文件中的函數和運算子
Athena 不支援 Presto 的所有功能。如需詳細資訊,請參閱限制。
2017 年 Athena 版本備註
2017 年 11 月 13 日
2017-11-13 發布
新增了將 Athena 連線至ODBC驅動程式的支援。如需相關資訊,請參閱 Connect 到 Amazon Athena ODBC。
2017 年 11 月 1 日
2017-11-01 發布
增加支援查詢地理空間資料,也增加支援亞太區域 (首爾)、亞太區域 (孟買) 和歐洲 (倫敦) 區域。如需相關資訊,請參閱查詢空間資料和 AWS 區域 與端點。
2017 年 10 月 19 日
2017-10-19 發布
增加支援歐洲 (法蘭克福)。如需支援區域的清單,請參閱 AWS 區域 與端點。
2017 年 10 月 3 日
2017-10-03 發布
使用 建立具名 Athena 查詢 AWS CloudFormation。如需詳細資訊,請參閱 AWS CloudFormation 使用者指南中的 AWS::Athena::NamedQuery。
2017 年 9 月 25 日
2017-09-25 發布
新增了對亞太區域 (雪梨) 的支援。如需支援區域的清單,請參閱 AWS 區域 與端點。
2017 年 8 月 14 日
2017-08-14 發布
新增與 AWS Glue Data Catalog 和遷移精靈的整合,以便從 Athena 受管資料目錄更新至 AWS Glue Data Catalog。如需詳細資訊,請參閱用於 AWS Glue 將 Athena 連線到 Amazon S3 中的資料。
2017 年 8 月 4 日
2017-08-04 發布
已新增對 Grok 的支援 SerDe,其為日誌等非結構化文字檔案中的記錄提供更簡單的模式比對。如需詳細資訊,請參閱GROK SerDe。新增鍵盤快速鍵,使用主控台捲動查詢歷史記錄 (CTRL使用 Windows + ⇧/⇩,使用 Mac CMD + ⇧/⇩)。
2017 年 6 月 22 日
2017-06-22 發布
新增了對亞太區域 (東京) 和亞太區域 (新加坡) 的支援。如需支援區域的清單,請參閱 AWS 區域 與端點。
2017 年 6 月 8 日
2017-06-08 發布
新增了對歐洲 (愛爾蘭) 的支援。如需詳細資訊,請參閱 AWS 區域 和端點。
2017 年 5 月 19 日
2017-05-19 發布
已新增 Amazon Athena API和 Athena 的 AWS CLI 支援;已更新JDBC驅動程式至 1.1.0 版;已修正各種問題。
-
Amazon Athena 支援為 Athena 設計應用程式。如需詳細資訊,請參閱 Amazon Athena API參考 。最新的 AWS SDKs 包含對 Athena 的支援API。如需文件和下載的連結,請參閱適用於 Amazon Web Services 的工具中的SDKs一節。 https://aws.amazon.com/tools/
-
AWS CLI 包含 Athena 的新命令。如需詳細資訊,請參閱 Amazon Athena API參考 。
-
新的JDBC驅動程式 1.1.0 已推出,支援新的 Athena API 以及最新的功能和錯誤修正。在 https://downloads.athena.us-east-1.amazonaws.com/drivers/Athena JDBC41-1.1.0.jar
下載驅動程式。我們建議您升級至最新的 Athena JDBC驅動程式;不過,您仍可使用較早的驅動程式版本。舊版驅動程式不支援 Athena API。如需詳細資訊,請參閱Connect 到 Amazon Athena JDBC。 -
舊版 Athena 中專用於政策陳述式的動作已淘汰。如果您升級至JDBC驅動程式 1.1.0 版,並將客戶受管或內嵌IAM政策連接到JDBC使用者,則必須更新IAM政策。相反地,舊版JDBC驅動程式不支援 Athena API,因此您只能在連接至舊版JDBC使用者的政策中指定已棄用的動作。因此,您不需要更新客戶管理或內嵌IAM政策。
-
在 Athena 發行之前,Athena 使用了這些政策特定的動作API。只有在 1.1.0 版之前的JDBC驅動程式中,才能在政策中使用這些已取代的動作。如果您要升級JDBC驅動程式,請將允許或拒絕已棄用動作的政策陳述式取代為列出的適當API動作,否則會發生錯誤:
已淘汰的政策特定動作 | 對應的 Athena API動作 |
---|---|
|
|
|
|
|
|
改善項目
-
查詢字串長度限制提高到 256 KB。
錯誤修正
-
修正在主控台上捲動結果時導致查詢結果看似格式不正確的問題。
-
修正 Simple Storage Service (Amazon S3) 資料檔案中的
\u0000
字元字串會造成錯誤的問題。 -
已修正導致透過JDBC驅動程式取消查詢的請求失敗的問題。
-
已修正導致 在美國東部 (俄亥俄) 使用 Amazon S3 資料 AWS CloudTrail SerDe 失敗的問題。
-
修正導致
DROP TABLE
在分割資料表上失敗的問題。
2017 年 4 月 4 日
2017-04-04 發布
新增對 Amazon S3 資料加密和發行JDBC驅動程式更新 (1.0.1 版) 的支援,其中包含加密支援、改進和錯誤修正。
功能
-
新增以下加密功能:
-
支援在 Simple Storage Service (Amazon S3) 中查詢加密資料。
-
支援加密 Athena 查詢結果。
-
-
新版本的驅動程式支援新的加密功能、新增改進功能並修正問題。
-
新增使用
ALTER TABLE
來新增、取代和變更資料欄的支援。如需詳細資訊,請參閱 Hive 文件中的更改資料欄。 -
新增查詢 LZO壓縮資料的支援。
如需詳細資訊,請參閱靜態加密。
改善項目
-
透過改善頁面大小,傳回 1,000 列而非 100 列,來改善JDBC查詢效能。
-
新增使用JDBC驅動程式界面取消查詢的功能。
-
新增在JDBC連線 中指定JDBC選項的功能URL。如需最新的JDBC驅動程式,Connect 到 Amazon Athena JDBC請參閱 。
-
在驅動程式中新增了PROXY設定,現在可以在適用於 Java 的 ClientConfiguration AWS SDK中使用 設定。
錯誤修正
修正以下錯誤:
-
當使用JDBC驅動程式介面發出多個查詢時,會發生限流錯誤。
-
投影十進位資料類型時,JDBC驅動程式會停止。
-
無論資料表中如何定義資料類型,JDBC驅動程式都會將每種資料類型傳回為字串。例如,使用
INT
選取定義為resultSet.GetObject()
資料類型的資料欄會傳回STRING
資料類型,而不是INT
。 -
JDBC 驅動程式會在建立連線時驗證憑證,而不是在查詢執行時驗證憑證。
-
當 與 一起指定結構描述時,透過JDBC驅動程式進行的查詢將會失敗URL。
2017 年 3 月 24 日
2017-03-24 發布
新增 AWS CloudTrail SerDe、改善效能、修正分割區問題。
功能
-
已新增 AWS CloudTrail SerDe,此後已被用於讀取 CloudTrail 日誌蜂巢 JSON SerDe的 取代。如需查詢 CloudTrail 日誌的資訊,請參閱 查詢 AWS CloudTrail 日誌。
改善項目
-
改進了掃描大量分割區時的效能。
-
改進了
MSCK Repair Table
操作的效能。 -
增加了查詢主要區域以外的區域中存放的 Simple Storage Service (Amazon S3) 資料的功能。除了標準 Athena 費用,也要支付 Simple Storage Service (Amazon S3) 的標準跨區域資料傳輸費用。
錯誤修正
-
修正未載入分割區時可能發生「找不到資料表錯誤」的錯誤。
-
修正錯誤以避免
ALTER TABLE ADD PARTITION IF NOT EXISTS
查詢擲回例外狀況。 -
修正
DROP PARTITIONS
中的錯誤。
2017 年 2 月 20 日
2017-02-20 發布
在主控台精靈中新增了對 AvroSerDe 和 O penCSVSerDe、美國東部 (俄亥俄) 區域的支援,以及大量編輯資料欄。改進大型 Parquet 資料表的效能。
功能
-
已推出對新 的支援 SerDes:
-
美國東部 (俄亥俄) 區域 (us-east-2) 啟動。您現在可以在此區域中執行查詢。
-
現已可使用從 S3 儲存貯體資料建立資料表方式來大量定義資料表的結構描述。在查詢編輯器中,選擇 Create (建立)、S3 bucket data (S3 儲存貯體資料),然後選擇 Column details (資料欄詳細資訊) 部分的 Bulk add columns (大量新增欄)。
在文字方塊中輸入名稱/值對,然後選擇 Add (新增)。
改善項目
-
改進大型 Parquet 資料表的效能。