Amazon 6.10.0 EMR版 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon 6.10.0 EMR版

6.10.0 應用程式版本

此版本支援下列應用程式: Delta, Flink, Ganglia, HBase, HCatalog, Hadoop, Hive, Hudi, Hue, Iceberg, JupyterEnterpriseGateway, JupyterHub, Livy, MXNet, Oozie, Phoenix, Pig, Presto, Spark, Sqoop, TensorFlow, Tez, Trino, Zeppelin、 和 ZooKeeper.

下表列出此版本 Amazon 中可用的應用程式版本,EMR以及前三個 Amazon EMR版本 (如適用) 中的應用程式版本。

如需每個 Amazon 版本應用程式版本的完整歷史記錄EMR,請參閱下列主題:

應用程式版本資訊
emr-6.10.0 emr-6.9.1 emr-6.9.0 emr-6.8.1
AWS SDK 適用於 Java 1.12.3971.12.1701.12.1701.12.170
Python 2.7、3.72.7、3.72.7、3.72.7、3.7
Scala 2.12.152.12.152.12.152.12.15
AmazonCloudWatchAgent - - - -
Delta2.2.02.1.02.1.0 -
Flink1.16.01.15.21.15.21.15.1
Ganglia3.7.23.7.23.7.23.7.2
HBase2.4.152.4.132.4.132.4.12
HCatalog3.1.33.1.33.1.33.1.3
Hadoop3.3.33.3.33.3.33.2.1
Hive3.1.33.1.33.1.33.1.3
Hudi0.12.2-amzn-00.12.1-amzn-00.12.1-amzn-00.11.1-amzn-0
Hue4.10.04.10.04.10.04.10.0
Iceberg1.1.0-amzn-00.14.1-amzn-00.14.1-amzn-00.14.0-amzn-0
JupyterEnterpriseGateway2.6.02.6.02.6.02.1.0
JupyterHub1.5.01.4.11.4.11.4.1
Livy0.7.10.7.10.7.10.7.1
MXNet1.9.11.9.11.9.11.9.1
Mahout - - - -
Oozie5.2.15.2.15.2.15.2.1
Phoenix5.1.25.1.25.1.25.1.2
Pig0.17.00.17.00.17.00.17.0
Presto0.2780.2760.2760.273
Spark3.3.13.3.03.3.03.3.0
Sqoop1.4.71.4.71.4.71.4.7
TensorFlow2.11.02.10.02.10.02.9.1
Tez0.10.20.10.20.10.20.9.2
Trino (Presto SQL)403398398388
Zeppelin0.10.10.10.10.10.10.10.1
ZooKeeper3.5.103.5.103.5.103.5.10

6.10.0 版本備註

下列版本備註包含 Amazon 6.10.0 EMR版的資訊。變更是相對於 6.9.0 版而言。如需有關發行時間表的資訊,請參閱 變更日誌

新功能
  • Amazon EMR 6.10.0 支援 Apache Spark 3.3.1、Apache Spark RAPIDS 22.12.0、CUDA11.8.0、Apache Hudi 0.12.2-amzn-0、Apache Iceberg 1.1.0-amzn-0、Trino 403 和 PrestoDB 0.278.1。

  • Amazon EMR 6.10.0 包含原生 Trino-Hudi 連接器,可提供對 Hudi 資料表中資料的讀取存取權。您可以使用 trino-cli --catalog hudi 啟動該連接器,並透過 trino-connector-hudi 按自身需求設定連接器。與 Amazon 的原生整合EMR意味著您不再需要使用 trino-connector-hive來查詢 Hudi 資料表。如需了解新連接器的支援組態清單,請參閱 Trino 文件的 Hudi 連接器頁面。

  • Amazon EMR6.10.0 版及更新版本支援 Apache Zeppelin 與 Apache Flink 整合。如需更多資訊,請參閱在 Amazon EMR 中使用 Zeppelin 的 Flink 作業

已知問題
  • Hadoop 3.3.3 引入了 YARN(YARN-9608) 的變更,該變更會讓容器在應用程式完成之前以停用狀態執行的節點保持。此變更確保本機資料 (例如隨機顯示資料) 不會遺失,而且您不需要重新執行作業。這種方法還可能導致叢集上的資源利用不足,不管該叢集是否啟用受管擴展。

    若要在 Amazon EMR 6.10.0 中解決此問題,您可以在 yarn.resourcemanager.decommissioning-nodes-watcher.wait-for-applications false 中將 的值設定為 yarn-site.xml。在 Amazon EMR6.11.0 及更新版本以及 6.8.1、6.9.1 和 6.10.1 false中,預設會將組態設為 以解決此問題。

變更、強化功能和已解決的問題
  • Amazon EMR 6.10.0 移除對 Apache Spark minimal-json.jar的 Amazon Redshift 整合的相依性,並自動將所需的 Spark-Redshift 相關 jar 新增至 Spark 的執行器類別路徑:spark-redshift.jarspark-avro.jarRedshiftJDBC.jar使用 Apache Spark 的 Amazon Redshift 整合,啟動 Spark 應用程式

  • 6.10.0 版本改進了叢集內日誌管理常駐程式,以監控EMR叢集中的其他日誌資料夾。這項改進可最大限度減少磁碟過度使用問題。

  • 6.10.0 版本會在叢集上的日誌管理常駐程式停止時自動重新啟動它。這項改進可降低節點因磁碟過度使用而運作狀態不佳的風險。

  • Amazon EMR 6.10.0 支援用於EMRFS使用者映射的區域端點。

  • Amazon 6.10.0 及更高版本的預設根磁碟區大小已增加至 EMR 15 GB。舊版預設根磁碟區大小為 10 GB。

  • 6.10.0 版本修正當所有剩餘的 Spark 執行程式都使用YARN資源管理員在停用主機上時,Spark 任務停止運作的問題。

  • 使用 Amazon EMR 6.6.0 到 6.9.x 時,具有動態分割區和 ORDER BY 或 SORT BY 子句的INSERT查詢一律有兩個減少器。此問題是由OSS變更 HIVE-20703 所造成,其會將動態排序分割區最佳化置於成本型決策下。如果您的工作負載不需要對動態分割區進行排序,建議將 hive.optimize.sort.dynamic.partition.threshold 屬性設定為 -1,以停用新功能並取得計算正確的縮減器數量。此問題在 OSS Hive 中作為 HIVE-22269 的一部分修正,並在 Amazon 6.10.0 EMR 中修正。

  • 當您啟動具有 Amazon EMR 5.36 或更高版本、6.6 或更高版本,或 7.0 或更高版本的叢集時,Amazon EMR會使用預設 Amazon 的最新 Amazon Linux 2023 或 Amazon Linux 2 EMR 版本AMI。如需詳細資訊,請參閱使用適用於 Amazon 的預設 AMI Amazon LinuxEMR

    注意

    此版本不會再收到自動AMI更新,因為它已經再成功執行 1 個修補程式版本。修補程式版本以第二個小數點後的數字表示 (6.8.1)。若要查看您是否使用最新的修補程式版本,請檢查版本指南 中的可用版本,或在主控台中建立叢集時檢查 Amazon EMR版本下拉式清單,或使用 ListReleaseLabelsAPI或 list-release-labelsCLI動作。若要取得新版本的更新,請訂閱 What's new? 頁面上的RSS摘要。

    OsReleaseLabel (Amazon Linux 版本) Amazon Linux 核心版本 可用日期 支援地區
    2.0.20241001.0 4.14.352 2024 年 10 月 4 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利福尼亞北部)、 美國西部 (奧勒岡)、 歐洲 (斯德哥爾摩)、 歐洲 (米蘭)、 歐洲 (法蘭克福)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 亞太區域 (香港)、 亞太區域 (孟買)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 亞太區域 (雅加達)、 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林)、 加拿大 (中部), AWS GovCloud (美國西部), AWS GovCloud (美國東部)、 中國 (北京)、 中國 (寧夏)
    2.0.20240816.0 4.14.350 2024 年 8 月 21 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利福尼亞北部)、 美國西部 (奧勒岡)、 歐洲 (斯德哥爾摩)、 歐洲 (米蘭)、 歐洲 (法蘭克福)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 亞太區域 (香港)、 亞太區域 (孟買)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 亞太區域 (雅加達)、 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林)、 加拿大 (中部), AWS GovCloud (美國西部), AWS GovCloud (美國東部)、 中國 (北京)、 中國 (寧夏)
    2.0.20240809.0 4.14.349 2024 年 8 月 20 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利福尼亞北部)、 美國西部 (奧勒岡)、 歐洲 (斯德哥爾摩)、 歐洲 (米蘭)、 歐洲 (法蘭克福)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 亞太區域 (香港)、 亞太區域 (孟買)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 亞太區域 (雅加達)、 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林)、 加拿大 (中部), AWS GovCloud (美國西部), AWS GovCloud (美國東部)、 中國 (北京)、 中國 (寧夏)
    2.0.20240719.0 4.14.348 2024 年 7 月 25 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利福尼亞北部)、 美國西部 (奧勒岡)、 歐洲 (斯德哥爾摩)、 歐洲 (米蘭)、 歐洲 (法蘭克福)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 亞太區域 (香港)、 亞太區域 (孟買)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 亞太區域 (雅加達)、 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林)、 加拿大 (中部), AWS GovCloud (美國西部), AWS GovCloud (美國東部)、 中國 (北京)、 中國 (寧夏)
    2.0.20240709.1 4.14.348 2024 年 7 月 23 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利福尼亞北部)、 美國西部 (奧勒岡)、 歐洲 (斯德哥爾摩)、 歐洲 (米蘭)、 歐洲 (法蘭克福)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 亞太區域 (香港)、 亞太區域 (孟買)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 亞太區域 (雅加達)、 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林)、 加拿大 (中部)、 AWS GovCloud (美國西部), AWS GovCloud (美國東部)、 中國 (北京)、 中國 (寧夏)、 亞太區域 (海德拉巴)、 中東 (UAE)、 歐洲 (西班牙)、 歐洲 (蘇黎世)、 亞太區域 (墨爾本)、 以色列 (特拉維夫)、 加拿大西部 (卡加利)
    2.0.20230808.0 4.14.320 2023 年 8 月 24 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (東京)、亞太區域 (首爾)、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、加拿大 (中部)、以色列 (特拉維夫)
    2.0.20230727.0 4.14.320 2023 年 8 月 14 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利福尼亞北部)、 美國西部 (奧勒岡)、 歐洲 (斯德哥爾摩)、 歐洲 (米蘭)、 歐洲 (西班牙)、 歐洲 (法蘭克福)、 歐洲 (蘇黎世)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 亞太區域 (香港)、 亞太區域 (孟買)、 亞太區域 (海德拉巴)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 亞太區域 (雅加達)、 亞太區域 (墨爾本)、 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林)、 中東 (UAE)、 加拿大 (中部)、 以色列 (特拉維夫)
    2.0.20230719.0 4.14.320 2023 年 8 月 2 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利福尼亞北部)、 美國西部 (奧勒岡)、 歐洲 (斯德哥爾摩)、 歐洲 (米蘭)、 歐洲 (西班牙)、 歐洲 (法蘭克福)、 歐洲 (蘇黎世)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 亞太區域 (香港)、 亞太區域 (孟買)、 亞太區域 (海德拉巴)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 亞太區域 (雅加達)、 亞太區域 (墨爾本)、 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林)、 中東 (UAE)、 加拿大 (中部)、 以色列 (特拉維夫)
    2.0.20230628.0 4.14.318 2023 年 7 月 12 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利福尼亞北部)、 美國西部 (奧勒岡)、 加拿大 (中部)、 歐洲 (斯德哥爾摩)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 歐洲 (法蘭克福)、 歐洲 (蘇黎世)、 歐洲 (米蘭)、 歐洲 (西班牙)、 亞太區域 (香港)、 亞太區域 (孟買)、 亞太區域 (海德拉巴)、 亞太區域 (雅加達)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林)、 中東 (UAE)
    2.0.20230612.0 4.14.314 2023 年 6 月 23 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利福尼亞北部)、 美國西部 (奧勒岡)、 加拿大 (中部)、 歐洲 (斯德哥爾摩)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 歐洲 (法蘭克福)、 歐洲 (蘇黎世)、 歐洲 (米蘭)、 歐洲 (西班牙)、 亞太區域 (香港)、 亞太區域 (孟買)、 亞太區域 (海德拉巴)、 亞太區域 (雅加達)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林)、 中東 (UAE)
    2.0.20230504.1 4.14.313 2023 年 5 月 16 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利福尼亞北部)、 美國西部 (奧勒岡)、 加拿大 (中部)、 歐洲 (斯德哥爾摩)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 歐洲 (法蘭克福)、 歐洲 (蘇黎世)、 歐洲 (米蘭)、 歐洲 (西班牙)、 亞太區域 (香港)、 亞太區域 (孟買)、 亞太區域 (海德拉巴)、 亞太區域 (雅加達)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林)、 中東 (UAE)
    2.0.20230418.0 4.14.311 2023 年 5 月 3 日 美國東部 (維吉尼亞北部)、 美國東部 (俄亥俄)、 美國西部 (加利福尼亞北部)、 美國西部 (奧勒岡)、 加拿大 (中部)、 歐洲 (斯德哥爾摩)、 歐洲 (愛爾蘭)、 歐洲 (倫敦)、 歐洲 (巴黎)、 歐洲 (法蘭克福)、 歐洲 (蘇黎世)、 歐洲 (米蘭)、 歐洲 (西班牙)、 亞太區域 (香港)、 亞太區域 (孟買)、 亞太區域 (海德拉巴)、 亞太區域 (雅加達)、 亞太區域 (東京)、 亞太區域 (首爾)、 亞太區域 (大阪)、 亞太區域 (新加坡)、 亞太區域 (雪梨), 非洲 (開普敦)、 南美洲 (聖保羅)、 中東 (巴林)、 中東 (UAE)
    2.0.20230404.1 4.14.311 2023 年 4 月 18 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利福尼亞北部)、美國西部 (奧勒岡)、加拿大 (中部)、歐洲 (斯德哥爾摩)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、歐洲 (法蘭克福)、歐洲 (米蘭)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (雅加達)、亞太區域 (東京)、亞太區域 (首爾)、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)
    2.0.20230404.0 4.14.311 2023 年 4 月 10 日 美國東部 (維吉尼亞北部)、歐洲 (巴黎)
    2.0.20230320.0 4.14.309 2023 年 3 月 30 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利福尼亞北部)、美國西部 (奧勒岡)、加拿大 (中部)、歐洲 (斯德哥爾摩)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、歐洲 (法蘭克福)、歐洲 (米蘭)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (雅加達)、亞太區域 (東京)、亞太區域 (首爾)、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)
    2.0.20230207.0 4.14.304 2023 年 2 月 22 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利福尼亞北部)、美國西部 (奧勒岡)、加拿大 (中部)、歐洲 (斯德哥爾摩)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、歐洲 (法蘭克福)、歐洲 (米蘭)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (雅加達)、亞太區域 (東京)、亞太區域 (首爾)、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)

6.10.0 元件版本

Amazon 使用此版本EMR安裝的元件如下所列。其中有一些屬於大數據應用程式套件。其他則對 Amazon 而言是獨一無二的EMR,並針對系統程序和功能進行安裝。這些通常會以 emraws 開頭。Amazon EMR最新版本中的大數據應用程式套件通常是社群中發現的最新版本。我們會EMR盡快在 Amazon 中提供社群版本。

Amazon 中的某些元件與社群版本EMR不同。這些元件具有版本標籤,格式為 CommunityVersion-amzn-EmrVersionEmrVersion 從 0 開始。例如,如果使用 2.2 版命名myapp-component的開放原始碼社群元件已修改三次,以包含在不同的 Amazon EMR版本中,則其發行版本會列為 2.2-amzn-2

元件 版本 描述
aws-sagemaker-spark-sdk1.4.2Amazon SageMaker Spark SDK
delta2.2.0Delta Lake 是一種適用於大型分析資料集的開放式資料表格式
emr-ddb4.16.0適用於 Hadoop 生態系統應用程式的 Amazon DynamoDB 連接器。
emr-goodies3.3.0適用 Hadoop 生態系統的超便利程式庫。
emr-kinesis3.7.0適用於 Hadoop 生態系統應用程式的 Amazon Kinesis 連接器。
emr-notebook-env1.7.0適用於 emr 筆記本的 Conda env,前者包含 Jupyter Enterprise Gateway
emr-s3-dist-cp2.24.0針對 Amazon S3 最佳化的分散式複製應用程式。
emr-s3-select2.3.0EMR S3Select 連接器
emr-wal-cli1.0.0用於 emrwal list/deletion 的 Cli。
emrfs2.55.0適用於 Hadoop 生態系統應用程式的 Amazon S3 連接器。
flink-client1.16.0Apache Flink 命令列用戶端指令碼和應用程式。
flink-jobmanager-config1.16.0管理 Apache Flink EMR節點上的資源 JobManager。
ganglia-monitor3.7.2Hadoop 生態系統應用程式內嵌 Ganglia 代理程式以及 Ganglia 監控代理程式。
ganglia-metadata-collector3.7.2Ganglia 監控代理程式的彙總指標 Ganglia 中繼資料收集器。
ganglia-web3.7.1由 Ganglia 中繼資料收集器收集,以檢視指標的 Web 應用程式。
hadoop-client3.3.3-amzn-2Hadoop 命令列用戶端,例如「hdfs」、「Hadoop」或「yarn」。
hadoop-hdfs-datanode3.3.3-amzn-2HDFS 儲存區塊的節點層級服務。
hadoop-hdfs-library3.3.3-amzn-2HDFS command-line 用戶端和程式庫
hadoop-hdfs-namenode3.3.3-amzn-2HDFS 服務,用於追蹤檔案名稱和區塊位置。
hadoop-hdfs-journalnode3.3.3-amzn-2HDFS 服務,用於管理 HA 叢集上的 Hadoop 檔案系統日誌。
hadoop-httpfs-server3.3.3-amzn-2HTTP HDFS操作的端點。
hadoop-kms-server3.3.3-amzn-2以 Hadoop 的 為基礎的密碼編譯金鑰管理伺服器 KeyProvider API。
hadoop-mapred3.3.3-amzn-2MapReduce 執行引擎程式庫,用於執行 MapReduce 應用程式。
hadoop-yarn-nodemanager3.3.3-amzn-2YARN 服務,用於管理個別節點上的容器。
hadoop-yarn-resourcemanager3.3.3-amzn-2YARN 服務,用於配置和管理叢集資源和分散式應用程式。
hadoop-yarn-timeline-server3.3.3-amzn-2擷取YARN應用程式目前和歷史資訊的 服務。
hbase-hmaster2.4.15-amzn-0負責協調區域和執行管理命令的HBase叢集的服務。
hbase-region-server2.4.15-amzn-0服務一或多個HBase區域的服務。
hbase-client2.4.15-amzn-0HBase command-line 用戶端。
hbase-rest-server2.4.15-amzn-0為 提供RESTfulHTTP端點的服務HBase。
hbase-thrift-server2.4.15-amzn-0向 提供 Thrift 端點的服務HBase。
hbase-operator-tools2.4.15-amzn-0Apache HBase叢集的修復工具。
hcatalog-client3.1.3-amzn-3操作 hcatalog-server 的「hcat」命令列用戶端。
hcatalog-server3.1.3-amzn-3為分散式應用程式提供 HCatalog、資料表和儲存管理層的服務。
hcatalog-webhcat-server3.1.3-amzn-3HTTP 端點為 提供REST介面HCatalog。
hive-client3.1.3-amzn-3Hive 命令列用戶端。
hive-hbase3.1.3-amzn-3Hive-hbase 用戶端。
hive-metastore-server3.1.3-amzn-3存取 Hive 中繼存放區的服務,這是在 Hadoop 操作SQL上儲存 中繼資料的語意儲存庫。
hive-server23.1.3-amzn-3依 Web 請求接受 Hive 查詢的服務。
hudi0.12.2-amzn-0增量處理架構,以低延遲和高效率強化資料管道。
hudi-presto0.12.2-amzn-0用於使用 Hudi 執行 Presto 的套件程式庫。
hudi-trino0.12.2-amzn-0用於使用 Hudi 執行 Trino 的套件程式庫。
hudi-spark0.12.2-amzn-0用於使用 Hudi 執行 Spark 的套件程式庫。
hue-server4.10.0使用 Hadoop 生態系統應用程式分析資料的 Web 應用程式
iceberg1.1.0-amzn-0Apache Iceberg 是一種適用於大型分析資料集的開放式資料表格式
jupyterhub1.5.0適用於 Jupyter 筆記本的多使用者伺服器
livy-server0.7.1-incubatingREST 與 Apache Spark 互動的介面
nginx1.12.1nginx 【引擎 x】 是 HTTP和 反向代理伺服器
mxnet1.9.1靈活有效率的程式庫,具可擴展性,適用於深度學習。
mariadb-server5.5.68+MariaDB 資料庫伺服器。
nvidia-cuda11.8.0Nvidia 驅動程式和 Cuda 工具組
oozie-client5.2.1Oozie 命令列用戶端。
oozie-server5.2.1接受 Oozie 工作流程要求的服務。
opencv4.5.0開放原始碼電腦 Vision 程式庫。
phoenix-library5.1.2適用於伺服器和用戶端的 phoenix 程式庫
phoenix-connectors6.0.0-SNAPSHOT適用於 Spark-3 的 Apache Phoenix 連接器
phoenix-query-server6.0.0輕量型伺服器,提供對 Avatica 的JDBC存取以及通訊協定緩衝區和JSON格式存取 API
presto-coordinator0.278.1-amzn-0在 presto-workers 之間接受查詢和執行管理查詢的服務。
presto-worker0.278.1-amzn-0執行查詢各部分的服務。
presto-client0.278.1-amzn-0安裝於 HA 叢集的待命主節點的 Presto 命令列用戶端,該主節點上的 Presto 伺服器未啟動。
trino-coordinator403-amzn-0在 trino-workers 之間接受查詢和執行管理查詢的服務。
trino-worker403-amzn-0執行查詢各部分的服務。
trino-client403-amzn-0安裝於 HA 叢集的待命主節點的 Trino 命令列用戶端,該主節點上的 Trino 伺服器未啟動。
pig-client0.17.0Pig 命令列用戶端。
r4.0.2統計運算 R 專案
ranger-kms-server2.0.0Apache Ranger Key Management System
spark-client3.3.1-amzn-0Spark 命令列用戶端。
spark-history-server3.3.1-amzn-0用於檢視完整 Spark 應用程式生命週期記錄事件的 Web 使用者介面。
spark-on-yarn3.3.1-amzn-0的記憶體內執行引擎YARN。
spark-yarn-slave3.3.1-amzn-0從屬所需的 Apache Spark YARN 程式庫。
spark-rapids22.12.0-amzn-0使用 加速 Apache Spark 的 NVIDIA Spark RAPIDS外掛程式GPUs。
sqoop-client1.4.7Apache Sqoop 命令列用戶端。
tensorflow2.11.0TensorFlow 適用於高效能數值運算的開放原始碼軟體程式庫。
tez-on-yarn0.10.2-amzn-1tez YARN 應用程式和程式庫。
tez-on-worker0.10.2-amzn-1工作者節點的 tez YARN 應用程式和程式庫。
webserver2.4.41+Apache HTTP 伺服器。
zeppelin-server0.10.1能進行互動式資料分析,以 Web 為基礎的筆記型電腦。
zookeeper-server3.5.10用於維護組態資訊、命名、提供分散式同步,並提供群組服務的集中化服務。
zookeeper-client3.5.10ZooKeeper 命令列用戶端。

6.10.0 組態類別

組態分類可讓您自訂應用程式。這些檔案通常對應於應用程式的組態XML檔案,例如 hive-site.xml。如需詳細資訊,請參閱設定應用程式

當您為執行中叢集的執行個體群組指定組態時,就會發生重新設定動作。Amazon EMR只會為您修改的分類啟動重新設定動作。如需詳細資訊,請參閱重新設定執行中叢集中的執行個體群組

emr-6.10.0 分類
分類 描述 重新設定動作

capacity-scheduler

變更 Hadoop 中 capacity-scheduler.xml 檔案的值。

Restarts the ResourceManager service.

container-executor

變更 Hadoop YARN的 container-executor.cfg 檔案中的值。

Not available.

container-log4j

變更 Hadoop YARN的 container-log4j.properties 檔案中的值。

Not available.

core-site

變更 Hadoop 中 core-site.xml 檔案的值。

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Hadoop KMS, Ranger KMS, HiveServer2, Hive MetaStore, Hadoop Httpfs, and MapReduce-HistoryServer.

docker-conf

變更 Docker 相關設定。

Not available.

emrfs-site

變更EMRFS設定。

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts HBaseRegionserver, HBaseMaster, HBaseThrift, HBaseRest, HiveServer2, Hive MetaStore, Hadoop Httpfs, and MapReduce-HistoryServer.

flink-conf

變更 flink-conf.yaml 設定。

Restarts Flink history server.

flink-log4j

變更 Flink log4j.properties 設定。

Restarts Flink history server.

flink-log4j-session

變更 Kubernetes/Yarn 工作階段的 Flink log4j-session.properties 設定。

Restarts Flink history server.

flink-log4j-cli

變更 Flink log4j-cli.properties 設定。

Restarts Flink history server.

hadoop-env

在 Hadoop 環境中變更所有 Hadoop 元件的值。

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts PhoenixQueryserver, HiveServer2, Hive MetaStore, and MapReduce-HistoryServer.

hadoop-log4j

變更 Hadoop 中 log4j.properties 檔案的值。

Restarts the Hadoop HDFS services SecondaryNamenode, Datanode, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Hadoop KMS, Hadoop Httpfs, and MapReduce-HistoryServer.

hadoop-ssl-server

變更 hadoop ssl 伺服器組態

Not available.

hadoop-ssl-client

變更 hadoop ssl 用戶端組態

Not available.

hbase

Apache 的 Amazon EMR精選設定HBase。

Custom EMR specific property. Sets emrfs-site and hbase-site configs. See those for their associated restarts.

hbase-env

變更 HBase環境中的值。

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-log4j

變更 HBasehbase-log4j.properties 檔案中的值。

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-metrics

變更 HBase的 hadoop-metrics2-hbase.properties 檔案中的值。

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-policy

變更 HBasehbase-policy.xml 檔案中的值。

Not available.

hbase-site

變更 HBasehbase-site.xml 檔案中的值。

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer. Additionally restarts Phoenix QueryServer.

hdfs-encryption-zones

設定HDFS加密區域。

This classification should not be reconfigured.

hdfs-env

變更HDFS環境中的值。

Restarts Hadoop HDFS services Namenode, Datanode, and ZKFC.

hdfs-site

變更 HDFShdfs-site.xml 中的值。

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Additionally restarts Hadoop Httpfs.

hcatalog-env

變更 HCatalog環境中的值。

Restarts Hive HCatalog Server.

hcatalog-server-jndi

變更 jndi.properties HCatalog中的值。

Restarts Hive HCatalog Server.

hcatalog-server-proto-hive-site

變更 HCatalog. proto-hive-sitexml 中的值。

Restarts Hive HCatalog Server.

hcatalog-webhcat-env

變更 HCatalog W ebHCat環境中的值。

Restarts Hive WebHCat server.

hcatalog-webhcat-log4j2

變更 HCatalog W ebHCat的 log4j2.properties 中的值。

Restarts Hive WebHCat server.

hcatalog-webhcat-site

變更 HCatalog W ebHCat的 webhcat-site.xml 檔案中的值。

Restarts Hive WebHCat server.

hive

Apache Hive 的 Amazon EMR精選設定。

Sets configurations to launch Hive LLAP service.

hive-beeline-log4j2

變更 Hive 的 beeline-log4j2.properties 檔案中的值。

Not available.

hive-parquet-logging

變更 Hive 的 parquet-logging.properties 檔案中的值。

Not available.

hive-env

變更 Hive 環境中的值。

Restarts HiveServer2, HiveMetastore, and Hive HCatalog-Server. Runs Hive schemaTool CLI commands to verify hive-metastore.

hive-exec-log4j2

在 Hive 的 hive-exec-log4j2.properties 檔案中變更值。

Not available.

hive-llap-daemon-log4j2

變更 Hive llap-daemon-log4j2.properties 檔案中的值。

Not available.

hive-log4j2

變更 Hive 的 hive-log4j2.properties 檔案中的值。

Not available.

hive-site

變更 Hive 的 hive-site.xml 檔案中的值

Restarts HiveServer2, HiveMetastore, and Hive HCatalog-Server. Runs Hive schemaTool CLI commands to verify hive-metastore. Also restarts Oozie and Zeppelin.

hiveserver2-site

變更 Hive Server2 的 hiveserver2-site.xml 檔案中的值

Not available.

hue-ini

變更 Hue 的 ini 檔案中的值

Restarts Hue. Also activates Hue config override CLI commands to pick up new configurations.

httpfs-env

變更HTTPFS環境中的值。

Restarts Hadoop Httpfs service.

httpfs-site

變更 Hadoop 中 httpfs-site.xml 檔案的值。

Restarts Hadoop Httpfs service.

hadoop-kms-acls

變更 Hadoop 中 kms-acls.xml 檔案的值。

Not available.

hadoop-kms-env

變更 Hadoop KMS環境中的值。

Restarts Hadoop-KMS service.

hadoop-kms-log4j

變更 Hadoop 的 kms-log4j.properties 檔案中的值。

Not available.

hadoop-kms-site

變更 Hadoop 中 kms-site.xml 檔案的值。

Restarts Hadoop-KMS and Ranger-KMS service.

hudi-env

變更 Hudi 環境中的值。

Not available.

hudi-defaults

變更 Hudi 的 hudi-defaults.conf 檔案中的值。

Not available.

iceberg-defaults

變更 Iceberg 的 iceberg-defaults.conf 檔案中的值。

Not available.

delta-defaults

變更 Delta 的 delta-defaults.conf 檔案中的值。

Not available.

jupyter-notebook-conf

變更 Jupyter 筆記本中 jupyter_notebook_config.py 檔案的值。

Not available.

jupyter-hub-conf

變更 JupyterHubsjupyterhub_config.py 檔案中的值。

Not available.

jupyter-s3-conf

設定 Jupyter 筆記本 S3 持久性。

Not available.

jupyter-sparkmagic-conf

變更 Sparkmagic 中 config.json 檔案的值。

Not available.

livy-conf

變更 Livy 的 livy.conf 檔案中的值。

Restarts Livy Server.

livy-env

變更 Livy 環境中的值。

Restarts Livy Server.

livy-log4j2

變更 Livy log4j2.properties 設定。

Restarts Livy Server.

mapred-env

變更 MapReduce 應用程式環境中的值。

Restarts Hadoop MapReduce-HistoryServer.

mapred-site

變更 MapReduce 應用程式 mapred-site.xml 檔案中的值。

Restarts Hadoop MapReduce-HistoryServer.

oozie-env

變更 Oozie 環境中的值。

Restarts Oozie.

oozie-log4j

變更 Oozie 的 oozie-log4j.properties 檔案中的值。

Restarts Oozie.

oozie-site

變更 Oozie 的 oozie-site.xml 檔案中的值。

Restarts Oozie.

phoenix-hbase-metrics

變更 Phoenix 的 hadoop-metrics2-hbase.properties 檔案中的值。

Not available.

phoenix-hbase-site

變更 Phoenix 的 hbase-site.xml 檔案中的值。

Not available.

phoenix-log4j

變更 Phoenix 中 log4j.properties 檔案的值。

Restarts Phoenix-QueryServer.

phoenix-metrics

變更 Phoenix 的 hadoop-metrics2-phoenix.properties 檔案中的值。

Not available.

pig-env

在 Pig 環境中變更值。

Not available.

pig-properties

變更 Pig 的 pig.properties 檔案中的值。

Restarts Oozie.

pig-log4j

變更 Pig 的 log4j.properties 檔案中的值。

Not available.

presto-log

變更 Presto 的 log.properties 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-config

變更 Presto 的 config.properties 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-password-authenticator

變更 Presto 的 password-authenticator.properties 檔案中的值。

Not available.

presto-env

變更 Presto 的 presto-env.sh 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-node

變更 Presto 的 node.properties 檔案中的值。

Not available.

presto-connector-blackhole

變更 Presto 的 blackhole.properties 檔案中的值。

Not available.

presto-connector-cassandra

變更 Presto 的 cassandra.properties 檔案中的值。

Not available.

presto-connector-hive

變更 Presto 的 hive.properties 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-connector-jmx

變更 Presto 的 jmx.properties 檔案中的值。

Not available.

presto-connector-kafka

變更 Presto 的 kafka.properties 檔案中的值。

Not available.

presto-connector-lakeformation

變更 Presto 的 lakeformation.properties 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-connector-localfile

變更 Presto 的 localfile.properties 檔案中的值。

Not available.

presto-connector-memory

變更 Presto 的 memory.properties 檔案中的值。

Not available.

presto-connector-mongodb

變更 Presto 的 mongodb.properties 檔案中的值。

Not available.

presto-connector-mysql

變更 Presto 的 mysql.properties 檔案中的值。

Not available.

presto-connector-postgresql

變更 Presto 的 postgresql.properties 檔案中的值。

Not available.

presto-connector-raptor

變更 Presto 的 raptor.properties 檔案中的值。

Not available.

presto-connector-redis

變更 Presto 的 redis.properties 檔案中的值。

Not available.

presto-connector-redshift

變更 Presto 的 redshift.properties 檔案中的值。

Not available.

presto-connector-tpch

變更 Presto 的 tpch.properties 檔案中的值。

Not available.

presto-connector-tpcds

變更 Presto 的 tpcds.properties 檔案中的值。

Not available.

trino-log

變更 Trino 的 log.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-config

變更 Trino 的 config.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-password-authenticator

變更 Trino 的 password-authenticator.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-env

變更 Trino 的 trino-env.sh 檔案中的值。

Restarts Trino-Server (for Trino)

trino-node

變更 Trino 的 node.properties 檔案中的值。

Not available.

trino-connector-blackhole

變更 Trino 的 blackhole.properties 檔案中的值。

Not available.

trino-connector-cassandra

變更 Trino 的 cassandra.properties 檔案中的值。

Not available.

trino-connector-delta

變更 Trino 的 delta.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-connector-hive

變更 Trino 的 hive.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-exchange-manager

變更 Trino 的 exchange-manager.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-connector-iceberg

變更 Trino 的 iceberg.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-connector-hudi

變更 Trino 的 hudi.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-connector-jmx

變更 Trino 的 jmx.properties 檔案中的值。

Not available.

trino-connector-kafka

變更 Trino 的 kafka.properties 檔案中的值。

Not available.

trino-connector-localfile

變更 Trino 的 localfile.properties 檔案中的值。

Not available.

trino-connector-memory

變更 Trino 的 memory.properties 檔案中的值。

Not available.

trino-connector-mongodb

變更 Trino 的 mongodb.properties 檔案中的值。

Not available.

trino-connector-mysql

變更 Trino 的 mysql.properties 檔案中的值。

Not available.

trino-connector-postgresql

變更 Trino 的 postgresql.properties 檔案中的值。

Not available.

trino-connector-raptor

變更 Trino 的 raptor.properties 檔案中的值。

Not available.

trino-connector-redis

變更 Trino 的 redis.properties 檔案中的值。

Not available.

trino-connector-redshift

變更 Trino 的 redshift.properties 檔案中的值。

Not available.

trino-connector-tpch

變更 Trino 的 tpch.properties 檔案中的值。

Not available.

trino-connector-tpcds

變更 Trino 的 tpcds.properties 檔案中的值。

Not available.

ranger-kms-dbks-site

變更 Ranger 的 dbks-site.xml 檔案中的值KMS。

Restarts Ranger KMS Server.

ranger-kms-site

變更 Ranger 的 ranger-kms-site.xml 檔案中的值KMS。

Restarts Ranger KMS Server.

ranger-kms-env

在 Ranger KMS環境中變更值。

Restarts Ranger KMS Server.

ranger-kms-logback

變更 Ranger 的 kms-logback.xml 檔案中的值KMS。

Not available.

ranger-kms-db-ca

變更 S3 for MySQL 與 Ranger SSL連線上的 CA 檔案值KMS。

Not available.

spark

Apache Spark 的 Amazon EMR精選設定。

This property modifies spark-defaults. See actions there.

spark-defaults

變更 Spark 的 spark-defaults.conf 檔案中的值。

Restarts Spark history server and Spark thrift server.

spark-env

變更 Spark 環境中的值。

Restarts Spark history server and Spark thrift server.

spark-hive-site

變更 Spark 的 hive-site.xml 檔案中的值

Not available.

spark-log4j2

變更 Spark 中 log4j2.properties 檔案中的值。

Restarts Spark history server and Spark thrift server.

spark-metrics

變更 Spark 中 metrics.properties 檔案的值。

Restarts Spark history server and Spark thrift server.

sqoop-env

變更 Sqoop 環境中的值。

Not available.

sqoop-oraoop-site

變更 Sqoop OraOop的 oraoop-site.xml 檔案中的值。

Not available.

sqoop-site

變更 Sqoop 的 sqoop-site.xml 檔案中的值。

Not available.

tez-site

變更 Tez 的 tez-site.xml 檔案中的值。

Restart Oozie and HiveServer2.

yarn-env

變更YARN環境中的值。

Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts MapReduce-HistoryServer.

yarn-site

變更 YARN的 yarn-site.xml 檔案中的值。

Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Livy Server and MapReduce-HistoryServer.

zeppelin-env

變更 Zeppelin 環境中的值。

Restarts Zeppelin.

zeppelin-site

變更 zeppelin-site.xml 中的組態設定。

Restarts Zeppelin.

zookeeper-config

變更 ZooKeeperzoo.cfg 檔案中的值。

Restarts Zookeeper server.

zookeeper-log4j

變更 ZooKeeper的 log4j.properties 檔案中的值。

Restarts Zookeeper server.

6.10.0 變更日誌

變更 6.10.0 版本和版本備註的日誌
日期 事件 描述
2023-08-21 更新 新增 Hadoop 3.3.3 引入的已知問題。
2023-07-26 更新 新的作業系統發行標籤 2.0.20230612.02.0.20230628.0
2023-03-02 部署完成 Amazon EMR 6.10 完全部署到所有支援的區域
2023-03-02 文件出版 先發佈 Amazon EMR 6.10 版本備註
2023-02-27 初始版本 Amazon EMR 6.10 部署到有限的商業區域