Amazon EMR 版本 6.10.1 版本 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon EMR 版本 6.10.1 版本

6.10.1 應用程式版本

此版本支援下列應用程式:DeltaFlinkGangliaHBaseHCatalogHadoopHiveHudiHueIcebergJupyterEnterpriseGatewayJupyterHubLivyMXNetOoziePhoenixPigPrestoSparkSqoopTensorFlowTezTrinoZeppelinZooKeeper

下表列出此 Amazon 發行版本中可用的應用程式版本,以EMR及前三個 Amazon 版本中的應用程式EMR版本 (如果適用)。

如需 Amazon 每個版本之應用程式版本的完整歷史記錄EMR,請參閱下列主題:

應用程式版本資訊
emr-6.10.1 emr-6.10.0 emr-6.9.1 emr-6.9.0
適用於 Java 的AWS SDK 1.12.3971.12.3971.12.1701.12.170
Python 2.7、3.72.7、3.72.7、3.72.7、3.7
Scala 2.12.152.12.152.12.152.12.15
AmazonCloudWatchAgent - - - -
Delta2.2.02.2.02.1.02.1.0
Flink1.16.01.16.01.15.21.15.2
Ganglia3.7.23.7.23.7.23.7.2
HBase2.4.152.4.152.4.132.4.13
HCatalog3.1.33.1.33.1.33.1.3
Hadoop3.3.33.3.33.3.33.3.3
Hive3.1.33.1.33.1.33.1.3
Hudi0.12.2-amzn-00.12.2-amzn-00.12.1-amzn-00.12.1-amzn-0
Hue4.10.04.10.04.10.04.10.0
Iceberg1.1.0-amzn-01.1.0-amzn-00.14.1-amzn-00.14.1-amzn-0
JupyterEnterpriseGateway2.6.02.6.02.6.02.6.0
JupyterHub1.5.01.5.01.4.11.4.1
Livy0.7.10.7.10.7.10.7.1
MXNet1.9.11.9.11.9.11.9.1
Mahout - - - -
Oozie5.2.15.2.15.2.15.2.1
Phoenix5.1.25.1.25.1.25.1.2
Pig0.17.00.17.00.17.00.17.0
Presto0.2780.2780.2760.276
Spark3.3.13.3.13.3.03.3.0
Sqoop1.4.71.4.71.4.71.4.7
TensorFlow2.11.02.11.02.10.02.10.0
Tez0.10.20.10.20.10.20.10.2
Trino (PrestoSQL)403403398398
Zeppelin0.10.10.10.10.10.10.10.1
ZooKeeper3.5.103.5.103.5.103.5.10

6.10.1 版本備註

下列版本說明包含 Amazon 6.10.1 EMR 版的資訊。變更是相對於 6.10.0 版而言。如需有關發行時間表的資訊,請參閱 6.10.1 變更日誌

變更、強化功能和已解決的問題
  • 由於鎖定爭用,如果節點在嘗試除役的同時被新增或移除,則可能會進入死鎖狀態。因此,Hadoop 資源管理員 (YARN) 變得沒有回應,並會影響所有傳入和目前執行的容器。

  • Hadoop 3.3.3 在 YARN (YARN-9608) 中引入了一項變更,讓容器處於停用狀態執行的節點,直到應用程式完成為止。此變更確保本機資料 (例如隨機顯示資料) 不會遺失,而且您不需要重新執行作業。這種方法還可能導致叢集上的資源利用不足,不管該叢集是否啟用受管擴展。

    Amazon EMR 版本 6.11.0 及更高版本以及 6.8.1、6.9.1 和 6.10.1 版本時,會將的值設定yarn.resourcemanager.decommissioning-nodes-watcher.wait-for-applicationsfalseyarn-site.xml以解決此問題。

    雖然此修正程式解決了 YARN -9608 引入的問題,但可能會造成 Hive 工作失敗,因為已啟用管理擴展的叢集上的隨機資料遺失。在此版本中,我們透過同時為 Hive 工作負載設定 yarn.resourcemanager.decommissioning-nodes-watcher.wait-for-shuffle-data,以降低該風險。此配置僅適用於 Amazon 6.11.0 及更高EMR版本。

  • 在使用執行個體群組組態的叢集中,若主節點發生容錯移轉,則指標收集器不會再將任何指標傳送至控制平面。

  • 此版本包含一項變更,以允許高可用性叢集在重新啟動後從失敗的狀態還原。

  • 此版本包含適用於 Hue 和HBase.

  • 此版本修正在使用 Amazon 的 Spark 上執行工作負載的叢集EMR可能會以無訊息方式收到containsstartsWithendsWith、和不正確結果的問題like。當您在 Amazon EMR Hive3 中繼存放區伺服器 () 中具有中繼資料的分區欄位上使用運算式時,就會發生此問題。HMS

  • 此版本修正了當沒有使用者定義函數 () UDF 時,Glue 端節流的問題。

  • 此版本修正了節點日誌彙總服務刪除容器日誌的問題,日誌推送器可以在YARN解除委任時將其推送到 S3 之前。

  • 此版本修正了針對 Hadoop 啟用節點標籤時, FairShare 排程器量度的問題。

  • 此版本修正了當您在 spark-defaults.conf 中為 spark.yarn.heterogeneousExecutors.enabled 組態設定預設 true 值時,Spark 效能將受影響的問題。

  • 此版本修正了「減少任務」無法讀取隨機顯示資料的問題。該問題導致 Hive 查詢因記憶體損毀錯誤而失敗。

  • 此版本為執行 Presto 或 Trino 的叢集擴展工作EMR流程增加了新的重試機制。此改進降低了叢集調整大小因一次失敗的操作而無限期停滯的風險。它還提高了叢集使用率,因為您的叢集可以更快地擴增與縮減規模。

  • 此版本改善了叢集向下縮減邏輯,因此您的叢集不會在叢集的HDFS複寫因素設定之下嘗試縮減核心節點。這和您的資料備援要求一致,且降低了擴展操作可能停滯的機率。

  • 日誌管理常駐程式已升級,可識別本機執行個體儲存及相關程序上與開放檔案控點搭配使用的所有作用中日誌。此升級可確保 Amazon 在日誌存檔到 Amazon S3 後EMR正確刪除檔案並回收儲存空間。

  • 此版本包含日誌管理常駐程式增強功能,可刪除本機叢集檔案系統中空白、未使用的步驟目錄。過多的空目錄可能會降低 Amazon 常EMR駐程式的效能,並導致磁碟過度使用率。

  • 此版本修正了當您從具有多個主節點的叢集複寫其中一個主要節點,以便建立邊緣節點時可能發生的問題。複寫的邊緣節點可能導致規模縮減操作出現延遲,或致使主節點上發生記憶體使用率升高的情形。如需如何建立邊緣節點以與EMR叢集通訊的詳細資訊,請參閱上的aws-samples存放庫中的 Edge 節點建立者 GitHub。

  • 此版本改善了 Amazon 在重新啟動後EMR用於將 Amazon EBS 卷重新掛接到執行個體的自動化程序。

  • 此版本修正了 Amazon EMR 發佈到 Amazon CloudWatch 的 Hadoop 指標間歇性差距的問題。

  • 此版本修正EMR叢集問題,其中包含叢集節點排除清單之YARN組態檔的更新會因磁碟過度使用而中斷。不完整的更新會阻礙未來的叢集規模縮減操作。此版本可確保您的叢集維持正常運作,擴展操作也如預期執行。

  • 當您使用 Amazon EMR 5.36 或更高版本,6.6 或更高版本或 7.0 或更高版本的最新修補程序版本啟動集群時,Amazon 將最新的 Amazon Linux 2023 或 Amazon Linux 2 版本EMR用於默認 Amazon。EMR AMI如需詳細資訊,請參閱使用 Amazon 的預設 Amazon Linux AMI EMR

    OsReleaseLabel (Amazon Linux 版本) Amazon Linux 核心版本 可用日期 支援地區
    2.0.20240709.1 4.14.348 2024年7月23 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (東京)、亞太區域 (首爾)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (東京)、亞太區域 (東京)、亞太區域 (首爾)、亞太區域 (香港) (雪梨)、亞太區域 (雅加達)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、加拿大 (中部)、 AWS GovCloud (美國西部)、 AWS GovCloud (美國東部)、中國 (北京)、中國 (寧夏)、亞洲太平洋 (海德拉巴)、中東 (UAE)、歐洲 (西班牙)、歐洲 (蘇黎世)、亞太區域 (墨爾本)、以色列 (特拉維夫)、加拿大西部 (卡加利)
    2.0.20240223.0 4.14.336 2024年3月8日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部),以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏),加拿大西部(卡加利)
    2.0.20240131.0 4.14.336 2024年2月14日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部),以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏),加拿大西部(卡加利)
    2.0.20240124.0 4.14.336 2024年2月7日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部),以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏),加拿大西部(卡加利)
    2.0.20240109.0 4.14.334 2024年1月24日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部),以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏),加拿大西部(卡加利)
    2.0.20231218.0 4.14.330 2024年1月2日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部),以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏)
    2.0.20231206.0 4.14.330 2023 年 12 月 22 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部),以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏)
    2.0.20231116.0 4.14.328 2023 年 12 月 11 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部),以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏)
    2.0.20231101.0 4.14.327 2023 年 11 月 16 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部),以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏)
    2.0.20231020.1 4.14.326 2023 年 11 月 7 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部),以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏)
    2.0.20231012.1 4.14.326 2023 年 10 月 26 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部),以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏)
    2.0.20230926.0 4.14.322 2023 年 10 月 19 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部),以色列(特拉維夫), AWS GovCloud (美國西部), AWS GovCloud (美國東部),中國(北京),中國(寧夏)
    2.0.20230906.0 4.14.322 2023 年 10 月 4 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部), 以色列 (特拉維夫)
    2.0.20230822.0 4.14.322 2023 年 8 月 30 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部), 以色列 (特拉維夫)
    2.0.20230808.0 4.14.320 2023 年 8 月 24 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (海德拉巴)、亞太區域 (東京))、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、亞太區域 (墨爾本)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、中東 (UAE)、加拿大 (中部), 以色列 (特拉維夫)
    2.0.20230727.0 4.14.320 2023 年 8 月 14 日 美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、歐洲 (斯德哥爾摩)、歐洲 (米蘭)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (巴黎)、亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (東京)、亞太區域 (首爾)、亞太區域 (大阪)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (雅加達)、非洲 (開普敦)、南美洲 (聖保羅)、中東 (巴林)、加拿大 (中部)

6.10.1 元件版本

下面列出了 Amazon 與此版本一起EMR安裝的元件。其中有一些屬於大數據應用程式套件。其他則是 Amazon 獨有的,EMR並安裝用於系統程序和功能。這些通常會以 emraws 開頭。最新 Amazon EMR 版本中的大數據應用程式套件通常是社群中的最新版本。我們會EMR盡快在 Amazon 提供社群版本。

Amazon 中的某些元件EMR與社群版本不同。這些元件具有版本標籤,格式為 CommunityVersion-amzn-EmrVersionEmrVersion 從 0 開始。例如,如果以 2.2 版命名myapp-component的開放原始碼社群元件已經修改三次以包含在不同的 Amazon EMR 版本中,則其發行版本會列為2.2-amzn-2

元件 版本 描述
aws-sagemaker-spark-sdk1.4.2Amazon SageMaker 星火 SDK
delta2.2.0Delta Lake 是一種適用於大型分析資料集的開放式資料表格式
emr-ddb4.16.0適用於 Hadoop 生態系統應用程式的 Amazon DynamoDB 連接器。
emr-goodies3.3.0適用 Hadoop 生態系統的超便利程式庫。
emr-kinesis3.7.0適用於 Hadoop 生態系統應用程式的 Amazon Kinesis 連接器。
emr-notebook-env1.7.0適用於 emr 筆記本的 Conda env,前者包含 Jupyter Enterprise Gateway
emr-s3-dist-cp2.24.0針對 Amazon S3 最佳化的分散式複製應用程式。
emr-s3-select2.3.0EMRS3 選擇連接器
emr-wal-cli1.0.0用於 emrwal list/deletion 的 Cli。
emrfs2.55.0適用於 Hadoop 生態系統應用程式的 Amazon S3 連接器。
flink-client1.16.0Apache Flink 命令列用戶端指令碼和應用程式。
flink-jobmanager-config1.16.0管理阿帕奇 Flink EMR JobManager 節點上的資源。
ganglia-monitor3.7.2Hadoop 生態系統應用程式內嵌 Ganglia 代理程式以及 Ganglia 監控代理程式。
ganglia-metadata-collector3.7.2Ganglia 監控代理程式的彙總指標 Ganglia 中繼資料收集器。
ganglia-web3.7.1由 Ganglia 中繼資料收集器收集,以檢視指標的 Web 應用程式。
hadoop-client3.3.3-amzn-2.1Hadoop 命令列用戶端,例如「hdfs」、「Hadoop」或「yarn」。
hadoop-hdfs-datanode3.3.3-amzn-2.1HDFS用於存儲塊的節點級服務。
hadoop-hdfs-library3.3.3-amzn-2.1HDFS命令行客戶端和庫
hadoop-hdfs-namenode3.3.3-amzn-2.1HDFS用於跟踪文件名和塊位置的服務。
hadoop-hdfs-journalnode3.3.3-amzn-2.1HDFS用於在 HA 叢集上管理 Hadoop 檔案系統日誌的服務。
hadoop-httpfs-server3.3.3-amzn-2.1HTTPHDFS作業的端點。
hadoop-kms-server3.3.3-amzn-2.1基於 Hadoop 的加密密鑰管理服務器。 KeyProvider API
hadoop-mapred3.3.3-amzn-2.1MapReduce 用於執行應用程式的執行引擎 MapReduce 程式庫。
hadoop-yarn-nodemanager3.3.3-amzn-2.1YARN用於管理個別節點上容器的服務。
hadoop-yarn-resourcemanager3.3.3-amzn-2.1YARN用於分配和管理叢集資源和分散式應用程式的服務。
hadoop-yarn-timeline-server3.3.3-amzn-2.1用於擷取應用程式目前和歷史資訊的YARN服務。
hbase-hmaster2.4.15-amzn-0.1負責協調區域和執行管理命令的HBase叢集服務。
hbase-region-server2.4.15-amzn-0.1服務於一個或多個HBase地區。
hbase-client2.4.15-amzn-0.1HBase命令行客戶端。
hbase-rest-server2.4.15-amzn-0.1服務RESTfulHTTP提供HBase.
hbase-thrift-server2.4.15-amzn-0.1提供節儉端點的HBase服務。
hbase-operator-tools2.4.15-amzn-0.1阿帕奇HBase叢集的修復工具。
hcatalog-client3.1.3-amzn-3.1操作 hcatalog-server 的「hcat」命令列用戶端。
hcatalog-server3.1.3-amzn-3.1服務提供HCatalog,分佈式應用程序的表和存儲管理層。
hcatalog-webhcat-server3.1.3-amzn-3.1HTTP端點提供REST介面HCatalog。
hive-client3.1.3-amzn-3.1Hive 命令列用戶端。
hive-hbase3.1.3-amzn-3.1Hive-hbase 用戶端。
hive-metastore-server3.1.3-amzn-3.1服務訪問蜂巢元存儲,一個語義存儲庫中存儲元數據SQL上的 Hadoop 操作。
hive-server23.1.3-amzn-3.1依 Web 請求接受 Hive 查詢的服務。
hudi0.12.2-amzn-0增量處理架構,以低延遲和高效率強化資料管道。
hudi-presto0.12.2-amzn-0用於使用 Hudi 執行 Presto 的套件程式庫。
hudi-trino0.12.2-amzn-0用於使用 Hudi 執行 Trino 的套件程式庫。
hudi-spark0.12.2-amzn-0用於使用 Hudi 執行 Spark 的套件程式庫。
hue-server4.10.0使用 Hadoop 生態系統應用程式分析資料的 Web 應用程式
iceberg1.1.0-amzn-0Apache Iceberg 是一種適用於大型分析資料集的開放式資料表格式
jupyterhub1.5.0適用於 Jupyter 筆記本的多使用者伺服器
livy-server0.7.1-incubatingREST接口與阿帕奇星火交互
nginx1.12.1nginx [引擎 x] 是一個反向代理HTTP服務器
mxnet1.9.1靈活有效率的程式庫,具可擴展性,適用於深度學習。
mariadb-server5.68+MariaDB 資料庫伺服器。
nvidia-cuda11.8.0Nvidia 驅動程式和 Cuda 工具組
oozie-client5.2.1Oozie 命令列用戶端。
oozie-server5.2.1接受 Oozie 工作流程要求的服務。
opencv4.5.0開放原始碼電腦 Vision 程式庫。
phoenix-library5.1.2適用於伺服器和用戶端的 phoenix 程式庫
phoenix-connectors6.0.0-SNAPSHOT適用於 Spark-3 的 Apache Phoenix 連接器
phoenix-query-server6.0.0輕量級服務器,提供對 Avatica 的JDBC訪問以及協議緩衝區和JSON格式訪問 API
presto-coordinator0.278.1-amzn-0在 presto-workers 之間接受查詢和執行管理查詢的服務。
presto-worker0.278.1-amzn-0執行查詢各部分的服務。
presto-client0.278.1-amzn-0安裝於 HA 叢集的待命主節點的 Presto 命令列用戶端,該主節點上的 Presto 伺服器未啟動。
trino-coordinator403-amzn-0在 trino-workers 之間接受查詢和執行管理查詢的服務。
trino-worker403-amzn-0執行查詢各部分的服務。
trino-client403-amzn-0安裝於 HA 叢集的待命主節點的 Trino 命令列用戶端,該主節點上的 Trino 伺服器未啟動。
pig-client0.17.0Pig 命令列用戶端。
r4.0.2統計運算 R 專案
ranger-kms-server2.0.0Apache Ranger Key Management System
spark-client3.3.1-amzn-0.1Spark 命令列用戶端。
spark-history-server3.3.1-amzn-0.1用於檢視完整 Spark 應用程式生命週期記錄事件的 Web 使用者介面。
spark-on-yarn3.3.1-amzn-0.1的記憶體內執行引擎。YARN
spark-yarn-slave3.3.1-amzn-0.1阿帕奇星火庫所需的YARN奴隸。
spark-rapids22.12.0-amzn-0Nvidia 的星火RAPIDS插件,加速阿帕奇星火與GPUs。
sqoop-client1.4.7Apache Sqoop 命令列用戶端。
tensorflow2.11.0TensorFlow 用於高性能數值計算的開源軟件庫。
tez-on-yarn0.10.2-amzn-1.1Tez YARN 應用程式和程式庫。
tez-on-worker0.10.2-amzn-1.1工作節點的 tez YARN 應用程式和程式庫。
webserver2.4.41+阿帕奇HTTP服務器。
zeppelin-server0.10.1能進行互動式資料分析,以 Web 為基礎的筆記型電腦。
zookeeper-server3.5.10用於維護組態資訊、命名、提供分散式同步,並提供群組服務的集中化服務。
zookeeper-client3.5.10ZooKeeper 命令行客戶端。

6.10.1 組態類別

組態分類可讓您自訂應用程式。這些通常對應於應用程序的配置XML文件,例如hive-site.xml。如需詳細資訊,請參閱 設定應用程式

當您為執行中叢集的執行個體群組指定組態時,就會發生重新設定動作。Amazon EMR 只會針對您修改的分類啟動重新設定動作。如需詳細資訊,請參閱 重新設定執行中叢集中的執行個體群組

emr-6.10.1 分類
分類 描述 重新設定動作

capacity-scheduler

變更 Hadoop 中 capacity-scheduler.xml 檔案的值。

Restarts the ResourceManager service.

container-executor

更改哈達通YARN的 container-executor.cfg 文件中的值。

Not available.

container-log4j

更改 Hadoop YARN 的容器,日誌 4j. 屬性文件中的值。

Not available.

core-site

變更 Hadoop 中 core-site.xml 檔案的值。

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Hadoop KMS, Ranger KMS, HiveServer2, Hive MetaStore, Hadoop Httpfs, and MapReduce-HistoryServer.

docker-conf

變更 Docker 相關設定。

Not available.

emrfs-site

變更EMRFS設定。

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts HBaseRegionserver, HBaseMaster, HBaseThrift, HBaseRest, HiveServer2, Hive MetaStore, Hadoop Httpfs, and MapReduce-HistoryServer.

flink-conf

變更 flink-conf.yaml 設定。

Restarts Flink history server.

flink-log4j

變更 Flink log4j.properties 設定。

Restarts Flink history server.

flink-log4j-session

變更 Kubernetes/Yarn 工作階段的 Flink log4j-session.properties 設定。

Restarts Flink history server.

flink-log4j-cli

變更 Flink log4j-cli.properties 設定。

Restarts Flink history server.

hadoop-env

在 Hadoop 環境中變更所有 Hadoop 元件的值。

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts PhoenixQueryserver, HiveServer2, Hive MetaStore, and MapReduce-HistoryServer.

hadoop-log4j

變更 Hadoop 中 log4j.properties 檔案的值。

Restarts the Hadoop HDFS services SecondaryNamenode, Datanode, and Journalnode. Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Hadoop KMS, Hadoop Httpfs, and MapReduce-HistoryServer.

hadoop-ssl-server

變更 hadoop ssl 伺服器組態

Not available.

hadoop-ssl-client

變更 hadoop ssl 用戶端組態

Not available.

hbase

Amazon EMR 策劃的阿帕奇HBase設置。

Custom EMR specific property. Sets emrfs-site and hbase-site configs. See those for their associated restarts.

hbase-env

變更環境中HBase的值。

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-log4j

更改值HBase的 hbase-log4j. 屬性文件。

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-metrics

更改值中HBase的反向度量 2 hbase.properties 文件。

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer.

hbase-policy

變更HBase的 hbase-policy.xml 檔案中的值。

Not available.

hbase-site

變更HBase的 hbase-site.xml 檔案中的值。

Restarts the HBase services RegionServer, HBaseMaster, ThriftServer, RestServer. Additionally restarts Phoenix QueryServer.

hdfs-encryption-zones

設定HDFS加密區域。

This classification should not be reconfigured.

hdfs-env

變更HDFS環境中的值。

Restarts Hadoop HDFS services Namenode, Datanode, and ZKFC.

hdfs-site

變更HDFS的 hdfs-site.xml 中的值。

Restarts the Hadoop HDFS services Namenode, SecondaryNamenode, Datanode, ZKFC, and Journalnode. Additionally restarts Hadoop Httpfs.

hcatalog-env

變更環境中HCatalog的值。

Restarts Hive HCatalog Server.

hcatalog-server-jndi

變更HCatalog的 jndi.properties 中的值。

Restarts Hive HCatalog Server.

hcatalog-server-proto-hive-site

變更HCatalog的 proto-hive-site .xml 中的值。

Restarts Hive HCatalog Server.

hcatalog-webhcat-env

更改 HCatalog W 環境中ebHCat的值。

Restarts Hive WebHCat server.

hcatalog-webhcat-log4j2

更改 HCatalog W ebHCat 的 log4j2. 屬性中的值。

Restarts Hive WebHCat server.

hcatalog-webhcat-site

更改 HCatalog W 的 webhcat-site.xml 文件中ebHCat的值。

Restarts Hive WebHCat server.

hive

Amazon EMR 策劃的阿帕奇蜂巢設置。

Sets configurations to launch Hive LLAP service.

hive-beeline-log4j2

變更 Hive 的 beeline-log4j2.properties 檔案中的值。

Not available.

hive-parquet-logging

變更 Hive 的 parquet-logging.properties 檔案中的值。

Not available.

hive-env

變更 Hive 環境中的值。

Restarts HiveServer2, HiveMetastore, and Hive HCatalog-Server. Runs Hive schemaTool CLI commands to verify hive-metastore.

hive-exec-log4j2

更改蜂巢的 hive-exec-log 4j2. 屬性文件中的值。

Not available.

hive-llap-daemon-log4j2

更改蜂巢的 llap-daemon-log 4j2. 屬性文件中的值。

Not available.

hive-log4j2

變更 Hive 的 hive-log4j2.properties 檔案中的值。

Not available.

hive-site

變更 Hive 的 hive-site.xml 檔案中的值

Restarts HiveServer2, HiveMetastore, and Hive HCatalog-Server. Runs Hive schemaTool CLI commands to verify hive-metastore. Also restarts Oozie and Zeppelin.

hiveserver2-site

變更 Hive Server2 的 hiveserver2-site.xml 檔案中的值

Not available.

hue-ini

變更 Hue 的 ini 檔案中的值

Restarts Hue. Also activates Hue config override CLI commands to pick up new configurations.

httpfs-env

變更HTTPFS環境中的值。

Restarts Hadoop Httpfs service.

httpfs-site

變更 Hadoop 中 httpfs-site.xml 檔案的值。

Restarts Hadoop Httpfs service.

hadoop-kms-acls

變更 Hadoop 中 kms-acls.xml 檔案的值。

Not available.

hadoop-kms-env

變更 Hadoop KMS 環境中的值。

Restarts Hadoop-KMS service.

hadoop-kms-log4j

變更 Hadoop 的 kms-log4j.properties 檔案中的值。

Not available.

hadoop-kms-site

變更 Hadoop 中 kms-site.xml 檔案的值。

Restarts Hadoop-KMS and Ranger-KMS service.

hudi-env

變更 Hudi 環境中的值。

Not available.

hudi-defaults

變更 Hudi 的 hudi-defaults.conf 檔案中的值。

Not available.

iceberg-defaults

變更 Iceberg 的 iceberg-defaults.conf 檔案中的值。

Not available.

delta-defaults

變更 Delta 的 delta-defaults.conf 檔案中的值。

Not available.

jupyter-notebook-conf

變更 Jupyter 筆記本中 jupyter_notebook_config.py 檔案的值。

Not available.

jupyter-hub-conf

變更 JupyterHubs的 jupyterhub_config.py 檔案中的值。

Not available.

jupyter-s3-conf

設定 Jupyter 筆記本 S3 持久性。

Not available.

jupyter-sparkmagic-conf

變更 Sparkmagic 中 config.json 檔案的值。

Not available.

livy-conf

變更 Livy 的 livy.conf 檔案中的值。

Restarts Livy Server.

livy-env

變更 Livy 環境中的值。

Restarts Livy Server.

livy-log4j2

變更 Livy log4j2.properties 設定。

Restarts Livy Server.

mapred-env

變更 MapReduce 應用程式環境中的值。

Restarts Hadoop MapReduce-HistoryServer.

mapred-site

變更 MapReduce 應用程式的 mapred-site.xml 檔案中的值。

Restarts Hadoop MapReduce-HistoryServer.

oozie-env

變更 Oozie 環境中的值。

Restarts Oozie.

oozie-log4j

變更 Oozie 的 oozie-log4j.properties 檔案中的值。

Restarts Oozie.

oozie-site

變更 Oozie 的 oozie-site.xml 檔案中的值。

Restarts Oozie.

phoenix-hbase-metrics

變更 Phoenix 的 hadoop-metrics2-hbase.properties 檔案中的值。

Not available.

phoenix-hbase-site

變更 Phoenix 的 hbase-site.xml 檔案中的值。

Not available.

phoenix-log4j

變更 Phoenix 中 log4j.properties 檔案的值。

Restarts Phoenix-QueryServer.

phoenix-metrics

變更 Phoenix 的 hadoop-metrics2-phoenix.properties 檔案中的值。

Not available.

pig-env

在 Pig 環境中變更值。

Not available.

pig-properties

變更 Pig 的 pig.properties 檔案中的值。

Restarts Oozie.

pig-log4j

變更 Pig 的 log4j.properties 檔案中的值。

Not available.

presto-log

變更 Presto 的 log.properties 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-config

變更 Presto 的 config.properties 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-password-authenticator

變更 Presto 的 password-authenticator.properties 檔案中的值。

Not available.

presto-env

變更 Presto 的 presto-env.sh 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-node

變更 Presto 的 node.properties 檔案中的值。

Not available.

presto-connector-blackhole

變更 Presto 的 blackhole.properties 檔案中的值。

Not available.

presto-connector-cassandra

變更 Presto 的 cassandra.properties 檔案中的值。

Not available.

presto-connector-hive

變更 Presto 的 hive.properties 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-connector-jmx

變更 Presto 的 jmx.properties 檔案中的值。

Not available.

presto-connector-kafka

變更 Presto 的 kafka.properties 檔案中的值。

Not available.

presto-connector-lakeformation

變更 Presto 的 lakeformation.properties 檔案中的值。

Restarts Presto-Server (for PrestoDB)

presto-connector-localfile

變更 Presto 的 localfile.properties 檔案中的值。

Not available.

presto-connector-memory

變更 Presto 的 memory.properties 檔案中的值。

Not available.

presto-connector-mongodb

變更 Presto 的 mongodb.properties 檔案中的值。

Not available.

presto-connector-mysql

變更 Presto 的 mysql.properties 檔案中的值。

Not available.

presto-connector-postgresql

變更 Presto 的 postgresql.properties 檔案中的值。

Not available.

presto-connector-raptor

變更 Presto 的 raptor.properties 檔案中的值。

Not available.

presto-connector-redis

變更 Presto 的 redis.properties 檔案中的值。

Not available.

presto-connector-redshift

變更 Presto 的 redshift.properties 檔案中的值。

Not available.

presto-connector-tpch

變更 Presto 的 tpch.properties 檔案中的值。

Not available.

presto-connector-tpcds

變更 Presto 的 tpcds.properties 檔案中的值。

Not available.

trino-log

變更 Trino 的 log.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-config

變更 Trino 的 config.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-password-authenticator

變更 Trino 的 password-authenticator.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-env

變更 Trino 的 trino-env.sh 檔案中的值。

Restarts Trino-Server (for Trino)

trino-node

變更 Trino 的 node.properties 檔案中的值。

Not available.

trino-connector-blackhole

變更 Trino 的 blackhole.properties 檔案中的值。

Not available.

trino-connector-cassandra

變更 Trino 的 cassandra.properties 檔案中的值。

Not available.

trino-connector-delta

變更 Trino 的 delta.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-connector-hive

變更 Trino 的 hive.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-exchange-manager

變更 Trino 的 exchange-manager.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-connector-iceberg

變更 Trino 的 iceberg.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-connector-hudi

變更 Trino 的 hudi.properties 檔案中的值。

Restarts Trino-Server (for Trino)

trino-connector-jmx

變更 Trino 的 jmx.properties 檔案中的值。

Not available.

trino-connector-kafka

變更 Trino 的 kafka.properties 檔案中的值。

Not available.

trino-connector-localfile

變更 Trino 的 localfile.properties 檔案中的值。

Not available.

trino-connector-memory

變更 Trino 的 memory.properties 檔案中的值。

Not available.

trino-connector-mongodb

變更 Trino 的 mongodb.properties 檔案中的值。

Not available.

trino-connector-mysql

變更 Trino 的 mysql.properties 檔案中的值。

Not available.

trino-connector-postgresql

變更 Trino 的 postgresql.properties 檔案中的值。

Not available.

trino-connector-raptor

變更 Trino 的 raptor.properties 檔案中的值。

Not available.

trino-connector-redis

變更 Trino 的 redis.properties 檔案中的值。

Not available.

trino-connector-redshift

變更 Trino 的 redshift.properties 檔案中的值。

Not available.

trino-connector-tpch

變更 Trino 的 tpch.properties 檔案中的值。

Not available.

trino-connector-tpcds

變更 Trino 的 tpcds.properties 檔案中的值。

Not available.

ranger-kms-dbks-site

改變遊俠的 dbks-site.xml 文件中的值KMS。

Restarts Ranger KMS Server.

ranger-kms-site

更改遊俠KMS的 ranger-kms-site .xml 文件中的值。

Restarts Ranger KMS Server.

ranger-kms-env

變更遊俠KMS環境中的值。

Restarts Ranger KMS Server.

ranger-kms-logback

改變遊俠的 kms-logback.xml 文件中的值KMS。

Not available.

ranger-kms-db-ca

為我與遊俠的SQLSSL連接更改 S3 上 CA 文件的值KMS。

Not available.

spark

Amazon EMR 策劃的阿帕奇星火設置。

This property modifies spark-defaults. See actions there.

spark-defaults

變更 Spark 的 spark-defaults.conf 檔案中的值。

Restarts Spark history server and Spark thrift server.

spark-env

變更 Spark 環境中的值。

Restarts Spark history server and Spark thrift server.

spark-hive-site

變更 Spark 的 hive-site.xml 檔案中的值

Not available.

spark-log4j2

變更 Spark 中 log4j2.properties 檔案中的值。

Restarts Spark history server and Spark thrift server.

spark-metrics

變更 Spark 中 metrics.properties 檔案的值。

Restarts Spark history server and Spark thrift server.

sqoop-env

變更 Sqoop 環境中的值。

Not available.

sqoop-oraoop-site

在方向 OraOop的 oraoop-site.xml 文件中更改值。

Not available.

sqoop-site

變更 Sqoop 的 sqoop-site.xml 檔案中的值。

Not available.

tez-site

變更 Tez 的 tez-site.xml 檔案中的值。

Restart Oozie and HiveServer2.

yarn-env

變更YARN環境中的值。

Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts MapReduce-HistoryServer.

yarn-site

變更YARN的 yarn-site.xml 檔案中的值。

Restarts the Hadoop YARN services ResourceManager, NodeManager, ProxyServer, and TimelineServer. Additionally restarts Livy Server and MapReduce-HistoryServer.

zeppelin-env

變更 Zeppelin 環境中的值。

Restarts Zeppelin.

zeppelin-site

變更 zeppelin-site.xml 中的組態設定。

Restarts Zeppelin.

zookeeper-config

變更 ZooKeeper的 zoo.cfg 檔案中的值。

Restarts Zookeeper server.

zookeeper-log4j

變更 log4j. 屬性 ZooKeeper檔案中的值。

Restarts Zookeeper server.

6.10.1 變更日誌

變更 6.10.1 版本和版本備註的日誌
日期 事件 描述
2023-08-30 更新版本備註 在版本備註中新增幾個與控制平面相關的修正
2023-08-21 文件出版 Amazon EMR 6.10.1 發行說明首次發布
2023-08-16 部署完成 Amazon EMR 6.10.1 完全部署到所有支援的區域
2023-08-04 初始版本 Amazon EMR 6.10.1 首先部署到有限的商業區域