Amazon EMRリリース 4.2.0 - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon EMRリリース 4.2.0

4.2.0 アプリケーションバージョン

このリリースでは、次のアプリケーションがサポートされています。 Ganglia, Hadoop, Hive, Hue, Mahout, Oozie-Sandbox, Pig, Presto-Sandbox, Spark、および Zeppelin-Sandbox.

次の表は、このリリースの Amazon で利用可能なアプリケーションバージョンEMRと、前述の 3 つの Amazon EMRリリース (該当する場合) のアプリケーションバージョンを示しています。

Amazon の各リリースのアプリケーションバージョンの包括的な履歴についてはEMR、以下のトピックを参照してください。

アプリケーションバージョン情報
emr-4.3.0 emr-4.2.0 emr-4.1.0 emr-4.0.0
AWS SDK Java 用 1.10.271.10.27追跡されていません追跡されていません
Python 追跡されていません追跡されていません追跡されていません追跡されていません
Scala 追跡されていません追跡されていません追跡されていません追跡されていません
AmazonCloudWatchAgent - - - -
差分 - - - -
Flink - - - -
Ganglia3.7.23.6.0 - -
HBase - - - -
HCatalog - - - -
Hadoop2.7.12.6.02.6.02.6.0
[Hive]1.0.01.0.01.0.01.0.0
Hudi - - - -
Hue3.7.13.7.13.7.1 -
Iceberg - - - -
JupyterEnterpriseGateway - - - -
JupyterHub - - - -
Livy - - - -
MXNet - - - -
Mahout0.11.00.11.00.11.00.10.0
Oozie - - - -
Oozie-Sandbox4.2.04.2.04.0.1 -
フェニックス - - - -
Pig0.14.00.14.00.14.00.14.0
Presto - - - -
Presto-Sandbox0.1300.1250.119 -
Spark1.6.01.5.21.5.01.4.1
Sqoop - - - -
Sqoop-Sandbox - - - -
TensorFlow - - - -
Tez - - - -
Trino (Presto SQL) - - - -
Zeppelin - - - -
Zeppelin-Sandbox0.5.50.5.50.6.0-SNAPSHOT -
ZooKeeper - - - -
ZooKeeper-サンドボックス - - - -

4.2.0 リリースノート

次のリリースノートには、Amazon 4.2.0 EMR リリースに関する情報が含まれています。

リリース日: 2015 年 11 月 18 日

機能
  • Ganglia のサポートを追加しました

  • Spark 1.5.2 にアップグレードしました

  • Presto 0.125 にアップグレードしました

  • Oozie を 4.2.0 にアップグレードしました

  • Zeppelin を 0.5.5 にアップグレードしました

  • AWS SDK for Java を 1.10.27 にアップグレードしました

以前のリリースから解決された既知の問題
  • がデフォルトのメタデータテーブル名を使用しEMRFSCLIなかった問題を修正しました。

  • Amazon S3 で ORC-backed テーブルを使用するときに発生する問題を修正しました。

  • Spark 設定で Python バージョンが一致しない問題を修正しました。

  • 内のクラスターDNSの問題が原因でYARNノードステータスがレポートされない問題を修正しましたVPC。

  • ノードのYARN廃止時に発生する問題を修正しました。これにより、ハングアプリケーションが発生したり、新しいアプリケーションをスケジュールできなくなったりします。

  • クラスターがステータス TIMED_OUT_ で終了したときに発生する問題を修正しましたSTARTING。

  • EMRFS Scala の依存関係を他のビルドに含めるときに発生する問題を修正しました。Scala 依存関係が削除されました。

4.2.0 コンポーネントバージョン

このリリースで Amazon がEMRインストールするコンポーネントを以下に示します。そのうちいくつかは、ビッグデータアプリケーションパッケージの一部としてインストールされます。その他は Amazon に固有でEMR、システムプロセスと機能用にインストールされます。これらは通常、emr または aws で開始されます。最新の Amazon EMRリリースのビッグデータアプリケーションパッケージは、通常、コミュニティにある最新バージョンです。Amazon では、コミュニティリリースEMRをできるだけ早く利用できるようにします。

Amazon の一部のコンポーネントは、コミュニティバージョンEMRとは異なります。これらのコンポーネントには、CommunityVersion-amzn-EmrVersion の形式のバージョンラベルがあります。EmrVersion は 0 から始まります。例えば、バージョン 2.2 myapp-componentの という名前のオープンソースコミュニティコンポーネントが、異なる Amazon EMRリリースに含めるために 3 回変更された場合、そのリリースバージョンは としてリストされます2.2-amzn-2

コンポーネント Version 説明
emr-ddb3.0.0Hadoop エコシステムアプリケーション用の Amazon DynamoDB コネクター。
emr-goodies2.0.0Hadoop エコシステムに役立つ追加のライブラリ。
emr-kinesis3.1.0Hadoop エコシステムアプリケーション用の Amazon Kinesis コネクター。
emr-s3-dist-cp2.0.0Amazon S3 に最適化された分散コピーアプリケーション。
emrfs2.2.0Hadoop エコシステムアプリケーション用の Amazon S3 コネクタ。
ganglia-monitor3.6.0Ganglia モニタリングエージェントとともに埋め込まれた、Hadoop エコシステムアプリケーション用 Ganglia エージェント。
ganglia-metadata-collector3.6.0Ganglia モニタリングエージェントからメトリクスを集計する Ganglia メタデータコレクター。
ganglia-web3.5.10Ganglia メタデータコレクターによって収集されたメトリクスを表示するウェブアプリケーション。
hadoop-client2.6.0-amzn-2'hdfs'、'hadoop'、'yarn' などの Hadoop コマンドラインクライアント。
hadoop-hdfs-datanode2.6.0-amzn-2HDFS ブロックを保存するためのノードレベルのサービス。
hadoop-hdfs-library2.6.0-amzn-2HDFS コマンドラインクライアントとライブラリ
hadoop-hdfs-namenode2.6.0-amzn-2HDFS ファイル名とブロックの場所を追跡するための サービス。
hadoop-httpfs-server2.6.0-amzn-2HTTP HDFSオペレーションの エンドポイント。
hadoop-kms-server2.6.0-amzn-2Hadoop の に基づく暗号化キー管理サーバー KeyProvider API。
hadoop-mapred2.6.0-amzn-2MapReduce MapReduce アプリケーションを実行するための実行エンジンライブラリ。
hadoop-yarn-nodemanager2.6.0-amzn-2YARN 個々のノードのコンテナを管理するための サービス。
hadoop-yarn-resourcemanager2.6.0-amzn-2YARN クラスターリソースと分散アプリケーションの割り当てと管理のための サービス。
hive-client1.0.0-amzn-1Hive コマンドラインクライアント。
hive-metastore-server1.0.0-amzn-1Hadoop オペレーション上の のメタデータを保存するセマンティックリポジトリである Hive SQL メタストアにアクセスするためのサービス。
hive-server1.0.0-amzn-1Hive クエリをウェブリクエストとして受け入れるサービス。
hue-server3.7.1-amzn-5Hadoop エコシステムアプリケーションを使用してデータを分析するウェブアプリケーション
mahout-client0.11.0機械学習用のライブラリ。
mysql-server5.5データベースSQLサーバー。
oozie-client4.2.0Oozie コマンドラインクライアント。
oozie-server4.2.0Oozie ワークフローリクエストを受け入れるサービス。
presto-coordinator0.125presto-worker 間でクエリを受け入れ、クエリの実行を管理するサービス。
presto-worker0.125いくつかのクエリを実行するサービス。
pig-client0.14.0-amzn-0Pig コマンドラインクライアント。
spark-client1.5.2Spark コマンドラインクライアント。
spark-history-server1.5.2完了した Spark アプリケーションの有効期間にログに記録されたイベントを表示するウェブ UI。
spark-on-yarn1.5.2のメモリ内実行エンジンYARN。
spark-yarn-slave1.5.2YARN スレーブに必要な Apache Spark ライブラリ。
webserver2.4Apache HTTPサーバー。
zeppelin-server0.5.5-incubating-amzn-0インタラクティブなデータ分析を可能にするウェブベースのノートブック。

4.2.0 設定分類

設定分類を使用すると、アプリケーションをカスタマイズできます。これらは、多くの場合、 などのアプリケーションの設定XMLファイルに対応しますhive-site.xml。詳細については、「アプリケーションの設定」を参照してください。

emr-4.2.0 分類
分類 説明

capacity-scheduler

Hadoop の capacity-scheduler.xml ファイルの値を変更します。

core-site

Hadoop の core-site.xml ファイルの値を変更します。

emrfs-site

EMRFS 設定を変更します。

hadoop-env

Hadoop のすべてのコンポーネントに対する Hadoop 環境の値を変更します。

hadoop-log4j

Hadoop の log4j.properties ファイルの値を変更します。

hdfs-encryption-zones

HDFS 暗号化ゾーンを設定します。

hdfs-site

HDFSの hdfs-site.xml の値を変更します。

hive-env

Hive 環境の値を変更します。

hive-exec-log4j

Hive の hive-exec-log4j.properties ファイルの値を変更します。

hive-log4j

Hive の hive-log4j.properties ファイルの値を変更します。

hive-site

Hive の hive-site.xml ファイルの値を変更します

hue-ini

Hue の ini ファイルの値を変更します

httpfs-env

HTTPFS 環境の値を変更します。

httpfs-site

Hadoop の httpfs-site.xml ファイルの値を変更します。

hadoop-kms-acls

Hadoop の kms-acls.xml ファイルの値を変更します。

hadoop-kms-env

Hadoop KMS環境の値を変更します。

hadoop-kms-log4j

Hadoop の kms-log4j.properties ファイルの値を変更します。

hadoop-kms-site

Hadoop の kms-site.xml ファイルの値を変更します。

mapred-env

MapReduce アプリケーションの環境の値を変更します。

mapred-site

MapReduce アプリケーションの mapred-site.xml ファイルの値を変更します。

oozie-env

Oozie の環境の値を変更します。

oozie-log4j

Oozie の oozie-log4j.properties ファイルの値を変更します。

oozie-site

Oozie の oozie-site.xml ファイルの値を変更します。

pig-properties

Pig の pig.properties ファイルの値を変更します。

pig-log4j

Pig の log4j.properties ファイルの値を変更します。

presto-log

Presto の log.properties ファイルの値を変更します。

presto-config

Presto の config.properties ファイルの値を変更します。

presto-connector-hive

Presto の hive.properties ファイルの値を変更します。

spark

Apache Spark の Amazon EMRが厳選した設定。

spark-defaults

Spark の spark-defaults.conf ファイルの値を変更します。

spark-env

Spark 環境の値を変更します。

spark-log4j

Spark の log4j.properties ファイルの値を変更します。

spark-metrics

Spark の metrics.properties ファイルの値を変更します。

yarn-env

YARN 環境の値を変更します。

yarn-site

YARNの yarn-site.xml ファイルの値を変更します。

zeppelin-env

Zeppelin 環境の値を変更します。