翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon EMRリリース 5.9.0
5.9.0 アプリケーションバージョン
このリリースでは、次のアプリケーションがサポートされています。 Flink
次の表は、Amazon のこのリリースで利用可能なアプリケーションバージョンEMRと、前述の 3 つの Amazon EMRリリース (該当する場合) のアプリケーションバージョンを示しています。
Amazon の各リリースのアプリケーションバージョンの包括的な履歴についてはEMR、以下のトピックを参照してください。
emr-5.9.0 | emr-5.8.3 | emr-5.8.2 | emr-5.8.1 | |
---|---|---|---|---|
AWS SDK Java 用 | 1.11.183 | 1.11.160 | 1.11.160 | 1.11.160 |
Python | 追跡されていません | 追跡されていません | 追跡されていません | 追跡されていません |
Scala | 2.11.8 | 2.11.8 | 2.11.8 | 2.11.8 |
AmazonCloudWatchAgent | - | - | - | - |
差分 | - | - | - | - |
Flink | 1.3.2 | 1.3.1 | 1.3.1 | 1.3.1 |
Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 |
HBase | 1.3.1 | 1.3.1 | 1.3.1 | 1.3.1 |
HCatalog | 2.3.0 | 2.3.0 | 2.3.0 | 2.3.0 |
Hadoop | 2.7.3 | 2.7.3 | 2.7.3 | 2.7.3 |
[Hive] | 2.3.0 | 2.3.0 | 2.3.0 | 2.3.0 |
Hudi | - | - | - | - |
Hue | 4.0.1 | 3.12.0 | 3.12.0 | 3.12.0 |
Iceberg | - | - | - | - |
JupyterEnterpriseGateway | - | - | - | - |
JupyterHub | - | - | - | - |
Livy | 0.4.0 | - | - | - |
MXNet | - | - | - | - |
Mahout | 0.13.0 | 0.13.0 | 0.13.0 | 0.13.0 |
Oozie | 4.3.0 | 4.3.0 | 4.3.0 | 4.3.0 |
フェニックス | 4.11.0 | 4.11.0 | 4.11.0 | 4.11.0 |
Pig | 0.17.0 | 0.16.0 | 0.16.0 | 0.16.0 |
Presto | 0.184 | 0.170 | 0.170 | 0.170 |
Spark | 2.2.0 | 2.2.0 | 2.2.0 | 2.2.0 |
Sqoop | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 |
TensorFlow | - | - | - | - |
Tez | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 |
Trino (Presto SQL) | - | - | - | - |
Zeppelin | 0.7.2 | 0.7.2 | 0.7.2 | 0.7.2 |
ZooKeeper | 3.4.10 | 3.4.10 | 3.4.10 | 3.4.10 |
5.9.0 リリースノート
次のリリースノートには、Amazon EMRバージョン 5.9.0 リリースに関する情報が含まれています。変更は Amazon 5.8.0 EMR リリースに関連しています。
リリース日: 2017 年 10 月 5 日
最新機能更新日: 2017 年 10 月 12 日
アップグレード
AWS SDK for Java バージョン 1.11.183
Flink 1.3.2
Hue 4.0.1
Pig 0.17.0
Presto 0.184
新機能
Livy サポート (バージョン 0.4.0-incubating) を追加しました。詳細については、「Apache Livy」を参照してください。
Spark の Hue ノートブックのサポートを追加しました。
i3 シリーズ Amazon EC2インスタンスのサポートを追加しました (2017 年 10 月 12 日)。
変更点、機能強化、解決した問題
-
Spark
手動のサイズ変更または自動のスケーリングポリシーのリクエストによるノードの終了処理を、Spark がより適切に行う、新しい機能のセットを追加しました。詳細については、「ノード停止の動作設定」を参照してください。
SSL は、ブロック転送サービスの転送中の暗号化に 3DES の代わりに使用され、Amazon EC2インスタンスタイプを AES-NI で使用する場合のパフォーマンスを向上させます。
バックポート SPARK-21494
。
-
Zeppelin
バックポート ZEPPELIN-2377
。
-
HBase
パッチ HBASE-18533
を追加しました。これにより、HBase BucketCache 設定分類を使用して hbase-site
設定用の値を追加できます。
-
Hue
Hue で Hive クエリエディタの AWS Glue Data Catalog サポートを追加しました。
デフォルトでは、Hue のスーパーユーザーは、Amazon EMRIAMロールがアクセスできるすべてのファイルにアクセスできます。新しく作成されたユーザーには、Amazon S3 ファイルブラウザへのアクセス許可は自動的には付与されません。グループに対して
filebrowser.s3_access
アクセス許可を有効にする必要があります。
AWS Glue Data Catalog を使用して作成された基盤JSONとなるデータにアクセスできなくなる問題を解決しました。
既知の問題
すべてのアプリケーションがインストールされ、デフォルトの Amazon EBSルートボリュームサイズが変更されていない場合、クラスターの起動は失敗します。回避策として、 から
aws emr create-cluster
コマンドを使用し AWS CLI 、より大きな--ebs-root-volume-size
パラメータを指定します。Hive 2.3.0 では
hive.compute.query.using.stats=true
がデフォルト設定になっています。これにより、クエリではデータが直接ではなく既存の統計から取得されるため、混乱が生じる場合があります。たとえば、hive.compute.query.using.stats=true
が設定されたテーブルのLOCATION
に新しいファイルをアップロードした場合、テーブルに対してSELECT COUNT(*)
クエリを実行すると、追加された行がカウントされずに、統計からカウントが返されます。回避策として、
ANALYZE TABLE
コマンドを使用して新しい統計を収集するか、hive.compute.query.using.stats=false
を設定します。詳細については、Apache Hive ドキュメントの「Statistics in Hive」を参照してください。
5.9.0 コンポーネントバージョン
このリリースで Amazon がEMRインストールするコンポーネントを以下に示します。そのうちいくつかは、ビッグデータアプリケーションパッケージの一部としてインストールされます。その他は Amazon に固有でEMR、システムプロセスと機能用にインストールされます。これらは通常、emr
または aws
で開始されます。最新の Amazon EMRリリースのビッグデータアプリケーションパッケージは通常、コミュニティで見つかった最新バージョンです。Amazon では、コミュニティリリースEMRをできるだけ早く利用できるようにします。
Amazon の一部のコンポーネントは、コミュニティバージョンEMRとは異なります。これらのコンポーネントには、
の形式のバージョンラベルがあります。CommunityVersion
-amzn-EmrVersion
は 0 から始まります。例えば、バージョン 2.2 EmrVersion
myapp-component
で という名前のオープンソースコミュニティコンポーネントが、異なる Amazon EMRリリースに含めるために 3 回変更された場合、そのリリースバージョンは としてリストされます2.2-amzn-2
。
コンポーネント | Version | 説明 |
---|---|---|
emr-ddb | 4.4.0 | Hadoop エコシステムアプリケーション用の Amazon DynamoDB コネクター。 |
emr-goodies | 2.4.0 | Hadoop エコシステムに役立つ追加のライブラリ。 |
emr-kinesis | 3.4.0 | Hadoop エコシステムアプリケーション用の Amazon Kinesis コネクター。 |
emr-s3-dist-cp | 2.7.0 | Amazon S3 に最適化された分散コピーアプリケーション。 |
emrfs | 2.19.0 | Hadoop エコシステムアプリケーション用の Amazon S3 コネクタ。 |
flink-client | 1.3.2 | Apache Flink のコマンドラインクライアント スクリプトとアプリケーション。 |
ganglia-monitor | 3.7.2 | Ganglia モニタリングエージェントとともに埋め込まれた、Hadoop エコシステムアプリケーション用 Ganglia エージェント。 |
ganglia-metadata-collector | 3.7.2 | Ganglia モニタリングエージェントからメトリクスを集計する Ganglia メタデータコレクター。 |
ganglia-web | 3.7.1 | Ganglia メタデータコレクターによって収集されたメトリクスを表示するウェブアプリケーション。 |
hadoop-client | 2.7.3-amzn-4 | 'hdfs'、'hadoop'、'yarn' などの Hadoop コマンドラインクライアント。 |
hadoop-hdfs-datanode | 2.7.3-amzn-4 | HDFS ブロックを保存するためのノードレベルのサービス。 |
hadoop-hdfs-library | 2.7.3-amzn-4 | HDFS コマンドラインクライアントとライブラリ |
hadoop-hdfs-namenode | 2.7.3-amzn-4 | HDFS ファイル名とブロックの場所を追跡するための サービス。 |
hadoop-httpfs-server | 2.7.3-amzn-4 | HTTP HDFSオペレーションの エンドポイント。 |
hadoop-kms-server | 2.7.3-amzn-4 | Hadoop の に基づく暗号化キー管理サーバー KeyProvider API。 |
hadoop-mapred | 2.7.3-amzn-4 | MapReduce MapReduce アプリケーションを実行するための実行エンジンライブラリ。 |
hadoop-yarn-nodemanager | 2.7.3-amzn-4 | YARN 個々のノードのコンテナを管理するための サービス。 |
hadoop-yarn-resourcemanager | 2.7.3-amzn-4 | YARN クラスターリソースと分散アプリケーションの割り当てと管理のための サービス。 |
hadoop-yarn-timeline-server | 2.7.3-amzn-4 | YARN アプリケーションの現在および履歴情報を取得するためのサービス。 |
hbase-hmaster | 1.3.1 | リージョンの調整と管理コマンドの実行を担当するHBaseクラスターのサービス。 |
hbase-region-server | 1.3.1 | 1 つ以上のHBaseリージョンに対応するサービス。 |
hbase-client | 1.3.1 | HBase コマンドラインクライアント。 |
hbase-rest-server | 1.3.1 | のRESTfulHTTPエンドポイントを提供するサービスHBase。 |
hbase-thrift-server | 1.3.1 | Thrift エンドポイントを に提供するサービスHBase。 |
hcatalog-client | 2.3.0-amzn-0 | hcatalog-server を操作するための 'hcat' コマンドラインクライアント。 |
hcatalog-server | 2.3.0-amzn-0 | 分散アプリケーション用のテーブルとストレージ管理レイヤーHCatalogである を提供するサービス。 |
hcatalog-webhcat-server | 2.3.0-amzn-0 | HTTP にRESTインターフェイスを提供する エンドポイントHCatalog。 |
hive-client | 2.3.0-amzn-0 | Hive コマンドラインクライアント。 |
hive-hbase | 2.3.0-amzn-0 | Hive-hbase クライアント。 |
hive-metastore-server | 2.3.0-amzn-0 | Hadoop オペレーション上の のメタデータを保存するセマンティックリポジトリである Hive SQL メタストアにアクセスするためのサービス。 |
hive-server2 | 2.3.0-amzn-0 | Hive クエリをウェブリクエストとして受け入れるサービス。 |
hue-server | 4.0.1 | Hadoop エコシステムアプリケーションを使用してデータを分析するウェブアプリケーション |
livy-server | 0.4.0-incubating | REST Apache Spark を操作するためのインターフェイス |
mahout-client | 0.13.0 | 機械学習用のライブラリ。 |
mysql-server | 5.5.54+ | データベースSQLサーバー。 |
oozie-client | 4.3.0 | Oozie コマンドラインクライアント。 |
oozie-server | 4.3.0 | Oozie ワークフローリクエストを受け入れるサービス。 |
phoenix-library | 4.11.0-HBase-1.3 | サーバーとクライアントの Phoenix ライブラリ |
phoenix-query-server | 4.11.0-HBase-1.3 | Avatica JDBC へのアクセスと Protocol Buffers およびJSONフォーマットアクセスを提供する軽量サーバー API |
presto-coordinator | 0.184 | presto-worker 間でクエリを受け入れ、クエリの実行を管理するサービス。 |
presto-worker | 0.184 | いくつかのクエリを実行するサービス。 |
pig-client | 0.17.0 | Pig コマンドラインクライアント。 |
spark-client | 2.2.0 | Spark コマンドラインクライアント。 |
spark-history-server | 2.2.0 | 完了した Spark アプリケーションの有効期間にログに記録されたイベントを表示するウェブ UI。 |
spark-on-yarn | 2.2.0 | のメモリ内実行エンジンYARN。 |
spark-yarn-slave | 2.2.0 | YARN スレーブに必要な Apache Spark ライブラリ。 |
sqoop-client | 1.4.6 | Apache Sqoop コマンドラインクライアント。 |
tez-on-yarn | 0.8.4 | Tez YARNアプリケーションとライブラリ。 |
webserver | 2.4.25+ | Apache HTTPサーバー。 |
zeppelin-server | 0.7.2 | インタラクティブなデータ分析を可能にするウェブベースのノートブック。 |
zookeeper-server | 3.4.10 | 設定情報を維持し、名前を付け、分散化された同期を提供し、グループサービスを提供する一元化されたサービス。 |
zookeeper-client | 3.4.10 | ZooKeeper コマンドラインクライアント。 |
5.9.0 設定分類
設定分類を使用すると、アプリケーションをカスタマイズできます。これらは、多くの場合、 などのアプリケーションの設定XMLファイルに対応しますhive-site.xml
。詳細については、「アプリケーションの設定」を参照してください。
分類 | 説明 |
---|---|
capacity-scheduler | Hadoop の capacity-scheduler.xml ファイルの値を変更します。 |
core-site | Hadoop の core-site.xml ファイルの値を変更します。 |
emrfs-site | EMRFS 設定を変更します。 |
flink-conf | flink-conf.yaml の設定を変更します。 |
flink-log4j | Flink log4j.properties の設定を変更します。 |
flink-log4j-yarn-session | Flink log4j-yarn-session.properties 設定を変更します。 |
flink-log4j-cli | Flink log4j-cli.properties の設定を変更します。 |
hadoop-env | Hadoop のすべてのコンポーネントに対する Hadoop 環境の値を変更します。 |
hadoop-log4j | Hadoop の log4j.properties ファイルの値を変更します。 |
hadoop-ssl-server | Hadoop ssl のサーバー設定を変更します。 |
hadoop-ssl-client | Hadoop ssl のクライアント設定を変更します。 |
hbase | Apache の Amazon EMRキュレート設定HBase。 |
hbase-env | HBaseの環境の値を変更します。 |
hbase-log4j | HBaseの hbase-log4j.properties ファイルの値を変更します。 |
hbase-metrics | HBaseの hadoop-metrics2-hbase.properties ファイルの値を変更します。 |
hbase-policy | HBaseの hbase-policy.xml ファイルの値を変更します。 |
hbase-site | HBaseの hbase-site.xml ファイルの値を変更します。 |
hdfs-encryption-zones | HDFS 暗号化ゾーンを設定します。 |
hdfs-site | HDFSの hdfs-site.xml の値を変更します。 |
hcatalog-env | HCatalogの環境の値を変更します。 |
hcatalog-server-jndi | HCatalogの jndi.properties の値を変更します。 |
hcatalog-server-proto-hive-site | HCatalogの proto-hive-site.xml の値を変更します。 |
hcatalog-webhcat-env | HCatalog W ebHCatの環境の値を変更します。 |
hcatalog-webhcat-log4j2 | HCatalog W ebHCatの log4j2.properties の値を変更します。 |
hcatalog-webhcat-site | HCatalog W ebHCatの webhcat-site.xml ファイルの値を変更します。 |
hive-beeline-log4j2 | Hive の beeline-log4j2.properties ファイルの値を変更します。 |
hive-parquet-logging | Hive の parquet-logging.properties ファイルの値を変更します。 |
hive-env | Hive 環境の値を変更します。 |
hive-exec-log4j2 | Hive の hive-exec-log4j2.properties ファイルの値を変更します。 |
hive-llap-daemon-log4j2 | Hive の llap-daemon-log4j2.properties ファイルの値を変更します。 |
hive-log4j2 | Hive の hive-log4j2.properties ファイルの値を変更します。 |
hive-site | Hive の hive-site.xml ファイルの値を変更します |
hiveserver2-site | Hive Server2 の hiveserver2-site.xml ファイルの値を変更します |
hue-ini | Hue の ini ファイルの値を変更します |
httpfs-env | HTTPFS 環境の値を変更します。 |
httpfs-site | Hadoop の httpfs-site.xml ファイルの値を変更します。 |
hadoop-kms-acls | Hadoop の kms-acls.xml ファイルの値を変更します。 |
hadoop-kms-env | Hadoop KMS環境の値を変更します。 |
hadoop-kms-log4j | Hadoop の kms-log4j.properties ファイルの値を変更します。 |
hadoop-kms-site | Hadoop の kms-site.xml ファイルの値を変更します。 |
livy-conf | Livy の livy.conf ファイルの値を変更します。 |
livy-env | Livy 環境の値を変更します。 |
livy-log4j | Livy の log4j.properties の設定を変更します。 |
mapred-env | MapReduce アプリケーションの環境の値を変更します。 |
mapred-site | MapReduce アプリケーションの mapred-site.xml ファイルの値を変更します。 |
oozie-env | Oozie の環境の値を変更します。 |
oozie-log4j | Oozie の oozie-log4j.properties ファイルの値を変更します。 |
oozie-site | Oozie の oozie-site.xml ファイルの値を変更します。 |
phoenix-hbase-metrics | Phoenix の hadoop-metrics2-hbase.properties ファイルの値を変更します。 |
phoenix-hbase-site | Phoenix の hbase-site.xml ファイルの値を変更します。 |
phoenix-log4j | Phoenix の log4j.properties ファイルの値を変更します。 |
phoenix-metrics | Phoenix の hadoop-metrics2-phoenix.properties ファイルの値を変更します。 |
pig-properties | Pig の pig.properties ファイルの値を変更します。 |
pig-log4j | Pig の log4j.properties ファイルの値を変更します。 |
presto-log | Presto の log.properties ファイルの値を変更します。 |
presto-config | Presto の config.properties ファイルの値を変更します。 |
presto-env | Presto の presto-env.sh ファイルの値を変更します。 |
presto-node | Presto の node.properties ファイルの値を変更します。 |
presto-connector-blackhole | Presto の blackhole.properties ファイルの値を変更します。 |
presto-connector-cassandra | Presto の cassandra.properties ファイルの値を変更します。 |
presto-connector-hive | Presto の hive.properties ファイルの値を変更します。 |
presto-connector-jmx | Presto の jmx.properties ファイルの値を変更します。 |
presto-connector-kafka | Presto の kafka.properties ファイルの値を変更します。 |
presto-connector-localfile | Presto の localfile.properties ファイルの値を変更します。 |
presto-connector-mongodb | Presto の mongodb.properties ファイルの値を変更します。 |
presto-connector-mysql | Presto の musql.properties ファイルの値を変更します。 |
presto-connector-postgresql | Presto の postgresql.properties ファイルの値を変更します。 |
presto-connector-raptor | Presto の raptor.properties ファイルの値を変更します。 |
presto-connector-redis | Presto の redis.properties ファイルの値を変更します。 |
presto-connector-tpch | Presto の tpcj.properties ファイルの値を変更します。 |
spark | Apache Spark の Amazon EMRが厳選した設定。 |
spark-defaults | Spark の spark-defaults.conf ファイルの値を変更します。 |
spark-env | Spark 環境の値を変更します。 |
spark-hive-site | Spark の hive-site.xml ファイルの値を変更します |
spark-log4j | Spark の log4j.properties ファイルの値を変更します。 |
spark-metrics | Spark の metrics.properties ファイルの値を変更します。 |
sqoop-env | Sqoop の環境の値を変更します。 |
sqoop-oraoop-site | Sqoop OraOopの oraoop-site.xml ファイルの値を変更します。 |
sqoop-site | Sqoop の sqoop-site.xml ファイルの値を変更します。 |
tez-site | Tez の tez-site.xml ファイルの値を変更します。 |
yarn-env | YARN 環境の値を変更します。 |
yarn-site | YARNの yarn-site.xml ファイルの値を変更します。 |
zeppelin-env | Zeppelin 環境の値を変更します。 |
zookeeper-config | ZooKeeperの zoo.cfg ファイルの値を変更します。 |
zookeeper-log4j | ZooKeeperの log4j.properties ファイルの値を変更します。 |