Apache Hive - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Apache Hive

Hive はオープンソースのデータウェアハウス兼分析パッケージで、Hadoop クラスター上で動作します。Hive スクリプトは、プログラミングモデルを抽象化し、一般的なデータウェアハウスとのやり取りをサポートする Hive QL (クエリ言語) と呼ばれる SQLのような言語を使用します。Hive を使用すると、有向非巡回グラフ (DAGs) または Java などの下位レベルのコンピュータ言語での MapReduce プログラムに基づいて Tez ジョブを記述する複雑さを回避できます。

Hive はシリアル化形式を含めることでSQLパラダイムを拡張します。また、データ自体は操作せずにデータと一致するテーブルスキーマを作成することで、クエリ処理をカスタマイズすることもできます。は日付、数値、文字列などのプリミティブ値型SQLのみをサポートしますが、Hive テーブル値は、JSONオブジェクト、ユーザー定義のデータ型、Java で記述された関数などの構造化された要素です。

Hive の詳細については、http://hive.apache.org/ を参照してください。

次の表に、Amazon 7.x シリーズの最新リリースに含まれている Hive EMR のバージョンと、Amazon が Hive と共にEMRインストールするコンポーネントを示します。

このリリースで Hive と共にインストールされるコンポーネントのバージョンについては、「リリース 7.2.0 コンポーネントバージョン」を参照してください。

emr-7.2.0 の Hive バージョン情報
Amazon EMR リリースラベル Hive のバージョン Hive でインストールされるコンポーネント

emr-7.2.0

Hive 3.1.3

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, tez-on-worker, zookeeper-client, zookeeper-server

次の表に、Amazon 6.x シリーズの最新リリースに含まれている Hive EMR のバージョンと、Amazon が Hive と共にEMRインストールするコンポーネントを示します。

このリリースで Hive と共にインストールされるコンポーネントのバージョンについては、「リリース 6.15.0 コンポーネントバージョン」を参照してください。

emr-6.15.0 の Hive バージョン情報
Amazon EMR リリースラベル Hive のバージョン Hive でインストールされるコンポーネント

emr-6.15.0

Hive 3.1.3

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, tez-on-worker, zookeeper-client, zookeeper-server

次の表に、Amazon 5.x シリーズの最新リリースに含まれている Hive EMR のバージョンと、Amazon が Hive と共にEMRインストールするコンポーネントを示します。

このリリースで Hive と共にインストールされるコンポーネントのバージョンについては、「リリース 5.36.2 コンポーネントバージョン」を参照してください。

emr-5.36.2 の Hive バージョン情報
Amazon EMR リリースラベル Hive のバージョン Hive でインストールされるコンポーネント

emr-5.36.2

Hive 2.3.9

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn

Amazon 5EMR.18.0 以降では、Amazon EMRアーティファクトリポジトリを使用して、特定の Amazon EMRリリースで利用可能なライブラリと依存関係の正確なバージョンに対してジョブコードを構築できます。詳細については、「Amazon EMR アーティファクトリポジトリを使用して依存関係を確認する」を参照してください。