翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Apache Hive
Hive はオープンソースのデータウェアハウス兼分析パッケージで、Hadoop クラスター上で動作します。Hive スクリプトは、Hive QL (クエリ言語) という SQL に似た言語を使用しています。この言語はプログラミングモデルを抽象化しており、データウェアハウスとの一般的なやりとりをサポートします。Hive では、Directed Acyclic Graphs (DAG) や MapReduce プログラムに基づいて Java などの下位レベルのコンピューター言語で Tez ジョブを記述する複雑さを回避できます。
Hive は、シリアライズ形式を取り込むことで、SQL の枠組みを拡張しています。また、データ自体は操作せずにデータと一致するテーブルスキーマを作成することで、クエリ処理をカスタマイズすることもできます。SQL は日付、数値、文字列などのプリミティブなデータ型のみサポートしていますが、Hive テーブルの値は JSON オブジェクト、ユーザー定義のデータ型、Java で記述した関数などの構造化された要素です。
Hive の詳細については、http://hive.apache.org/
次の表は、Amazon EMR 7.x シリーズの最新リリースに含まれている Hive のバージョンと、Amazon EMR で Hive と共にインストールされるコンポーネントを示しています。
このリリースで Hive と共にインストールされるコンポーネントのバージョンについては、「リリース 7.7.0 コンポーネントバージョン」を参照してください。
Amazon EMR リリースラベル | Hive のバージョン | Hive でインストールされるコンポーネント |
---|---|---|
emr-7.7.0 |
Hive 3.1.3 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, tez-on-worker, zookeeper-client, zookeeper-server |
次の表は、Amazon EMR 6.x シリーズの最新リリースに含まれている Hive のバージョンと、Amazon EMR で Hive と共にインストールされるコンポーネントを示しています。
このリリースで Hive と共にインストールされるコンポーネントのバージョンについては、「リリース 6.15.0 コンポーネントバージョン」を参照してください。
Amazon EMR リリースラベル | Hive のバージョン | Hive でインストールされるコンポーネント |
---|---|---|
emr-6.15.0 |
Hive 3.1.3 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, tez-on-worker, zookeeper-client, zookeeper-server |
次の表は、Amazon EMR 5.x シリーズの最新リリースに含まれている Hive のバージョンと、Amazon EMR で Hive と共にインストールされるコンポーネントを示しています。
このリリースで Hive と共にインストールされるコンポーネントのバージョンについては、「Release 5.36.2 Component Versions」を参照してください。
Amazon EMR リリースラベル | Hive のバージョン | Hive でインストールされるコンポーネント |
---|---|---|
emr-5.36.2 |
Hive 2.3.9 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn |
Amazon EMR 5.18.0 以降では、Amazon EMR アーティファクトリポジトリを使用し、特定の Amazon EMR リリースで利用可能なライブラリおよび依存関係の正確なバージョンに対してジョブコードをビルドできます。詳細については、「Amazon EMR アーティファクトリポジトリを使用して依存関係を確認する」を参照してください。