本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Apache Hive
Hive 是一款在 Hadoop 叢集上執行的開源資料倉儲暨分析套件。Hive 指令碼使用的是一種稱為 Hive QL (查詢語言) 的語言,與 SQL 語言類似,會擷取出程式設計模型,且可支援一般的資料倉儲互動。使用 Hive,即可避免要用要低階的電腦語言 (如 Java) 根據有向無環圖 (DAG) 或 MapReduce 程式撰寫 Tez 任務的複雜作業。
Hive 可納入序列化格式,藉此擴大 SQL 範例。也可以建立與您的資料相符的表格結構描述,以自訂查詢處理作業,而無需接觸資料本身。SQL 僅支援原始的資料類型 (如日期、數字、字串等),而 Hive 表格值為結構化的元素,例如 JSON 物件、任何由使用者定義的資料類型,或是以 Java 寫成的函數等。
如需關於 Hive 的詳細資訊,請參閱 http://hive.apache.org/
以下表格列出了 Amazon EMR 7.x 系列最新版本中包含的 Hive 版本,以及 Amazon EMR 隨 Hive 一起安裝的元件。
如需此版本中與 Hive 一起安裝的元件版本,請參閱 7.6.0 版元件版本。
Amazon EMR 發行標籤 | Hive 版本 | 與 Hive 一起搭配安裝的元件 |
---|---|---|
emr-7.6.0 |
Hive 3.1.3 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, tez-on-worker, zookeeper-client, zookeeper-server |
下表列出 Amazon EMR 6.x 系列最新版本中包含的 Hive 版本,以及 Amazon EMR 隨 Hive 一起安裝的元件。
如需此版本中與 Hive 一起搭配安裝的元件版本,請參閱發行版本 6.15.0 元件版本。
Amazon EMR 發行標籤 | Hive 版本 | 與 Hive 一起搭配安裝的元件 |
---|---|---|
emr-6.15.0 |
Hive 3.1.3 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn, tez-on-worker, zookeeper-client, zookeeper-server |
下表列出 Amazon EMR 5.x 系列最新版本中包含的 Hive 版本,以及 Amazon EMR 隨 Hive 一起安裝的元件。
如需此版本中與 Hive 一起安裝的元件版本,請參閱 5.36.2 版元件版本。
Amazon EMR 發行標籤 | Hive 版本 | 與 Hive 一起搭配安裝的元件 |
---|---|---|
emr-5.36.2 |
Hive 2.3.9 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-s3-select, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hive-hbase, hcatalog-server, hive-server2, hudi, mariadb-server, tez-on-yarn |
自 Amazon EMR 5.18.0 開始,您可以使用 Amazon EMR 成品儲存庫建置作業程式碼,並將其用於確切的程式庫和相依版本,以搭配特定 Amazon EMR 發行版本使用。如需詳細資訊,請參閱使用 Amazon EMR 成品儲存庫檢查相依性。