As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Amazon EMR versão 4.7.0
Versões 4.7.0 da aplicação
Os seguintes aplicativos são compatíveis com esta versão: Ganglia
A tabela abaixo lista as versões do aplicativo disponíveis nesta versão da Amazon EMR e as versões do aplicativo nas três EMR versões anteriores da Amazon (quando aplicável).
Para obter um histórico abrangente das versões do aplicativo para cada lançamento da AmazonEMR, consulte os seguintes tópicos:
emr-4.7.0 | emr-4.6.1 | emr-4.6.0 | emr-4.5.0 | |
---|---|---|---|---|
AWS SDK para Java | 1.10.75 | 1.10.27 | 1.10.27 | 1.10.27 |
Python | Não rastreadas | Não rastreadas | Não rastreadas | Não rastreadas |
Scala | Não rastreadas | Não rastreadas | Não rastreadas | Não rastreadas |
AmazonCloudWatchAgent | - | - | - | - |
Delta | - | - | - | - |
Flink | - | - | - | - |
Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 |
HBase | 1.2.1 | 1.2.0 | 1.2.0 | - |
HCatalog | 1.0.0 | 1.0.0 | 1.0.0 | 1.0.0 |
Hadoop | 2.7.2 | 2.7.2 | 2.7.2 | 2.7.2 |
Hive | 1.0.0 | 1.0.0 | 1.0.0 | 1.0.0 |
Hudi | - | - | - | - |
Hue | 3.7.1 | 3.7.1 | 3.7.1 | 3.7.1 |
Iceberg | - | - | - | - |
JupyterEnterpriseGateway | - | - | - | - |
JupyterHub | - | - | - | - |
Livy | - | - | - | - |
MXNet | - | - | - | - |
Mahout | 0.12.0 | 0.11.1 | 0.11.1 | 0.11.1 |
Oozie | - | - | - | - |
Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 |
Phoenix | 4.7.0 | - | - | - |
Pig | 0.14.0 | 0.14.0 | 0.14.0 | 0.14.0 |
Presto | - | - | - | - |
Presto-Sandbox | 0.147 | 0.143 | 0.143 | 0.140 |
Spark | 1.6.1 | 1.6.1 | 1.6.1 | 1.6.1 |
Sqoop | - | - | - | - |
Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 |
TensorFlow | - | - | - | - |
Tez | 0.8.3 | - | - | - |
Trino (Em breve) SQL | - | - | - | - |
Zeppelin | - | - | - | - |
Zeppelin-Sandbox | 0.5.6 | 0.5.6 | 0.5.6 | 0.5.6 |
ZooKeeper | - | - | - | - |
ZooKeeper-Caixa de areia | 3.4.8 | 3.4.8 | 3.4.8 | - |
Notas da versão 4.7.0
Importante
O Amazon EMR 4.7.0 está obsoleto. Em vez disso, use o Amazon EMR 4.7.1 ou posterior.
Data do release: 2 de junho de 2016
Atributos
-
Adicionado o Apache Phoenix 4.7.0
-
Adicionado o Apache Tez 0.8.3
-
Atualizado para 1.2.1 HBase
-
Atualizado para Mahout 0.12.0
-
Atualizado para Presto 0.147
-
Atualizado AWS SDK for Java para 1.10.75
-
O sinalizador final foi removido da propriedade
mapreduce.cluster.local.dir
emmapred-site.xml
para permitir que os usuários executem o Pig no modo local. -
JDBCDrivers do Amazon Redshift disponíveis no cluster
JDBCOs drivers do Amazon Redshift agora estão incluídos em.
/usr/share/aws/redshift/jdbc
/usr/share/aws/redshift/jdbc/RedshiftJDBC41.jar
é o driver do Amazon Redshift JDBC compatível com 4.1/usr/share/aws/redshift/jdbc/RedshiftJDBC4.jar
e é o driver do Amazon Redshift JDBC compatível com 4.0. Para obter mais informações, consulte Configurar uma JDBC conexão no Guia de gerenciamento do Amazon Redshift. Java 8
Com exceção do Presto, o Open JDK 1.7 é o padrão JDK usado para todos os aplicativos. No entanto, o Open JDK 1.7 e o 1.8 estão instalados. Para obter mais informações sobre como configurar
JAVA_HOME
para aplicativos, consulte Configuração de aplicativos para usar Java 8.
Problemas conhecidos das versões anteriores que foram resolvidos
-
Corrigido um problema de kernel que afetou significativamente o desempenho em volumes otimizados de taxa de transferência HDD (st1) da Amazon EMR no EBS emr-4.6.0.
-
Corrigido um problema em que um cluster falharia se alguma zona de HDFS criptografia fosse especificada sem escolher o Hadoop como aplicativo.
-
Alterou a política de HDFS gravação padrão de
RoundRobin
paraAvailableSpaceVolumeChoosingPolicy
. Alguns volumes não foram utilizados adequadamente com a RoundRobin configuração, o que resultou em falhas nos nós principais e na falta HDFS de confiabilidade. -
Corrigido um problema com o EMRFSCLI, que causaria uma exceção ao criar a tabela de metadados padrão do DynamoDB para visualizações consistentes.
-
Corrigido um problema de impasse EMRFS que potencialmente ocorria durante operações de renomeação e cópia de várias partes.
-
Foi corrigido um problema EMRFS que fazia com que o CopyPart tamanho padrão fosse 5 MB. O padrão agora está definido corretamente como 128 MB.
-
Corrigido um problema com a configuração de inicialização do Zeppelin que potencialmente impedia a interrupção do serviço.
-
Corrigido um problema com o Spark e o Zeppelin, que impedia você de usar o
s3a://
URI esquema porque ele não/usr/lib/hadoop/hadoop-aws.jar
estava carregado corretamente em seus respectivos classpath. -
Portado para trás HUE-2484
. -
Reportou um commit
do Hue 3.9.0 (não JIRA existe) para corrigir um problema com a amostra do navegador. HBase -
Portado para trás HIVE-9073
.
Versões de componente 4.7.0
Os componentes que a Amazon EMR instala com esta versão estão listados abaixo. Alguns são instalados como parte de pacotes de aplicativos de big data. Outros são exclusivos da Amazon EMR e são instalados para processos e recursos do sistema. Eles normalmente começam com emr
ou aws
. Os pacotes de aplicativos de big data na versão mais recente da Amazon EMR geralmente são a versão mais recente encontrada na comunidade. Disponibilizamos lançamentos comunitários na Amazon o mais EMR rápido possível.
Alguns componentes na Amazon EMR são diferentes das versões da comunidade. Esses componentes tem um rótulo de versão no formulário
. O CommunityVersion
-amzn-EmrVersion
começa em 0. Por exemplo, se um componente de comunidade de código aberto nomeado EmrVersion
myapp-component
com a versão 2.2 tiver sido modificado três vezes para inclusão em diferentes EMR versões da Amazon, sua versão de lançamento será listada como2.2-amzn-2
.
Componente | Versão | Descrição |
---|---|---|
emr-ddb | 3.1.0 | O conector do Amazon DynamoDB para aplicativos do ecossistema do Hadoop. |
emr-goodies | 2.0.0 | Bibliotecas convenientes para o ecossistema do Hadoop. |
emr-kinesis | 3.2.0 | O conector do Amazon Kinesis para aplicativos do ecossistema do Hadoop. |
emr-s3-dist-cp | 2.4.0 | Cópia distribuída otimizada de aplicativos para o Amazon S3. |
emrfs | 2.7.1 | O conector do Amazon S3 para aplicações do ecossistema do Hadoop. |
ganglia-monitor | 3.7.2 | O agente incorporado do Ganglia para aplicativos do ecossistema do Hadoop, juntamente com o agente de monitoramento do Ganglia. |
ganglia-metadata-collector | 3.7.2 | O coletor de metadados do Ganglia para agregar métricas de agentes de monitoramento do Ganglia. |
ganglia-web | 3.7.1 | O aplicativo web para visualizar as métricas coletadas pelo coletor de metadados do Ganglia. |
hadoop-client | 2.7.2-amzn-2 | Clientes da linha de comando do Hadoop, como 'hdfs', 'hadoop', ou 'yarn'. |
hadoop-hdfs-datanode | 2.7.2-amzn-2 | HDFSserviço em nível de nó para armazenar blocos. |
hadoop-hdfs-library | 2.7.2-amzn-2 | HDFScliente e biblioteca de linha de comando |
hadoop-hdfs-namenode | 2.7.2-amzn-2 | HDFSserviço para rastrear nomes de arquivos e localizações de blocos. |
hadoop-httpfs-server | 2.7.2-amzn-2 | HTTPendpoint para HDFS operações. |
hadoop-kms-server | 2.7.2-amzn-2 | Servidor de gerenciamento de chaves criptográficas baseado no Hadoop. KeyProvider API |
hadoop-mapred | 2.7.2-amzn-2 | MapReduce bibliotecas de mecanismos de execução para executar um MapReduce aplicativo. |
hadoop-yarn-nodemanager | 2.7.2-amzn-2 | YARNserviço para gerenciar contêineres em um nó individual. |
hadoop-yarn-resourcemanager | 2.7.2-amzn-2 | YARNserviço para alocar e gerenciar recursos de cluster e aplicativos distribuídos. |
hadoop-yarn-timeline-server | 2.7.2-amzn-2 | Serviço para recuperar informações atuais e históricas para YARN aplicativos. |
hbase-hmaster | 1.2.1 | Serviço para um HBase cluster responsável pela coordenação das regiões e execução de comandos administrativos. |
hbase-region-server | 1.2.1 | Serviço para atender uma ou mais HBase regiões. |
hbase-client | 1.2.1 | HBasecliente de linha de comando. |
hbase-rest-server | 1.2.1 | Serviço que fornece um RESTful HTTP endpoint paraHBase. |
hbase-thrift-server | 1.2.1 | Serviço que fornece um endpoint Thrift para. HBase |
hcatalog-client | 1.0.0-amzn-5 | O cliente da linha de comando 'hcat' para manipular o hcatalog-server. |
hcatalog-server | 1.0.0-amzn-5 | Fornecimento de serviçosHCatalog, uma camada de gerenciamento de tabelas e armazenamento para aplicativos distribuídos. |
hcatalog-webhcat-server | 1.0.0-amzn-5 | HTTPendpoint fornecendo uma REST interface paraHCatalog. |
hive-client | 1.0.0-amzn-5 | O cliente da linha de comando do Hive. |
hive-metastore-server | 1.0.0-amzn-5 | Serviço para acessar o metastore Hive, um repositório semântico que armazena metadados para operações no Hadoop. SQL |
hive-server | 1.0.0-amzn-5 | O serviço que aceita as consultas do Hive como solicitações da web. |
hue-server | 3.7.1-amzn-7 | O aplicativo web para analisar dados usando aplicativos do ecossistema do Hadoop |
mahout-client | 0.12.0 | A biblioteca de Machine Learning. |
mysql-server | 5.5.46 | Meu servidor SQL de banco de dados. |
oozie-client | 4.2.0 | O cliente da linha de comando do Oozie. |
oozie-server | 4.2.0 | O serviço que aceita solicitações de fluxo de trabalho do Oozie. |
phoenix-library | 4.7.0- -1,2 HBase | As bibliotecas do phoenix para servidor e cliente |
phoenix-query-server | 4.7.0- -1,2 HBase | Um servidor leve que fornece JDBC acesso, buffers de protocolo e acesso ao JSON formato do Avatica API |
presto-coordinator | 0.147 | O serviço que aceita consultas e gerencia a execução de consultas entre os presto-workers. |
presto-worker | 0.147 | O serviço que executa partes de uma consulta. |
pig-client | 0.14.0-amzn-0 | O cliente da linha de comando do Pig. |
spark-client | 1.6.1 | Os clientes da linha de comando do Spark. |
spark-history-server | 1.6.1 | A interface de usuário da web para visualizar os eventos registrados por toda a vida útil de um aplicativo Spark concluído. |
spark-on-yarn | 1.6.1 | Mecanismo de execução na memória paraYARN. |
spark-yarn-slave | 1.6.1 | Bibliotecas do Apache Spark necessárias para escravos. YARN |
sqoop-client | 1.4.6 | O cliente da linha de comando do Apache Sqoop. |
tez-on-yarn | 0.8.3 | O YARN aplicativo e as bibliotecas tez. |
webserver | 2.4.18 | HTTPServidor Apache. |
zeppelin-server | 0.5.6-incubating | O notebook baseado na web que permite um data analytics interativo. |
zookeeper-server | 3.4.8 | O serviço centralizado de manutenção de informações de configuração, nomenclatura, fornecimento de sincronização distribuída, e fornecimento de serviços de grupo. |
zookeeper-client | 3.4.8 | ZooKeeper cliente de linha de comando. |
Classificações de configuração 4.7.0
As classificações de configuração permitem que você personalize aplicações. Eles geralmente correspondem a um XML arquivo de configuração do aplicativo, comohive-site.xml
. Para obter mais informações, consulte Configurar aplicações.
Classificações | Descrição |
---|---|
capacity-scheduler | Alterar os valores no arquivo capacity-scheduler.xml do Hadoop. |
core-site | Alterar os valores no arquivo core-site.xml do Hadoop. |
emrfs-site | Altere EMRFS as configurações. |
hadoop-env | Alterar os valores no ambiente do Hadoop para todos os componentes do Hadoop. |
hadoop-log4j | Alterar os valores no arquivo log4j.properties do Hadoop. |
hbase-env | Mude os valores no HBase ambiente. |
hbase-log4j | Altere os valores no arquivo HBase hbase-log4j.properties. |
hbase-metrics | Altere os valores no arquivo HBase hadoop-metrics2-hbaase.properties do. |
hbase-policy | Altere os valores no HBase arquivo hbase-policy.xml do. |
hbase-site | Altere os valores no HBase arquivo hbase-site.xml do. |
hdfs-encryption-zones | Configure zonas de HDFS criptografia. |
hdfs-site | Altere os valores em HDFS's hdfs-site.xml. |
hcatalog-env | Mude os valores no HCatalog ambiente. |
hcatalog-server-jndi | Altere os valores em HCatalog jndi.properties. |
hcatalog-server-proto-hive-site | Altere os valores em HCatalog proto-hive-site .xml. |
hcatalog-webhcat-env | Altere os valores no ambiente ebHCat de HCatalog W. |
hcatalog-webhcat-log4j | Altere os valores nas propriedades ebHCat log4j.properties de HCatalog W. |
hcatalog-webhcat-site | Altere os valores no arquivo webhcat-site.xml de HCatalog W. ebHCat |
hive-env | Alterar os valores no ambiente do Hive. |
hive-exec-log4j | Altere os valores no arquivo hive-exec-log 4j.properties do Hive. |
hive-log4j | Alterar os valores no arquivo hive-log4j.properties do Hive. |
hive-site | Alterar os valores no arquivo hive-site.xml do Hive. |
hue-ini | Alterar os valores no arquivo ini do Hue |
httpfs-env | Mude os valores no HTTPFS ambiente. |
httpfs-site | Alterar os valores no arquivo httpfs-site.xml do Hadoop. |
hadoop-kms-acls | Alterar os valores no arquivo kms-acls.xml do Hadoop. |
hadoop-kms-env | Altere os valores no ambiente HadoopKMS. |
hadoop-kms-log4j | Alterar os valores no arquivo kms-log4j.properties do Hadoop. |
hadoop-kms-site | Alterar os valores no arquivo kms-site.xml do Hadoop. |
mapred-env | Altere os valores no ambiente do MapReduce aplicativo. |
mapred-site | Altere os valores no arquivo mapred-site.xml do MapReduce aplicativo. |
oozie-env | Alterar os valores no ambiente do Oozie. |
oozie-log4j | Alterar os valores no arquivo oozie-log4j.properties do Oozie. |
oozie-site | Alterar os valores no arquivo oozie-site.xml do Oozie. |
phoenix-hbase-metrics | Alterar os valores no arquivo hadoop-metrics2-hbase.properties do Phoenix. |
phoenix-hbase-site | Alterar os valores no arquivo hbase-site.xml do Phoenix. |
phoenix-log4j | Alterar os valores no arquivo log4j.properties do Phoenix. |
phoenix-metrics | Alterar os valores no arquivo hadoop-metrics2-phoenix.properties do Phoenix. |
pig-properties | Alterar os valores no arquivo pig.properties do Pig. |
pig-log4j | Alterar os valores no arquivo log4j.properties do Pig. |
presto-log | Alterar os valores no arquivo log.properties do Presto. |
presto-config | Alterar os valores no arquivo config.properties do Presto. |
presto-connector-hive | Alterar os valores no arquivo hive.properties do Presto. |
spark | Configurações EMR selecionadas pela Amazon para o Apache Spark. |
spark-defaults | Alterar os valores no arquivo spark-defaults.conf do Spark. |
spark-env | Alterar os valores no ambiente do Spark. |
spark-log4j | Alterar os valores no arquivo log4j.properties do Spark. |
spark-metrics | Alterar os valores no arquivo metrics.properties do Spark. |
sqoop-env | Alterar os valores no ambiente do Sqoop. |
sqoop-oraoop-site | Altere os valores no arquivo oraoop-site.xml OraOop do Sqoop. |
sqoop-site | Alterar os valores no arquivo sqoop-site.xml do Sqoop. |
tez-site | Alterar os valores no arquivo tez-site.xml do Tez. |
yarn-env | Mude os valores no YARN ambiente. |
yarn-site | Altere os valores no YARN arquivo yarn-site.xml do. |
zeppelin-env | Alterar os valores no ambiente do Zeppelin. |
zookeeper-config | Altere os valores no ZooKeeper arquivo zoo.cfg do. |
zookeeper-log4j | Altere os valores no ZooKeeper arquivo log4j.properties. |