As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Versões 7.2.0 do Amazon EMR no EKS
Esta página descreve a funcionalidade nova e atualizada do Amazon EMR que é específica para a implantação do Amazon EMR no EKS. Para obter detalhes sobre o Amazon EMR em execução na Amazon EC2 e sobre a versão do Amazon EMR 7.2.0 em geral, consulte Amazon EMR 7.2.0 no Guia de lançamento do Amazon EMR.
Versões 7.2 do Amazon EMR no EKS
As versões 7.2.0 do Amazon EMR a seguir estão disponíveis para o Amazon EMR no EKS. Selecione uma versão específica do emr-7.2.0-XXXX para exibir mais detalhes, como a tag de imagem do contêiner relacionada.
Notas de lançamento
Notas da versão 7.2.0 do Amazon EMR no EKS
-
Aplicativos compatíveis ‐ AWS SDK for Java 2.23.18 and 1.12.705, Apache Spark 3.5.1-amzn-1, Apache Hudi 0.14.1-amzn-0, Apache Iceberg 1.5.0-amzn-0, Delta 3.1.0, Apache Spark RAPIDS 24.02.0-amzn-1, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-0, Flink Operator 1.8.0-amzn-1
-
Componentes com suporte:
aws-sagemaker-spark-sdk
,emr-ddb
,emr-goodies
,emr-s3-select
,emrfs
,hadoop-client
,hudi
,hudi-spark
,iceberg
espark-kubernetes
. -
Classificações de configuração com suporte
Para uso com StartJobRune CreateManagedEndpoint APIs:
Classificações Descrições core-site
Altera os valores no arquivo
core-site.xml
do Hadoop.emrfs-site
Alterar as configurações do EMRFS.
spark-metrics
Altera os valores no arquivo
metrics.properties
do Spark.spark-defaults
Altera os valores no arquivo
spark-defaults.conf
do Spark.spark-env
Alterar os valores no ambiente do Spark.
spark-hive-site
Altera os valores no arquivo
hive-site.xml
do Spark.spark-log4j2
Altera os valores no arquivo
log4j2.properties
do Spark.emr-job-submitter
Configuração para o pod de envio de trabalho.
Para uso específico com CreateManagedEndpoint APIs:
Classificações Descrições jeg-config
Altera os valores no arquivo
jupyter_enterprise_gateway_config.py
do Jupyter Enterprise Gateway.jupyter-kernel-overrides
Altera o valor da imagem do kernel no arquivo de um kernel do Jupyter especificado.
As classificações de configuração permitem que você personalize aplicações. Elas geralmente correspondem a um arquivo XML de configuração da aplicação, como
spark-hive-site.xml
. Para obter mais informações, consulte Configure Applications.
Recursos notáveis
Os recursos a seguir estão incluídos na versão 7.2.0 do Amazon EMR no EKS.
-
Atualizações da aplicação: as atualizações da aplicação do Amazon EMR no EKS 7.2.0 incluem Spark 3.5.1, Flink 1.18.1 e operador do Flink 1.8.0.
-
Escalador automático para atualizações do Flink: a versão 7.2.0 usa a configuração de código aberto
job.autoscaler.restart.time-tracking.enabled
para permitir a estimativa do tempo de redimensionamento, para que você não precise mais atribuir valores empíricos manualmente ao reiniciar. Se você executar a versão 7.1.0 ou inferior, ainda poderá usar o ajuste de escala automático do Amazon EMR. -
Integração do Apache Hudi com Apache Flink no Amazon EMR no EKS: essa versão adiciona uma integração entre o Apache Hudi e o Apache Flink, para que você possa usar o operador do Kubernetes do Flink ao executar trabalhos do Hudi. O Hudi permite usar operações em nível de registro que podem simplificar o gerenciamento de dados e o desenvolvimento do pipeline de dados.
-
Integração do Amazon S3 Express One Zone com o Amazon EMR no EKS: com a versão 7.2.0 e superior, você pode fazer upload de dados no S3 Express One Zone com o Amazon EMR no EKS. O S3 Express One Zone é uma classe de armazenamento de zona única e alta performance do Amazon S3 que oferece acesso consistente a dados de milissegundos de um dígito para a maioria das aplicações sensíveis à latência. Na hora da execução, o S3 Express One Zone oferece o armazenamento de objetos na nuvem com a menor latência e a maior performance do Amazon S3.
-
Suporte para configurações padrão no operador do Spark: o operador do Spark no Amazon EKS agora oferece suporte às mesmas configurações padrão do modelo de início de execução de trabalhos no Amazon EMR no EKS para a versão 7.2.0 e posteriores. Isso significa que recursos como Amazon S3 e EMRFS não exigem mais configurações manuais no arquivo YAML.