Versões 7.2.0 do Amazon EMR no EKS - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Versões 7.2.0 do Amazon EMR no EKS

Esta página descreve a funcionalidade nova e atualizada do Amazon EMR que é específica para a implantação do Amazon EMR no EKS. Para obter detalhes sobre o Amazon EMR em execução na Amazon EC2 e sobre a versão do Amazon EMR 7.2.0 em geral, consulte Amazon EMR 7.2.0 no Guia de lançamento do Amazon EMR.

Versões 7.2 do Amazon EMR no EKS

As versões 7.2.0 do Amazon EMR a seguir estão disponíveis para o Amazon EMR no EKS. Selecione uma versão específica do emr-7.2.0-XXXX para exibir mais detalhes, como a tag de imagem do contêiner relacionada.

Flink releases

As versões 7.2.0 do Amazon EMR a seguir estão disponíveis para o Amazon EMR no EKS ao executar aplicações do Flink.

Spark releases

As versões 7.2.0 do Amazon EMR a seguir estão disponíveis para o Amazon EMR no EKS ao executar aplicações do Spark.

  • emr-7.2.0-latest

  • emr-7.2.0-20240610

  • emr-7.2.0-spark-rapids-latest

  • emr-7.2.0-spark-rapids-20240610

  • emr-7.2.0-java11-latest

  • emr-7.2.0-java11-20240610

  • emr-7.2.0-java8-latest

  • emr-7.2.0-java8-20240610

  • emr-7.2.0-spark-rapids-java8-latest

  • emr-7.2.0-spark-rapids-java8-20240610

  • notebook-spark/emr-7.2.0-latest

  • notebook-spark/emr-7.2.0-20240610

  • notebook-spark/emr-7.2.0-spark-rapids-latest

  • notebook-spark/emr-7.2.0-spark-rapids-20240610

  • notebook-spark/emr-7.2.0-java11-latest

  • notebook-spark/emr-7.2.0-java11-20240610

  • notebook-spark/emr-7.2.0-java8-latest

  • notebook-spark/emr-7.2.0-java8-20240610

  • notebook-spark/emr-7.2.0-spark-rapids-java8-latest

  • notebook-spark/emr-7.2.0-spark-rapids-java8-20240610

  • notebook-python/emr-7.2.0-latest

  • notebook-python/emr-7.2.0-20240610

  • notebook-python/emr-7.2.0-spark-rapids-latest

  • notebook-python/emr-7.2.0-spark-rapids-20240610

  • notebook-python/emr-7.2.0-java11-latest

  • notebook-python/emr-7.2.0-java11-20240610

  • notebook-python/emr-7.2.0-java8-latest

  • notebook-python/emr-7.2.0-java8-20240610

  • notebook-python/emr-7.2.0-spark-rapids-java8-latest

  • notebook-python/emr-7.2.0-spark-rapids-java8-20240610

  • livy/emr-7.2.0-latest

  • livy/emr-7.2.0-20240610

  • livy/emr-7.2.0-java11-latest

  • livy/emr-7.2.0-java11-20240610

  • livy/emr-7.2.0-java8-latest

  • livy/emr-7.2.0-java8-20240610

Notas de lançamento

Notas da versão 7.2.0 do Amazon EMR no EKS

  • Aplicativos compatíveis ‐ AWS SDK for Java 2.23.18 and 1.12.705, Apache Spark 3.5.1-amzn-1, Apache Hudi 0.14.1-amzn-0, Apache Iceberg 1.5.0-amzn-0, Delta 3.1.0, Apache Spark RAPIDS 24.02.0-amzn-1, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-0, Flink Operator 1.8.0-amzn-1

  • Componentes com suporte: aws-sagemaker-spark-sdk, emr-ddb, emr-goodies, emr-s3-select, emrfs, hadoop-client, hudi, hudi-spark, iceberg e spark-kubernetes.

  • Classificações de configuração com suporte

    Para uso com StartJobRune CreateManagedEndpoint APIs:

    Classificações Descrições

    core-site

    Altera os valores no arquivo core-site.xml do Hadoop.

    emrfs-site

    Alterar as configurações do EMRFS.

    spark-metrics

    Altera os valores no arquivo metrics.properties do Spark.

    spark-defaults

    Altera os valores no arquivo spark-defaults.conf do Spark.

    spark-env

    Alterar os valores no ambiente do Spark.

    spark-hive-site

    Altera os valores no arquivo hive-site.xml do Spark.

    spark-log4j2

    Altera os valores no arquivo log4j2.properties do Spark.

    emr-job-submitter

    Configuração para o pod de envio de trabalho.

    Para uso específico com CreateManagedEndpoint APIs:

    Classificações Descrições

    jeg-config

    Altera os valores no arquivo jupyter_enterprise_gateway_config.py do Jupyter Enterprise Gateway.

    jupyter-kernel-overrides

    Altera o valor da imagem do kernel no arquivo de um kernel do Jupyter especificado.

    As classificações de configuração permitem que você personalize aplicações. Elas geralmente correspondem a um arquivo XML de configuração da aplicação, como spark-hive-site.xml. Para obter mais informações, consulte Configure Applications.

Recursos notáveis

Os recursos a seguir estão incluídos na versão 7.2.0 do Amazon EMR no EKS.

  • Atualizações da aplicação: as atualizações da aplicação do Amazon EMR no EKS 7.2.0 incluem Spark 3.5.1, Flink 1.18.1 e operador do Flink 1.8.0.

  • Escalador automático para atualizações do Flink: a versão 7.2.0 usa a configuração de código aberto job.autoscaler.restart.time-tracking.enabled para permitir a estimativa do tempo de redimensionamento, para que você não precise mais atribuir valores empíricos manualmente ao reiniciar. Se você executar a versão 7.1.0 ou inferior, ainda poderá usar o ajuste de escala automático do Amazon EMR.

  • Integração do Apache Hudi com Apache Flink no Amazon EMR no EKS: essa versão adiciona uma integração entre o Apache Hudi e o Apache Flink, para que você possa usar o operador do Kubernetes do Flink ao executar trabalhos do Hudi. O Hudi permite usar operações em nível de registro que podem simplificar o gerenciamento de dados e o desenvolvimento do pipeline de dados.

  • Integração do Amazon S3 Express One Zone com o Amazon EMR no EKS: com a versão 7.2.0 e superior, você pode fazer upload de dados no S3 Express One Zone com o Amazon EMR no EKS. O S3 Express One Zone é uma classe de armazenamento de zona única e alta performance do Amazon S3 que oferece acesso consistente a dados de milissegundos de um dígito para a maioria das aplicações sensíveis à latência. Na hora da execução, o S3 Express One Zone oferece o armazenamento de objetos na nuvem com a menor latência e a maior performance do Amazon S3.

  • Suporte para configurações padrão no operador do Spark: o operador do Spark no Amazon EKS agora oferece suporte às mesmas configurações padrão do modelo de início de execução de trabalhos no Amazon EMR no EKS para a versão 7.2.0 e posteriores. Isso significa que recursos como Amazon S3 e EMRFS não exigem mais configurações manuais no arquivo YAML.