O que é o Amazon EMR no EKS?
O Amazon EMR no EKS oferece uma opção de implantação para o Amazon EMR que permite executar estruturas de big data de código aberto no Amazon Elastic Kubernetes Service (Amazon EKS). Com essa opção de implantação, você pode se concentrar na execução de workloads de analytics enquanto o Amazon EMR no EKS cria, configura e gerencia contêineres para aplicações de código aberto.
Se você já usa o Amazon EMR, agora poderá executar aplicações baseadas no Amazon EMR com outros tipos de aplicações no mesmo cluster do Amazon EKS. Esta opção de implantação também melhora a utilização de recursos e simplifica o gerenciamento da infraestrutura em diversas zonas de disponibilidade. Se você já executa estruturas de big data no Amazon EKS, poderá usar o Amazon EMR para automatizar o provisionamento e o gerenciamento, e executar o Apache Spark mais rapidamente.
O Amazon EMR no EKS possibilita que sua equipe colabore com mais eficiência e processe grandes quantidades de dados com mais facilidade e economia:
-
Você pode executar aplicações em um grupo comum de recursos sem a necessidade de provisionar infraestrutura. Você pode usar o Amazon EMR Studio e o AWS SDK ou AWS CLI para desenvolver, enviar e diagnosticar aplicações de analytics em execução em clusters do EKS. É possível executar trabalhos programados no Amazon EMR no EKS usando o Apache Airflow autogerenciado ou o Amazon Managed Workflows for Apache Airflow (MWAA).
-
As equipes de infraestrutura podem gerenciar centralmente uma plataforma de computação comum para consolidar as workloads do Amazon EMR com outras aplicações baseadas em contêiner. Você pode simplificar o gerenciamento da infraestrutura com ferramentas comuns do Amazon EKS e aproveitar um cluster compartilhado para workloads que precisam de versões diferentes de estruturas de código aberto. Também é possível reduzir a sobrecarga operacional com o gerenciamento automatizado de cluster do Kubernetes e com a aplicação de patches para o sistema operacional. Com o Amazon EC2 e o AWS Fargate, você pode habilitar diversos recursos de computação para atender aos requisitos de performance, de operações ou de finanças.
O diagrama a seguir mostra os dois diferentes modelos de implantação do Amazon EMR.