Cosa succede quando invii un lavoro a un Amazon EMR su un cluster EKS virtuale - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Cosa succede quando invii un lavoro a un Amazon EMR su un cluster EKS virtuale

La registrazione di Amazon EMR con uno spazio dei nomi Kubernetes su Amazon crea un cluster virtuale. EKS Amazon EMR può quindi eseguire carichi di lavoro di analisi su quel namespace. Quando usi Amazon EMR on EKS per inviare lavori Spark al cluster virtuale, Amazon EMR on EKS richiede allo scheduler Kubernetes su Amazon di pianificare i pod. EKS

I passaggi e il diagramma seguenti illustrano il flusso di lavoro di Amazon EMR onEKS:

  • Usa un EKS cluster Amazon esistente o creane uno utilizzando l'utilità da riga di comando eksctl o la console AmazonEKS.

  • Crea un cluster virtuale registrando Amazon EMR con uno spazio dei nomi su un cluster. EKS

  • Invia il tuo lavoro al cluster virtuale utilizzando o. AWS CLI SDK

Amazon EMR su EKS Jobs

Per ogni processo eseguito, Amazon EMR on EKS crea un contenitore con un'immagine di base di Amazon Linux 2, Apache Spark e dipendenze associate. Ogni processo viene eseguito in un pod che effettua il download del container e inizia a eseguirlo. Il pod termina dopo la fine del processo. Se l'immagine del container è stata già precedentemente impiegata nel nodo, viene utilizzata un'immagine memorizzata nella cache e il download viene ignorato. I container Sidecar, come ad esempio i server d'inoltro di log e parametri, possono essere implementati sul pod. Una volta terminato il processo, puoi comunque eseguirne il debug utilizzando l'interfaccia utente dell'applicazione Spark nella console Amazon. EMR