Vue d'ensemble des points de terminaison interactifs - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Vue d'ensemble des points de terminaison interactifs

Un point de terminaison interactif permet aux clients interactifs tels qu'Amazon EMR Studio de se connecter à Amazon EMR sur des EKS clusters afin d'exécuter des charges de travail interactives. Le point de terminaison interactif est soutenu par une passerelle Jupyter Enterprise Gateway qui fournit la capacité de gestion à distance du cycle de vie du noyau dont les clients interactifs ont besoin. Les noyaux sont des processus spécifiques au langage qui interagissent avec le client Amazon EMR Studio basé sur Jupyter pour exécuter des charges de travail interactives.

Les points de terminaison interactifs prennent en charge les noyaux suivants :

  • Python 3

  • PySpark sur Kubernetes

  • Apache Spark avec Scala

Note

EKSLes tarifs Amazon EMR on s'appliquent aux points de terminaison et aux noyaux interactifs. Pour plus d'informations, consultez la page Amazon EMR sur EKS les tarifs.

Les entités suivantes sont requises pour que EMR Studio puisse se connecter à Amazon EMR surEKS.

  • Amazon EMR sur un cluster EKS virtuel : un cluster virtuel est un espace de noms Kubernetes auprès duquel vous enregistrez Amazon. EMR Amazon EMR utilise des clusters virtuels pour exécuter des tâches et héberger des points de terminaison. Vous pouvez sauvegarder plusieurs clusters virtuels avec le même cluster physique. Cependant, chaque cluster virtuel correspond à un espace de noms sur un EKS cluster Amazon. Les clusters virtuels ne créent aucune ressource active qui contribue à votre facture ou qui nécessite une gestion du cycle de vie en dehors du service.

  • Amazon EMR sur un point de terminaison EKS interactif : un point de terminaison interactif est un HTTPS point de terminaison auquel les utilisateurs de EMR Studio peuvent connecter un espace de travail. Vous ne pouvez accéder aux HTTPS points de terminaison que depuis votre EMR studio, et vous les créez dans un sous-réseau privé d'Amazon Virtual Private Cloud VPC (Amazon) pour votre cluster AmazonEKS.

    Les noyaux Python et Spark Scala utilisent les autorisations définies dans votre rôle Amazon EMR on EKS job execution pour en invoquer d'autres. PySpark Services AWS Tous les noyaux et utilisateurs qui se connectent au point de terminaison interactif utilisent le rôle que vous avez spécifié lors de la création du point de terminaison. Nous vous recommandons de créer des points de terminaison distincts pour les différents utilisateurs et de leur attribuer des rôles AWS Identity and Access Management (IAM) différents.

  • AWS Contrôleur Application Load Balancer : le contrôleur AWS Application Load Balancer gère Elastic Load Balancing pour un cluster Amazon EKS Kubernetes. Le contrôleur approvisionne un Application Load Balancer (ALB) lorsque vous créez une ressource Kubernetes Ingress. Un ALB expose un service Kubernetes, tel qu'un point de terminaison interactif, en dehors du EKS cluster Amazon mais au sein du même Amazon. VPC Lorsque vous créez un point de terminaison interactif, une ressource d'entrée est également déployée qui expose le point de terminaison interactif au moyen du ALB pour les clients interactifs auxquels se connecter. Il vous suffit d'installer un contrôleur AWS Application Load Balancer pour chaque cluster AmazonEKS.

Le schéma suivant décrit l'architecture des points de terminaison interactifs dans Amazon EMR onEKS. Un EKS cluster Amazon comprend le calcul nécessaire pour exécuter les charges de travail analytiques et le point de terminaison interactif. Le contrôleur d'équilibreur de charge Application Load Balancer s'exécute dans l'espace de noms kube-system ; les charges de travail et les points de terminaison interactifs s'exécutent dans l'espace de noms que vous indiquez lors de la création du cluster virtuel. Lorsque vous créez un point de terminaison interactif, le plan de EKS contrôle Amazon EMR crée le déploiement du point de terminaison interactif dans le EKS cluster Amazon. En outre, une instance de l'entrée de l'équilibreur de charge de l'application est créée par le contrôleur de l'équilibreur de AWS charge. L'équilibreur de charge d'application fournit l'interface externe permettant aux clients tels que EMR Studio de se connecter au EMR cluster Amazon et d'exécuter des charges de travail interactives.

Diagramme d'architecture des points de terminaison interactifs