Configurer le réseau dans un VPC pour Amazon EMR - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configurer le réseau dans un VPC pour Amazon EMR

La plupart des clusters sont lancés sur un réseau virtuel à l'aide d'Amazon Virtual Private Cloud (AmazonVPC). A VPC est un réseau virtuel isolé au sein de votre AWS compte AWS qui est logiquement isolé. Vous pouvez configurer des aspects tels que les plages d'adresses IP privées, les sous-réseaux, les tables de routage et les passerelles réseau. Pour plus d'informations, consultez le guide de VPC l'utilisateur Amazon.

VPCoffre les fonctionnalités suivantes :

  • Traitement des données sensibles

    Le lancement d'un cluster dans un VPC est similaire au lancement du cluster dans un réseau privé avec des outils supplémentaires, tels que des tables de routage et un réseauACLs, pour définir qui a accès au réseau. Si vous traitez des données sensibles dans votre cluster, vous souhaiterez peut-être bénéficier du contrôle d'accès supplémentaire VPC fourni par le lancement de votre cluster dans un cluster. En outre, vous pouvez choisir de lancer vos ressources dans un sous-réseau privé, dans lequel aucune de ces ressources ne dispose d'une connectivité Internet directe.

  • Accès aux ressources sur un réseau interne

    Si votre source de données se trouve sur un réseau privé, il peut s'avérer peu pratique ou indésirable de télécharger ces données AWS pour les importer sur AmazonEMR, soit en raison de la quantité de données à transférer, soit en raison de leur nature sensible. Au lieu de cela, vous pouvez lancer le cluster dans un VPC et connecter votre centre de données à vous VPC via une VPN connexion, permettant au cluster d'accéder aux ressources de votre réseau interne. Par exemple, si vous avez une base de données Oracle dans votre centre de données, le lancement de votre cluster dans un réseau VPC connecté à ce réseau VPN permet au cluster d'accéder à la base de données Oracle.

Sous-réseaux publics et privés

Vous pouvez lancer des EMR clusters Amazon dans des VPC sous-réseaux publics et privés. Cela signifie que vous n'avez pas besoin de connexion Internet pour exécuter un EMR cluster Amazon ; toutefois, vous devrez peut-être configurer la traduction d'adresses réseau (NAT) et des VPN passerelles pour accéder à des services ou à des ressources situés en dehors du clusterVPC, par exemple sur un intranet d'entreprise ou sur des points de terminaison de AWS service public tels que. AWS Key Management Service

Important

Amazon prend EMR uniquement en charge le lancement de clusters dans des sous-réseaux privés dans les versions 4.2 et ultérieures.

Pour plus d'informations sur AmazonVPC, consultez le guide de VPC l'utilisateur Amazon.

Plus de ressources pour en savoir plus sur VPCs

Consultez les rubriques suivantes pour en savoir plus sur VPCs les sous-réseaux.