Netzwerkkonfigurationen - AWS ParallelCluster

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Netzwerkkonfigurationen

AWS ParallelCluster verwendet Amazon Virtual Private Cloud (VPC) für Netzwerke. VPCbietet eine flexible und konfigurierbare Netzwerkplattform, auf der Sie Cluster bereitstellen können.

Das VPC Muss DNS Hostnames = yes und DNS Resolution = yes die DHCP Optionen mit dem richtigen Domainnamen für die Region. Der DHCP Standardoptionssatz spezifiziert bereits die erforderlichen Optionen. AmazonProvidedDNS Wenn Sie mehr als einen Domain-Namenserver angeben, finden Sie weitere Informationen zu den DHCPOptionssätzen im VPCAmazon-Benutzerhandbuch.

AWS ParallelCluster unterstützt die folgenden Konfigurationen auf hoher Ebene:

  • Ein Subnetz für Kopf- und Rechenknoten.

  • Zwei Subnetze, mit dem Hauptknoten in einem öffentlichen Subnetz und Rechenknoten in einem privaten Subnetz. Bei den Subnetzen kann es sich entweder um neue oder um bestehende Subnetze handeln.

Alle diese Konfigurationen können mit oder ohne öffentliche IP-Adressierung betrieben werden. AWS ParallelCluster kann auch so eingesetzt werden, dass ein HTTP Proxy für alle AWS Anfragen verwendet wird. Die Kombinationen dieser Konfigurationen bedeuten, dass viele Bereitstellungsszenarien möglich sind. Sie können beispielsweise ein einzelnes öffentliches Subnetz mit vollständigem Zugriff über das Internet konfigurieren. Oder Sie können ein vollständig privates Netzwerk konfigurieren, indem Sie einen HTTP Proxy für den gesamten Datenverkehr verwenden AWS Direct Connect .

Illustrationen für einige dieser Szenarien finden Sie in den folgenden Architekturdiagrammen:

AWS ParallelCluster in einem einzigen öffentlichen Subnetz

Die Konfiguration für diese Architektur erfordert die folgenden Einstellungen:

[vpc public] vpc_id = vpc-xxxxxx master_subnet_id = subnet-<public> use_public_ips = true

Die use_public_ips-Einstellung kann nicht auf false gesetzt werden, da das Internet-Gateway voraussetzt, dass alle Instances über eine global eindeutige IP-Adresse verfügen. Weitere Informationen finden Sie unter Aktivieren des Internetzugangs im VPCAmazon-Benutzerhandbuch.

AWS ParallelCluster unter Verwendung von zwei Subnetzen

AWS ParallelCluster mit zwei Subnetzen

Die Konfiguration zum Erstellen eines neuen privaten Subnetzes für Datenverarbeitungs-Instances erfordert die folgenden Einstellungen:

Beachten Sie, dass alle Werte nur als Beispiele angegeben werden.

[vpc public-private-new] vpc_id = vpc-xxxxxx master_subnet_id = subnet-<public> compute_subnet_cidr = 10.0.1.0/24

Die Konfiguration zur Verwendung eines vorhandenen privaten Netzwerks erfordert die folgenden Einstellungen:

[vpc public-private-existing] vpc_id = vpc-xxxxxx master_subnet_id = subnet-<public> compute_subnet_id = subnet-<private>

Beide Konfigurationen erfordern ein NATGateway oder einen internen Proxy, um den Webzugriff für Recheninstanzen zu ermöglichen.

AWS ParallelCluster in einem einzigen privaten Subnetz, verbunden mit AWS Direct Connect

Privat mit AWS ParallelCluster AWS Direct Connect

Die Konfiguration für diese Architektur erfordert die folgenden Einstellungen:

[cluster private-proxy] proxy_server = http://proxy.corp.net:8080 [vpc private-proxy] vpc_id = vpc-xxxxxx master_subnet_id = subnet-<private> use_public_ips = false

Wenn auf eingestellt use_public_ips istfalse, VPC muss der korrekt eingerichtet sein, um den Proxy für den gesamten Datenverkehr verwenden zu können. Webzugriff ist sowohl für Haupt- als auch für Rechenknoten erforderlich.

AWS ParallelCluster mit awsbatch Scheduler

Wenn Sie awsbatch als Scheduler-Typ verwenden, AWS ParallelCluster wird eine AWS Batch verwaltete Rechenumgebung erstellt. Die AWS Batch Umgebung kümmert sich um die Verwaltung von Amazon Elastic Container Service (AmazonECS) Container-Instances, die in der gestartet werdencompute_subnet. AWS Batch Damit ECS Amazon-Container-Instances ordnungsgemäß funktionieren, benötigen sie externen Netzwerkzugriff, um mit dem ECS Amazon-Serviceendpunkt zu kommunizieren. Daraus ergeben sich die folgenden Szenarien:

  • Der compute_subnet verwendet ein NAT Gateway für den Zugriff auf das Internet. (Wir empfehlen diesen Ansatz.)

  • Im compute_subnet gestartete Instances verfügen über öffentliche IP-Adressen und können eine Internetverbindung über ein Internet-Gateway herstellen.

Wenn Sie außerdem an parallel Jobs mit mehreren Knoten interessiert sind (aus den AWS Batch Dokumenten):

AWS Batch parallel Jobs mit mehreren Knoten verwenden den ECS awsvpc Amazon-Netzwerkmodus, der Ihren parallel Job-Containern mit mehreren Knoten dieselben Netzwerkeigenschaften wie EC2 Amazon-Instances verleiht. Jeder parallel Jobcontainer mit mehreren Knoten erhält seine eigene elastic network interface, eine primäre private IP-Adresse und einen internen DNS Hostnamen. Die Netzwerkschnittstelle wird im selben VPC Amazon-Subnetz wie ihre Host-Rechenressource erstellt. Alle Sicherheitsgruppen, die auf Ihre Datenverarbeitungsressourcen angewendet werden, werden auch darauf angewendet.

Bei Verwendung von Amazon ECS Task Networking bietet der awsvpc Netzwerkmodus keine elastischen Netzwerkschnittstellen mit öffentlichen IP-Adressen für Aufgaben, die den EC2 Amazon-Starttyp verwenden. Um auf das Internet zugreifen zu können, müssen Aufgaben, die den EC2 Amazon-Starttyp verwenden, in einem privaten Subnetz gestartet werden, das für die Verwendung eines NAT Gateways konfiguriert ist.

Sie müssen ein NAT Gateway konfigurieren, damit der Cluster parallel Jobs mit mehreren Knoten ausführen kann.

AWS ParallelCluster Vernetzung mit Scheduler awsbatch

Weitere Informationen finden Sie unter den folgenden Themen: