Konfiguration von EMR Amazon-Cluster-Hardware und -Netzwerken - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Konfiguration von EMR Amazon-Cluster-Hardware und -Netzwerken

Ein wichtiger Aspekt bei der Erstellung eines EMR Amazon-Clusters ist die Konfiguration von EC2 Amazon-Instances und Netzwerkoptionen. Dieses Kapitel behandelt diese Optionen im Detail und beschreibt entsprechende bewährte Methoden und Richtlinien.

  • Knotentypen — EC2 Amazon-Instances in einem EMR Cluster sind in Knotentypen unterteilt. Es gibt drei Knotentypen: Primärknoten, Core-Knoten und Aufgabenknoten. Jeder Knotentyp führt eine Reihe von Rollen aus, die durch die von Ihnen auf dem Cluster installierten verteilten Anwendungen definiert werden. Während eines Hadoop MapReduce - oder Spark-Jobs verarbeiten Komponenten auf Kern- und Taskknoten beispielsweise Daten, übertragen die Ausgabe an Amazon S3 oder HDFS stellen Statusmetadaten zurück an den primären Knoten. Bei einem einzigen Knoten-Cluster werden alle Komponenten auf dem Primärknoten ausgeführt. Weitere Informationen finden Sie unter Verstehen Sie die Knotentypen in AmazonEMR: Primär-, Kern- und Aufgabenknoten.

  • EC2Instances — Wenn Sie einen Cluster erstellen, treffen Sie Entscheidungen über die EC2 Amazon-Instances, auf denen die einzelnen Knotentypen ausgeführt werden sollen. Der EC2 Instance-Typ bestimmt das Verarbeitungs- und Speicherprofil des Knotens. Die Wahl der EC2 Amazon-Instance für Ihre Knoten ist wichtig, da sie das Leistungsprofil der einzelnen Knotentypen in Ihrem Cluster bestimmt. Weitere Informationen finden Sie unter Konfigurieren Sie EC2 Amazon-Instance-Typen für die Verwendung mit Amazon EMR.

  • Netzwerk — Sie können Ihren EMR Amazon-Cluster in einem VPC öffentlichen Subnetz, einem privaten Subnetz oder einem gemeinsam genutzten Subnetz starten. Ihre Netzwerkkonfiguration bestimmt, wie Kunden und Services Verbindungen zu Clustern herstellen können, um ihre Arbeit zu erledigen, wie Cluster mit Datenspeichern und anderen AWS -Ressourcen verbunden werden und welche Optionen Sie zur Steuerung des Datenverkehrs auf diesen Verbindungen haben. Weitere Informationen finden Sie unter Konfigurieren Sie das Netzwerk in einem VPC für Amazon EMR.

  • Instance-Gruppierung — Die Sammlung von EC2 Instances, die jeden Knotentyp hosten, wird entweder als Instance-Flotte oder als einheitliche Instance-Gruppe bezeichnet. Die Konfiguration der Instance-Gruppierung ist eine Auswahl, die Sie beim Erstellen eines Clusters treffen. Diese Auswahl bestimmt, wie Sie Ihrem Cluster Knoten hinzufügen können, während er läuft. Die Konfiguration gilt für alle Knotentypen. Er kann später nicht mehr geändert werden. Weitere Informationen finden Sie unter Erstellen Sie einen EMR Amazon-Cluster mit Instance-Flotten oder einheitlichen Instance-Gruppen.

    Anmerkung

    Die Konfiguration der Instance-Flotten ist nur in EMR Amazon-Versionen 4.8.0 und höher verfügbar, mit Ausnahme von 5.0.0 und 5.0.3.