Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Datenaufbereitung mit Amazon EMR
Wichtig
Amazon SageMaker Studio und Amazon SageMaker Studio Classic sind zwei der Machine-Learning-Umgebungen, mit denen Sie interagieren können SageMaker.
Wenn Ihre Domain nach dem 30. November 2023 erstellt wurde, ist Studio Ihr Standarderlebnis.
Wenn Ihre Domain vor dem 30. November 2023 erstellt wurde, ist Amazon SageMaker Studio Classic Ihr Standarderlebnis. Informationen zur Verwendung von Studio, wenn Amazon SageMaker Studio Classic Ihr Standarderlebnis ist, finden Sie unterMigration von Amazon SageMaker Studio Classic.
Wenn Sie von Amazon SageMaker Studio Classic zu Amazon SageMaker Studio migrieren, geht die Verfügbarkeit von Funktionen nicht verloren. Studio Classic ist auch als Anwendung in Amazon SageMaker Studio verfügbar, um Sie bei der Ausführung Ihrer älteren Machine-Learning-Workflows zu unterstützen.
Amazon SageMaker Studio und Studio Classic verfügen über eine integrierte Integration mit Amazon EMR. In JupyterLab und Studio Classic-Notebooks können Datenwissenschaftler und Dateningenieure bestehende EMR Amazon-Cluster erkennen und eine Verbindung zu ihnen herstellen und anschließend umfangreiche Daten interaktiv mit Apache Spark, Apache
Administratoren können AWS CloudFormation Vorlagen erstellen, die EMR Amazon-Cluster definieren. Sie können diese Cluster-Vorlagen dann AWS Service Catalogfür Studio- und Studio Classic-Benutzer zum Start verfügbar machen. Datenwissenschaftler können dann eine vordefinierte Vorlage auswählen, um einen EMR Amazon-Cluster direkt von ihrer Studio-Umgebung aus selbst bereitzustellen. Administratoren können die Vorlagen weiter parametrisieren, sodass Benutzer innerhalb vordefinierter Werte Aspekte des Clusters auswählen können. Beispielsweise möchten Benutzer möglicherweise die Anzahl der Kernknoten angeben oder den Instanztyp eines Knotens aus einem Dropdownmenü auswählen.
Mithilfe dieser AWS CloudFormation Funktion können Administratoren die Organisations-, Sicherheits- und Netzwerkkonfiguration von EMR Amazon-Clustern steuern. Datenwissenschaftler und Dateningenieure können diese Vorlagen dann an ihre Workloads anpassen, um EMR On-Demand-Amazon-Cluster direkt aus Studio und Studio Classic zu erstellen, ohne komplexe Konfigurationen einrichten zu müssen. Benutzer können EMR Amazon-Cluster nach der Verwendung beenden.
-
Wenn Sie ein Administrator sind:
Stellen Sie sicher, dass Sie die Kommunikation zwischen Studio oder Studio Classic und EMR Amazon-Clustern aktiviert haben. Anweisungen dazu finden Sie im Abschnitt Netzwerkzugriff für Ihren EMR Amazon-Cluster konfigurieren. Sobald diese Kommunikation aktiviert ist, können Sie:
-
Wenn Sie ein Datenwissenschaftler oder Dateningenieur sind, können Sie: