Daten mit Amazon vorbereiten EMR - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Daten mit Amazon vorbereiten EMR

Wichtig

Amazon SageMaker Studio und Amazon SageMaker Studio Classic sind zwei der Machine-Learning-Umgebungen, mit denen Sie interagieren können SageMaker.

Wenn Ihre Domain nach dem 30. November 2023 erstellt wurde, ist Studio Ihr Standarderlebnis.

Wenn Ihre Domain vor dem 30. November 2023 erstellt wurde, ist Amazon SageMaker Studio Classic Ihr Standarderlebnis. Informationen zur Verwendung von Studio, wenn Amazon SageMaker Studio Classic Ihr Standarderlebnis ist, finden Sie unterMigration von Amazon SageMaker Studio Classic.

Wenn Sie von Amazon SageMaker Studio Classic zu Amazon SageMaker Studio migrieren, geht die Verfügbarkeit von Funktionen nicht verloren. Studio Classic ist auch als Anwendung in Amazon SageMaker Studio verfügbar, um Sie bei der Ausführung Ihrer älteren Machine-Learning-Workflows zu unterstützen.

Amazon SageMaker Studio und Studio Classic verfügen über eine integrierte Integration von Amazon EMR, mit der Datenwissenschaftler und Dateningenieure interaktive Datenaufbereitung und maschinelles Lernen (ML) im Petabyte-Bereich direkt von ihrem Notebook aus durchführen können. In JupyterLab und Studio Classic-Notebooks können sie bestehende EMR Amazon-Cluster erkennen und eine Verbindung zu ihnen herstellen und anschließend mithilfe von Apache Spark, ApacheHive oder Presto umfangreiche Daten interaktiv für maschinelles Lernen untersuchen, visualisieren und aufbereiten. Mit einem einzigen Klick können sie auf die Spark-Benutzeroberfläche zugreifen, um den Status und die Metriken ihrer Spark-Jobs zu überwachen, ohne ihr Notizbuch verlassen zu müssen.

Administratoren können AWS CloudFormation Vorlagen erstellen, die EMR Amazon-Cluster definieren. Sie können diese Cluster-Vorlagen dann AWS Service Catalogfür Studio- und Studio Classic-Benutzer zum Start verfügbar machen. Datenwissenschaftler können dann eine vordefinierte Vorlage auswählen, um einen EMR Amazon-Cluster direkt von ihrer Studio-Umgebung aus selbst bereitzustellen. Administratoren können die Vorlagen weiter parametrisieren, sodass Benutzer innerhalb vordefinierter Werte Aspekte des Clusters auswählen können. Beispielsweise möchten Benutzer möglicherweise die Anzahl der Kernknoten angeben oder den Instanztyp eines Knotens aus einem Dropdownmenü auswählen.

Mithilfe dieser AWS CloudFormation Funktion können Administratoren die Organisations-, Sicherheits- und Netzwerkkonfiguration von EMR Amazon-Clustern steuern. Datenwissenschaftler und Dateningenieure können diese Vorlagen dann an ihre Workloads anpassen, um EMR On-Demand-Amazon-Cluster direkt aus Studio und Studio Classic zu erstellen, ohne komplexe Konfigurationen einrichten zu müssen. Benutzer können EMR Amazon-Cluster nach der Verwendung beenden.