Benutzerhandbuch - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Benutzerhandbuch

In diesem Abschnitt wird beschrieben, wie Datenwissenschaftler und Dateningenieure einen EMR Amazon-Cluster von Studio oder Studio Classic aus starten, entdecken, eine Verbindung zu ihm herstellen oder ihn beenden können.

Bevor Benutzer Cluster auflisten oder starten können, müssen Administratoren die erforderlichen Einstellungen in der Studio-Umgebung konfiguriert haben. Informationen darüber, wie Administratoren eine Studio-Umgebung so konfigurieren können, dass sie die Selbstbereitstellung und Listung von EMR Amazon-Clustern ermöglicht, finden Sie unter. Leitfaden für Administratoren

Unterstützte Images und Kernel für die Verbindung zu einem EMR Amazon-Cluster von Studio oder Studio Classic

Die folgenden Images und Kernel enthalten die JupyterLab Erweiterung sagemaker-studio-analytics-extension, die mithilfe von Apache Livy über die SparkMagicBibliothek eine Verbindung zu einem EMR Remote-Spark-Cluster (Amazon) herstellt.

  • Für Studio-Benutzer: SageMaker Distribution ist eine Docker-Umgebung für Datenwissenschaft, die als Standard-Image für Notebook-Instances verwendet wird. JupyterLab Alle Versionen von SageMakerDistribution sind sagemaker-studio-analytics-extension vorinstalliert.

  • Für Studio Classic-Benutzer: Die folgenden Images sind vorinstalliert mit: sagemaker-studio-analytics-extension

    • DataScience — Python-3-Kernel

    • DataScience 2.0 — Python-3-Kernel

    • DataScience 3.0 — Python-3-Kernel

    • SparkAnalytics 1.0 — SparkMagic und PySpark Kernel

    • SparkAnalytics 2.0 — SparkMagic und Kernel PySpark

    • SparkMagic — SparkMagic und Kernel PySpark

    • PyTorch 1.8 — Python-3-Kernel

    • TensorFlow 2.6 — Python-3-Kernel

    • TensorFlow 2.11 — Python-3-Kernel

Um mithilfe eines anderen integrierten Images oder Ihres eigenen Images eine Verbindung zu EMR Amazon-Clustern herzustellen, folgen Sie den Anweisungen unterBring Your on.

Bring Your on

Um Ihr eigenes Image in Studio oder Studio Classic zu integrieren und es Ihren Notebooks zu ermöglichen, sich mit EMR Amazon-Clustern zu verbinden, installieren Sie die folgende sagemaker-studio-analytics-extensionErweiterung in Ihrem Kernel. Es unterstützt die Verbindung von SageMaker Studio- oder Studio Classic-Notebooks mit Spark-Clustern (AmazonEMR) über die SparkMagicBibliothek.

pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension

Um EMR mit Kerberos-Authentifizierung eine Verbindung zu Amazon herzustellen, müssen Sie außerdem den Kinit-Client installieren. Je nach Betriebssystem kann der Befehl zur Installation des Kinit-Clients unterschiedlich sein. Verwenden Sie den Befehl apt-get install -y -qq krb5-user, um ein Ubuntu-Image (auf Basis von Debian) mitzubringen.

Weitere Informationen zum Mitbringen Ihres eigenen Images in SageMaker Studio oder Studio Classic finden Sie unter Bringen Sie Ihr eigenes Bild mit. SageMaker