Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Stellen Sie von Studio aus eine Connect zu einer EMR serverlosen Anwendung her
Datenwissenschaftler und Dateningenieure können eine EMR serverlose Anwendung direkt von der Studio-Benutzeroberfläche aus erkennen und dann eine Verbindung zu ihr herstellen. Bevor Sie beginnen, stellen Sie sicher, dass Sie eine EMR serverlose Anwendung erstellt haben, indem Sie die Anweisungen unter befolgen. Erstellen Sie EMR serverlose Anwendungen in Studio
Sie können eine EMR serverlose Anwendung direkt über die Studio-Benutzeroberfläche mit einem neuen JupyterLab Notebook verbinden oder die Verbindung einer laufenden JupyterLab Anwendung in einem Notizbuch initiieren.
Wichtig
Wenn Sie Studio verwenden, können Sie nur EMR serverlose Anwendungen für JupyterLab Anwendungen erkennen und eine Verbindung zu ihnen herstellen, die von privaten Bereichen aus gestartet werden. Stellen Sie sicher, dass sich die EMR serverlosen Anwendungen in derselben AWS Region wie Ihre Studio-Umgebung befinden. Ihr JupyterLab Bereich muss eine SageMaker Distributions-Image-Version 1.10
oder höher verwenden.
So verbinden Sie eine EMR serverlose Anwendung über die Studio-Benutzeroberfläche mit einem neuen JupyterLab Notizbuch:
-
Navigieren Sie in der Studio-Benutzeroberfläche zum linken Bereich und wählen Sie im linken Navigationsmenü den Knoten Daten aus. Scrollen Sie dann und wählen Sie die Option EMRAmazon-Anwendungen und -Cluster aus. Dadurch wird eine Seite geöffnet, auf der die EMR Amazon-Anwendungen, auf die Sie in der Studio-Umgebung zugreifen können, auf der Registerkarte Serverlose Anwendungen angezeigt werden.
Anmerkung
Wenn Sie oder Ihr Administrator die Berechtigungen so konfiguriert haben, dass sie den kontoübergreifenden Zugriff auf EMR serverlose Anwendungen ermöglichen, können Sie eine konsolidierte Liste der Anwendungen aller Konten einsehen, denen Sie Zugriff auf Studio gewährt haben.
-
Wählen Sie eine EMR serverlose Anwendung aus, die Sie mit einem neuen Notizbuch verbinden möchten, und wählen Sie dann An Notizbuch anhängen aus. Dadurch wird ein modales Fenster geöffnet, in dem die Liste Ihrer JupyterLab Spaces angezeigt wird.
-
-
Wählen Sie den privaten Bereich aus, von dem aus Sie eine JupyterLab Anwendung starten möchten, und wählen Sie dann Notizbuch öffnen. Dadurch wird eine JupyterLab Anwendung von Ihrem ausgewählten Bereich aus gestartet und ein neues Notizbuch geöffnet.
-
Alternativ können Sie einen neuen privaten Bereich erstellen, indem Sie oben im modalen Fenster auf die Schaltfläche Neuen Bereich erstellen klicken. Geben Sie einen Namen für Ihren Bereich ein und wählen Sie dann Bereich erstellen und Notizbuch öffnen. Dadurch wird ein privater Bereich mit dem Standard-Instanztyp und dem neuesten verfügbaren SageMaker Distributions-Image erstellt, eine JupyterLab Anwendung gestartet und ein neues Notizbuch geöffnet.
-
-
Wählen Sie den Namen der IAM Runtime-Ausführungsrolle, die Ihre EMR serverlose Anwendung für die Jobausführung übernehmen kann. Nach der Auswahl füllt ein Verbindungsbefehl die erste Zelle Ihres Notebooks und initiiert die Verbindung mit der EMR serverlosen Anwendung.
Wichtig
Um ein JupyterLab Notebook erfolgreich mit einer EMR serverlosen Anwendung zu verbinden, müssen Sie zunächst die Liste der Runtime-Rollen Ihrer Domäne oder Ihrem Benutzerprofil zuordnen, wie unter beschrieben. Richten Sie die Berechtigungen ein, um das Auflisten und Starten von EMR Amazon-Anwendungen von SageMaker Studio aus zu ermöglichen Wenn Sie diesen Schritt nicht abschließen, können Sie die Verbindung nicht herstellen.
Sobald die Verbindung erfolgreich hergestellt wurde, bestätigt eine Meldung die Verbindung, startet Ihre EMR Serverless-Anwendung und leitet Ihre Spark-Sitzung ein.
Anmerkung
Wenn Sie eine Verbindung zu einer EMR serverlosen Anwendung herstellen, wechselt ihr Status von entweder oder zu.
Stopped
Created
Started
Alternativ können Sie von einem JupyterLab Notebook aus eine Verbindung zu einem Cluster herstellen.
-
Wählen Sie die Cluster-Schaltfläche oben rechts in Ihrem Notizbuch. Dadurch wird ein modales Fenster geöffnet, in dem die EMR serverlosen Anwendungen aufgelistet sind, auf die Sie zugreifen können. Sie können die Anwendungen auf der Registerkarte Serverlose Anwendungen sehen.
-
Wählen Sie die Anwendung aus, mit der Sie Connect möchten, und wählen Sie dann Verbinden.
-
EMRServerless unterstützt IAM Runtime-Rollen, die beim Einstellen der erforderlichen Berechtigungen vorinstalliert wurden, wie unter beschrieben. Richten Sie die Berechtigungen ein, um das Auflisten und Starten von EMR Amazon-Anwendungen von SageMaker Studio aus zu ermöglichen Wenn Sie diesen Schritt nicht abschließen, können Sie die Verbindung nicht herstellen.
Sie können Ihre Rolle aus dem Drop-down-Menü EMRAmazon-Ausführungsrolle auswählen. Wenn Sie eine Verbindung zu einem EMR Serverless herstellen, fügt Studio einer aktiven Zelle Ihres Notebooks einen Codeblock hinzu, um die Verbindung herzustellen.
-
Eine aktive Zelle wird ausgefüllt und ausgeführt. Dieses Feld enthält den magischen Verbindungsbefehl, mit dem Sie Ihr Notebook mit Ihrer Anwendung verbinden können.
Sobald die Verbindung hergestellt wurde, bestätigt eine Meldung die Verbindung und den Start der Spark-Anwendung. Sie können damit beginnen, Ihre Datenverarbeitungsaufträge an Ihre EMR serverlose Anwendung zu senden.