Stellen Sie von SageMaker Studio oder Studio Classic aus eine Connect zu einem EMR Amazon-Cluster her - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Stellen Sie von SageMaker Studio oder Studio Classic aus eine Connect zu einem EMR Amazon-Cluster her

Benutzer von Studio können mithilfe ihrer Standardversion von einem JupyterLab Notebook aus eine Verbindung zu ihren laufenden EMR Amazon-Clustern herstellenSageMaker Verteilung von Bildern. Benutzer von Studio Classic können von einem Studio Classic-Notebook aus mit jedem der unterstützten Kernel eine Verbindung zu ihren Clustern herstellen.

Stellen Sie mithilfe der Studio-Benutzeroberfläche eine Connect zu einem EMR Amazon-Cluster her

Um über die Benutzeroberfläche von Studio oder Studio Classic eine Verbindung zu Ihrem Cluster herzustellen, können Sie entweder über die Liste der Cluster, auf die zugegriffen wirdEMRAmazon-Cluster von Studio oder Studio Classic auflisten, oder über ein Notizbuch in SageMaker Studio oder Studio Classic eine Verbindung herstellen.

Zur Verbindung mit einem bestimmten Cluster aus der Liste Ihrer Cluster
  1. Wählen Sie den Namen des Clusters auf der Liste. Hiermit wird die Schaltfläche An neues Notebook anhängen aktiviert.

  2. Wählen Sie An neues Notebook anhängen. Hiermit wird das Auswahlfeld für Bilder und Kernel geöffnet.

  3. Wählen Sie Ihr Image und Ihren Kernel aus und wählen Sie dann Auswählen. Eine Liste der unterstützten Images finden Sie unter Unterstützte Images und Kernel für die Verbindung zu einem EMR Amazon-Cluster von Studio oder Studio Classic oder unter Bring Your on.

  4. Wenn der von Ihnen ausgewählte Cluster keine Kerberos- oder Runtime-Rollenauthentifizierung verwendetLDAP, werden Sie von Studio oder Studio Classic aufgefordert, den Anmeldeinformationstyp auszuwählen. Sie können zwischen HTTP-Basisauthentifizierung oder Keine Anmeldeinformationen wählen und dann ggf. Ihre Anmeldeinformationen eingeben. Ein Verbindungsbefehl füllt die erste Zelle Ihres Notebooks und initiiert die Verbindung mit dem EMR Amazon-Cluster.

    Sobald die Verbindung hergestellt wurde, bestätigt eine Meldung die Verbindung und den Start der Spark-Anwendung.

Alternativ können Sie von einem Notebook aus eine Verbindung zu einem Cluster herstellen.
  1. Wählen Sie im oberen Bereich Ihres Notebooks die Option Cluster aus.

    Cluster ist nur sichtbar, wenn Sie einen Kernel von Unterstützte Images und Kernel für die Verbindung zu einem EMR Amazon-Cluster von Studio oder Studio Classic oder von Bring Your on verwenden. Wenn Sie oben in Ihrem Notebook nicht Cluster sehen können, vergewissern Sie sich, dass Ihr Administrator die Auffindbarkeit Ihrer Cluster konfiguriert hat, und wechseln Sie zu einem unterstützten Kernel.

    Dadurch wird eine Liste der verfügbaren Cluster in einem Running Bundesstaat geöffnet.

  2. Wählen Sie den Cluster aus, zu dem Sie eine Verbindung herstellen möchten, und wählen Sie dann Verbinden aus.

  3. Wenn Sie Ihre EMR Amazon-Cluster für die Unterstützung von IAM Runtime-Rollen konfiguriert haben und Ihr Administrator Ihre Rollen in einer Ausführungsrollenkonfiguration vorinstalliert hatJSON, können Sie Ihre EMR Amazon-Zugriffsrolle aus dem Drop-down-Menü EMRAmazon-Ausführungsrolle auswählen. Wenn Ihre Rollen nicht vorinstalliert sind, verwendet Studio oder Studio Classic standardmäßig Ihre Studio- oder Studio Classic-Ausführungsrolle. Informationen zur Verwendung von Runtime-Rollen mit Amazon EMR finden Sie unterStellen Sie von Studio Classic aus mithilfe von IAM Runtime-Rollen eine Connect zu einem EMR Amazon-Cluster her. Wenn Sie eine Verbindung zu einem Cluster herstellen, fügt Studio oder Studio Classic einer aktiven Zelle einen Codeblock hinzu, um die Verbindung herzustellen.

    Andernfalls, wenn der von Ihnen gewählte Cluster keine Kerberos- oder Runtime-Rollenauthentifizierung verwendet, fordert Studio oder Studio Classic Sie auf, den Anmeldeinformationstyp auszuwählen. LDAP Sie können HTTPStandardauthentifizierung oder Keine Anmeldeinformationen wählen.

  4. Eine aktive Zelle wird ausgefüllt und ausgeführt. Diese Zelle enthält den Verbindungsbefehl für die Verbindung mit Ihrem EMR Amazon-Cluster.

    Sobald die Verbindung erfolgreich hergestellt wurde, bestätigt eine Meldung die Verbindung und dass die Spark-Anwendung gestartet wurde.

Connect Sie mithilfe eines Verbindungsbefehls eine Verbindung zu einem EMR Amazon-Cluster her

Um eine Verbindung zu einem EMR Amazon-Cluster herzustellen, können Sie Verbindungsbefehle innerhalb einer Notebook-Zelle ausführen.

Beim Herstellen der Verbindung können Sie sich mit Kerberos, Lightweight Directory Access Protocol (LDAP) oder der IAMRuntime-Rollenauthentifizierung authentifizieren. Welche Authentifizierungsmethode Sie wählen, hängt von Ihrer Clusterkonfiguration ab.

In diesem Beispiel können Sie auf Apache Livy zugreifen, indem Sie einen Network Load Balancer auf einem Kerberos-fähigen EMR Amazon-Cluster verwenden, um einen Amazon-Cluster einzurichten, der die Kerberos-Authentifizierung EMR verwendet. Alternativ können Sie sich die CloudFormation Beispielvorlagen mit Kerberos oder Authentifizierung im aws-samples/ Repository ansehen. LDAP sagemaker-studio-emr GitHub

Wenn Ihr Administrator den kontoübergreifenden Zugriff aktiviert hat, können Sie von einem Studio Classic-Notebook aus eine Verbindung zu Ihrem EMR Amazon-Cluster herstellen, unabhängig davon, ob sich Ihre Studio Classic-Anwendung und Ihr Cluster im selben AWS Konto oder in unterschiedlichen Konten befinden.

Verwenden Sie für jeden der folgenden Authentifizierungstypen den angegebenen Befehl, um von Ihrem Studio- oder Studio Classic-Notebook aus eine Verbindung zu Ihrem Cluster herzustellen.

  • Kerberos

    Hängen Sie das --assumable-role-arn Argument an, wenn Sie kontoübergreifenden EMR Amazon-Zugriff benötigen. Hängen Sie das --verify-certificate Argument an, wenn Sie mit eine Verbindung zu Ihrem Cluster herstellen. HTTPS

    %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id cluster_id \ --auth-type Kerberos --language python [--assumable-role-arn EMR_access_role_ARN ] [--verify-certificate /home/user/certificateKey.pem]
  • LDAP

    Hängen Sie das --assumable-role-arn Argument an, wenn Sie kontoübergreifenden EMR Amazon-Zugriff benötigen. Hängen Sie das --verify-certificate Argument an, wenn Sie mit eine Verbindung zu Ihrem Cluster herstellen. HTTPS

    %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id cluster_id \ --auth-type Basic_Access --language python [--assumable-role-arn EMR_access_role_ARN ] [--verify-certificate /home/user/certificateKey.pem]
  • NoAuth

    Hängen Sie das --assumable-role-arn Argument an, wenn Sie kontoübergreifenden EMR Amazon-Zugriff benötigen. Hängen Sie das --verify-certificate Argument an, wenn Sie mit eine Verbindung zu Ihrem Cluster herstellen. HTTPS

    %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id cluster_id \ --auth-type None --language python [--assumable-role-arn EMR_access_role_ARN ] [--verify-certificate /home/user/certificateKey.pem]
  • Runtime-Rollen IAM

    Hängen Sie das --assumable-role-arn Argument an, wenn Sie kontoübergreifenden EMR Amazon-Zugriff benötigen. Hängen Sie das --verify-certificate Argument an, wenn Sie mit eine Verbindung zu Ihrem Cluster herstellen. HTTPS

    Weitere Informationen zum Herstellen einer Verbindung zu einem EMR Amazon-Cluster mithilfe von IAM Runtime-Rollen finden Sie unterStellen Sie von Studio Classic aus mithilfe von IAM Runtime-Rollen eine Connect zu einem EMR Amazon-Cluster her.

    %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id cluster_id \ --auth-type Basic_Access \ --emr-execution-role-arn arn:aws:iam::studio_account_id:role/emr-execution-role-name [--assumable-role-arn EMR_access_role_ARN] [--verify-certificate /home/user/certificateKey.pem]

Stellen Sie eine Connect zu einem EMR Amazon-Cluster her über HTTPS

Wenn Sie Ihren EMR Amazon-Cluster mit aktivierter Transitverschlüsselung und Apache Livy-Server für konfiguriert haben HTTPS und möchten, dass Studio oder Studio Classic EMR mit Amazon kommuniziertHTTPS, müssen Sie Studio oder Studio Classic für den Zugriff auf Ihren Zertifikatsschlüssel konfigurieren.

Bei selbstsignierten oder von einer lokalen Zertifizierungsstelle (CA) signierten Zertifikaten können Sie dies in zwei Schritten tun:

  1. Laden Sie die PEM Datei Ihres Zertifikats mithilfe einer der folgenden Optionen in Ihr lokales Dateisystem herunter:

  2. Aktivieren Sie die Validierung des Zertifikates, indem Sie im Argument --verify-certificate Ihres Verbindungsbefehls den Pfad zu Ihrem Zertifikat angeben.

    %sm_analytics emr connect --cluster-id cluster_id \ --verify-certificate /home/user/certificateKey.pem ...

Für Zertifikate, die von einer öffentlichen Zertifizierungsstelle ausgestellt wurden, legen Sie die Validierung des Zertifikates fest, indem Sie den --verify-certificate Parameter auf true setzen.

Alternativ können Sie die Validierung von Zertifikaten abschalten, indem Sie den --verify-certificate Parameter auf false setzen.

Die Liste der verfügbaren Verbindungsbefehle zu einem EMR Amazon-Cluster finden Sie unterConnect Sie mithilfe eines Verbindungsbefehls eine Verbindung zu einem EMR Amazon-Cluster her.