Erste Schritte mit AWS Glue interaktiven Sitzungen - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erste Schritte mit AWS Glue interaktiven Sitzungen

In diesem Handbuch erfahren Sie, wie Sie eine AWS Glue interaktive Sitzung in SageMaker Studio Classic initiieren und Ihre Umgebung mit Jupyter Magics verwalten.

Berechtigungen für AWS Glue interaktive Sitzungen in Studio oder Studio Classic

In diesem Abschnitt sind die Richtlinien aufgeführt, die für die Ausführung AWS Glue interaktiver Sitzungen in Studio oder Studio Classic erforderlich sind, und es wird erklärt, wie sie eingerichtet werden. Insbesondere wird beschrieben, wie Sie:

  • Ordnen Sie die AwsGlueSessionUserRestrictedServiceRole verwaltete Richtlinie Ihrer SageMaker Ausführungsrolle zu.

  • Erstellen Sie eine benutzerdefinierte Inline-Richtlinie für Ihre SageMaker Ausführungsrolle.

  • Ändern Sie die Vertrauensstellung Ihrer SageMaker Ausführungsrolle.

So hängen Sie die AwsGlueSessionUserRestrictedServiceRole verwaltete Richtlinie an Ihre Ausführungsrolle an
  1. Öffnen Sie die IAMKonsole.

  2. Wählen Sie im linken Bereich Rollen aus.

  3. Suchen Sie die Studio Classic-Ausführungsrolle, die von Ihrem Benutzerprofil verwendet wird. Informationen zum Anzeigen eines Benutzerprofils finden Sie unterBenutzerprofile in einer Domäne anzeigen.

  4. Wählen Sie Ihren Rollennamen, um auf die Seite mit der Rollenzusammenfassung zuzugreifen.

  5. Wählen Sie auf der Registerkarte Berechtigungen im Dropdown-Menü Berechtigungen hinzufügen die Option Richtlinien anhängen aus.

  6. Aktivieren Sie das Kontrollkästchen neben der verwalteten Richtlinie AwsGlueSessionUserRestrictedServiceRole.

  7. Wählen Sie Richtlinien anfügen.

    Auf der Übersichtsseite werden Ihre neu hinzugefügten verwalteten Richtlinien angezeigt.

Um die benutzerdefinierte Inline-Richtlinie für Ihre Ausführungsrolle zu erstellen
  1. Wählen Sie im Dropdown-Menü Berechtigungen hinzufügen die Option Inline-Richtlinie erstellen aus.

  2. Wählen Sie die Registerkarte JSON aus.

  3. Kopieren Sie die folgende Richtlinie und fügen Sie sie ein.

    { "Version": "2012-10-17", "Statement": [ { "Sid": "unique_statement_id", "Effect": "Allow", "Action": [ "iam:GetRole", "iam:PassRole", "sts:GetCallerIdentity" ], "Resource": "*" } ] }
  4. Wählen Sie Richtlinie prüfen.

  5. Geben Sie unter Name einen Namen ein und wählen Sie anschließend Richtlinie erstellen aus.

    Auf der Übersichtsseite wird Ihre neu hinzugefügte benutzerdefinierte Richtlinie angezeigt.

So ändern Sie die Vertrauensbeziehung Ihrer Ausführungsrolle
  1. Wählen Sie den Tab Vertraunsbeziehungen.

  2. Wählen Sie Vertraunsrichtlinie bearbeiten aus.

  3. Kopieren Sie die folgende Richtlinie und fügen Sie sie ein.

    { "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "glue.amazonaws.com", "sagemaker.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ] }
  4. Wählen Sie Richtlinie aktualisieren.

Sie können zusätzliche Rollen und Richtlinien hinzufügen, wenn Sie auf andere AWS Ressourcen zugreifen müssen. Eine Beschreibung der zusätzlichen Rollen und Richtlinien, die Sie hinzufügen können, finden Sie IAM in der AWS Glue Dokumentation unter interaktive Sitzungen mit.

Verbreitung von Tags

Tags werden häufig verwendet, um Kosten zu verfolgen und zuzuweisen, den Zugriff auf Ihre Sitzung zu kontrollieren, Ihre Ressourcen zu isolieren und vieles mehr. Weitere Informationen zum Hinzufügen von Metadaten zu Ihren AWS Ressourcen mithilfe von Tagging sowie Einzelheiten zu häufigen Anwendungsfällen finden Sie unter Zusätzliche Informationen.

Sie können die automatische Weitergabe von AWS Tags an neue AWS Glue interaktive Sitzungen aktivieren, die in der Studio- oder Studio Classic-Benutzeroberfläche erstellt wurden. Wenn eine AWS Glue interaktive Sitzung in Studio oder Studio Classic erstellt wird, werden alle benutzerdefinierten Tags, die an das Benutzerprofil oder den gemeinsam genutzten Bereich angehängt sind, in die neue AWS Glue interaktive Sitzung übernommen. Darüber hinaus fügen Studio und Studio Classic automatisch zwei AWS generierte interne Tags (sagemaker:user-profile-arnundsagemaker:domain-arn) oder (sagemaker:shared-space-arnundsagemaker:domain-arn) zu neuen AWS Glue interaktiven Sitzungen hinzu, die über ihre Benutzeroberfläche erstellt wurden. Sie können diese Tags verwenden, um die Kosten für einzelne Domänen, Benutzerprofile oder Bereiche zu aggregieren.

Aktivieren Sie die Tag-Weitergabe

Um die automatische Weitergabe von Tags an neue AWS Glue interaktive Sitzungen zu ermöglichen, legen Sie die folgenden Berechtigungen für Ihre SageMaker Ausführungsrolle und die mit Ihrer AWS Glue Sitzung verknüpfte IAM Rolle fest:

Anmerkung

Standardmäßig entspricht die der AWS Glue interaktiven Sitzung zugeordnete Rolle der SageMaker Ausführungsrolle. Sie können eine andere Ausführungsrolle für die AWS Glue interaktive Sitzung angeben, indem Sie den %iam_role magischen Befehl verwenden. Informationen zu den verfügbaren magischen Jupyter-Befehlen zur Konfiguration AWS Glue interaktiver Sitzungen finden Sie unter Konfigurieren Sie Ihre AWS Glue interaktive Sitzung in Studio oder Studio Classic.

  • In Ihrer SageMaker Ausführungsrolle: Erstellen Sie eine neue Inline-Richtlinie und fügen Sie die folgende JSON Datei ein. Die Richtlinie gewährt der Ausführungsrolle die Berechtigung, die in den Benutzerprofilen DescribeUserProfileDescribeSpace, DescribeDomain gemeinsam genutzten Bereichen und der SageMaker Domäne festgelegten Tags (ListTag) zu beschreiben (,,) und aufzulisten.

    { "Effect": "Allow", "Action": [ "sagemaker:ListTags" ], "Resource": [ "arn:aws:sagemaker:*:*:user-profile/*", "arn:aws:sagemaker:*:*:space/*" ] }, { "Effect": "Allow", "Action": [ "sagemaker:DescribeUserProfile" ], "Resource": [ "arn:aws:sagemaker:*:*:user-profile/*" ] }, { "Effect": "Allow", "Action": [ "sagemaker:DescribeSpace" ], "Resource": [ "arn:aws:sagemaker:*:*:space/*" ] } { "Effect": "Allow", "Action": [ "sagemaker:DescribeDomain" ], "Resource": [ "arn:aws:sagemaker:*:*:domain/*" ] }
  • Zur IAM Rolle Ihrer AWS Glue Sitzung: Erstellen Sie eine neue Inline-Richtlinie und fügen Sie die folgende JSON Datei ein. Die Richtlinie erteilt Ihrer Rolle die Berechtigung, Tags (TagResource) an Ihre Sitzung anzuhängen oder deren Tagliste abzurufen (GetTags).

    { "Effect": "Allow", "Action": [ "glue:TagResource", "glue:GetTags" ], "Resource": [ "arn:aws:glue:*:*:session/*" ] }
Anmerkung
  • Fehler, die bei der Anwendung dieser Berechtigungen auftreten, verhindern nicht die Erstellung AWS Glue interaktiver Sitzungen. Einzelheiten zur Ursache des Fehlers finden Sie in den Studio- oder Studio CloudWatchClassic-Protokollen.

  • Sie müssen den Kernel Ihrer AWS Glue interaktiven Sitzung neu starten, um die Aktualisierung des Werts eines Tags zu übertragen.

Es ist wichtig, dabei die folgenden Punkte zu beachten:

  • Sobald ein Tag an eine Sitzung angehängt ist, kann es nicht mehr durch die Weitergebung entfernt werden.

    Sie können Tags direkt über den AWS CLI, den oder den aus einer AWS Glue interaktiven Sitzung entfernen. AWS Glue API https://console.aws.amazon.com/sagemaker/ Mit dem können Sie beispielsweise ein Tag entfernen AWS CLI, indem Sie die Schlüssel für die Sitzung ARN und die Tag-Schlüssel, die Sie entfernen möchten, wie folgt angeben:

    aws glue untag-resource \ --resource-arn arn:aws:glue:region:account-id:session:session-name \ --tags-to-remove tag-key1,tag-key2
  • Studio und Studio Classic fügen zwei AWS-generierte interne Tags (sagemaker:user-profile-arnundsagemaker:domain-arn) oder (sagemaker:shared-space-arnund)sagemaker:domain-arn) zu neuen AWS Glue interaktiven Sitzungen hinzu, die über ihre Benutzeroberfläche erstellt wurden. Diese Tags werden auf das Limit von 50 Tags angerechnet, das für alle AWS Ressourcen festgelegt ist. Beide sagemaker:user-profile-arn sagemaker:shared-space-arn enthalten die Domain-ID, zu der sie gehören.

  • Tags-Schlüssel, die mit aws:AWS:, oder einer beliebigen Kombination von Groß- und Kleinbuchstaben als Präfix für Schlüssel beginnen, werden nicht weitergegeben und sind für AWS die Verwendung reserviert.

Zusätzliche Informationen

Weitere Informationen zum Tagging finden Sie in den folgenden Ressourcen.

Starten Sie Ihre AWS Glue interaktive Sitzung in Studio oder Studio Classic

Nachdem Sie die Rollen, Richtlinien und die SageMaker Domäne erstellt haben, können Sie Ihre AWS Glue interaktive Sitzung in Studio oder Studio Classic starten.

  1. Melden Sie sich bei der SageMaker Konsole unter an https://console.aws.amazon.com/sagemaker/.

  2. Wählen Sie im linken Navigationsbereich Studio aus.

  3. Wählen Sie auf der Studio-Landingpage die Domäne und das Benutzerprofil für den Start von Studio aus.

  4. Wählen Sie Open Studio und starten Sie eine JupyterLab oder Studio Classic-Anwendung.

  5. Wählen Sie in der Jupyter-Ansicht Datei, dann Neu und dann Notebook aus.

  6. Für Studio Classic-Benutzer: Wählen Sie im Dropdownmenü Image die Option SparkAnalytics 1.0 oder SparkAnalytics2.0 aus. Wählen Sie im Kernel-Dropdown-Menü Glue Spark oder Glue Python [PySpark and Ray] aus. Wählen Sie Select (Auswählen).

    Für Studio-Benutzer wählen Sie einen Glue Spark - oder Glue Python [PySpark and Ray] -Kernel

  7. (optional) Verwenden Sie Jupyter Magics, um Ihre Umgebung anzupassen. Weitere Informationen zu Jupyter-Magics finden Sie unter Konfigurieren Sie Ihre AWS Glue interaktive Sitzung in Studio oder Studio Classic.

  8. Beginnen Sie mit dem Schreiben Ihrer Spark-Datenverarbeitungsskripten. Das folgende Notizbuch zeigt einen end-to-end Arbeitsablauf für ETL einen großen Datensatz anhand einer AWS Glue interaktiven Sitzung, einer explorativen Datenanalyse, der Datenvorverarbeitung und schließlich des Trainings eines Modells anhand der verarbeiteten Daten. SageMaker

Konfigurieren Sie Ihre AWS Glue interaktive Sitzung in Studio oder Studio Classic

Anmerkung

Alle Magic-Konfigurationen werden für die gesamte Lebensdauer des Kernels auf nachfolgende Sitzungen übertragen. AWS Glue

Sie können Jupyter Magics in Ihrer AWS Glue interaktiven Sitzung verwenden, um Ihre Sitzungs- und Konfigurationsparameter zu ändern. Magics sind kurze Befehle mit einem Präfix % am Anfang von Jupyter-Zellen, mit denen Sie Ihre Umgebung schnell und einfach steuern können. In Ihrer AWS Glue interaktiven Sitzung sind die folgenden Magics standardmäßig für Sie festgelegt:

Magie Standardwert
%glue_version

3.0

%iam_role

execution role attached to your SageMaker domain

%region

Ihre Region

Sie können Magics verwenden, um Ihre Umgebung weiter anzupassen. Wenn Sie beispielsweise die Anzahl der Auftragnehmer, die Ihrem Auftrag zugewiesen sind, von standardmäßig fünf auf 10 ändern möchten, können Sie Folgendes angeben %number_of_workers 10. Wenn Sie Ihre Sitzung so konfigurieren möchten, dass sie nach 10 Minuten Leerlaufzeit beendet wird, anstatt nach der Standardeinstellung 2880, können Sie Folgendes angeben %idle_timeout 10.

Alle Jupyter-Magics, die derzeit in verfügbar sind, AWS Glue sind auch in Studio oder Studio Classic verfügbar. Die vollständige Liste der verfügbaren AWS Glue Magics finden Sie unter Konfiguration AWS Glue interaktiver Sitzungen für Jupyter- und Studio-Notebooks. AWS Glue