Tutorial: Verwenden Sie ein SageMaker KI-Notizbuch mit Ihrem Entwicklungsendpunkt

In AWS Glue, können Sie einen Entwicklungsendpunkt und anschließend ein SageMaker KI-Notizbuch erstellen, um Sie bei der Entwicklung Ihrer Skripte ETL und der Skripts für maschinelles Lernen zu unterstützen. Ein SageMaker KI-Notebook ist eine vollständig verwaltete Recheninstanz für maschinelles Lernen, auf der die Jupyter Notebook-Anwendung ausgeführt wird.

Im AWS Glue Konsole, wählen Sie Dev endpoints aus, um zur Liste der Entwicklungsendpunkte zu navigieren.
Aktivieren Sie das Kontrollkästchen neben dem Namen eines Entwicklungsendpunkts, den Sie verwenden möchten, und wählen Sie im Menü Aktion die Option Notizbuch erstellen SageMaker aus.
Füllen Sie die Seite Create and configure a notebook (Notebook erstellen und konfigurieren) wie folgt aus:
1. Geben Sie einen Namen für das Notebook ein.
2. Überprüfen Sie unter Attach to development endpoint (An Entwicklungsendpunkt anfügen) den Entwicklungsendpunkt.
3. Erstellen Sie eine Rolle AWS Identity and Access Management (IAM), oder wählen Sie sie aus.
  
  Es wird empfohlen, eine Rolle zu erstellen. Wenn Sie eine vorhandene Rolle verwenden, stellen Sie sicher, dass sie über die erforderlichen Berechtigungen verfügt. Weitere Informationen finden Sie unter Schritt 6: Erstellen Sie eine IAM Richtlinie für SageMaker KI-Notebooks.
4. (Optional) Wählen Sie eineVPC, ein Subnetz und eine oder mehrere Sicherheitsgruppen aus.
5. (Optional) Wählen Sie einen AWS Key Management Service Verschlüsselungsschlüssel.
6. (Optional) Fügen Sie Tags für die Notebook-Instance hinzu.
Klicken Sie auf Create Notebook (Notebook erstellen). Wählen Sie auf der Seite Notebooks das Aktualisierungssymbol oben rechts aus, und fahren Sie fort, bis der Status angezeigt wird Ready.
Aktivieren Sie das Kontrollkästchen neben dem neuen Notebooknamen, und wählen Sie Open notebook (Notebook öffnen).
Erstellen Sie ein neues Notizbuch: Wählen Sie auf der Jupyter-Seite Neu und dann Sparkmagic (). PySpark

Ihr Bildschirm sollte jetzt wie folgt aussehen.
(Optional) Wählen Sie oben auf der Seite Untitled (Ohne Titel), und geben Sie dem Notebook einen Namen.
Um eine Spark-Anwendung zu starten, geben Sie den folgenden Befehl in das Notebook ein, und wählen Sie dann in der Symbolleiste Run (Ausführen) aus.
```
spark
```
Nach einer kurzen Verzögerung sollten Sie die folgende Antwort sehen:

Erstellen Sie einen dynamischen Frame, und führen Sie eine Abfrage aus: Kopieren, Einfügen und Ausführen des folgenden Codes, der die Anzahl und das Schema der persons_json-Tabelle ausgibt.


import sys
from pyspark.context import SparkContext
from awsglue.context import GlueContext
from awsglue.transforms import *
glueContext = GlueContext(SparkContext.getOrCreate())
persons_DyF = glueContext.create_dynamic_frame.from_catalog(database="legislators", table_name="persons_json")
print ("Count:  ", persons_DyF.count())
persons_DyF.printSchema()

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Tutorial: Jupyter Notebook im JupyterLab

Tutorial: Verwenden Sie eine REPL Shell