Erstellen Sie eine SageMaker Amazon-Notebook-Instance - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen Sie eine SageMaker Amazon-Notebook-Instance

Wichtig

Benutzerdefinierte IAM-Richtlinien, die es Amazon SageMaker Studio oder Amazon SageMaker Studio Classic ermöglichen, SageMaker Amazon-Ressourcen zu erstellen, müssen auch Berechtigungen zum Hinzufügen von Tags zu diesen Ressourcen gewähren. Die Berechtigung zum Hinzufügen von Tags zu Ressourcen ist erforderlich, da Studio und Studio Classic automatisch alle von ihnen erstellten Ressourcen taggen. Wenn eine IAM-Richtlinie Studio und Studio Classic das Erstellen von Ressourcen, aber kein Tagging erlaubt, können "AccessDenied" Fehler auftreten, wenn versucht wird, Ressourcen zu erstellen. Weitere Informationen finden Sie unter Erteilen Sie Berechtigungen für das Markieren von Ressourcen SageMaker.

AWS Verwaltete Richtlinien für Amazon SageMakerdie Berechtigungen zum Erstellen von SageMaker Ressourcen gewähren, beinhalten bereits Berechtigungen zum Hinzufügen von Tags beim Erstellen dieser Ressourcen.

Eine SageMaker Amazon-Notebook-Instance ist eine ML-Compute-Instance, auf der die Jupyter Notebook-Anwendung ausgeführt wird. SageMaker verwaltet die Erstellung der Instance und der zugehörigen Ressourcen. Verwenden Sie Jupyter-Notebooks in Ihrer Notebook-Instanz, um:

  • Daten vorbereiten und verarbeiten

  • Code schreiben, um Modelle zu trainieren

  • Modelle für das SageMaker Hosting bereitstellen

  • testen oder validieren Sie Ihre Modelle

Um eine Notebook-Instanz zu erstellen, verwenden Sie entweder die SageMaker Konsole oder CreateNotebookInstanceAPI.

Der auszuwählende Notebook-Instance-Typ hängt von der von Ihnen beabsichtigten Verwendung Ihrer Notebook-Instance ab. Stellen Sie sicher, dass Ihre Notebook-Instanz nicht an Arbeitsspeicher, CPU oder I/O gebunden ist. Um einen Datensatz zur Erkundung oder Vorverarbeitung in den Speicher der Notebook-Instanz zu laden, wählen Sie einen Instance-Typ mit ausreichend RAM-Speicher für Ihren Datensatz. Dies erfordert eine Instanz mit mindestens 16 GB Arbeitsspeicher (.xlarge oder größer). Wenn Sie das Notebook für die rechenintensive Vorverarbeitung verwenden möchten, empfehlen wir Ihnen, eine rechneroptimierte Instance wie c4 oder c5 zu wählen.

Eine bewährte Methode bei der Verwendung eines SageMaker Notebooks besteht darin, die Notebook-Instanz zur Orchestrierung anderer AWS Dienste zu verwenden. Sie können die Notebook-Instanz beispielsweise verwenden, um die Verarbeitung großer Datensätze zu verwalten. Rufen Sie dazu AWS Glue für ETL-Services (Extrahieren, Transformieren und Laden) oder Amazon EMR für die Zuordnung und Datenreduzierung mit Hadoop auf. Sie können AWS Dienste als temporäre Berechnungs- oder Speicherformen für Ihre Daten verwenden.

Sie können Ihre Trainings- und Testdaten mit einem Amazon Simple Storage Service-Bucket speichern und abrufen. Sie können es dann verwenden SageMaker , um Ihr Modell zu trainieren und zu bauen. Folglich hätte der Instance-Typ Ihres Notebooks keinen Einfluss auf die Geschwindigkeit, mit der Ihr Modell trainiert und getestet wird.

Geht nach Erhalt der Anfrage wie folgt vor: SageMaker

  • Erstellt eine Netzwerkschnittstelle — Wenn Sie die optionale VPC-Konfiguration wählen, SageMaker wird die Netzwerkschnittstelle in Ihrer VPC erstellt. Es verwendet die Subnetz-ID, die Sie in der Anfrage angeben, um zu bestimmen, in welcher Availability Zone das Subnetz erstellt werden soll. SageMaker ordnet die Sicherheitsgruppe, die Sie in der Anfrage angeben, dem Subnetz zu. Weitere Informationen finden Sie unter Verbinden einer Notebook-Instance in einer VPC mit externen Ressourcen.

  • Startet eine ML-Compute-Instanz — SageMaker Startet eine ML-Compute-Instanz in einer SageMaker VPC. SageMaker führt die Konfigurationsaufgaben aus, die es ihr ermöglichen, Ihre Notebook-Instanz zu verwalten. Wenn Sie Ihre VPC angegeben haben, wird der Datenverkehr zwischen Ihrer VPC und der Notebook-Instance SageMaker aktiviert.

  • Installiert Anaconda-Pakete und -Bibliotheken für gängige Deep-Learning-Plattformen — SageMaker installiert alle Anaconda-Pakete, die im Installationsprogramm enthalten sind. Weitere Informationen finden Sie in der Anaconda-Paketliste. SageMaker installiert auch die Deep-Learning-Bibliotheken TensorFlow und Apache MXNet.

  • Hängt ein ML-Speichervolume an — SageMaker Hängt ein ML-Speichervolume an die ML-Compute-Instance an. Sie können das Volume als Arbeitsbereich verwenden, um das Trainingsdatensatz zu bereinigen oder Überprüfungs-, Test- oder andere Daten vorübergehend zu speichern. Für das Volume können Sie eine beliebige Größe zwischen 5 GB und 16 384 GB verwenden. Größenänderungen sind in Schritten von 1 GB möglich. Der Standardwert ist 5 GB. ML-Speichervolumes sind verschlüsselt, SageMaker sodass die Menge des verfügbaren freien Speicherplatzes auf dem Volume nicht bestimmt werden kann. Daher können Sie beim Aktualisieren einer Notebook-Instance die Volume-Größe nur erhöhen, nicht jedoch verkleinern. Wenn Sie die Größe eines verwendeten ML-Speicher-Volumes verkleinern möchten, erstellen Sie eine neue Notebook-Instance mit der gewünschten Größe.

    Nur Dateien und Daten, die im Ordner /home/ec2-user/SageMaker gespeichert sind, bleiben über Notebook-Instance-Sitzungen hinweg erhalten. Dateien und Daten, die außerhalb dieses Verzeichnisses gespeichert sind, werden überschrieben, wenn die Notebook-Instance angehalten und neu gestartet wird. Das /tmp-Verzeichnis jeder Notebook-Instance bietet mindestens 10 GB Speicherplatz in einem Instance-Store. Beim Instance-Speicher handelt es sich um temporären Speicher auf Blockebene, der nicht persistent ist. Wenn die Instanz gestoppt oder neu gestartet wird, wird der Inhalt des Verzeichnisses SageMaker gelöscht. Dieser temporäre Speicher ist Teil des Root-Volumes der Notebook-Instance.

    Wenn der von der Notebook-Instance verwendete Instance-Typ NVMe-Unterstützung bietet, können Kunden die für diesen Instance-Typ verfügbaren NVMe-Instance-Speicher-Volumes verwenden. Bei Instances mit NVMe-Speicher-Volumes werden alle Instance-Speicher-Volumes beim Start automatisch an die Instance angehängt. Weitere Informationen zu Instance-Typen und den zugehörigen NVMe-Speicher-Volumes finden Sie in den Amazon Elastic Compute Cloud-Instance-Typdetails.

    Um das angehängte NVMe-Speicher-Volume für Ihre Notebook-Instance verfügbar zu machen, führen Sie die Schritte unter Instance-Speicher-Volumes auf Ihrer Instance verfügbar machen aus. Führen Sie die Schritte mit Root-Zugriff oder mithilfe eines Lebenszyklus-Konfigurationsskripts aus.

    Anmerkung

    NVMe-Instance-Speicher-Volumes sind kein persistenter Speicher. Dieser Speicher ist zusammen mit der Instanz kurzlebig und muss jedes Mal neu konfiguriert werden, wenn eine Instanz mit diesem Speicher gestartet wird.

  • Kopiert Beispiel-Jupyter-Notebooks — Diese Python-Codebeispiele zeigen Modelltraining und Hosting-Übungen mit unterschiedlichen Algorithmen und Trainingsdatensätzen.

So erstellen Sie eine Notebook-Instanz: SageMaker
  1. Öffnen Sie die SageMaker Konsole unter https://console.aws.amazon.com/sagemaker/.

  2. Wählen Sie Notebook instances (Notebook-Instances) und Create notebook instance (Notebook-Instance erstellen) aus.

  3. Geben Sie auf der Seite Notebook-Instance erstellen folgende Informationen ein:

    1. Geben Sie unter Notebook instance name (Name der Notebook-Instance) einen Namen für die Notebook-Instance ein.

    2. Wählen Sie als Notebook-Instance-Typ eine Instance-Größe, die für Ihren Anwendungsfall geeignet ist. Eine Liste der unterstützten Instance-Typen und Kontingente finden Sie unter Amazon SageMaker Service Quotas.

    3. Wählen Sie für Elastic Inference einen Inferenzbeschleunigertyp aus, der der Notebook-Instance zugeordnet werden soll, wenn Sie beabsichtigen, Inferenzen von der Notebook-Instance aus durchzuführen. Wenn Sie nicht vorhaben, Inferenzen von der Notebook-Instance aus durchzuführen, wählen Sie „Keine“. Weitere Informationen zu elastischen Inferenzen finden Sie unter Verwenden Sie Amazon SageMaker Elastic Inference (EI) .

    4. Wählen Sie unter Platform Identifier einen Plattformtyp aus, auf dem die Notebook-Instance erstellt werden soll. Dieser Plattformtyp bestimmt das Betriebssystem und die JupyterLab Version, mit der Ihre Notebook-Instanz erstellt wird. Weitere Informationen zum Plattform-Identifikationstyp finden Sie unter Amazon Linux 2-Notebook-Instances. Informationen zu den JupyterLab-Versionen erhalten Sie unter JupyterLab Versionierung.

    5. (Optional) Über Additional configuration (Zusätzliche Konfiguration) können fortgeschrittene Benutzer ein Shell-Skript erstellen, das ausgeführt werden kann, wenn Sie die Instance erstellen oder starten. Dieses Skript, das als Lifecycle-Konfigurationsskript bezeichnet wird, kann verwendet werden, um die Umgebung für das Notebook festzulegen oder andere Funktionen auszuführen. Weitere Informationen finden Sie unter Passen Sie eine SageMaker Notebook-Instanz mithilfe eines LCC-Skripts an.

    6. (Optional) Über Additional configuration (Zusätzliche Konfiguration) können Sie auch die Größe (in GB) des ML-Speichervolumes angeben, das der Notebook-Instance angefügt ist. Sie können eine Größe zwischen 5 GB und 16.384 GB in 1-GB-Schritten wählen. Sie können dieses Volume verwenden, um das Trainingsdatensatz zu bereinigen oder Überprüfungsdaten oder andere Daten temporär zu speichern.

    7. (Optional) Wählen Sie für IMDS-Mindestversion eine Version aus der Dropdown-Liste aus. Wenn dieser Wert auf v1 gesetzt ist, können beide Versionen mit der Notebook-Instance verwendet werden. Wenn v2 ausgewählt ist, kann nur IMDSv2 mit der Notebook-Instance verwendet werden. Informationen zu IMDSv2 finden Sie unter Verwenden von IMDSv2.

      Anmerkung

      Ab dem 31. Oktober 2022 ändert sich die Standard-IMDS-Mindestversion für SageMaker Notebook-Instances von IMDSv1 auf IMDSv2.

      Ab dem 1. Februar 2023 ist IMDSv1 nicht mehr für die Erstellung neuer Notebook-Instances verfügbar. Nach diesem Datum können Sie Notebook-Instances mit einer Mindestversion von IMDS 2 erstellen.

    8. Wählen Sie für die IAM-Rolle entweder eine bestehende IAM-Rolle in Ihrem Konto mit den erforderlichen Berechtigungen für den Zugriff auf SageMaker Ressourcen oder Erstellen Sie eine neue Rolle. Wenn Sie Neue Rolle erstellen wählen, SageMaker wird eine IAM-Rolle mit dem Namen erstellt. AmazonSageMaker-ExecutionRole-YYYYMMDDTHHmmSS Die AWS verwaltete Richtlinie AmazonSageMakerFullAccess ist der Rolle zugeordnet. Die Rolle bietet Berechtigungen, die es der Notebook-Instance ermöglichen, Amazon S3 aufzurufen SageMaker .

    9. Wählen Sie für Root-Zugriff die Option Enable aus, um allen Benutzern der Notebook-Instance Root-Zugriff zu gewähren. Um Benutzern den Root-Zugriff zu entziehen, wählen Sie Deaktivieren. Wenn Sie Root-Zugriff gewähren, haben alle Benutzer der Notebook-Instanz Administratorrechte und können auf alle darauf befindlichen Dateien zugreifen und diese bearbeiten.

    10. (Optional) Über die Option Encryption key (Verschlüsselungsschlüssel) können Sie Daten auf dem ML-Speichervolume, das der Notebook-Instance angefügt ist, mithilfe eines AWS Key Management Service -(AWS KMS-)Schlüssels verschlüsseln. Wenn Sie vertrauliche Informationen auf dem ML-Speichervolume speichern möchten, sollten Sie die Informationen verschlüsseln.

    11. (Optional) Über die Option Network (Netzwerk) können Sie Ihre Notebook-Instance in eine Virtual Private Cloud (VPC) stellen. Eine VPC bietet zusätzliche Sicherheit und beschränkt den Zugriff auf Ressourcen in der VPC von Quellen außerhalb der VPC. Weitere Informationen finden Sie im Amazon VPC-Benutzerhandbuch.

      So fügen Sie Ihre Notebook-Instance zu einer VPC hinzu:

      1. Wählen Sie die VPC und eine SubnetId.

      2. Wählen Sie unter Security Group (Sicherheitsgruppe) die Standardsicherheitsgruppe der VPC aus.

      3. Wenn Ihre Notebook-Instance über einen Internetzugang verfügen muss, aktivieren Sie den direkten Internetzugang. Wählen Sie für Direct internet access (Direkte Internetverbindung) die Option Enable (Aktivieren) aus. Es kann sein, dass Ihre Notebook-Instance mit Internetzugang weniger sicher ist. Weitere Informationen finden Sie unter Verbinden einer Notebook-Instance in einer VPC mit externen Ressourcen.

    12. (Optional) Um Git-Repositorys mit der Notebook-Instance zu verknüpfen, wählen Sie ein Standard-Repository und bis zu 3 zusätzliche Repositorys. Weitere Informationen finden Sie unter Git-Repositorys mit SageMaker Notebook-Instanzen verknüpfen.

    13. Wählen Sie Create notebook instance (Notebook-Instance erstellen) aus.

      In wenigen Minuten SageMaker startet Amazon eine ML-Compute-Instance — in diesem Fall eine Notebook-Instance — und fügt ihr ein ML-Speicher-Volume hinzu. Die Notebook-Instance verfügt über einen vorkonfigurierten Jupyter-Notebook-Server und mehrere Anaconda-Bibliotheken. Weitere Informationen finden Sie in der CreateNotebookInstance-API.

  4. Wenn der Status der Notebook-Instance in der Konsole InService lautet, ist die Notebook-Instance einsatzbereit. Wählen Sie Open Jupyter (Jupyter öffnen) neben dem Notebook-Namen aus, um das klassische Jupyter-Dashboard zu öffnen.

    Anmerkung

    Um die Sicherheit Ihrer Amazon SageMaker Notebook-Instance zu erhöhen, sind alle regionalen notebook.region.sagemaker.aws Domains in der Internet Public Suffix List (PSL) registriert. Aus Sicherheitsgründen empfehlen wir Ihnen, Cookies mit einem __Host- Präfix zu verwenden, um sensible Cookies für die Domänen Ihrer SageMaker Notebook-Instances zu setzen. Diese Vorgehensweise hilft Ihnen dabei, Ihre Domain vor CSRF (Cross-Site Request Forgery Attempts, Anforderungsfälschung zwischen Websites)-Versuchen zu schützen. Weitere Informationen finden Sie auf der Set-Cookie-Seite auf der Website mit der Entwicklerdokumentation von mozilla.org.

    Sie können Öffnen wählen, um das Dashboard zu öffnen JupyterLab. JupyterLab Das Dashboard bietet Zugriff auf Ihre Notebook-Instanz und SageMaker Beispielnotizbücher, die vollständige Code-Anleitungen enthalten. Diese exemplarischen Vorgehensweisen zeigen, wie Sie allgemeine Aufgaben im Bereich SageMaker maschinelles Lernen ausführen können. Weitere Informationen finden Sie unter Beispiel-Notebooks. Weitere Informationen finden Sie unter Steuern Sie den Root-Zugriff auf eine Notebook-Instance SageMaker .

    Weitere Informationen zu Jupyter Notebooks finden Sie bei The Jupyter notebook.