SageMaker Notizbuch-Jobs - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SageMaker Notizbuch-Jobs

Sie können Amazon verwenden, SageMaker um interaktiv Modelle für maschinelles Lernen von Ihrem Jupyter-Notebook aus in jeder Umgebung zu erstellen, zu trainieren und bereitzustellen. JupyterLab Es gibt jedoch verschiedene Szenarien, in denen Sie Ihr Notebook möglicherweise als nicht interaktiven, geplanten Auftrag ausführen möchten. Möglicherweise möchten Sie beispielsweise regelmäßige Auditberichte erstellen, in denen alle Trainingsaufgaben analysiert werden, die über einen bestimmten Zeitraum ausgeführt wurden, und in denen der geschäftliche Nutzen der Implementierung dieser Modelle in der Produktion analysiert wird. Oder Sie möchten einen Feature-Engineering-Auftrag skalieren, nachdem Sie die Datentransformationslogik an einer kleinen Teilmenge von Daten getestet haben. Andere häufige Anwendungsfälle sind:

  • Planung von Aufträgen für die Überwachung von Modellabweichungen

  • Erkundung des Parameterraums für bessere Modelle

In diesen Szenarien können Sie SageMaker Notebook-Jobs verwenden, um einen nicht interaktiven Job (der als zugrunde liegender Trainingsjob SageMaker ausgeführt wird) zu erstellen, der entweder bei Bedarf oder nach einem Zeitplan ausgeführt wird. SageMaker Notebook Jobs bietet eine intuitive Benutzeroberfläche, über die Sie Ihre Jobs direkt planen können, JupyterLab indem Sie das Notizbuch-Jobs-Widget ( Blue icon of a calendar with a checkmark, representing a scheduled task or event. ) in Ihrem Notizbuch auswählen. Sie können Ihre Jobs auch mit SageMaker Python planenSDK, was die Flexibilität bietet, mehrere Notebook-Jobs in einem Pipeline-Workflow zu planen. Sie können mehrere Notebooks parallel ausführen und Zellen in Ihren Notebooks parametrisieren, um die Eingabeparameter anzupassen.

Diese Funktion nutzt die Dienste Amazon EventBridge, SageMaker Training und Pipelines und kann in Ihrem Jupyter-Notebook in einer der folgenden Umgebungen verwendet werden:

  • Studio-, Studio Lab-, Studio Classic- oder Notebook-Instances

  • Lokales Setup, z. B. Ihr lokaler Computer, auf dem Sie ausführen JupyterLab

Voraussetzungen

Um ein Notebook-Projekt zu planen, stellen Sie sicher, dass die folgenden Kriterien erfüllt sind:

  • Stellen Sie sicher, dass Ihr Jupyter Notebook und alle Initialisierungs- oder Startskripts in Bezug auf Code und Softwarepakete eigenständig sind. Andernfalls kann es bei Ihrem nicht interaktiven Auftrag zu Fehlern kommen.

  • Überprüfen Sie Einschränkungen und Überlegungen, ob Sie Ihr Jupyter Notebook, die Netzwerkeinstellungen und die Container-Einstellungen richtig konfiguriert haben.

  • Stellen Sie sicher, dass Ihr Notebook auf benötigte externe Ressourcen wie EMR Amazon-Cluster zugreifen kann.

  • Wenn Sie Notebook-Aufträge in einem lokalen Jupyter Notebook einrichten, schließen Sie die Installation ab. Detaillierte Anweisungen finden Sie unter Installationsanleitung.

  • Wenn Sie eine Verbindung zu einem EMR Amazon-Cluster in Ihrem Notebook herstellen und Ihren EMR Amazon-Verbindungsbefehl parametrisieren möchten, müssen Sie eine Problemumgehung anwenden, indem Sie Umgebungsvariablen verwenden, um Parameter zu übergeben. Details hierzu finden Sie unter Stellen Sie von Ihrem Notebook aus eine Connect zu einem EMR Amazon-Cluster her.

  • Wenn Sie mithilfe der Kerberos- oder HTTP Basic Auth-Authentifizierung eine Verbindung zu einem EMR Amazon-Cluster herstellen, LDAP müssen Sie die verwenden, AWS Secrets Manager um Ihre Sicherheitsanmeldeinformationen an Ihren EMR Amazon-Verbindungsbefehl zu übergeben. Details hierzu finden Sie unter Stellen Sie von Ihrem Notebook aus eine Connect zu einem EMR Amazon-Cluster her.

  • (optional) Wenn Sie möchten, dass die Benutzeroberfläche ein Skript vorinstalliert, das beim Start des Notebooks ausgeführt wird, muss Ihr Administrator es mit einer Lifecycle-Konfiguration () installieren. LCC Informationen zur Verwendung eines LCC Skripts finden Sie unter Anpassen einer Notebook-Instanz mithilfe eines Lifecycle-Konfigurationsskripts.