Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwenden Sie Notebook-Instances, um Modelle zu erstellen
Eine der besten Möglichkeiten für Machine-Learning-Experten (ML), Amazon zu nutzen, SageMaker besteht darin, ML-Modelle mithilfe von SageMaker Notebook-Instances zu trainieren und bereitzustellen. Die SageMaker Notebook-Instances helfen bei der Erstellung der Umgebung, indem sie Jupyter-Server auf Amazon Elastic Compute Cloud (AmazonEC2) initiieren und vorkonfigurierte Kernel mit den folgenden Paketen bereitstellen: Amazon SageMaker PythonSDK, AWS Command Line Interface (AWS CLI), Conda, Pandas AWS SDK for Python (Boto3), Deep-Learning-Framework-Bibliotheken und andere Bibliotheken für Datenwissenschaft und maschinelles Lernen.
Machine Learning mit SageMaker Python SDK
Verwenden Sie SageMaker Python, um ein ML-Modell in einer SageMaker Notebook-Instanz zu trainieren, zu validieren, bereitzustellen und zu evaluierenSDK. Die SageMaker SDK Python-Abstraktionen AWS SDK for Python (Boto3) und SageMaker API Operationen. Sie können damit andere AWS Services integrieren und orchestrieren, wie Amazon Simple Storage Service (Amazon S3) zum Speichern von Daten und Modellartefakten, Amazon Elastic Container Registry (ECR) für den Import und die Wartung der ML-Modelle, Amazon Elastic Compute Cloud (AmazonEC2) für Training und Inferenz.
Sie können auch SageMaker Funktionen nutzen, die Ihnen helfen, jede Phase eines vollständigen ML-Zyklus zu bewältigen: Datenkennzeichnung, Datenvorverarbeitung, Modelltraining, Modellbereitstellung, Bewertung der Prognoseleistung und Überwachung der Modellqualität in der Produktion.
Wenn Sie ein SageMaker Erstbenutzer sind, empfehlen wir Ihnen, SageMaker Python zu verwendenSDK, indem Sie dem end-to-end ML-Tutorial folgen. Die Open-Source-Dokumentation finden Sie in Amazon SageMaker Python SDK
Tutorial-Übersicht
In diesem Tutorial „Erste Schritte“ erfahren Sie, wie Sie eine SageMaker Notebook-Instance erstellen, ein Jupyter-Notebook mit einem vorkonfigurierten Kernel mit der Conda-Umgebung für maschinelles Lernen öffnen und eine SageMaker Sitzung starten, um einen ML-Zyklus auszuführen. end-to-end Sie erfahren, wie Sie einen Datensatz in einem standardmäßigen Amazon S3 S3-Bucket speichern, der automatisch mit der SageMaker Sitzung gepaart wird, einen Trainingsjob eines ML-Modells an Amazon senden und das trainierte Modell für Prognosen bereitstellenEC2, indem Sie es hosten oder Batch-Inferenzen über Amazon EC2 bereitstellen.
In diesem Tutorial wird explizit ein vollständiger ML-Flow gezeigt, bei dem das XGBoost Modell aus dem SageMaker integrierten Modellpool trainiert wird. Sie verwenden den Datensatz der US-Volkszählung für Erwachsene
-
SageMakerXGBoost— Das XGBoost
Modell ist an die SageMaker Umgebung angepasst und als Docker-Container vorkonfiguriert. SageMakerbietet eine Suite integrierter Algorithmen, die für die Verwendung SageMaker von Funktionen vorbereitet sind. Weitere Informationen darüber, wofür ML-Algorithmen angepasst sind SageMaker, finden Sie unter Wählen Sie einen Algorithmus und verwenden Sie die von Amazon SageMaker integrierten Algorithmen. Informationen zu den SageMaker integrierten API Algorithmusoperationen finden Sie unter Erstanbieter-Algorithmen in Amazon SageMaker Python SDK . -
Datensatz zur Volkszählung von Erwachsenen
– Der Datensatz aus der Datenbank des Census Bureau von 1994 von Ronny Kohavi und Barry Becker (Data Mining and Visualization, Silicon Graphics). Das SageMaker XGBoost Modell wird anhand dieses Datensatzes trainiert, um vorherzusagen, ob eine Person mehr als 50.000$ pro Jahr oder weniger verdient.
Themen
- Schritt 1: Erstellen Sie eine Amazon SageMaker Notebook-Instance für das Tutorial
- Schritt 2: Erstellen Sie ein Jupyter-Notebook in der Notebook-Instance SageMaker
- Schritt 3: Herunterladen, Analysieren und Transformieren eines Datensatzes
- Schritt 4: Schulen eines Modells
- Schritt 5: Stellen Sie das Modell auf Amazon bereit EC2
- Schritt 6: Bewerten des Modells
- Schritt 7: Bereinigen der SageMaker Amazon-Notebook-Instance-Ressourcen