Übersicht Voraussetzungen und Einschränkungen Architektur Tools Epen Zugehörige Ressourcen

Erstellen Sie ein benutzerdefiniertes Docker-Container-Image für SageMaker und verwenden Sie es für das Modelltraining in AWS Step Functions

Erstellt von Julia Bluszcz (AWS), Neha Sharma (), Aubrey Oosthuizen (AWS), Mohan Gowda Purushothama () und Mateusz Zaremba (AWS) AWS AWS

Umwelt: Produktion

Technologien: Maschinelles Lernen und KI; DevOps

AWSDienstleistungen: AmazonECR; Amazon SageMaker; AWS Step Functions

Übersicht

Dieses Muster zeigt, wie Sie ein Docker-Container-Image für Amazon erstellen SageMaker und es für ein Trainingsmodell in AWSStep Functions verwenden. Indem Sie benutzerdefinierte Algorithmen in einem Container verpacken, können Sie fast jeden Code in der SageMaker Umgebung ausführen, unabhängig von Programmiersprache, Framework oder Abhängigkeiten.

In dem bereitgestellten SageMaker Beispiel-Notizbuch wird das benutzerdefinierte Docker-Container-Image in Amazon Elastic Container Registry (AmazonECR) gespeichert. Step Functions verwendet dann den in Amazon gespeicherten Container, ECR um ein Python-Verarbeitungsskript für auszuführen SageMaker. Anschließend exportiert der Container das Modell nach Amazon Simple Storage Service (Amazon S3).

Voraussetzungen und Einschränkungen

Voraussetzungen

Ein aktives AWS Konto
Eine AWSIdentity and Access Management Zugriffsmanagement-Rolle (IAM) für SageMaker mit Amazon S3 S3-Berechtigungen
Eine IAMRolle für Step Functions
Vertrautheit mit Python
Vertrautheit mit Amazon Python SageMaker SDK
Vertrautheit mit der AWS Befehlszeilenschnittstelle () AWS CLI
Vertrautheit mit AWS SDK for Python (Boto3)
Vertrautheit mit Amazon ECR
Vertrautheit mit Docker

Produktversionen

AWSStep Functions Data Science SDK Version 2.3.0
Amazon SageMaker Python SDK versie 2.78.0

Architektur

Das folgende Diagramm zeigt einen Beispiel-Workflow für die Erstellung eines Docker-Container-Images für und SageMaker dessen anschließende Verwendung für ein Trainingsmodell in Step Functions:

Workflow zum Erstellen eines Docker-Container-Images SageMaker zur Verwendung als Step Functions Functions-Trainingsmodell.

Das Diagramm zeigt den folgenden Workflow:

Ein Datenwissenschaftler oder DevOps Ingenieur verwendet ein SageMaker Amazon-Notizbuch, um ein benutzerdefiniertes Docker-Container-Image zu erstellen.
Ein Datenwissenschaftler oder DevOps Ingenieur speichert das Docker-Container-Image in einem ECR privaten Amazon-Repository, das sich in einer privaten Registrierung befindet.
Ein Datenwissenschaftler oder DevOps Ingenieur verwendet den Docker-Container, um einen SageMaker Python-Verarbeitungsjob in einem Step Functions Functions-Workflow auszuführen.

Automatisierung und Skalierung

Das SageMaker Beispiel-Notizbuch in diesem Muster verwendet einen ml.m5.xlarge Notebook-Instanztyp. Sie können den Instanztyp an Ihren Anwendungsfall anpassen. Weitere Informationen zu SageMaker Notebook-Instance-Typen finden Sie unter SageMaker Amazon-Preise.

Tools

Amazon Elastic Container Registry (AmazonECR) ist ein verwalteter Container-Image-Registry-Service, der sicher, skalierbar und zuverlässig ist.
Amazon SageMaker ist ein verwalteter Service für maschinelles Lernen (ML), der Ihnen hilft, ML-Modelle zu erstellen und zu trainieren und sie dann in einer produktionsbereiten gehosteten Umgebung bereitzustellen.
Amazon SageMaker Python SDK ist eine Open-Source-Bibliothek zum Trainieren und Bereitstellen von Modellen für maschinelles Lernen. SageMaker
AWSStep Functions ist ein serverloser Orchestrierungsdienst, mit dem Sie AWS Lambda-Funktionen und andere AWS Dienste kombinieren können, um geschäftskritische Anwendungen zu erstellen.
AWSStep Functions Data Science Python SDK ist eine Open-Source-Bibliothek, mit der Sie Step Functions Functions-Workflows erstellen können, die Modelle für maschinelles Lernen verarbeiten und veröffentlichen.

Epen

Aufgabe	Beschreibung	Erforderliche Fähigkeiten
Richten Sie Amazon ein ECR und erstellen Sie eine neue private Registrierung.	Falls Sie dies noch nicht getan haben, richten Sie Amazon ein, ECR indem Sie den Anweisungen unter Einrichtung bei Amazon ECR im ECRAmazon-Benutzerhandbuch folgen. Jedes AWS Konto ist standardmäßig mit einer privaten ECR Amazon-Registrierung ausgestattet.	DevOps Ingenieur
Erstellen Sie ein ECR privates Amazon-Repository.	Folgen Sie den Anweisungen unter Erstellen eines privaten Repositorys im ECRAmazon-Benutzerhandbuch. Hinweis: In dem Repository, das Sie erstellen, speichern Sie Ihre benutzerdefinierten Docker-Container-Images.	DevOps Ingenieur
Erstellen Sie ein Dockerfile, das die Spezifikationen enthält, die für die Ausführung Ihres SageMaker Verarbeitungsjobs erforderlich sind.	Erstellen Sie ein Dockerfile, das die für die Ausführung Ihres SageMaker Verarbeitungsjobs erforderlichen Spezifikationen enthält, indem Sie ein Dockerfile konfigurieren. Eine Anleitung finden Sie im Amazon SageMaker Developer Guide unter Anpassung Ihres eigenen Trainingscontainers. Weitere Informationen zu Dockerfiles finden Sie in der Dockerfile-Referenz in der Docker-Dokumentation. Beispiel: Jupyter-Notebook-Codezellen zum Erstellen eines Dockerfiles Zelle 1 `# Make docker folder !mkdir -p docker` Zelle 2 `%%writefile docker/Dockerfile FROM python:3.7-slim-buster RUN pip3 install pandas==0.25.3 scikit-learn==0.21.3 ENV PYTHONUNBUFFERED=TRUE ENTRYPOINT ["python3"]`	DevOps Ingenieur
Erstellen Sie Ihr Docker-Container-Image und übertragen Sie es an AmazonECR.	Erstellen Sie das Container-Image mit der Dockerfile, die Sie erstellt haben, indem Sie den `docker build` Befehl in der ausgeführt haben. AWS CLI Senden Sie das Container-Image an Amazon, ECR indem `docker push` Sie den Befehl ausführen. Weitere Informationen finden Sie unter Container erstellen und registrieren unter Erstellen eines eigenen Algorithmus-Containers auf GitHub. Beispiel für Jupyter-Notebook-Codezellen zum Erstellen und Registrieren eines Docker-Images Wichtig: Bevor Sie die folgenden Zellen ausführen, stellen Sie sicher, dass Sie ein Dockerfile erstellt und im Verzeichnis namens gespeichert haben. `docker` Stellen Sie außerdem sicher, dass Sie ein ECR Amazon-Repository erstellt haben und dass Sie den `ecr_repository` Wert in der ersten Zelle durch den Namen Ihres Repositorys ersetzen. Zelle 1 `import boto3 tag = ':latest' account_id = boto3.client('sts').get_caller_identity().get('Account') region = boto3.Session().region_name ecr_repository = 'byoc' image_uri = '{}.dkr.ecr.{}.amazonaws.com/{}'.format(account_id, region, ecr_repository + tag)` Zelle 2 `# Build docker image !docker build -t $image_uri docker` Zelle 3 `# Authenticate to ECR !aws ecr get-login-password --region {region} \| docker login --username AWS --password-stdin {account_id}.dkr.ecr.{region}.amazonaws.com` Zelle 4 `# Push docker image !docker push $image_uri` Hinweis: Sie müssen Ihren Docker-Client bei Ihrer privaten Registrierung authentifizieren, damit Sie die Befehle `docker push` und `docker pull` verwenden können. Mit diesen Befehlen werden Bilder in und aus den Repositorys in Ihrer Registrierung übertragen und abgerufen.	DevOps Ingenieur

Aufgabe Beschreibung Erforderliche Fähigkeiten

Aufgabe	Beschreibung	Erforderliche Fähigkeiten
Erstellen Sie ein Python-Skript, das Ihre benutzerdefinierte Verarbeitungs- und Modelltrainingslogik enthält.	Schreiben Sie eine benutzerdefinierte Verarbeitungslogik, die in Ihrem Datenverarbeitungsskript ausgeführt werden soll. Speichern Sie es dann als Python-Skript mit dem Namen`training.py`. Weitere Informationen finden Sie unter Bringen Sie Ihr eigenes Modell mit aktiviertem SageMaker Skriptmodus mit GitHub. Beispiel für ein Python-Skript mit benutzerdefinierter Verarbeitungs- und Modelltrainingslogik `%%writefile training.py from numpy import empty import pandas as pd import os from sklearn import datasets, svm from joblib import dump, load if __name__ == '__main__': digits = datasets.load_digits() #create classifier object clf = svm.SVC(gamma=0.001, C=100.) #fit the model clf.fit(digits.data[:-1], digits.target[:-1]) #model output in binary format output_path = os.path.join('/opt/ml/processing/model', "model.joblib") dump(clf, output_path)`	Data Scientist
Erstellen Sie einen Step Functions Functions-Workflow, der Ihren SageMaker Verarbeitungsjob als einen der Schritte enthält.	Installieren und importieren Sie AWSStep Functions Data Science SDK und laden Sie die Datei training.py auf Amazon S3 hoch. Verwenden Sie dann Amazon SageMaker Python, SDK um einen Verarbeitungsschritt in Step Functions zu definieren. Wichtig: Stellen Sie sicher, dass Sie in Ihrem AWS Konto eine IAM Ausführungsrolle für Step Functions erstellt haben. Beispiel für die Einrichtung einer Umgebung und ein benutzerdefiniertes Trainingsskript zum Hochladen auf Amazon S3 !pip install stepfunctions import boto3 import stepfunctions import sagemaker import datetime from stepfunctions import steps from stepfunctions.inputs import ExecutionInput from stepfunctions.steps import ( Chain ) from stepfunctions.workflow import Workflow from sagemaker.processing import ScriptProcessor, ProcessingInput, ProcessingOutput sagemaker_session = sagemaker.Session() bucket = sagemaker_session.default_bucket() role = sagemaker.get_execution_role() prefix = 'byoc-training-model' # See prerequisites section to create this role workflow_execution_role = f"arn:aws:iam::{account_id}:role/AmazonSageMaker-StepFunctionsWorkflowExecutionRole" execution_input = ExecutionInput( schema={ "PreprocessingJobName": str}) input_code = sagemaker_session.upload_data( "training.py", bucket=bucket, key_prefix="preprocessing.py", ) Beispiel für eine Definition eines SageMaker Verarbeitungsschritts, die ein benutzerdefiniertes ECR Amazon-Image und ein Python-Skript verwendet Hinweis: Stellen Sie sicher, dass Sie den `execution_input` Parameter verwenden, um den Jobnamen anzugeben. Der Wert des Parameters muss bei jeder Ausführung des Jobs eindeutig sein. Außerdem wird der Code der Datei training.py als `input` Parameter an die übergeben`ProcessingStep`, was bedeutet, dass er in den Container kopiert wird. Das Ziel für den `ProcessingInput` Code ist dasselbe wie das zweite Argument in der`container_entrypoint`. script_processor = ScriptProcessor(command=['python3'], image_uri=image_uri, role=role, instance_count=1, instance_type='ml.m5.xlarge') processing_step = steps.ProcessingStep( "training-step", processor=script_processor, job_name=execution_input["PreprocessingJobName"], inputs=[ ProcessingInput( source=input_code, destination="/opt/ml/processing/input/code", input_name="code", ), ], outputs=[ ProcessingOutput( source='/opt/ml/processing/model', destination="s3://{}/{}".format(bucket, prefix), output_name='byoc-example') ], container_entrypoint=["python3", "/opt/ml/processing/input/code/training.py"], ) Beispiel Step Functions Functions-Workflow, der einen SageMaker Verarbeitungsjob ausführt Hinweis: Dieser Beispiel-Workflow umfasst nur den SageMaker Verarbeitungs-Job-Schritt, keinen vollständigen Step Functions Functions-Workflow. Einen vollständigen Beispiel-Workflow finden Sie unter Beispiel-Notebooks SageMaker in der Data SDK Science-Dokumentation von AWS Step Functions. `workflow_graph = Chain([processing_step]) workflow = Workflow( name="ProcessingWorkflow", definition=workflow_graph, role=workflow_execution_role ) workflow.create() # Execute workflow execution = workflow.execute( inputs={ "PreprocessingJobName": str(datetime.datetime.now().strftime("%Y%m%d%H%M-%SS")), # Each pre processing job (SageMaker processing job) requires a unique name, } ) execution_output = execution.get_output(wait=True)`	Data Scientist

Erstellen Sie ein Python-Skript, das Ihre benutzerdefinierte Verarbeitungs- und Modelltrainingslogik enthält.

Schreiben Sie eine benutzerdefinierte Verarbeitungslogik, die in Ihrem Datenverarbeitungsskript ausgeführt werden soll. Speichern Sie es dann als Python-Skript mit dem Namentraining.py.

Weitere Informationen finden Sie unter Bringen Sie Ihr eigenes Modell mit aktiviertem SageMaker Skriptmodus mit GitHub.

Beispiel für ein Python-Skript mit benutzerdefinierter Verarbeitungs- und Modelltrainingslogik


%%writefile training.py
from numpy import empty
import pandas as pd
import os
from sklearn import datasets, svm
from joblib import dump, load


if __name__ == '__main__':
    digits = datasets.load_digits()
    #create classifier object
    clf = svm.SVC(gamma=0.001, C=100.)
    
    #fit the model
    clf.fit(digits.data[:-1], digits.target[:-1])
    
    #model output in binary format
    output_path = os.path.join('/opt/ml/processing/model', "model.joblib")
    dump(clf, output_path)

Data Scientist

Erstellen Sie einen Step Functions Functions-Workflow, der Ihren SageMaker Verarbeitungsjob als einen der Schritte enthält.

Installieren und importieren Sie AWSStep Functions Data Science SDK und laden Sie die Datei training.py auf Amazon S3 hoch. Verwenden Sie dann Amazon SageMaker Python, SDK um einen Verarbeitungsschritt in Step Functions zu definieren.

Wichtig: Stellen Sie sicher, dass Sie in Ihrem AWS Konto eine IAM Ausführungsrolle für Step Functions erstellt haben.

Beispiel für die Einrichtung einer Umgebung und ein benutzerdefiniertes Trainingsskript zum Hochladen auf Amazon S3


!pip install stepfunctions

import boto3
import stepfunctions
import sagemaker
import datetime

from stepfunctions import steps
from stepfunctions.inputs import ExecutionInput
from stepfunctions.steps import (
    Chain
)
from stepfunctions.workflow import Workflow
from sagemaker.processing import ScriptProcessor, ProcessingInput, ProcessingOutput

sagemaker_session = sagemaker.Session()
bucket = sagemaker_session.default_bucket() 
role = sagemaker.get_execution_role()
prefix = 'byoc-training-model'

# See prerequisites section to create this role
workflow_execution_role = f"arn:aws:iam::{account_id}:role/AmazonSageMaker-StepFunctionsWorkflowExecutionRole"

execution_input = ExecutionInput(
    schema={
        "PreprocessingJobName": str})


input_code = sagemaker_session.upload_data(
    "training.py",
    bucket=bucket,
    key_prefix="preprocessing.py",
)

Beispiel für eine Definition eines SageMaker Verarbeitungsschritts, die ein benutzerdefiniertes ECR Amazon-Image und ein Python-Skript verwendet

Hinweis: Stellen Sie sicher, dass Sie den execution_input Parameter verwenden, um den Jobnamen anzugeben. Der Wert des Parameters muss bei jeder Ausführung des Jobs eindeutig sein. Außerdem wird der Code der Datei training.py als input Parameter an die übergebenProcessingStep, was bedeutet, dass er in den Container kopiert wird. Das Ziel für den ProcessingInput Code ist dasselbe wie das zweite Argument in dercontainer_entrypoint.


script_processor = ScriptProcessor(command=['python3'],
                image_uri=image_uri,
                role=role,
                instance_count=1,
                instance_type='ml.m5.xlarge')


processing_step = steps.ProcessingStep(
    "training-step",
    processor=script_processor,
    job_name=execution_input["PreprocessingJobName"],
    inputs=[
        ProcessingInput(
            source=input_code,
            destination="/opt/ml/processing/input/code",
            input_name="code",
        ),
    ],
    outputs=[
        ProcessingOutput(
            source='/opt/ml/processing/model', 
            destination="s3://{}/{}".format(bucket, prefix), 
            output_name='byoc-example')
    ],
    container_entrypoint=["python3", "/opt/ml/processing/input/code/training.py"],
)

Beispiel Step Functions Functions-Workflow, der einen SageMaker Verarbeitungsjob ausführt

Hinweis: Dieser Beispiel-Workflow umfasst nur den SageMaker Verarbeitungs-Job-Schritt, keinen vollständigen Step Functions Functions-Workflow. Einen vollständigen Beispiel-Workflow finden Sie unter Beispiel-Notebooks SageMaker in der Data SDK Science-Dokumentation von AWS Step Functions.


workflow_graph = Chain([processing_step])

workflow = Workflow(
    name="ProcessingWorkflow",
    definition=workflow_graph,
    role=workflow_execution_role
)

workflow.create()
# Execute workflow
execution = workflow.execute(
    inputs={
        "PreprocessingJobName": str(datetime.datetime.now().strftime("%Y%m%d%H%M-%SS")),  # Each pre processing job (SageMaker processing job) requires a unique name,
    }
)
execution_output = execution.get_output(wait=True)

Data Scientist

Zugehörige Ressourcen

Daten verarbeiten (Amazon SageMaker Developer Guide)
Anpassung Ihres eigenen Trainingscontainers (Amazon SageMaker Developer Guide)

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Erstellen Sie einen MLOps Workflow SageMaker mit Azure DevOps

Stellen Sie einen Anwendungsfall bereit auf RAG AWS