Konfigurieren Sie den Dateneingabemodus mit dem SageMaker Python-SDK

SageMaker Das Python-SDK stellt die generische Estimator-Klasse und ihre Variationen für ML-Frameworks zum Starten von Trainingsjobs bereit. Sie können bei der Konfiguration der SageMaker Estimator AI-Klasse oder der Estimator.fit Methode einen der Dateneingabemodi angeben. Die folgenden Codevorlagen zeigen die beiden Möglichkeiten zur Angabe von Eingabemodi.

So legen Sie den Eingabemodus mithilfe der Klasse Estimator fest


from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

estimator = Estimator(
    checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/',
    output_path='s3://amzn-s3-demo-bucket/output-path/',
    base_job_name='job-name',
    input_mode='File'  # Available options: File | Pipe | FastFile
    ...
)

# Run the training job
estimator.fit(
    inputs=TrainingInput(s3_data="s3://amzn-s3-demo-bucket/my-data/train")
)

Weitere Informationen finden Sie in der Klasse SageMaker.Estimator.Estimator in der Python SDK-Dokumentation. SageMaker

Um den Eingabemodus mit der Methode anzugeben estimator.fit()


from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

estimator = Estimator(
    checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/',
    output_path='s3://amzn-s3-demo-bucket/output-path/',
    base_job_name='job-name',
    ...
)

# Run the training job
estimator.fit(
    inputs=TrainingInput(
        s3_data="s3://amzn-s3-demo-bucket/my-data/train",
        input_mode='File'  # Available options: File | Pipe | FastFile
    )
)

Weitere Informationen finden Sie in der Klassenmethode SageMaker.Estimator.Estimator.fit und unter sagemaker.inputs. TrainingInputKlasse in der SageMaker Python SDK-Dokumentation.

Tipp

Weitere Informationen zur Konfiguration von Amazon FSx for Lustre oder Amazon EFS mit Ihrer VPC-Konfiguration mithilfe der SageMaker Python SDK-Schätzer finden Sie unter Verwenden von Dateisystemen als Trainingseingaben in der SageMaker AI Python SDK-Dokumentation.

Tipp

Die Dateneingabemodus-Integrationen mit Amazon S3, Amazon EFS und FSx für Lustre sind empfohlene Methoden zur optimalen Konfiguration der Datenquelle gemäß den Best Practices. Mithilfe der SageMaker KI-verwalteten Speicheroptionen und Eingabemodi können Sie die Leistung beim Laden von Daten strategisch verbessern, dies ist jedoch nicht strikt eingeschränkt. Sie können Ihre eigene Datenleselogik direkt in Ihren Trainingscontainer schreiben. Sie können z. B. festlegen, dass aus einer anderen Datenquelle gelesen wird, eine eigene S3-Datenladeklasse schreiben oder die Datenladefunktionen von Drittanbieter-Frameworks in Ihrem Trainingsskript verwenden. Sie müssen jedoch sicherstellen, dass Sie die richtigen Pfade angeben, die SageMaker KI erkennen kann.

Tipp

Wenn Sie einen benutzerdefinierten Schulungscontainer verwenden, stellen Sie sicher, dass Sie das SageMaker Schulungs-Toolkit installieren, mit dem Sie die Umgebung für SageMaker Schulungsjobs einrichten können. Andernfalls müssen Sie die Umgebungsvariablen explizit in Ihrem Dockerfile angeben. Weitere Informationen finden Sie unter Erstellen eines Containers mit Ihren eigenen Algorithmen und Modellen.

Weitere Informationen zum Einstellen der Dateneingabemodi mithilfe des Low-Levels SageMaker APIs finden Sie unter Wie Amazon SageMaker AI Schulungsinformationen bereitstellt CreateTrainingJobAPI und in. TrainingInputMode AlgorithmSpecification

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Einrichtung von Trainingsjobs für den Zugriff auf Datensätze

Dateneingabekanal für die Verwendung von Amazon FSx for Lustre konfigurieren