XGBoost Framework-Prozessor - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

XGBoost Framework-Prozessor

XGBoost ist ein Open-Source-Framework für Machine Learning. Das XGBoostProcessor im Amazon SageMaker Python SDK bietet Ihnen die Möglichkeit, Verarbeitungsaufträge mit XGBoost-Skripten auszuführen. Wenn Sie die XG- verwendenBoostProcessor, können Sie einen von Amazon erstellten Docker-Container mit einer verwalteten XGBoost-Umgebung nutzen, sodass Sie keinen eigenen Container mitbringen müssen.

Das folgende Codebeispiel zeigt, wie Sie die verwenden könnenXGBoostProcessor, um Ihren Verarbeitungsauftrag mit einem von bereitgestellten und verwalteten Docker-Image auszuführen SageMaker. Beachten Sie, dass Sie beim Ausführen des Auftrags ein Verzeichnis angeben können, das Ihre Skripts und Abhängigkeiten im source_dir -Argument enthält, und dass sich eine requirements.txt Datei in Ihrem source_dir Verzeichnis befinden kann, die die Abhängigkeiten für Ihr/Ihre Verarbeitungsskript(e) angibt. SageMaker Bei der Verarbeitung werden die Abhängigkeiten in requirements.txt im Container für Sie installiert.

from sagemaker.xgboost import XGBoostProcessor from sagemaker.processing import ProcessingInput, ProcessingOutput from sagemaker import get_execution_role #Initialize the XGBoostProcessor xgb = XGBoostProcessor( framework_version='1.2-2', role=get_execution_role(), instance_type='ml.m5.xlarge', instance_count=1, base_job_name='frameworkprocessor-XGB', ) #Run the processing job xgb.run( code='processing-script.py', source_dir='scripts', inputs=[ ProcessingInput( input_name='data', source=f's3://{BUCKET}/{S3_INPUT_PATH}', destination='/opt/ml/processing/input/data' ) ], outputs=[ ProcessingOutput( output_name='processed_data', source='/opt/ml/processing/output/', destination=f's3://{BUCKET}/{S3_OUTPUT_PATH}' ) ] )

Wenn Sie eine requirements.txt Datei haben, sollte es sich um eine Liste von Bibliotheken handeln, die Sie im Container installieren möchten. Der Pfad für source_dir kann ein relativer, absoluter oder Amazon >SS3-URI-Pfad sein. Wenn Sie jedoch einen Amazon S3-URI verwenden, muss dieser auf eine Datei tar.gz verweisen. Sie können mehrere Skripte in dem Verzeichnis haben, das Sie für source_dir angeben. Weitere Informationen zur XGBoostProcessor Klasse finden Sie unter XGBoost Estimator im Amazon SageMaker Python SDK .