Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
XGBoostProcesseur Framework
XGBoostest un framework d'apprentissage automatique open source. XGBoostProcessor
Dans Amazon SageMaker Python, vous SDK pouvez exécuter des tâches de traitement à l'aide de XGBoost scripts. Lorsque vous utilisez leXGBoostProcessor, vous pouvez tirer parti d'un conteneur Docker construit par Amazon avec un XGBoost environnement géré afin de ne pas avoir à apporter votre propre conteneur.
L'exemple de code suivant montre comment vous pouvez utiliser le XGBoostProcessor
pour exécuter votre tâche de traitement à l'aide d'une image Docker fournie et gérée par SageMaker. Notez que lorsque vous exécutez la tâche, vous pouvez spécifier un répertoire contenant vos scripts et dépendances dans l'source_dir
argument, et vous pouvez avoir un requirements.txt
fichier situé dans votre source_dir
répertoire qui spécifie les dépendances de vos scripts de traitement. SageMaker Le traitement installe les dépendances requirements.txt
dans le conteneur pour vous.
from sagemaker.xgboost import XGBoostProcessor from sagemaker.processing import ProcessingInput, ProcessingOutput from sagemaker import get_execution_role #Initialize the XGBoostProcessor xgb = XGBoostProcessor( framework_version='1.2-2', role=get_execution_role(), instance_type='ml.m5.xlarge', instance_count=1, base_job_name='frameworkprocessor-XGB', ) #Run the processing job xgb.run( code='
processing-script.py
', source_dir='scripts
', inputs=[ ProcessingInput( input_name='data', source=f's3://{BUCKET}/{S3_INPUT_PATH}
', destination='/opt/ml/processing/input/data' ) ], outputs=[ ProcessingOutput( output_name='processed_data', source='/opt/ml/processing/output/', destination=f's3://{BUCKET}/{S3_OUTPUT_PATH}
' ) ] )
Si vous avez un fichier requirements.txt
, il doit s'agir d'une liste de bibliothèques que vous souhaitez installer dans le conteneur. Le chemin pour source_dir
peut être un URI chemin relatif, absolu ou Amazon S3. Toutefois, si vous utilisez un Amazon S3URI, celui-ci doit pointer vers un fichier tar.gz. Vous pouvez disposer de plusieurs scripts dans le répertoire que vous spécifiez pour source_dir
. Pour en savoir plus sur cette XGBoostProcessor
classe, consultez XGBoostEstimator