사용 방법 SageMaker CatBoost - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

사용 방법 SageMaker CatBoost

를 Amazon 기본 SageMaker 제공 알고리즘 CatBoost 으로 사용할 수 있습니다. 다음 섹션에서는 SageMaker Python CatBoost 에서 를 사용하는 방법을 설명합니다SDK. Amazon SageMaker Studio Classic UI CatBoost 에서 를 사용하는 방법에 대한 자세한 내용은 섹션을 참조하세요SageMaker JumpStart 사전 훈련된 모델.

  • 기본 제공 알고리즘 CatBoost 으로 사용

    다음 코드 예제와 같이 CatBoost 기본 제공 알고리즘을 사용하여 CatBoost 훈련 컨테이너를 빌드합니다. API (또는 Amazon SageMaker Python SDK 버전 2를 CatBoost 사용하는 get_image_uri API 경우)를 URI SageMaker image_uris.retrieve 사용하여 기본 제공 알고리즘 이미지를 자동으로 찾을 수 있습니다.

    CatBoost 이미지를 지정한 후 CatBoost 컨테이너를 사용하여 추정기를 사용하여 추정 SageMaker 기를 구성API하고 훈련 작업을 시작할 URI수 있습니다. CatBoost 내장 알고리즘은 스크립트 모드에서 실행되지만 훈련 스크립트가 제공되므로 교체할 필요가 없습니다. 스크립트 모드를 사용하여 SageMaker 훈련 작업을 생성한 경험이 많은 경우 자체 CatBoost 훈련 스크립트를 통합할 수 있습니다.

    from sagemaker import image_uris, model_uris, script_uris train_model_id, train_model_version, train_scope = "catboost-classification-model", "*", "training" training_instance_type = "ml.m5.xlarge" # Retrieve the docker image train_image_uri = image_uris.retrieve( region=None, framework=None, model_id=train_model_id, model_version=train_model_version, image_scope=train_scope, instance_type=training_instance_type ) # Retrieve the training script train_source_uri = script_uris.retrieve( model_id=train_model_id, model_version=train_model_version, script_scope=train_scope ) train_model_uri = model_uris.retrieve( model_id=train_model_id, model_version=train_model_version, model_scope=train_scope ) # Sample training data is available in this bucket training_data_bucket = f"jumpstart-cache-prod-{aws_region}" training_data_prefix = "training-datasets/tabular_multiclass/" training_dataset_s3_path = f"s3://{training_data_bucket}/{training_data_prefix}/train" validation_dataset_s3_path = f"s3://{training_data_bucket}/{training_data_prefix}/validation" output_bucket = sess.default_bucket() output_prefix = "jumpstart-example-tabular-training" s3_output_location = f"s3://{output_bucket}/{output_prefix}/output" from sagemaker import hyperparameters # Retrieve the default hyperparameters for training the model hyperparameters = hyperparameters.retrieve_default( model_id=train_model_id, model_version=train_model_version ) # [Optional] Override default hyperparameters with custom values hyperparameters[ "iterations" ] = "500" print(hyperparameters) from sagemaker.estimator import Estimator from sagemaker.utils import name_from_base training_job_name = name_from_base(f"built-in-algo-{train_model_id}-training") # Create SageMaker Estimator instance tabular_estimator = Estimator( role=aws_role, image_uri=train_image_uri, source_dir=train_source_uri, model_uri=train_model_uri, entry_point="transfer_learning.py", instance_count=1, instance_type=training_instance_type, max_run=360000, hyperparameters=hyperparameters, output_path=s3_output_location ) # Launch a SageMaker Training job by passing the S3 path of the training data tabular_estimator.fit( { "training": training_dataset_s3_path, "validation": validation_dataset_s3_path, }, logs=True, job_name=training_job_name )

    내장 알고리즘 CatBoost 으로 설정하는 방법에 대한 자세한 내용은 다음 노트북 예제를 참조하세요.