Crea un lavoro di formazione utilizzando l'API AWS CLI, SDK SageMaker - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Crea un lavoro di formazione utilizzando l'API AWS CLI, SDK SageMaker

Per utilizzare i piani di SageMaker formazione per il tuo lavoro di SageMaker formazione, specifica il TrainingPlanArn parametro del piano desiderato nell'area ResourceConfig Quando richiami l'operazione CreateTrainingJobAPI. È possibile utilizzare esattamente un piano per lavoro.

Importante

Il InstanceType campo impostato nella ResourceConfig sezione della CreateTrainingJob richiesta deve corrispondere al piano InstanceType di allenamento.

Esegui un processo di formazione su un piano utilizzando la CLI

L'esempio seguente dimostra come creare un processo di SageMaker formazione e associarlo a un piano di formazione fornito utilizzando l'TrainingPlanArnattributo nel create-training-job AWS CLI comando.

Per ulteriori informazioni su come creare un processo di formazione utilizzando il AWS CLI CreateTrainingJobcomando, vedere create-training-job.

# Create a training job aws sagemaker create-training-job \ --training-job-name training-job-name \ ... --resource-config '{ "InstanceType": "ml.p5.48xlarge", "InstanceCount": 8, "VolumeSizeInGB": 10, "TrainingPlanArn": "training-plan-arn" } }' \ ...

Questo comando di AWS CLI esempio crea un nuovo processo di addestramento in SageMaker AI inserendo un piano di formazione nell'--resource-configargomento.

aws sagemaker create-training-job \ --training-job-name job-name \ --role-arn arn:aws:iam::123456789123:role/DataAndAPIAccessRole \ --algorithm-specification '{"TrainingInputMode": "File","TrainingImage": "123456789123.dkr.ecr.us-east-1.amazonaws.com/algo-image:tag", "ContainerArguments": [" "]}' \ --input-data-config '[{"ChannelName":"training","DataSource":{"S3DataSource":{"S3DataType":"S3Prefix","S3Uri":"s3://bucketname/input","S3DataDistributionType":"ShardedByS3Key"}}}]' \ --output-data-config '{"S3OutputPath": "s3://bucketname/output"}' \ --resource-config '{"VolumeSizeInGB":10,"InstanceCount":4,"InstanceType":"ml.p5.48xlarge", "TrainingJobArn" : "arn:aws:sagemaker:us-east-1:123456789123:training-job/plan-name"}' \ --stopping-condition '{"MaxRuntimeInSeconds": 1800}' \ --region us-east-1

Dopo aver creato il processo di formazione, puoi verificare che sia stato assegnato correttamente al piano di formazione chiamando l'DescribeTrainingJobAPI.

aws sagemaker describe-training-job --training-job-name training-job-name

Esegui un processo di formazione su un piano utilizzando SageMaker AI Python SDK

In alternativa, puoi creare un lavoro di formazione associato a un piano di formazione utilizzando SageMaker Python SDK.

Se utilizzi SageMaker Python SDK da Studio per creare un processo di formazione, assicurati che il ruolo di esecuzione utilizzato dallo spazio su cui è JupyterLab in esecuzione l' JupyterLabapplicazione disponga delle autorizzazioni necessarie per utilizzare i piani di formazione. SageMaker Per ulteriori informazioni sulle autorizzazioni necessarie per utilizzare i piani di SageMaker formazione, consulta. IAM per i piani di formazione SageMaker

L'esempio seguente dimostra come creare un processo di SageMaker formazione e associarlo a un piano di formazione fornito utilizzando l'training_planattributo nell'Estimatoroggetto quando si utilizza SageMaker Python SDK.

Per ulteriori informazioni sull' SageMaker Estimator, consulta Utilizzare uno SageMaker stimatore per eseguire un processo di formazione.

import sagemaker import boto3 from sagemaker import get_execution_role from sagemaker.estimator import Estimator from sagemaker.inputs import TrainingInput # Set up the session and SageMaker client session = boto3.Session() region = session.region_name sagemaker_session = session.client('sagemaker') # Get the execution role for the training job role = get_execution_role() # Define the input data configuration trainingInput = TrainingInput( s3_data='s3://input-path', distribution='ShardedByS3Key', s3_data_type='S3Prefix' ) estimator = Estimator( entry_point='train.py', image_uri="123456789123.dkr.ecr.{}.amazonaws.com/image:tag", role=role, instance_count=4, instance_type='ml.p5.48xlarge', training_plan="training-plan-arn", volume_size=20, max_run=3600, sagemaker_session=sagemaker_session, output_path="s3://output-path" ) # Create the training job estimator.fit(inputs=trainingInput, job_name=job_name)

Dopo aver creato il processo di formazione, puoi verificare che sia stato assegnato correttamente al piano di formazione chiamando l'DescribeTrainingJobAPI.

# Check job details sagemaker_session.describe_training_job(TrainingJobName=job_name)