Use um SageMaker estimador para executar um trabalho de treinamento - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Use um SageMaker estimador para executar um trabalho de treinamento

Você também pode usar um estimador do SDK do SageMaker Python para lidar com a configuração e a execução do seu trabalho de treinamento. SageMaker Os exemplos de código a seguir mostram como configurar e executar um estimador usando imagens de um registro particular do Docker.

  1. Importe as bibliotecas e dependências necessárias, conforme exibido no seguinte exemplo de código.

    import boto3 import sagemaker from sagemaker.estimator import Estimator session = sagemaker.Session() role = sagemaker.get_execution_role()
  2. Forneça um Identificador de recursos uniforme (Uniform Resource Identifier, URI) para a imagem de treinamento, grupos de segurança e sub-redes para a configuração da VPC para o trabalho de treinamento, conforme mostrado no exemplo de código a seguir.

    image_uri = "myteam.myorg.com/docker-local/my-training-image:<IMAGE-TAG>" security_groups = ["sg-0123456789abcdef0"] subnets = ["subnet-0123456789abcdef0", "subnet-0123456789abcdef0"]

    Para obter mais informações sobre security_group_ids esubnets, consulte a descrição apropriada do parâmetro na seção Estimadores do SDK para Python SageMaker .

    nota

    SageMaker usa uma conexão de rede em sua VPC para acessar imagens em seu registro do Docker. Para usar as imagens no registro do Docker para treinamento, o registro deve estar acessível em uma Amazon VPC na sua conta.

  3. Opcionalmente, se seu registro do Docker exigir autenticação, você também deverá especificar o Amazon Resource Name (ARN) de uma AWS Lambda função que fornece credenciais de acesso a. SageMaker O exemplo a seguir mostra como especificar o ARN.

    training_repository_credentials_provider_arn = "arn:aws:lambda:us-west-2:1234567890:function:test"

    Para obter mais informações sobre o uso de imagens em um registro do Docker que exige autenticação, consulte abaixo Usar um registro do Docker que exija autenticação para treinamento.

  4. Use os exemplos de código das etapas anteriores para configurar um estimador, conforme mostrado no exemplo de código a seguir.

    # The training repository access mode must be 'Vpc' for private docker registry jobs training_repository_access_mode = "Vpc" # Specify the instance type, instance count you want to use instance_type="ml.m5.xlarge" instance_count=1 # Specify the maximum number of seconds that a model training job can run max_run_time = 1800 # Specify the output path for the model artifacts output_path = "s3://your-output-bucket/your-output-path" estimator = Estimator( image_uri=image_uri, role=role, subnets=subnets, security_group_ids=security_groups, training_repository_access_mode=training_repository_access_mode, training_repository_credentials_provider_arn=training_repository_credentials_provider_arn, # remove this line if auth is not needed instance_type=instance_type, instance_count=instance_count, output_path=output_path, max_run=max_run_time )
  5. Inicie o trabalho de treinamento chamando estimator.fit com o nome do trabalho e o caminho de entrada como parâmetros, conforme mostrado no seguinte exemplo de código.

    input_path = "s3://your-input-bucket/your-input-path" job_name = "your-job-name" estimator.fit( inputs=input_path, job_name=job_name )