As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Use um SageMaker estimador para executar um trabalho de treinamento
Você também pode usar um estimador
-
Importe as bibliotecas e dependências necessárias, conforme exibido no seguinte exemplo de código.
import boto3 import sagemaker from sagemaker.estimator import Estimator session = sagemaker.Session() role = sagemaker.get_execution_role()
-
Forneça um Identificador de recursos uniforme (Uniform Resource Identifier, URI) para a imagem de treinamento, grupos de segurança e sub-redes para a configuração da VPC para o trabalho de treinamento, conforme mostrado no exemplo de código a seguir.
image_uri = "
myteam.myorg.com/docker-local/my-training-image:<IMAGE-TAG>
" security_groups = ["sg-0123456789abcdef0
"] subnets = ["subnet-0123456789abcdef0
", "subnet-0123456789abcdef0
"]Para obter mais informações sobre
security_group_ids
esubnets
, consulte a descrição apropriada do parâmetro na seção Estimadoresdo SDK para Python SageMaker . nota
SageMaker usa uma conexão de rede em sua VPC para acessar imagens em seu registro do Docker. Para usar as imagens no registro do Docker para treinamento, o registro deve estar acessível em uma Amazon VPC na sua conta.
-
Opcionalmente, se seu registro do Docker exigir autenticação, você também deverá especificar o Amazon Resource Name (ARN) de uma AWS Lambda função que fornece credenciais de acesso a. SageMaker O exemplo a seguir mostra como especificar o ARN.
training_repository_credentials_provider_arn = "
arn:aws:lambda:us-west-2:1234567890:function:test
"Para obter mais informações sobre o uso de imagens em um registro do Docker que exige autenticação, consulte abaixo Usar um registro do Docker que exija autenticação para treinamento.
-
Use os exemplos de código das etapas anteriores para configurar um estimador, conforme mostrado no exemplo de código a seguir.
# The training repository access mode must be 'Vpc' for private docker registry jobs training_repository_access_mode = "Vpc" # Specify the instance type, instance count you want to use instance_type="
ml.m5.xlarge
" instance_count=1
# Specify the maximum number of seconds that a model training job can run max_run_time =1800
# Specify the output path for the model artifacts output_path = "s3://your-output-bucket/your-output-path
" estimator = Estimator( image_uri=image_uri, role=role, subnets=subnets, security_group_ids=security_groups, training_repository_access_mode=training_repository_access_mode, training_repository_credentials_provider_arn=training_repository_credentials_provider_arn, # remove this line if auth is not needed instance_type=instance_type, instance_count=instance_count, output_path=output_path, max_run=max_run_time ) -
Inicie o trabalho de treinamento chamando
estimator.fit
com o nome do trabalho e o caminho de entrada como parâmetros, conforme mostrado no seguinte exemplo de código.input_path = "
s3://your-input-bucket/your-input-path
" job_name = "your-job-name
" estimator.fit( inputs=input_path, job_name=job_name )