As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Configure o modo de entrada de dados usando o SDK do SageMaker Python
SageMaker O Python SDK fornece a classe genérica EstimatorEstimator
classe de SageMaker IA ou o Estimator.fit
método. Os modelos de código a seguir mostram as duas formas de especificar os modos de entrada.
Para especificar o modo de entrada usando a classe Estimator
from sagemaker.
estimator
importEstimator
from sagemaker.inputs import TrainingInput estimator = Estimator( checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/
', output_path='s3://amzn-s3-demo-bucket/output-path/
', base_job_name='job-name
', input_mode='File
' # Available options: File | Pipe | FastFile ... ) # Run the training job estimator.fit( inputs=TrainingInput(s3_data="s3://amzn-s3-demo-bucket/my-data/train
") )
Para obter mais informações, consulte a classe SageMaker.Estimator.Estimator
Para especificar o modo de entrada por meio do método estimator.fit()
from sagemaker.
estimator
importEstimator
from sagemaker.inputs import TrainingInput estimator = Estimator( checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/
', output_path='s3://amzn-s3-demo-bucket/output-path/
', base_job_name='job-name
', ... ) # Run the training job estimator.fit( inputs=TrainingInput( s3_data="s3://amzn-s3-demo-bucket/my-data/train
", input_mode='File
' # Available options: File | Pipe | FastFile ) )
Para obter mais informações, consulte o método da classe SageMaker.Estimator.fit e o sagemaker.inputs
dica
Para saber mais sobre como configurar o Amazon FSx for Lustre ou o Amazon EFS com sua configuração de VPC usando os estimadores do SDK do SageMaker Python, consulte Usar sistemas de arquivos como entradas de treinamento
dica
As integrações do modo de entrada de dados com o Amazon S3, o Amazon EFS e o FSx Lustre são formas recomendadas de configurar a fonte de dados de forma otimizada de acordo com as melhores práticas. Você pode melhorar estrategicamente o desempenho do carregamento de dados usando as opções de armazenamento gerenciado por SageMaker IA e os modos de entrada, mas isso não é estritamente restrito. Você pode escrever sua própria lógica de leitura de dados diretamente no seu contêiner de treinamento. Por exemplo, você pode configurar para ler de uma fonte de dados diferente, escrever sua própria classe de carregador de dados S3 ou usar as funções de carregamento de dados de estruturas de terceiros em seu script de treinamento. No entanto, você deve se certificar de especificar os caminhos corretos que a SageMaker IA pode reconhecer.
dica
Se você usa um contêiner de treinamento personalizado, certifique-se de instalar o kit de ferramentas de SageMaker treinamento
Para obter mais informações sobre como definir os modos de entrada de dados usando o nível baixo SageMaker APIsComo a Amazon SageMaker AI fornece informações de treinamento, consulte a CreateTrainingJob
API e o TrainingInputMode
in AlgorithmSpecification
.