Configure o modo de entrada de dados usando o SDK do SageMaker Python

SageMaker O Python SDK fornece a classe genérica Estimator e suas variações para estruturas de ML para o lançamento de trabalhos de treinamento. Você pode especificar um dos modos de entrada de dados ao configurar a Estimator classe de SageMaker IA ou o Estimator.fit método. Os modelos de código a seguir mostram as duas formas de especificar os modos de entrada.

Para especificar o modo de entrada usando a classe Estimator


from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

estimator = Estimator(
    checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/',
    output_path='s3://amzn-s3-demo-bucket/output-path/',
    base_job_name='job-name',
    input_mode='File'  # Available options: File | Pipe | FastFile
    ...
)

# Run the training job
estimator.fit(
    inputs=TrainingInput(s3_data="s3://amzn-s3-demo-bucket/my-data/train")
)

Para obter mais informações, consulte a classe SageMaker.Estimator.Estimator na documentação do SDK para Python. SageMaker

Para especificar o modo de entrada por meio do método estimator.fit()


from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

estimator = Estimator(
    checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/',
    output_path='s3://amzn-s3-demo-bucket/output-path/',
    base_job_name='job-name',
    ...
)

# Run the training job
estimator.fit(
    inputs=TrainingInput(
        s3_data="s3://amzn-s3-demo-bucket/my-data/train",
        input_mode='File'  # Available options: File | Pipe | FastFile
    )
)

Para obter mais informações, consulte o método da classe SageMaker.Estimator.fit e o sagemaker.inputs. TrainingInputclasse na documentação do SageMaker Python SDK.

dica

Para saber mais sobre como configurar o Amazon FSx for Lustre ou o Amazon EFS com sua configuração de VPC usando os estimadores do SDK do SageMaker Python, consulte Usar sistemas de arquivos como entradas de treinamento na documentação do AI Python SDK. SageMaker

dica

As integrações do modo de entrada de dados com o Amazon S3, o Amazon EFS e o FSx Lustre são formas recomendadas de configurar a fonte de dados de forma otimizada de acordo com as melhores práticas. Você pode melhorar estrategicamente o desempenho do carregamento de dados usando as opções de armazenamento gerenciado por SageMaker IA e os modos de entrada, mas isso não é estritamente restrito. Você pode escrever sua própria lógica de leitura de dados diretamente no seu contêiner de treinamento. Por exemplo, você pode configurar para ler de uma fonte de dados diferente, escrever sua própria classe de carregador de dados S3 ou usar as funções de carregamento de dados de estruturas de terceiros em seu script de treinamento. No entanto, você deve se certificar de especificar os caminhos corretos que a SageMaker IA pode reconhecer.

dica

Se você usa um contêiner de treinamento personalizado, certifique-se de instalar o kit de ferramentas de SageMaker treinamento que ajuda a configurar o ambiente para trabalhos de SageMaker treinamento. Caso contrário, você deve especificar as variáveis de ambiente explicitamente em seu Dockerfile. Para obter mais informações, consulte Criar um contêiner com seus próprios algoritmos e modelos.

Para obter mais informações sobre como definir os modos de entrada de dados usando o nível baixo SageMaker APIsComo a Amazon SageMaker AI fornece informações de treinamento, consulte a CreateTrainingJobAPI e o TrainingInputMode in AlgorithmSpecification.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Como configurar trabalhos de treinamento para acessar conjuntos de dados

Configure o canal de entrada de dados para usar o Amazon FSx for Lustre