Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Configurar el modo de entrada de datos mediante SageMaker Python SDK
SageMaker Python SDK proporciona la clase genérica EstimatorEstimator
clase o el Estimator.fit
método. Las siguientes plantillas de código muestran las dos formas de especificar modos de entrada.
Para especificar el modo de entrada mediante la clase Estimator
from sagemaker.
estimator
importEstimator
from sagemaker.inputs import TrainingInput estimator = Estimator( checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/
', output_path='s3://amzn-s3-demo-bucket/output-path/
', base_job_name='job-name
', input_mode='File
' # Available options: File | Pipe | FastFile ... ) # Run the training job estimator.fit( inputs=TrainingInput(s3_data="s3://amzn-s3-demo-bucket/my-data/train
") )
Para obtener más información, consulte la clase SageMaker.Estimator.Estimator
Para especificar el modo de entrada estimator.fit()
mediante el método
from sagemaker.
estimator
importEstimator
from sagemaker.inputs import TrainingInput estimator = Estimator( checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/
', output_path='s3://amzn-s3-demo-bucket/output-path/
', base_job_name='job-name
', ... ) # Run the training job estimator.fit( inputs=TrainingInput( s3_data="s3://amzn-s3-demo-bucket/my-data/train
", input_mode='File
' # Available options: File | Pipe | FastFile ) )
Para obtener más información, consulte el método de clase Sagemaker.Estimator.Estimator.fit y sagemaker.inputs
sugerencia
Para obtener más información sobre cómo configurar Amazon FSx for Lustre o Amazon EFS con su VPC configuración mediante los SDK estimadores de SageMaker Python, consulte Uso de sistemas de archivos como entradas de formación en la documentación
sugerencia
Las integraciones del modo de entrada de datos con Amazon S3EFS, Amazon y FSx for Lustre son formas recomendadas de configurar de manera óptima la fuente de datos según las mejores prácticas. Puede mejorar estratégicamente el rendimiento de carga de datos mediante las opciones de almacenamiento SageMaker gestionado y los modos de entrada, pero no está estrictamente limitado. Puede escribir su propia lógica de lectura de datos directamente en su contenedor de entrenamiento. Por ejemplo, puede configurarlo para leer desde un origen de datos distinto, escribir su propia clase de cargador de datos de S3 o usar funciones de carga de datos de marcos de terceros en su script de entrenamiento. Sin embargo, debe asegurarse de especificar las rutas correctas que SageMaker puedan reconocerlas.
sugerencia
Si utiliza un contenedor de formación personalizado, asegúrese de instalar el kit de herramientas de SageMaker formación
Para obtener más información sobre cómo configurar los modos de entrada de datos mediante el nivel bajo SageMaker APIs, consulte Cómo SageMaker proporciona Amazon la información sobre formación CreateTrainingJob
API, the TrainingInputMode
y in. AlgorithmSpecification