Desactivación del almacenamiento en caché de pasos - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Desactivación del almacenamiento en caché de pasos

Un paso de canalización no se vuelve a ejecutar si cambia algún atributo que no aparezca enumerado en Atributos clave de caché predeterminados por tipo de paso de la canalización de su tipo de paso. Sin embargo, puede decidir que desea que el paso de canalización se vuelva a ejecutar de todos modos. En este caso, debe desactivar el almacenamiento en caché de pasos.

Para desactivar el almacenamiento en caché de pasos, defina el atributo Enabled de la propiedad CacheConfig en la definición del paso en false, tal y como se muestra en el siguiente fragmento de código:

{     "CacheConfig": {         "Enabled": false,         "ExpireAfter": "<time>"     } }

Tenga en cuenta que el atributo ExpireAfter se pasa por alto cuando Enabled es false.

Para desactivar el almacenamiento en caché de un paso de canalización mediante Amazon SageMaker PythonSDK, defina la canalización de su paso de canalización, desactive la enable_caching propiedad y actualice la canalización.

Una vez que se ejecute de nuevo, el siguiente ejemplo de código activa el almacenamiento en caché para un paso de entrenamiento:

from sagemaker.workflow.pipeline_context import PipelineSession from sagemaker.workflow.steps import CacheConfig from sagemaker.workflow.pipeline import Pipeline cache_config = CacheConfig(enable_caching=False, expire_after="PT1H") estimator = Estimator(..., sagemaker_session=PipelineSession()) step_train = TrainingStep( name="TrainAbaloneModel", step_args=estimator.fit(inputs=inputs), cache_config=cache_config ) # define pipeline pipeline = Pipeline( steps=[step_train] ) # update the pipeline pipeline.update() # or, call upsert() to update the pipeline # pipeline.upsert()

Como alternativa, desactive la propiedad enable_caching una vez que haya definido la canalización, lo que permitirá ejecutar el código de forma continua. En el siguiente ejemplo de código se muestra esta solución:

# turn off caching for the training step pipeline.steps[0].cache_config.enable_caching = False # update the pipeline pipeline.update() # or, call upsert() to update the pipeline # pipeline.upsert()

Para obtener ejemplos de código más detallados y un análisis sobre cómo SDK los parámetros de Python afectan al almacenamiento en caché, consulte Configuración del almacenamiento en caché en la documentación de Amazon SageMaker PythonSDK.