Pasos del proceso de almacenamiento en caché - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Pasos del proceso de almacenamiento en caché

En Amazon SageMaker Pipelines, puede utilizar el almacenamiento en caché por pasos para ahorrar tiempo y recursos al volver a ejecutar canalizaciones. El almacenamiento en caché por pasos reutiliza el resultado de una ejecución anterior exitosa de un paso (en lugar de volver a calcularlo) cuando el paso tiene la misma configuración y las mismas entradas. Esto te ayuda a conseguir resultados uniformes en todas las repeticiones de la canalización con parámetros idénticos. En el siguiente tema, se muestra cómo configurar y activar el almacenamiento en caché por pasos para las canalizaciones.

Cuando utilizas el almacenamiento en caché de firmas de pasos, Pipelines intenta buscar una ejecución anterior de tu paso de canalización actual con los mismos valores para determinados atributos. Si lo encuentra, Pipelines propaga los resultados de la ejecución anterior en lugar de volver a calcular el paso. Los atributos marcados son específicos del tipo de paso y se enumeran en Atributos clave de caché predeterminados por tipo de paso de la canalización.

Debe elegir utilizar el almacenamiento en caché de pasos; está desactivado de forma predeterminada. Al activar el almacenamiento en caché de pasos, también debe definir un tiempo de espera. Este tiempo de espera define la antigüedad que puede tener una ejecución anterior para que aún pueda reutilizarse.

El almacenamiento en caché de pasos solo considera las ejecuciones correctas; nunca reutiliza las ejecuciones que produjeron un error. Cuando hay varias ejecuciones correctas dentro del período de tiempo de espera, Pipelines usa el resultado de la ejecución exitosa más reciente. Si no coinciden las ejecuciones correctas en el período de tiempo de espera, Pipelines vuelve a ejecutar el paso. Si el ejecutor encuentra una ejecución anterior que cumple los criterios pero que aún está en curso, ambos pasos seguirán ejecutándose y actualizarán la caché si se realizan correctamente.

El almacenamiento en caché de pasos solo se aplica a canalizaciones individuales, por lo que no puede reutilizar un paso de otra canalización aunque la firma de un paso coincida.

El almacenamiento en caché de pasos está disponible para los siguientes tipos de pasos: