按管道步骤类型划分的默认缓存键属性 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

按管道步骤类型划分的默认缓存键属性

在决定是重用上一个工作流步骤还是重新运行该步骤时,Pipelines 会检查某些属性是否已更改。如果这组属性与超时时间段内所有之前的运行不同,则将再次运行该步骤。这些属性包括输入构件、应用程序或算法规范以及环境变量。以下列表显示了每种管道步骤类型和属性,这些属性如果发生更改,则会启动该步骤的重新运行。有关使用哪些 Python SDK 参数来创建以下属性的更多信息,请参阅 Amaz SageMaker on Python SDK 文档中的缓存配置

  • AppSpecification

  • 环境

  • ProcessingInputs。此属性包含有关预处理脚本的信息。

  • AlgorithmSpecification

  • CheckpointConfig

  • DebugHookConfig

  • DebugRuleConfigurations

  • 环境

  • HyperParameters

  • InputDataConfig。此属性包含有关训练脚本的信息。

  • HyperParameterTuningJobConfig

  • TrainingJobDefinition。此属性由多个子属性组成,并非所有子属性都会导致该步骤重新运行。可能导致重新运行(如果已更改)的子属性如下:

    • AlgorithmSpecification

    • HyperParameterRanges

    • InputDataConfig

    • StaticHyperParameters

    • TuningObjective

  • TrainingJobDefinitions

  • A utoMLJob Config。此属性由多个子属性组成,并非所有子属性都会导致该步骤重新运行。可能导致重新运行(如果已更改)的子属性如下:

    • CompletionCriteria

    • CandidateGenerationConfig

    • DataSplitConfig

    • Mode

  • 一个utoMLJob目标

  • InputDataConfig

  • ProblemType

  • DataProcessing

  • 环境

  • ModelName

  • TransformInput

  • ClarifyCheckConfig

  • CheckJobConfig

  • SkipCheck

  • RegisterNewBaseline

  • ModelPackageGroupName

  • SuppliedBaselineConstraints

  • QualityCheckConfig

  • CheckJobConfig

  • SkipCheck

  • RegisterNewBaseline

  • ModelPackageGroupName

  • SuppliedBaselineConstraints

  • SuppliedBaselineStatistics

  • ClusterId

  • StepConfig