偏差偏移违规 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

偏差偏移违规

偏差偏移作业根据当前 MonitoringExecution 的分析结果来评估基准配置提供的基准约束。如果检测到违规行为,则该作业会将其列在执行输出位置的 constraint_violations.json 文件中,并将执行状态标记为 解释结果

以下是偏差偏移违规文件的架构。

  • facet - 分面的名称,由监控作业分析配置分面 name_or_index 提供。

  • facet_value - 分面的值,由监控作业分析配置分面 value_or_threshold 提供。

  • metric_name - 偏差指标的简称。例如,“CI”表示类别不平衡。有关每个训练前偏差指标的简称,请参阅训练前偏差指标;有关每个训练后偏差指标的简称,请参阅训练后数据和模型偏差指标

  • constraint_check_type - 监控的违规类型。目前仅支持 bias_drift_check

  • description - 解释违规行为的描述性消息。

{ "version": "1.0", "violations": [{ "facet": "string", "facet_value": "string", "metric_name": "string", "constraint_check_type": "string", "description": "string" }] }

偏差指标用于衡量分布中的相等程度。值接近于零表示分布较为均衡。如果作业分析结果文件 (analysis.json) 中偏差指标的值比基准约束文件中的相应值差,则会记录违规行为。例如,如果DPPL偏差指标的基线约束为0.2,而分析结果为,则不会记录任何违规行为0.1,因为0.1该值接近00.2。但是,如果分析结果为 -0.3,则会记录违规行为,因为它比基准约束 0.20 更远。

{ "version": "1.0", "violations": [{ "facet": "Age", "facet_value": "40", "metric_name": "CI", "constraint_check_type": "bias_drift_check", "description": "Value 0.0751544567666083 does not meet the constraint requirement" }, { "facet": "Age", "facet_value": "40", "metric_name": "DPPL", "constraint_check_type": "bias_drift_check", "description": "Value -0.0791244970125596 does not meet the constraint requirement" }] }