本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
添加 ML 洞察以检测异常值和关键驱动因素
您可以添加用于检测异常的 ML 洞察,异常是看似显著的异常值。要开始使用,您需要为自己的洞察创建一个小组件,也称为自动叙述。配置选项时,可以在屏幕右侧的预览窗格中查看洞察的有限屏幕截图。
在您的洞察小组件中,您最多可以添加五个不是计算字段的维度字段。在字段井中,类别的值代表 Amazon QuickSight 拆分指标所用的维度值。例如,假设您正在分析所有产品类别和产品 SKU 的收入。有 10 个产品类别,每个类别有 10 个产品 SKU。Amazon QuickSight 按照 100 个唯一组合对指标进行拆分,并对拆分的每个组合进行异常检测。
以下步骤说明了如何执行此操作,以及如何添加贡献分析以检测导致每个异常的关键驱动因素。您可以稍后添加贡献分析,如 对关键驱动因素使用贡献分析 中所述。
设置异常值分析,包括主要驱动因素
-
打开您的分析,在工具栏中选择见解,然后选择添加。从列表中,选择 Anomaly detection (异常检测) 和 Select (选择)。
-
按照新小部件上的屏幕提示操作,它会告诉您如何为见解选择字段。必须添加至少一个日期、一个度量和一个维度。
-
在小部件上选择 Get started (开始)。此时将显示配置屏幕。
-
在计算选项下,为以下选项选择值。
-
对于要分析的组合,请选择以下选项之一:
-
分层
如果要按层次分析字段,请选择此选项。例如,如果您选择日期(T)、度量(N)和三个维度类别(C1、C2 和 C3),QuickSight 会按层次分析字段,如下所示。
T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N
-
精确
如果您只想分析“类别”字段井中列出的字段的精确组合,请选择此选项。例如,如果您选择日期(T)、度量(N)和三个维度类别(C1、C2 和 C3),QuickSight 将仅按类别字段的列出顺序分析其精确组合,如下所示。
T-C1-C2-C3-N
-
全部
如果您想分析“类别”字段井中的所有字段组合,请选择此选项。例如,如果您选择日期(T)、度量(N)和三个维度类别(C1、C2 和 C3),QuickSight 会分析所有字段组合,如下所示。
T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N, T-C1-C3-N, T-C2-N, T-C2-C3-N, T-C3-N
如果您只选择日期和度量,QuickSight 会先按日期分析字段,然后再按度量分析字段。
在要分析的字段部分中,您可以看到字段井中用于参考的字段列表。
-
-
在名称中,输入不含空格的描述性字母数字名称,或者选择默认值。这为计算提供了名称。
如果您计划编辑自动显示在小部件上的叙述,则可以使用该名称来识别此小部件的计算。如果您计划编辑自动叙述,并且分析中有其他类似的计算时,可自定义名称。
-
-
在显示选项部分,选择以下选项以自定义洞察小组件中显示的内容。无论显示什么,您仍然可以探索所有结果。
-
要显示的最大异常数 – 要在叙述小组件中显示的异常值数量。
-
严重性 – 要在洞察小组件中显示的异常的最低严重性级别。
严重性级别 是一个异常分数范围,其特征是该范围中包含的最低实际异常分数。所有分数较高的异常都包含在范围内。如果将严重性设置为低,则洞察会显示排名介于低和非常高之间的所有异常。如果将严重性设置为 Very high (非常高),则见解仅显示具有最高异常分数的异常。
可以使用以下选项:
-
非常高
-
高及以上
-
中等及以上
-
低及以上
-
-
方向 – 要识别为异常的值在 x 轴或 y 轴上的方向。可从以下选项中进行选择:
-
高于预期将较高的值识别为异常。
-
低于预期将较低的值识别为异常。
-
[ALL] 将识别所有异常值,包括高值和低值(默认设置)。
-
-
增量 – 输入用于识别异常的自定义值。任何高于阈值的数量均视为异常。此处的值会更改分析中洞察的工作方式。在此部分,您可以设置以下内容:
-
绝对值 – 要使用的实际值。例如,假设这个值是 48。Amazon QuickSight 会在某个值和预期值之间的差值大于 48 时,将该值识别为异常值。
-
百分比 – 要使用的百分比阈值。例如,假设这个值是 12.5%。Amazon QuickSight 会在某个值和预期值之间的差值大于 12.5% 时,将该值识别为异常值。
-
-
排序依据 – 为结果选择排序方法。有些方法基于 Amazon QuickSight 生成的异常分数。Amazon QuickSight 为看似异常的数据点提供较高的分数。您可以使用以下任意选项:
-
加权异常分数 – 异常分数乘以实际值和预期值之差的绝对值的对数。此分数始终是正数。
-
异常分数 – 分配给此数据点的实际异常分数。
-
与预期值的加权差 – 异常分数乘以实际值和预期值之差(默认)。
-
与预期值的差 – 实际值与预期值之间的实际差(即,实际值-预期值)。
-
实际值 – 未应用公式的实际值。
-
-
-
在计划选项部分,您可以设置计划以自动运行洞察的重新计算。仅为已发布的控制面板运行计划。在分析中,您可以根据需要手动运行它。计划的安排包括以下设置。
-
发生率 – 希望重新计算运行的频率:每小时、每天、每周或每个月。
-
计划开始时间 – 开始运行此计划的日期和时间。
-
时区 – 在其中运行计划的时区。要查看列表,请删除当前条目。
-
-
在排名靠前的贡献者部分,将 Amazon QuickSight 设置为在检测到异常值(异常)时分析关键驱动因素。
例如,Amazon QuickSight 可以展示促成家装产品在美国销量飙升的顶级客户。您最多可以从数据集中添加四个维度。这些维度包括您未添加到此洞察小组件的字段井中的维度。
对于可用于贡献分析的维度列表,请选择选择字段。
-
选择保存以确认您的选择。选择 Cancel (取消) 退出而不保存。
-
从洞察小组件中,选择立即运行以运行异常检测并查看您的洞察。
异常检测完成所需的时间取决于要分析的唯一数据点的数量。此过程可能需要几分钟时间(对于最小点数),也可能需要数小时。
当它在后台运行时,您可以对分析执行别的操作。对于此洞察,确保等待它完成,然后再更改配置、编辑叙述或打开探索异常页面。
洞察小组件需要至少运行一次才能看到结果。如果您认为状态可能已过期,可以刷新页面。洞察可能为以下状态之一。
页面上显示 | Status |
---|---|
Run now (立即运行) 按钮 | 该作业尚未开始。 |
关于 Analyzing for anomalies (分析异常) 的消息 | 作业当前正在运行。 |
关于检测到的异常(异常值)的叙述 | 作业已成功运行。该消息显示此小部件的计算上次更新时间。 |
带有感叹号的警报图标(!) | 此图标表示上次运行期间出现错误。如果还显示叙述,您仍可以使用 Explore anomalies (探索异常) 来使用上一次成功运行的数据。 |