本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
B 部分:生成欺诈预测
欺诈预测是对商业活动(事件)欺诈的评估。亚马逊欺诈检测器使用检测器生成欺诈预测。检测器包含您想要评估是否存在欺诈的特定事件的检测逻辑,例如模型和规则。检测逻辑使用规则告诉 Amazon Fraud Detector 如何解释与模型相关的数据。在本教程中,您将使用之前上传的账户注册示例数据集评估账户注册事件。
在第 A 部分中,您创建、训练和部署了模型。在 B 部分中,您为sample_registration
事件类型构建检测器,添加已部署的模型,创建规则和规则执行顺序,然后创建并激活用于生成欺诈预测的检测器版本。
创建探测器
-
在 Amazon Fraud Detector 的左侧导航窗格中,选择 Setec to r。
-
选择 “创建探测器”。
-
在定义探测器详细信息页面中,输入
sample_detector
探测器名称。或者,输入探测器的描述,例如my sample fraud detector
。 -
对于事件类型,选择 sample_registration。这是您在本教程的 A 部分中创建的事件。
-
选择下一步。
如果您完成了本教程的 A 部分,那么您可能已经有了 Amazon Fraud Detector 模型可以添加到您的检测器中。如果您尚未创建模型,请转到第 A 部分并完成创建、训练和部署模型的步骤,然后继续执行第 B 部分。
-
在添加模型-可选中,选择添加模型。
-
在添加模型页面的选择模型中,选择您之前部署的 Amazon Fraud Detector 模型名称。对于选择版本,选择已部署模型的模型版本。
-
选择 Add model (添加模型)。
-
选择下一步。
规则是指在评估欺诈预测时指示 Amazon Fraud Detector 如何解释模型性能分数的条件。在本教程中,您将创建三条规则:high_fraud_risk
medium_fraud_risk
、和low_fraud_risk
。
-
在 “添加规则” 页的 “定义规则” 下,输入
high_fraud_risk
规则名称,在 “描述-可选” 下输入This rule captures events with a high ML model score
规则的描述。 -
在 E x pression 中,使用 Amazon Fraud Detector 简化规则表达式语言输入以下规则表达式:
$sample_fraud_detection_model_insightscore > 900
-
在结果中,选择创建新结果。结果是欺诈预测的结果,如果在评估期间规则匹配,则返回结果。
-
在创建新结果中,输入
verify_customer
作为结果名称。或者,输入描述。 -
选择 “保存结果”。
-
选择 “添加规则” 以运行规则验证检查器并保存规则。创建后,Amazon Fraud Detector 会使该规则可在您的检测器中使用。
-
选择 “添加其他规则”,然后选择 “创建规则” 选项卡。
-
再次重复此过程两次,使用以下
low_fraud_risk
规则详细信息创建您的medium_fraud_risk
和规则:-
中等欺诈风险
规则名称:
medium_fraud_risk
结果:
review
表达式:
$sample_fraud_detection_model_insightscore <= 900 and
$sample_fraud_detection_model_insightscore > 700
-
低欺诈风险
规则名称:
low_fraud_risk
结果:
approve
表达式:
$sample_fraud_detection_model_insightscore <= 700
这些值是本教程使用的示例。为自己的探测器创建规则时,请使用适合您的模型和用例的值,
-
-
创建所有三条规则后,选择 “下一步”。
检测器中包含的规则的规则执行模式决定是否对您定义的所有规则进行评估,或者规则评估是否在第一个匹配的规则处停止。规则顺序决定了您希望规则的运行顺序。
默认规则执行模式为FIRST_MATCHED
。
- 第一次匹配
-
第一个匹配的规则执行模式根据定义的规则顺序返回第一个匹配规则的结果。如果指定
FIRST_MATCHED
,Amazon Fraud Detector 会按顺序评估规则,从第一个到最后一个,在第一个匹配的规则处停止。然后,Amazon Fraud Detector 提供该单一规则的结果。您运行规则的顺序可能会影响生成的欺诈预测结果。创建规则后,按照以下步骤对规则进行重新排序,使其按所需顺序运行:
如果您的
high_fraud_risk
规则还不在规则列表的顶部,请选择顺序,然后选择 1。这将移high_fraud_risk
至第一个位置。重复此过程,使您的
medium_fraud_risk
规则位于第二位置,而您的low_fraud_risk
规则位于第三位置。 - 全部匹配
-
无论规则顺序如何,所有匹配的规则执行模式都会返回所有匹配规则的结果。如果指定
ALL_MATCHED
,Amazon Fraud Detector 会评估所有规则并返回所有匹配规则的结果。
选择FIRST_MATCHED
本教程,然后选择 “下一步”。
检测器版本定义了用于生成欺诈预测的特定模型和规则。
-
在查看和创建页面中,查看您配置的探测器详细信息、模型和规则。如果需要进行任何更改,请选择相应部分旁边的 Edit(编辑)。
-
选择 “创建探测器”。创建后,探测器的第一个版本将显示在探测器版本表中,并显示其
Draft
状态。您可以使用草稿版本来测试您的探测器。
在 Amazon Fraud Detector 控制台中,您可以使用带有运行测试功能的模拟数据来测试检测器的逻辑。在本教程中,您可以使用示例数据集中的账户注册数据。
-
滚动至 Det ector 版本详细信息页面底部的运行测试。
-
对于事件元数据,输入事件发生时间的时间戳,然后输入执行事件的实体的唯一标识符。在本教程中,从日期选择器中选择一个日期作为时间戳,然后输入 “1234” 作为实体 ID。
-
对于事件变量,输入要测试的变量值。在本教程中,您只需要
ip_address
和email_address
字段。这是因为它们是用于训练您的亚马逊Fraud Detector 模型的输入。您可以使用以下示例值。这假设你使用了建议的变量名:-
IP 地址:
205.251.233.178
-
电子邮件地址:
johndoe@exampledomain.com
-
-
选择 “运行测试”。
-
Amazon Fraud Detector 根据规则执行模式返回欺诈预测结果。如果规则执行模式为
FIRST_MATCHED
,则返回的结果对应于第一个匹配的规则。第一条规则是优先级最高的规则。如果评估为真,则表示匹配。如果规则执行模式为ALL_MATCHED
,则返回的结果对应于所有匹配的规则。这意味着它们都被评估为真实。Amazon Fraud Detector 还会返回添加到检测器中的任何模型的模型分数。您可以更改输入并运行几次测试以查看不同的结果。您可以使用示例数据集中的 ip_ad dress 和 e mail_ address 值进行测试,并检查结果是否符合预期。
-
当你对探测器的工作方式感到满意时,将其从提升
Draft
到Active
。这样做可以使检测器可用于实时欺诈检测。在 Det ector 版本详细信息页面上,选择操作、发布、发布版本。这会将探测器的状态从 “草稿” 更改为 “活动”。
此时,您的模型和相关的检测器逻辑已准备就绪,可以使用 Amazon Fraud Detector
GetEventPrediction
API 实时评估在线活动是否存在欺诈。您也可以使用 CSV 输入文件和CreateBatchPredictionJob
API 离线评估事件。有关欺诈预测的更多信息,请参阅欺诈预测
完成本教程后,您执行了以下操作:
-
将示例事件数据集上载到 Amazon S3。
-
使用示例数据集创建并训练了 Amazon Fraud Detector 欺诈检测模型。
-
查看了 Amazon Fraud Detector 生成的模型性能分数和其他性能指标。
-
部署了欺诈检测模型。
-
创建了探测器并添加了部署的模型。
-
向检测器添加了规则、规则执行顺序和结果。
-
通过提供不同的输入并检查规则和规则执行顺序是否按预期运行来测试检测器。
-
通过发布探测器将其激活。