Amazon Machine Learning 流程 - Amazon Machine Learning

我们不再更新 Amazon Machine Learning 服务,也不再接受新用户使用该服务。本文档可供现有用户使用,但我们不会再对其进行更新。有关更多信息,请参阅什么是 Amazon Machine Learning

Amazon Machine Learning 流程

下表描述了如何使用 Amazon ML 控制台执行本文档中概述的 ML 流程。

ML 流程

Amazon ML 任务

分析您的数据

要在 Amazon ML 中分析您的数据,请创建数据源并查看数据洞察页面。

将数据拆分为训练数据源和评估数据源

Amazon ML 可以拆分数据源以将 70% 的数据用于模型训练,将 30% 的数据用于评估模型的预测性能。

在您使用“创建机器学习模型”向导和默认设置时,Amazon ML 会为您拆分数据。

如果您使用“创建机器学习模型”向导以及自定义设置,并且选择评估 ML 模型,您会看到一个选项,该选项允许 Amazon ML 为您拆分数据并对 30% 的数据运行评估。

将训练数据乱序化

在您使用“创建机器学习模型”向导和默认设置时,Amazon ML 为您乱序数据。您也可以在将数据导入 Amazon ML 之前将其乱序。

处理特征

将训练数据一起置入优化格式用于学习和归纳的处理称为特征转换。在您使用“创建机器学习模型”向导和默认设置时,Amazon ML 将推荐您数据的特征处理设置。

要指定特征处理设置,请使用“创建 ML 模型”向导的自定义选项并提供特征处理配方。

训练模型

使用“创建机器学习模型”向导在 Amazon ML 中创建模型时,Amazon ML 会训练您的模型。

选择模型参数

在 Amazon ML 中,您可以优化影响模型预测性能的四个参数:模型大小,扫描次数,乱序类型以及正则化。在使用“创建 ML 模型”向导创建 ML 模型并选择自定义选项时,您可以设置这些参数。

评估模型性能

使用“Create Evaluation”向导可评估您模型的预测性能。

特征选择

Amazon ML 学习算法可以删除对学习过程没有多大帮助的特征。要指示您希望删除这些特征,请在创建 ML 模型时选择 L1 regularization 参数。

为预测精度设置分数阈值

检查评估报告中不同分数阈值下模型的预测性能,然后根据您的业务应用设置分数阈值。分数阈值确定模型如何定义预测匹配。调整数字以控制错误肯定和错误否定。

使用模型

使用您的模型,通过“Create Batch Prediction”向导获取一批观察的预测。

或者,使用 Predict API 启用 ML 模型来处理实时预测,按需获得个别观察的预测。