我们不再更新 Amazon Machine Learning 服务,也不再接受新用户使用该服务。本文档可供现有用户使用,但我们不会再对其进行更新。有关更多信息,请参阅什么是 Amazon Machine Learning。
Amazon Machine Learning 流程
下表描述了如何使用 Amazon ML 控制台执行本文档中概述的 ML 流程。
ML 流程 |
Amazon ML 任务 |
---|---|
分析您的数据 |
要在 Amazon ML 中分析您的数据,请创建数据源并查看数据洞察页面。 |
将数据拆分为训练数据源和评估数据源 |
Amazon ML 可以拆分数据源以将 70% 的数据用于模型训练,将 30% 的数据用于评估模型的预测性能。 在您使用“创建机器学习模型”向导和默认设置时,Amazon ML 会为您拆分数据。 如果您使用“创建机器学习模型”向导以及自定义设置,并且选择评估 ML 模型,您会看到一个选项,该选项允许 Amazon ML 为您拆分数据并对 30% 的数据运行评估。 |
将训练数据乱序化 |
在您使用“创建机器学习模型”向导和默认设置时,Amazon ML 为您乱序数据。您也可以在将数据导入 Amazon ML 之前将其乱序。 |
处理特征 |
将训练数据一起置入优化格式用于学习和归纳的处理称为特征转换。在您使用“创建机器学习模型”向导和默认设置时,Amazon ML 将推荐您数据的特征处理设置。 要指定特征处理设置,请使用“创建 ML 模型”向导的自定义选项并提供特征处理配方。 |
训练模型 |
使用“创建机器学习模型”向导在 Amazon ML 中创建模型时,Amazon ML 会训练您的模型。 |
选择模型参数 |
在 Amazon ML 中,您可以优化影响模型预测性能的四个参数:模型大小,扫描次数,乱序类型以及正则化。在使用“创建 ML 模型”向导创建 ML 模型并选择自定义选项时,您可以设置这些参数。 |
评估模型性能 |
使用“Create Evaluation”向导可评估您模型的预测性能。 |
特征选择 |
Amazon ML 学习算法可以删除对学习过程没有多大帮助的特征。要指示您希望删除这些特征,请在创建 ML 模型时选择 |
为预测精度设置分数阈值 |
检查评估报告中不同分数阈值下模型的预测性能,然后根据您的业务应用设置分数阈值。分数阈值确定模型如何定义预测匹配。调整数字以控制错误肯定和错误否定。 |
使用模型 |
使用您的模型,通过“Create Batch Prediction”向导获取一批观察的预测。 或者,使用 |