View a markdown version of this page

Amazon Machine Learning 流程 - Amazon Machine Learning

Amazon Machine Learning 流程

下表描述了如何使用 Amazon ML 控制台执行本文档中概述的 ML 流程。

ML 流程	Amazon ML 任务
分析您的数据	要在 Amazon ML 中分析您的数据，请创建数据源并查看数据洞察页面。
将数据拆分为训练数据源和评估数据源	Amazon ML 可以拆分数据源以将 70% 的数据用于模型训练，将 30% 的数据用于评估模型的预测性能。在您使用“创建机器学习模型”向导和默认设置时，Amazon ML 会为您拆分数据。如果您使用“创建机器学习模型”向导以及自定义设置，并且选择评估 ML 模型，您会看到一个选项，该选项允许 Amazon ML 为您拆分数据并对 30% 的数据运行评估。
将训练数据乱序化	在您使用“创建机器学习模型”向导和默认设置时，Amazon ML 为您乱序数据。您也可以在将数据导入 Amazon ML 之前将其乱序。
处理特征	将训练数据一起置入优化格式用于学习和归纳的处理称为特征转换。在您使用“创建机器学习模型”向导和默认设置时，Amazon ML 将推荐您数据的特征处理设置。要指定特征处理设置，请使用“创建 ML 模型”向导的自定义选项并提供特征处理配方。
训练模型	使用“创建机器学习模型”向导在 Amazon ML 中创建模型时，Amazon ML 会训练您的模型。
选择模型参数	在 Amazon ML 中，您可以优化影响模型预测性能的四个参数：模型大小，扫描次数，乱序类型以及正则化。在使用“创建 ML 模型”向导创建 ML 模型并选择自定义选项时，您可以设置这些参数。
评估模型性能	使用“Create Evaluation”向导可评估您模型的预测性能。
特征选择	Amazon ML 学习算法可以删除对学习过程没有多大帮助的特征。要指示您希望删除这些特征，请在创建 ML 模型时选择 `L1 regularization` 参数。
为预测精度设置分数阈值	检查评估报告中不同分数阈值下模型的预测性能，然后根据您的业务应用设置分数阈值。分数阈值确定模型如何定义预测匹配。调整数字以控制错误肯定和错误否定。
使用模型	使用您的模型，通过“Create Batch Prediction”向导获取一批观察的预测。或者，使用 `Predict` API 启用 ML 模型来处理实时预测，按需获得个别观察的预测。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

在新数据上重新训练模型

设置 Amazon Machine Learning