

我们不再更新 Amazon Machine Learning 服务，也不再接受新用户使用该服务。本文档可供现有用户使用，但我们不会再对其进行更新。有关更多信息，请参阅[什么是 Amazon Machine Learning](https://docs.aws.amazon.com/machine-learning/latest/dg/what-is-amazon-machine-learning.html)。

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 系统地阐述问题
<a name="formulating-the-problem"></a>

机器学习的第一步是确定您希望预测的内容，这称为标签答案或目标答案。假设一个您要制造产品的场景，但您制造每个产品的决策取决于潜在的销售量。在此场景中，您希望预测每个产品将被购买的次数（预测的销售量）。可以使用机器学习以多种方法定义此问题。根据您的使用案例或业务需求选择如何定义问题。

您是否希望预测您的客户将对每个产品进行的购买数（这种情况下目标是数字，您要解决回归问题）？ 或者，您是否只想预测哪些产品将获得 10 次以上的购买（在这种情况下，目标为二进制，您要解决二进制分类问题）？

重要的是避免过度复杂化问题并制定满足您需求的最简单解决方案。但是，避免丢失信息（特别是历史答案中的信息）也很重要。在这里，将过去的实际销售数量转换为二进制变量“over 10”与“fewer”时，会丢失有价值的信息。投入一些时间来决定预测哪个目标对您最有意义，可以帮助您避免构建无法回答您问题的模型。