本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
自定义模型
在 Amazon SageMaker Canvas 中,您可以训练根据您的特定数据和用例量身定制的自定义机器学习模型。通过基于数据训练自定义模型,您可以捕获最能代表您数据的特定特征和趋势。例如,您可能需要创建一个自定义的时间序列预测模型,利用仓库中的库存数据对其进行训练,以管理您的物流运营。
Canvas 支持训练一系列模型类型。训练自定义模型后,您可以评估模型的性能和准确性。对模型感到满意后,您可以对新数据进行预测,还可以选择与数据科学家共享自定义模型以进行进一步分析,或者将其部署到 SageMaker 托管端点进行实时推理,所有这些都可以在Canvas应用程序中完成。
您可以基于以下类型的数据集训练 Canvas 自定义模型:
-
表格(包括数字、分类、时间序列和文本数据)
-
图像
下表显示了您可以在 Canvas 中构建的自定义模型类型及其支持的数据类型和数据源。
模型类型 | 使用案例示例 | 支持的数据类型 | 支持的数据来源 |
---|---|---|---|
数值预测 |
根据面积等特征预测房价 |
数值 |
本地上传、Amazon S3、SaaS 连接器 |
2 类别预测 |
预测客户是否可能流失 |
二进制或分类 |
本地上传、Amazon S3、SaaS 连接器 |
3+ 类别预测 |
预测患者出院后的预后 |
分类 |
本地上传、Amazon S3、SaaS 连接器 |
时间序列预测 |
预测下一季度的库存 |
时间序列 |
本地上传、Amazon S3、SaaS 连接器 |
单标签图像预测 |
预测图像中的制造缺陷类型 |
图片 (JPG,PNG) |
本地上传、Amazon S3 |
多元文本预测 |
根据商品描述预测商品类别,例如服装、电子产品或家居用品 |
来源列:文本 目标列:二进制或分类列 |
本地上传、Amazon S3 |
开始使用
要开始构建自定义模型并使用自定义模型生成预测,请执行以下操作:
-
确定您的使用案例和要构建的模型类型。有关自定义模型类型的更多信息,请参阅 自定义模型的工作原理。有关自定义模型支持的数据类型和来源的更多信息,请参阅 数据导入。
-
导入数据至 Canvas。您可以使用满足输入要求的任何表格或图像数据集构建自定义模型。有关输入要求的更多信息,请参阅 创建数据集。
要详细了解所提供的可供您 SageMaker 进行实验的示例数据集,请参阅画布中的示例数据集。
-
构建您的自定义模型。您可以进行快速构建以便更快地获得模型并开始预测,也可以进行标准构建以提高准确性。
对于数值、分类和时间序列预测模型类型,您可以使用 Data Wrangler 功能清理和准备数据。在 Data Wrangler 中,您可以创建数据流并使用各种数据准备技术,例如应用高级转换或连接数据集。对于图像预测模型,您可以编辑图像数据集以更新标签或添加和删除图像。请注意,您无法将这些功能用于多元文本预测模型。
-
评估模型的性能,确定其在实际数据中的表现。
-
(可选)对于某些模型类型,您可以与 Amazon SageMaker Studio Classic 中的数据科学家合作,他们可以帮助审查和改进您的模型。
-
使用您的模型进行单一预测或批量预测。
注意
如果你在 Amazon SageMaker Studio Classic 中已经有一位经过训练的模型想与 Canvas 共享,你可以将自己的模型带到 SageMaker Canvas。查看BYOM先决条件以确定您的模型是否符合共享条件。