选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

Amazon SageMaker 推理推荐器

聚焦模式
Amazon SageMaker 推理推荐器 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon SageMaker 推理推荐器是 Ama SageMaker zon AI 的一项功能。它通过在 SageMaker AI ML 实例之间自动执行负载测试和模型调整,缩短了将机器学习 (ML) 模型投入生产所需的时间。您可以使用 Inference Recommender 将模型部署到以最低成本提供最佳性能的实时推理端点。Inference Recommender 可帮助您为机器学习模型和工作负载选择最佳实例类型和配置。它考虑的因素包括实例数量、容器参数、模型优化、最大并发量和内存大小等。

Amazon SageMaker Inference Reverence Recommerder 仅向您收取任务执行期间使用的实例费用。

工作方式

要使用 Amazon SageMaker Inference Recommerder,您可以创建 A SageMaker I 模型,也可以使用模型工件将 SageMaker 模型注册到模型注册表中。使用 AWS SDK for Python (Boto3) 或 SageMaker AI 控制台针对不同的 A SageMaker I 端点配置运行基准测试作业。Inference Recommender 作业有助于您收集和可视化性能和资源利用率方面的指标,以便您决定选择哪种端点类型和配置。

如何开始

如果您是首次使用 Amazon SageMaker Inference 推荐器,我们建议您执行以下操作:

  1. 通读使用 Amazon SageMaker 推理推荐器的先决条件本节,确保您满足使用 Amazon SageMaker Inference Recommerder 的要求。

  2. 阅读使用 Amazon SageMaker 推理推荐器推荐作业部分,启动您的第一个 Inference Recommender 推荐作业。

  3. 探索 Amazon SageMaker Inference 推荐器 Jupyter 笔记本入门示例,或者查看下一节中的示例笔记本。

示例笔记本

以下示例 Jupyter 笔记本有助于您完成 Inference Recommender 中多个使用案例的工作流:

隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。