本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
创建影子测试
您可以创建影子测试,将影子变体的性能与生产变体进行比较。您可以在提供推理请求服务的现有端点上运行测试,也可以创建一个新端点来运行测试。
要创建影子测试,您需要指定以下内容:
-
生产变体,可接收并响应 100% 的传入推理请求。
-
影子变体,可接收一定比例的传入请求,从生产变体中复制,但不返回任何响应。
对于每个变体,您可以使用 SageMaker 来控制模型、实例类型和实例数量。您可以配置要复制到影子变体的传入请求的百分比,即流量采样百分比。 SageMaker 管理对你的影子变体的请求的复制,你可以在安排或运行测试时修改流量采样百分比。您还可以选择开启 Data Capture 以记录生产变体和影子变体的请求和响应。
注意
SageMaker 每个端点最多支持一个阴影变体。对于具有影子变体的端点,最多只能有一个生产变体。
您可以安排测试在任何时间开始,并在指定时间内持续进行。默认持续时间为 7 天,最长持续时间为 30 天。测试完成后,端点会恢复到开始测试前的状态。这可确保您在测试完成后无需手动清理资源。
您可以通过 SageMaker 控制台中的仪表板监控正在运行的测试。此控制面板提供了生产变体和影子变体之间调用指标和实例指标的并排比较,以及相关指标统计的表格视图。此控制面板也可用于已完成的测试。查看完指标后,您可以选择将影子变体推广为新的生产变体,也可以选择保留现有的生产变体。推广影子变体后,它会响应所有传入的请求。有关更多信息,请参阅 推广影子变体。
以下过程介绍如何通过 SageMaker 控制台创建影子测试。根据您是要使用现有端点还是要为影子测试创建新端点,工作流会有所变化。
先决条件
在使用 SageMaker 控制台创建阴影测试之前,必须准备好可用的 SageMaker 模型。有关如何创建 SageMaker 模型的更多信息,请参阅部署模型以进行实时推理。
你可以从包含生产变体和影子变体的现有端点、只有生产变体的现有端点,或者只使用你想要比较的 SageMaker 模型开始影子测试。影子测试支持在测试开始前创建端点和添加变体。
注意
某些端点功能可能会使您的端点与影子测试不兼容。如果您的终端节点使用以下任何功能,则无法在终端节点上使用影子测试,并且您设置影子测试的请求将导致验证错误。
无服务器推理
异步推理
Marketplace 容器
多容器端点
多模型端点
使用 Inf1(基于 Inferentia)实例的端点
输入影子测试详细信息
要开始创建影子测试,请按以下步骤填写输入影子测试详细信息页面:
-
打开控制SageMaker 台
。 -
在左侧导航面板中选择推理,然后选择影子测试。
-
选择创建影子测试。
-
在名称下,输入测试名称。
-
(可选)在描述下,输入测试的描述。
-
(可选)使用键和值对指定标签。
-
选择下一步。
输入影子测试设置
填写输入影子测试详细信息页面后,填写输入影子测试设置页面。如果您已经拥有 SageMaker 推理端点和生产变体,请按照使用现有终端节点工作流程进行操作。如果您还没有端点,请按照创建新端点工作流进行操作。
完成上述步骤后,您现在应该有一个计划在指定的开始日期和时间开始的测试。您可以从控制面板查看测试进度。有关查看测试和您可以执行的操作的更多信息,请参阅如何查看、监视和编辑影子测试。