本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
您可以通过增加或减少推理单元的数量(IUs)来调整终端节点的吞吐量。有关更新您的终端节点的更多信息,请参阅 正在更新 Amazon Comprehend 终端节点。
您可以通过使用 Amazon CloudWatch 控制台监控终端节点的使用情况来确定如何最好地调整终端节点的吞吐量。
使用监控您的终端节点使用情况 CloudWatch
-
登录 AWS Management Console 并打开CloudWatch 控制台
。 -
请在左侧选择指标,然后选择全部指标。
-
在全部指标下,选择 Comprehend。
-
CloudWatch 控制台显示 Comprehend 指标的维度。选择EndpointArn维度。
控制台会显示每个终端节点InferenceUtilization的ProvisionedInferenceUnitsRequestedInferenceUnitsConsumedInferenceUnits、、和。
选择四个指标,然后导航到 “图表化指标” 选项卡。
-
将RequestedInferenceUnits和的统计数据列设置ConsumedInferenceUnits为总和。
-
将的 “统计数据” 列设置InferenceUtilization为 “总和”。
-
将 “统计数据” 列设置ProvisionedInferenceUnits为 “平均值”。
-
将所有指标的周期列更改为 1 分钟。
-
选择InferenceUtilization并选择箭头,将其移动到单独的 Y 轴。
您的图表已准备好进行分析。
根据这些 CloudWatch 指标,您还可以设置 auto scaling 以自动调整终端节点的吞吐量。有关更多在终端节点上使用自动扩缩信息,请参阅 使用终端节点自动扩缩。
-
ProvisionedInferenceUnits-此指标表示发出请求 IUs 时的平均预配置数量。
-
RequestedInferenceUnits-这是基于提交给服务且发送待处理的每个请求的使用情况。这有助于将发送的待处理请求与实际处理的请求进行比较,而不会受到限制 () ConsumedInferenceUnits。该指标的值的计算方法是,将发送的待处理字符数除以每分钟可处理的字符数,得出 1 IU。
-
ConsumedInferenceUnits-这是基于向服务成功处理(未限制)提交的每个请求的使用情况。当您将消耗的资源与预配置的消耗量进行比较时,这会很有帮助。 IUs该指标的计算方法是将处理的字符数除以每分钟1个 IU 可以处理的字符数。
-
InferenceUtilization-这是根据请求发出的。该值的计算方法是将 IUs 定义的ConsumedInferenceUnits消耗量除以ProvisionedInferenceUnits并转换为 100 中的百分比。
注意
只有成功请求时才会发出所有指标。如果该指标来自因内部服务器错误或客户错误而受到节流或失败的请求,则不会显示该指标。