选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

正在监控 Amazon Comprehend 终端节点

聚焦模式
正在监控 Amazon Comprehend 终端节点 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

您可以通过增加或减少推理单元的数量(IUs)来调整终端节点的吞吐量。有关更新您的终端节点的更多信息,请参阅 正在更新 Amazon Comprehend 终端节点

您可以通过使用 Amazon CloudWatch 控制台监控终端节点的使用情况来确定如何最好地调整终端节点的吞吐量。

使用监控您的终端节点使用情况 CloudWatch
  1. 登录 AWS Management Console 并打开CloudWatch 控制台

  2. 请在左侧选择指标,然后选择全部指标

  3. 全部指标下,选择 Comprehend

    控制台显示指标页面,显示了 Comprehend 面板。
  4. CloudWatch 控制台显示 Comprehend 指标的维度。选择EndpointArn维度。

    控制台显示的 Amazon Comprehend 指标页面显示该维度。EndpointArn

    控制台会显示每个终端节点InferenceUtilizationProvisionedInferenceUnitsRequestedInferenceUnitsConsumedInferenceUnits、、和。

    CloudWatch 控制台显示了四个指标。

    选择四个指标,然后导航到 “图表化指标” 选项卡。

  5. RequestedInferenceUnits和的统计数据列设置ConsumedInferenceUnits总和

  6. 将的 “统计数据” 列设置InferenceUtilization为 “总和”。

  7. 将 “统计数据” 列设置ProvisionedInferenceUnits为 “平均值”。

  8. 将所有指标的周期列更改为 1 分钟

  9. 选择InferenceUtilization并选择箭头,将其移动到单独的 Y 轴

    您的图表已准备好进行分析。

    显示图表指标的控制台显示屏。

根据这些 CloudWatch 指标,您还可以设置 auto scaling 以自动调整终端节点的吞吐量。有关更多在终端节点上使用自动扩缩信息,请参阅 使用终端节点自动扩缩

  • ProvisionedInferenceUnits-此指标表示发出请求 IUs 时的平均预配置数量。

  • RequestedInferenceUnits-这是基于提交给服务且发送待处理的每个请求的使用情况。这有助于将发送的待处理请求与实际处理的请求进行比较,而不会受到限制 () ConsumedInferenceUnits。该指标的值的计算方法是,将发送的待处理字符数除以每分钟可处理的字符数,得出 1 IU。

  • ConsumedInferenceUnits-这是基于向服务成功处理(未限制)提交的每个请求的使用情况。当您将消耗的资源与预配置的消耗量进行比较时,这会很有帮助。 IUs该指标的计算方法是将处理的字符数除以每分钟1个 IU 可以处理的字符数。

  • InferenceUtilization-这是根据请求发出的。该值的计算方法是将 IUs 定义的ConsumedInferenceUnits消耗量除以ProvisionedInferenceUnits并转换为 100 中的百分比。

注意

只有成功请求时才会发出所有指标。如果该指标来自因内部服务器错误或客户错误而受到节流或失败的请求,则不会显示该指标。

隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。