增强的监控仪表板 - AWS 数据库迁移服务

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

增强的监控仪表板

增强的监控仪表板可让您全面了解与您的监控任务和复制实例相关的关键指标。它允许您筛选、汇总和可视化要跟踪的特定资源的指标。仪表板直接发布现有 CloudWatch 指标,使您无需更改数据点采样时间即可监控资源性能。

增强型监控仪表板概述

控制 AWS DMS 台中提供了增强型监控面板。它提供了一个用户友好的界面,带有直观的可视化和图表,使您能够有效地监控、分析和优化数据迁移流程。借助增强的监控功能,您可以通过集中查看所有相关信息来简化监控流程并快速识别潜在问题。

在增强型监控仪表板上,您可以查看任务和复制实例的指标以及终端节点的详细信息。您还可以跟踪当前区域的活动 CloudWatch 警报数量和服务运行状况。该控制面板适用于所有 AWS DMS 可用的商业区域。使用此仪表板无需支付额外费用。

注意

增强型监控仪表板不支持 AWS DMS 无服务器复制。

在增强型监控仪表板中查看指标

要在增强型监控控制面板中查看指标,请确保您拥有具有 CloudWatch 权限的IAM角色。此外,您还需要cloudwatch:DescribeAlarmshealth:DescribeEvents权限才能查看指标。最后,要访问增强型监控仪表板中的 CloudWatch 指标,您还必须有权访问IAM策略GetMetricDataAPI中的指标。如果没有这些权限或仅对其中一部分的权限APIs,您将无法在增强型监控控制面板中查看指标。有关所需IAM权限的信息,请参阅IAM使用所需的权限 AWS DMS

增强的监控仪表板视图

AWS DMS 增强型监控仪表板有两种类型的视图:“任务” 和 “复制” 实例视图。

任务视图

的增强型控制面板中的 “任务” 视图全面概述了您的数据迁移任务。 AWS DMS 此视图提供了一个集中位置,您可以在其中通过直观的图表和可视化来监控和分析任务的各个方面。

任务视图提供对与迁移任务相关的关键指标和统计数据的见解,使您能够更好地了解迁移任务的性能、进度和整体运行状况。以下是任务视图的一些主要功能和优点:

  • 任务状态摘要:此图表显示任务在不同状态类别中的分布情况,例如正在运行、已停止、失败或已完成。您可以快速识别需要注意的任务并采取适当的措施。

  • 性能指标:这些图表说明了任务的性能,包括吞吐量、延迟、CPU利用率等指标。这些指标可帮助您识别潜在的瓶颈并优化迁移流程。

  • 错误分析:如果任务失败或出错,任务视图会提供有关遇到的错误及其关联日志条目的详细信息。这些信息可以帮助您更有效地进行故障排除和解决问题。

  • 历史趋势:仪表板包含历史数据,允许您分析任务在一段时间内的执行情况。您可以根据这些历史趋势识别模式、跟踪进度并做出明智的决策。

  • 筛选和排序任务视图允许您根据各种标准(例如任务名称、标签或特定时间范围)对任务进行筛选和排序。这种灵活性使您可以专注于与您的需求最相关的任务或方面。

以下列表描述了您可以在任务视图中看到的指标:

  • 满载吞吐量带宽-来源:表示从源满负荷传输的传入数据,以 KB 每秒 KB 为单位。

  • 满载吞吐量带宽-目标:表示目标满负荷后传输的传出数据,以 KB 每秒 KB 为单位。

  • 满负荷吞吐量行数-来源:以每秒行数表示来自目标的满负荷后传入的更改。

  • 满负荷吞吐量行数-目标:以每秒行数表示目标满负荷后的传出变化。

  • CDC吞吐量带宽-来源:表示源的网络带宽,以 KB 每秒 KB 为单位。

    CDC吞吐量带宽记录采样点的带宽。如果未找到网络流量,则该值为零。由于CDC不会发出长时间运行的交易,因此可能不会记录网络流量。

  • CDC吞吐量带宽-目标:表示目标的网络带宽,以 KB 每秒 KB 为单位。

    CDC吞吐量带宽记录采样点的带宽。如果未找到网络流量,则该值为零。由于CDC不会发出长时间运行的交易,因此可能不会记录网络流量。

  • CDC吞吐量行-来源:以每秒行数表示来自源的传入任务更改。

  • CDC吞吐量行-目标:以每秒行数表示目标的传出任务更改。

  • CDClatency- source:表示从源端点捕获的最后一个事件与 AWS DMS 实例的当前系统时间戳之间的间隔(以秒为单位)。如果由于任务范围界定而未从源捕获任何更改,则 AWS DMS 将此值设置为零。

  • CDClatency-target:表示等待在目标上提交的第一个事件时间戳与实例的当前时间戳之间的间隔(以秒为单位)。 AWS DMS 如果存在未由 target 处理的交易,则会出现此值。否则,如果应用了所有事务,目标延迟会与源延迟相同。目标延迟永远不应小于源延迟。

  • CPU利用率:表示任务CPU在多个内核中使用的百分比。任务CPUUtilization的语义与复制实例的语义略有不同。CPUUtilizaiton如果完全使用 1 vCPU,则表示 100%;但如果使用多个 v, vCPUs 则该值可能超过 100%。

  • 内存使用情况:表示任务memory.usage_in_bytes消耗的控制组 (cgroup)。 AWS DMS 使用 cgroups 来控制系统资源的使用,例如内存和。CPU该指标表示在为任务分配的 cgroup 中,该任务的内存使用量,以 MB 为单位。

    cgroup 限制基于您的 AWS DMS 复制实例类的可用资源。 memory.usage_in_bytes由内存的驻留集大小 (RSS)、缓存和交换组件组成。如果需要,操作系统可以回收缓存。我们建议您同时监控复制实例指标 AvailableMemory。

    AWS DMS 将此指标与 CloudWatch 控制台ReplicationTaskIdentifier中的ReplicationInstanceIdentifer和的组合维度相提并论。使用ReplicationInstanceIdentifierReplicationTaskIdentifier类别查看此指标。

  • 验证记录数:只有在为 AWS DMS 任务启用验证后,才会显示此图表。这是可用于该 AWS DMS 任务的验证指标的组合,其中包括以下内容:

    • ValidationSucceededRecordCount— 每分钟 AWS DMS 验证的行数。

    • ValidationAttemptedRecordCount— 每分钟尝试验证的行数。

    • ValidationFailedOverallCount— 验证失败的行数。

    • ValidationSuspendedOverallCount-暂停验证的行数。

    • ValidationPendingOverallCount— 验证仍处于待处理状态的行数。

除了上述指标外,您还可以自定义 “任务” 视图,并通过将其添加为小组件来添加其他指标。有关这些指标的信息,我们建议您查看以下文档:

复制实例视图

复制实例视图全面概述了您的复制实例,使您能够有效地监控和管理您的数据复制基础架构。此视图提供了一个集中位置,您可以在其中通过直观的图表和可视化来分析复制实例的各个方面。

Replicati on 实例视图可让您深入了解与您的复制实例相关的关键指标和统计数据,从而更好地了解其性能、资源利用率和整体运行状况。以下是复制实例视图的一些主要功能和优点:

  • 实例状态摘要:此图表显示所选复制实例的详细信息,例如可用区、实例类别、引擎版本、分配的存储空间和当前的运行状况。

  • 资源利用率:仪表板显示的图表说明您的复制实例的资源利用率,包括内存和磁盘使用率等CPU指标。这些指标可帮助您确定潜在的资源限制并优化您的复制基础架构。

  • 历史趋势:控制面板包含历史数据,允许您分析复制实例在一段时间内的表现。您可以根据这些历史趋势识别模式、跟踪变化并做出明智的决策。

  • 筛选和排序复制实例视图允许您根据各种标准(例如实例名称或特定时间范围)对复制实例进行筛选和排序。这种灵活性使您可以专注于与您的需求最相关的实例或方面。

以下列表描述了您可以在复制实例视图中看到的指标:

  • CloudWatch al arms:表示 AWS/DMS命名空间中警报的摘要。

  • CPU利用率:表示任务CPU在多个内核中使用的百分比。任务的语义与CPUUtilization复制的语义略有不同。CPUUtilizaiton如果完全使用 1 vCPU,则表示 100%;但如果使用多个 v, vCPUs 则该值可能超过 100%。

  • 每个实例的任务的内存使用情况:表示任务占用的驻留集大小 (RSS)。它表示任务占用的内存部分,保存在主存储器中 (RAM)。由于部分占用的内存被分页出来,或者部分可执行文件从未被加载,因此MemoryUsage不包括交换空间或文件系统中保存的内存。

  • 内存:表示可用、正在使用或可以腾出的内存量,以及已使用的交换空间量。

  • 可用内存:表示无需交换即可启动新应用程序的内存的估计值。

  • 可用内存:表示可供应用程序、页面缓存和内核自己的数据结构使用的物理内存量。

  • 可释放内存:可释放内存并不表示实际可用的可用内存。当前正在使用的内存可以释放并用于其他用途。它是复制时使用的缓冲区和缓存的组合。

  • 交换空间使用情况:表示复制实例上使用的交换空间量。

  • 可用存储空间:表示以字节为单位的可用存储空间量。

除了上述指标外,您还可以自定义 Replication 实例视图,并通过将其添加为小组件来包含其他指标。有关这些指标的信息,我们建议您查看以下文档:

保留增强的监控指标

默认情况下,增强型监控指标遵循 CloudWatch 指标的保留政策。有关更改保留策略的信息,请参阅 Amazon CloudWatch 用户指南中的 “在 CloudWatch 日志中更改日志数据保留期”。