控制表任务设置 - AWS 数据库迁移服务

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

控制表任务设置

控制表提供有关 AWS DMS 任务的信息。它们还提供有用的统计数据,可用来计划和管理当前迁移任务和将来任务。可以在JSON文件中应用这些任务设置,也可以在 AWS DMS 控制台的 “创建任务” 页面上选择 “高级设置”。将始终在数据库目标上创建应用异常表(dmslogs.awsdms_apply_exceptions)。有关如何使用任务配置文件来设置任务设置的信息,请参阅任务设置示例

AWS DMS 仅在 CDC Full Load + CDC 或仅限满载任务期间创建控制表,而不会在 “仅限满载” 任务期间创建控制表。

对于满载和CDC(迁移现有数据并复制正在进行的更改)和CDC仅限(仅复制数据更改)任务,您还可以创建其他表,包括以下表:

  • 复制状态(dmslogs.awsdms_status)– 此表提供有关当前任务的详细信息。其中包括任务状态、任务使用的内存量以及尚未应用于目标的更改的数量。此表还给出了源数据库中当前 AWS DMS 正在读取的位置。此外,它还会指示任务是处于满负荷阶段还是更改数据捕获 (CDC)。

  • 暂停的表(dmslogs.awsdms_suspended_tables)– 该表提供一系列暂停的表及其暂停原因。

  • 复制历史记录(dmslogs.awsdms_history)– 此表提供有关复制历史记录的信息。此信息包括任务期间处理的记录数量和数量、任务结束时的延迟以及其他统计信息。CDC

应用例外表 (dmslogs.awsdms_apply_exceptions) 包含以下参数。

类型 描述

TASK_NAME

nvchar

AWS DMS 任务的资源 ID。资源 ID 可以在任务中找到ARN。

TABLE_OWNER

nvchar

表所有者。

TABLE_NAME

nvchar

表名称。

ERROR_TIME

时间戳

异常 (错误) 的出现时间。

STATEMENT

nvchar

出错时运行的语句。

ERROR

nvchar

错误名称和描述。

复制状态表 (dmslogs.awsdms_status) 包含任务和目标数据库的当前状态。它具有以下设置。

类型 描述

SERVER_NAME

nvchar

复制任务运行于的计算机的名称。

TASK_NAME

nvchar

AWS DMS 任务的资源 ID。资源 ID 可以在任务中找到ARN。

TASK_STATUS

varchar

下列值之一:

  • FULL LOAD

  • CHANGE PROCESSING (CDC)

  • NOT RUNNING

FULLLOAD只要至少有一张表处于满负荷状态,任务状态就会设置为。加载完所有表后,任务状态将更改为 “CHANGEPROCESSING如果已启CDC用”。任务设置为NOTRUNNING在开始任务之前或任务完成之后。

STATUS_TIME

时间戳

任务状态的时间戳。

PENDING_CHANGES

int

在源数据库中提交并缓存在复制实例的内存和磁盘中的更改记录的数量。

DISK_SWAP_SIZE

int

旧的或卸载的事务所占用的磁盘空间量。

TASK_MEMORY

int

当前使用的内存 (以 MB 为单位)。

SOURCE_CURRENT

_POSITION

varchar

源数据库中当前 AWS DMS 正在读取数据的位置。

SOURCE_CURRENT

_TIMESTAMP

时间戳

源数据库中当前 AWS DMS 正在读取的时间戳。

SOURCE_TAIL

_POSITION

varchar

未提交的最早开始事务的位置。此值是可在不丢失任何更改的情况下恢复到的最新位置。

SOURCE_TAIL

_TIMESTAMP

时间戳

未提交的最早开始事务的时间戳。此值是可在不丢失任何更改的情况下恢复到的最新时间戳。

SOURCE_TIMESTAMP

_APPLIED

时间戳

最后一个事务提交的时间戳。在批量应用过程中,此值是批处理中最后一个事务的提交时间戳。

暂停表(dmslogs.awsdms_suspended_tables)包含以下参数。

类型 描述

SERVER_NAME

nvchar

复制任务运行于的计算机的名称。

TASK_NAME

nvchar

AWS DMS 任务的名称

TABLE_OWNER

nvchar

表所有者。

TABLE_NAME

nvchar

表名称。

SUSPEND_REASON

nvchar

暂停的原因。

SUSPEND_TIMESTAMP

时间戳

暂停发生的时间。

复制历史记录表 (dmslogs.awsdms_history) 包含以下参数。

类型 描述

SERVER_NAME

nvchar

复制任务运行于的计算机的名称。

TASK_NAME

nvchar

AWS DMS 任务的资源 ID。资源 ID 可以在任务中找到ARN。

TIMESLOT_TYPE

varchar

下列值之一:

  • FULL LOAD

  • CHANGE PROCESSING (CDC)

如果任务同时满负荷运行CDC,则会向该时隙写入两条历史记录。

TIMESLOT

时间戳

时段的结束时间戳。

TIMESLOT_DURATION

int

时段的持续时间(以分钟为单位)。

TIMESLOT_LATENCY

int

时段结束时的目标延迟(以秒为单位)。此值仅适用于CDC时段。

RECORDS

int

时段内处理的记录数。

TIMESLOT_VOLUME

int

已处理的数据量(以 MB 为单位)。

验证失败表(awsdms_validation_failures_v1)包含任务的所有数据验证失败。有关更多信息,请参阅数据验证故障排除

其他控制表设置包括:

  • HistoryTimeslotInMinutes – 使用该选项指示复制历史记录表中每个时段的长度。默认值为 5 分钟。

  • ControlSchema— 使用此选项来指明 AWS DMS 目标控制表的数据库架构名称。如果未为选项输入任何信息,则表将复制到数据库中的默认位置,如下所示:

    • PostgreSQL,公众

    • Oracle,目标架构

    • 微软SQL服务器,目标数据库中的 dbo

    • 天哪SQL,awsdms_control

    • MariaDB,awsdms_control

    • Amazon Redshift,公共

    • DynamoDB,创建作为数据库中的单独表

    • IBMdb2,awsdms_cont LUW rol