

AWS Data Pipeline 不再向新客户提供。的现有客户 AWS Data Pipeline 可以继续照常使用该服务。[了解详情](https://aws.amazon.com/blogs/big-data/migrate-workloads-from-aws-data-pipeline/)

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# AWS Data Pipeline 极限
<a name="dp-limits"></a>

 为确保所有用户都有容量， AWS Data Pipeline 会对您可以分配的资源和分配资源的速率施加限制。

**Topics**
+ [账户限制](#dp-limits-account)
+ [Web 服务调用限制](#dp-limits-web-service)
+ [扩展注意事项](#dp-scaling-considerations)

## 账户限制
<a name="dp-limits-account"></a>

以下限制适用于单个 AWS 账户。如果您需要额外容量，可以使用 [Amazon Web Services 支持中心请求表](https://console.aws.amazon.com/support/home#/case/create?issueType=service-limit-increase&limitType=service-code-datapipe)增加容量。


| 属性 | 限制 | 可调整 | 
| --- | --- | --- | 
| 管线数量 | 100 | 是 | 
| 每个管道的对象数量 | 100 | 是 | 
| 每个对象的活动实例数量 | 5 | 是 | 
| 每个对象的字段数量 | 50 | 不可以 | 
| 每个字段名或标识符的 UTF8 字节数 | 256 | 否 | 
| 每个字段的 UTF8 字节数 | 10240 | 否 | 
| 每个对象的 UTF8 字节数 | 15360（包括字段名） | 否 | 
| 对象的实例创建速率 | 每 5 分钟一个 | 否 | 
| 管道活动的重试次数 | 每个任务 5 次 | 否 | 
| 重试之间的最短延迟 | 2 分钟 | 否 | 
| 最短计划时间间隔 | 15 分钟 | 否 | 
| 单个对象的累计最大数量 | 32 | 否 | 
| 每个 Ec2Resource 对象的最大 EC2 实例数 | 1 | 否 | 

## Web 服务调用限制
<a name="dp-limits-web-service"></a>

 AWS Data Pipeline 限制了您可以调用 Web 服务 API 的速率。这些限制也适用于代表您调用 Web 服务 API 的 AWS Data Pipeline 代理，例如控制台、CLI 和任务运行器。

以下限制适用于单个 AWS 账户。这意味着，该账户的总使用量（包括 用户产生的使用量）不能超过这些限制。

 突增速率可让您在非活动期间节省 Web 服务调用并在很短的时间内扩展这些调用。例如， CreatePipeline 固定速率为每五秒钟一个呼叫。如果在 30 秒内未调用该服务，则会节省 6 次调用。您可以随后在 1 秒内调用 6 次 Web 服务。由于该值低于突增限制并确保您的平均调用次数符合常规速率限制，因此，您的调用不受限制。

 如果您超出速率限制和突增限制，则您的 Web 服务调用将失败并返回限制异常。任务运行程序工作线程的默认实施自动重试发生限制异常的失败 API 调用。任务运行程序使用退避，以便后续 API 调用尝试具有逐渐增加的间隔。如果您编写工作线程，我们建议您实施类似的重试逻辑。

这些限制适用于个人 AWS 账户。


| API  | 常规速率限制 | 突增限制 | 
| --- | --- | --- | 
| ActivatePipeline | 每秒调用 1 次 | 100 次调用 | 
| CreatePipeline | 每秒调用 1 次 | 100 次调用 | 
| DeletePipeline | 每秒调用 1 次 | 100 次调用 | 
| DescribeObjects | 每秒调用 2 次 | 100 次调用 | 
| DescribePipelines | 每秒调用 1 次 | 100 次调用 | 
| GetPipelineDefinition | 每秒调用 1 次 | 100 次调用 | 
| PollForTask | 每秒调用 2 次 | 100 次调用 | 
| ListPipelines | 每秒调用 1 次 | 100 次调用 | 
| PutPipelineDefinition | 每秒调用 1 次 | 100 次调用 | 
| QueryObjects | 每秒调用 2 次 | 100 次调用 | 
| ReportTaskProgress | 每秒调用 10 次 | 100 次调用 | 
| SetTaskStatus | 每秒调用 10 次 | 100 次调用 | 
| SetStatus | 每秒调用 1 次 | 100 次调用 | 
| ReportTaskRunnerHeartbeat | 每秒调用 1 次 | 100 次调用 | 
| ValidatePipelineDefinition | 每秒调用 1 次 | 100 次调用 | 

## 扩展注意事项
<a name="dp-scaling-considerations"></a>

 AWS Data Pipeline 可扩展以容纳大量并发任务，您可以将其配置为自动创建处理大型工作负载所需的资源。这些自动创建的资源由您控制，并计入您的 AWS 账户资源限制。例如，如果您配置 AWS Data Pipeline 为自动创建一个 20 个节点的 Amazon EMR 集群来处理数据，并且 AWS 您的账户的 EC2 实例限制设置为 20，则可能会无意中耗尽可用的回填资源。因此，在设计中请考虑这些资源限制或相应增加您的账户限制。

如果您需要额外容量，可以使用 [Amazon Web Services 支持中心请求表](https://console.aws.amazon.com/support/home#/case/create?issueType=service-limit-increase&limitType=service-code-datapipe)增加容量。