AWS Data Pipeline 한도 - AWS Data Pipeline

AWS Data Pipeline 신규 고객은 더 이상 이용할 수 없습니다. 의 기존 고객 AWS Data Pipeline 정상적으로 서비스를 계속 사용할 수 있습니다. 자세히 알아보기

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

AWS Data Pipeline 한도

모든 사용자가 사용할 수 있는 용량을 확보하기 위해 AWS Data Pipeline은 할당할 수 있는 리소스와 리소스를 할당할 수 있는 속도에 제한을 둡니다.

계정 제한

단일 AWS 계정에 다음과 같은 제한이 적용됩니다. 추가 용량이 필요할 경우 Amazon Web Services Support Center 요청 양식을 사용하여 용량을 늘릴 수 있습니다.

속성 한도 조정 가능
파이프라인 수 100
파이프라인당 객체 수 100
객체당 활성 인스턴스 수 5
객체당 필드 수 50 아니요
필드 이름 또는 식별자당 UTF8 바이트 수 256 아니요
필드당 UTF8 바이트 수 10,240 아니요
객체당 UTF8 바이트 수 15,360(필드 이름 포함) 아니요
객체에서 인스턴스의 생성 속도 5분당 1 아니요
파이프라인 활동의 재시도 작업당 5 아니요
재시도 간 최소 지연 2 minutes 아니요
최소 일정 간격 15분 아니요
단일 객체에 롤업할 수 있는 최대 수 32 아니요
Ec2Resource 객체당 최대 EC2 인스턴스 수 1 아니요

웹 서비스 호출 제한

AWS Data Pipeline은 웹 서비스 API를 호출할 수 있는 속도를 제한합니다. 이러한 제한은 콘솔, CLI, 등과 같은 사용자를 대신하여 웹 서비스 API를 호출하는 AWS Data Pipeline에이전트에도 적용됩니다.

단일 AWS 계정에 다음과 같은 제한이 적용됩니다. 따라서 사용자를 포함해 계정 총 사용량이 이 한계를 초과하지 못합니다.

버스트 속도를 사용하면 비활성 기간에 웹 서비스 호출을 저장했다가 단시간에 모두 소비할 수 있습니다. 예를 들어, CreatePipeline의 일반 호출 속도는 5초당 1회입니다. 30초 동안 서비스를 호출하지 않으면 6개 호출이 저장됩니다. 이후 웹 서비스를 1초에 6회 호출할 수 있을 것입니다. 이것은 버스트 제한 미만이고, 평균 호출이 일반 속도 제한으로 유지되기 때문에 호출이 정체되지 않습니다.

속도 제한과 버스트 제한을 초과하면 웹 서비스 호출이 안 되고 조절 예외가 반환됩니다. 작업자의 기본 구현인 Task Runner는 전송률 조절 예외로 인해 실패한 API 호출을 자동으로 재시도합니다. Task Runner에는 백오프 기능이 있어서 이후에 API를 호출하려는 시도가 점점 더 긴 간격으로 발생합니다. 작업자에게 알릴 경우 유사한 재시도 논리를 실행하는 것이 좋습니다.

이러한 제한은 개별 AWS 계정을 기준으로 적용됩니다.

API 일반 속도 제한 버스트 제한
ActivatePipeline 초당 호출 1회 100회 호출
CreatePipeline 초당 호출 1회 100회 호출
DeletePipeline 초당 호출 1회 100회 호출
DescribeObjects 초당 호출 2회 100회 호출
DescribePipelines 초당 호출 1회 100회 호출
GetPipelineDefinition 초당 호출 1회 100회 호출
PollForTask 초당 호출 2회 100회 호출
ListPipelines 초당 호출 1회 100회 호출
PutPipelineDefinition 초당 호출 1회 100회 호출
QueryObjects 초당 호출 2회 100회 호출
ReportTaskProgress 초당 호출 10회 100회 호출
SetTaskStatus 초당 호출 10회 100회 호출
SetStatus 초당 호출 1회 100회 호출
ReportTaskRunnerHeartbeat 초당 호출 1회 100회 호출
ValidatePipelineDefinition 초당 호출 1회 100회 호출

조정 고려 사항

AWS Data Pipeline은 동시에 엄청나게 많은 수의 작업을 감당할 수 있도록 조정되므로, 대용량 워크로드를 처리할 때 필요한 리소스를 자동으로 생성하도록 구성할 수 있습니다. 이렇게 자동으로 생성된 리소스는 사용자가 제어할 수 있으며, AWS 계정 리소스 제한을 기준으로 계수할 수 있습니다. 예를 들어, 20 노드 Amazon EMR 클러스터를 자동으로 생성하여 데이터를 처리하도록 AWS Data Pipeline을(를) 구성하고, AWS계정의 EC2 인스턴스 제한이 20으로 설정된 경우, 가용 채우기 리소스를 본의 아니게 소모할 수 있습니다. 따라서 디자인할 때 이러한 리소스 제한을 고려하거나 계정 한계를 알맞게 늘리는 것이 좋습니다.

추가 용량이 필요할 경우 Amazon Web Services Support Center 요청 양식을 사용하여 용량을 늘릴 수 있습니다.