를 사용한 모니터링을 위한 Amazon MSK 지표 CloudWatch - Amazon Managed Streaming for Apache Kafka

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

를 사용한 모니터링을 위한 Amazon MSK 지표 CloudWatch

Amazon은 Amazon 클러스터에 대한 지표를 수집, 확인 및 분석할 CloudWatch 수 CloudWatch 있도록 Amazon과 MSK 통합됩니다MSK. MSK 클러스터에 대해 구성하는 지표는 1분 간격으로 자동으로 수집되고 CloudWatch 로 푸시됩니다. MSK 클러스터의 모니터링 수준을 DEFAULT, PER_BROKERPER_TOPIC_PER_BROKER, 또는 중 하나로 설정할 수 있습니다PER_TOPIC_PER_PARTITION. 다음 섹션의 표에는 각 모니터링 수준부터 사용할 수 있는 모든 지표가 나와 있습니다.

참고

CloudWatch 모니터링을 위한 일부 Amazon MSK 지표의 이름이 버전 3.6.0 이상에서 변경되었습니다. 해당 지표를 모니터링할 때 새 이름을 사용하세요. 이름이 변경된 지표의 경우 아래 표에 버전 3.6.0 이상에서 사용된 이름과 버전 2.8.2.tired에서 사용된 이름이 차례로 나와 있습니다.

DEFAULT-수준 지표는 무료입니다. 다른 지표에 대한 요금은 Amazon CloudWatch 요금 페이지에 설명되어 있습니다.

DEFAULT 수준 모니터링

다음 표에 설명된 지표는 DEFAULT 모니터링 수준에서 사용할 수 있습니다. 무료로 제공됩니다.

DEFAULT 모니터링 수준에서 사용 가능한 지표
명칭 표시되는 경우 Dimensions 설명
ActiveControllerCount 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름 클러스터당 하나의 컨트롤러만 지정된 시간에 활성화되어야 합니다.
BurstBalance

클러스터가 ACTIVE 상태로 전환된 후.

클러스터 이름, 브로커 ID

클러스터의 EBS 볼륨에 대한 입력-출력 버스트 크레딧의 나머지 잔액입니다. 지연 시간 또는 처리량 감소를 조사하는 데 사용합니다.

BurstBalance 는 EBS 볼륨의 기준 성능이 최대 버스트 성능보다 높은 경우 볼륨에 대해 보고되지 않습니다. 자세한 내용은 I/O 크레딧 및 버스트 성능을 참조하세요.

BytesInPerSec 주제를 생성한 후. 클러스터 이름, 브로커 ID, 주제 클라이언트로부터 받은 초당 바이트 수입니다. 이 지표는 브로커별 및 주제별로 제공됩니다.
BytesOutPerSec 주제를 생성한 후. 클러스터 이름, 브로커 ID, 주제 클라이언트에 전송된 초당 바이트 수입니다. 이 지표는 브로커별 및 주제별로 제공됩니다.
ClientConnectionCount 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID, 클라이언트 인증 인증된 활성 클라이언트 연결 수입니다.
ConnectionCount 클러스터가 ACTIVE 상태로 전환된 후.

클러스터 이름, 브로커 ID

활성 인증, 미인증 및 브로커 간 연결 수입니다.
CPUCreditBalance

클러스터가 ACTIVE 상태로 전환된 후.

클러스터 이름, 브로커 ID

브로커가 시작된 이후 발생한 적립 CPU 크레딧 수입니다. 크레딧은 획득 이후에 크레딧 밸런스에 누적되고, 소비 시 크레딧 밸런스에서 소멸됩니다. CPU 크레딧 잔액이 부족하면 클러스터의 성능에 부정적인 영향을 미칠 수 있습니다. CPU 부하를 줄이기 위한 조치를 취할 수 있습니다. 예를 들어 클라이언트 요청 수를 줄이거나 브로커 유형을 M5 브로커 유형으로 업데이트할 수 있습니다.

CpuIdle 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID CPU 유휴 시간의 백분율입니다.
CpuIoWait 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 보류 중인 디스크 작업 중 CPU 유휴 시간의 백분율입니다.
CpuSystem 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 커널 공간 CPU 내 의 백분율입니다.
CpuUser 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 사용자 공간 CPU 내 의 백분율입니다.
GlobalPartitionCount 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름 클러스터의 모든 주제에서 복제본을 제외한 파티션 수입니다. GlobalPartitionCount 에는 복제본이 포함되지 않으므로 항목의 복제 인수가 1보다 큰 GlobalPartitionCount 경우보다 PartitionCount 값의 합계가 높을 수 있습니다.
GlobalTopicCount 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름 클러스터의 모든 브로커에 있는 총 주제 수입니다.
EstimatedMaxTimeLag 소비자 그룹이 주제에서 소비한 후. 소비자 그룹, 주제 MaxOffsetLag를 배출하는 데 걸리는 예상 시간(초)입니다.
KafkaAppLogsDiskUsed 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 애플리케이션 로그에 사용된 디스크 공간의 백분율입니다.
KafkaDataLogsDiskUsed(Cluster Name, Broker ID 차원) 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 데이터 로그에 사용된 디스크 공간의 백분율입니다.
KafkaDataLogsDiskUsed(Cluster Name 차원) 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름 데이터 로그에 사용된 디스크 공간의 백분율입니다.
LeaderCount 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커당 총 파티션 리더 수(복제본 제외)입니다.
MaxOffsetLag 소비자 그룹이 주제에서 소비한 후. 소비자 그룹, 주제 주제의 모든 파티션에 대한 최대 오프셋 지연입니다.
MemoryBuffered 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커에 대한 버퍼링된 메모리의 크기(바이트)입니다.
MemoryCached 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커에 대한 캐시 메모리의 크기(바이트)입니다.
MemoryFree 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커에 사용할 수 있는 메모리의 크기(바이트)입니다.
HeapMemoryAfterGC

클러스터가 ACTIVE 상태로 전환된 후.

클러스터 이름, 브로커 ID

가비지 수집 이후 사용된 총 힙 메모리의 백분율입니다.
MemoryUsed 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커에서 사용 중인 메모리의 크기(바이트)입니다.
MessagesInPerSec 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커의 초당 수신 메시지 수입니다.
NetworkRxDropped 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 삭제된 수신 패키지의 수입니다.
NetworkRxErrors 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커에 대한 네트워크 수신 오류 수입니다.
NetworkRxPackets 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커에서 수신된 패킷 수입니다.
NetworkTxDropped 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 삭제된 전송 패키지의 수입니다.
NetworkTxErrors 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커의 네트워크 전송 오류 수입니다.
NetworkTxPackets 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커가 전송한 패킷 수입니다.
OfflinePartitionsCount 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름 클러스터에서 오프라인 상태인 총 파티션 수입니다.
PartitionCount 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 복제본을 포함하여 브로커당 주제 파티션의 총 개수입니다.
ProduceTotalTimeMsMean 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 밀리초 단위의 평균 생산 시간.
RequestBytesMean 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커에 대한 요청 바이트의 평균 수입니다.
RequestTime 요청 조절이 적용된 후. 클러스터 이름, 브로커 ID 브로커 네트워크 및 I/O 스레드가 요청을 처리하는 데 소비한 평균 시간(밀리초)입니다.
RootDiskUsed 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커가 사용하는 루트 디스크의 백분율입니다.
SumOffsetLag 소비자 그룹이 주제에서 소비한 후. 소비자 그룹, 주제 주제의 모든 파티션에 대한 집계된 오프셋 지연입니다.
SwapFree 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커에서 사용할 수 있는 스왑 메모리의 크기(바이트)입니다.
SwapUsed 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커에서 사용 중인 스왑 메모리의 크기(바이트)입니다.
TrafficShaping

클러스터가 ACTIVE 상태로 전환된 후.

클러스터 이름, 브로커 ID

네트워크 할당 초과로 인해 형성(삭제 또는 대기열에 추가)된 패킷 수를 나타내는 상위 수준 지표입니다. PER_BROKER 지표에서 더 세밀한 세부 정보를 사용할 수 있습니다.

UnderMinIsrPartitionCount 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커의 minIsr 파티션 수입니다.
UnderReplicatedPartitions 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID 브로커에 대해 복제가 덜 진행된 파티션 수입니다.
ZooKeeperRequestLatencyMsMean 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID ZooKeeper기반 클러스터의 경우. 브로커의 Apache ZooKeeper 요청에 대한 밀리초 단위의 평균 지연 시간입니다.
ZooKeeperSessionState 클러스터가 ACTIVE 상태로 전환된 후. 클러스터 이름, 브로커 ID ZooKeeper기반 클러스터의 경우. 브로커 ZooKeeper 세션의 연결 상태는 NOT_CONNECTED: '0.0', ASSOCIATING: '0.1', CONNECTING: '0.5', CONNECTEDREADONLY: '0.8', CONNECTED: '1.0', CLOSED: '5.0', AUTH_FAILED: '10.0' 중 하나일 수 있습니다.

PER_BROKER 수준 모니터링

모니터링 수준을 PER_BROKER로 설정하면 모든 DEFAULT 수준 지표 외에 다음 표에 설명된 지표가 표시됩니다. 다음 표의 지표에 해당하는 비용을 지불하지만 DEFAULT 수준 지표는 계속 무료로 제공됩니다. 이 표에 있는 지표의 차원은 클러스터 이름, 브로커 ID입니다.

PER_BROKER 모니터링 수준부터 사용할 수 있는 추가 지표
명칭 표시되는 경우 설명
BwInAllowanceExceeded 클러스터가 ACTIVE 상태로 전환된 후.

인바운드 집계 대역폭이 브로커의 최대치를 초과하여 형성된 패킷 수입니다.

BwOutAllowanceExceeded 클러스터가 ACTIVE 상태로 전환된 후.

아웃바운드 집계 대역폭이 브로커의 최대치를 초과하여 형성된 패킷 수입니다.

ConnTrackAllowanceExceeded 클러스터가 ACTIVE 상태로 전환된 후.

연결 추적이 브로커의 최대치를 초과하여 형성된 패킷 수입니다. 연결 추적은 설정된 각 연결을 추적하여 반환 패킷이 예상대로 전달되도록 하는 보안 그룹과 관련이 있습니다.

ConnectionCloseRate 클러스터가 ACTIVE 상태로 전환된 후.

리스너당 초당 닫힌 연결 수입니다. 이 숫자는 리스너별로 집계되며 클라이언트 리스너에 대해 필터링됩니다.

ConnectionCreationRate 클러스터가 ACTIVE 상태로 전환된 후.

리스너당 초당 설정된 새 연결 수입니다. 이 숫자는 리스너별로 집계되며 클라이언트 리스너에 대해 필터링됩니다.

CpuCreditUsage 클러스터가 ACTIVE 상태로 전환된 후.

브로커가 사용한 CPU 크레딧 수입니다. CPU 크레딧 밸런스가 부족하면 클러터의 성능에 부정적인 영향을 미칠 수 있습니다. CPU 부하를 줄이기 위한 조치를 취할 수 있습니다. 예를 들어 클라이언트 요청 수를 줄이거나 브로커 유형을 M5 브로커 유형으로 업데이트할 수 있습니다.

FetchConsumerLocalTimeMsMean 생산자/소비자가 만들어진 이후. 소비자 요청이 리더에서 처리되는 평균 시간(밀리초)입니다.
FetchConsumerRequestQueueTimeMsMean 생산자/소비자가 만들어진 이후. 소비자 요청이 요청 대기열에서 대기하는 평균 시간(밀리초)입니다.
FetchConsumerResponseQueueTimeMsMean 생산자/소비자가 만들어진 이후. 소비자 요청이 응답 대기열에서 대기하는 평균 시간(밀리초)입니다.
FetchConsumerResponseSendTimeMsMean 생산자/소비자가 만들어진 이후. 소비자가 응답을 보내는 평균 시간(밀리초)입니다.
FetchConsumerTotalTimeMsMean 생산자/소비자가 만들어진 이후. 소비자가 브로커에서 데이터를 가져오는 데 소요하는 평균 총 시간(밀리초)입니다.
FetchFollowerLocalTimeMsMean 생산자/소비자가 만들어진 이후. 팔로어 요청이 리더에서 처리되는 평균 시간(밀리초)입니다.
FetchFollowerRequestQueueTimeMsMean 생산자/소비자가 만들어진 이후. 팔로어 요청이 요청 대기열에서 대기하는 평균 시간(밀리초)입니다.
FetchFollowerResponseQueueTimeMsMean 생산자/소비자가 만들어진 이후. 팔로어 요청이 응답 대기열에서 대기하는 평균 시간(밀리초)입니다.
FetchFollowerResponseSendTimeMsMean 생산자/소비자가 만들어진 이후. 팔로어가 응답을 보내는 평균 시간(밀리초)입니다.
FetchFollowerTotalTimeMsMean 생산자/소비자가 만들어진 이후. 팔로어가 브로커에서 데이터를 가져오는 데 소비하는 평균 총 시간(밀리초)입니다.
FetchMessageConversionsPerSec 주제를 생성한 후. 브로커의 초당 가져오기 메시지 변환 횟수입니다.
FetchThrottleByteRate 대역폭 조절이 적용된 후. 초당 병목 현상 바이트 수입니다.
FetchThrottleQueueSize 대역폭 조절이 적용된 후. 조절 대기열에 있는 메시지 수입니다.
FetchThrottleTime 대역폭 조절이 적용된 후. 평균 가져오기 조절 시간(밀리초)입니다.
IAMNumberOfConnectionRequests 클러스터가 ACTIVE 상태로 전환된 후. 초당 IAM 인증 요청 수입니다.
IAMTooManyConnections 클러스터가 ACTIVE 상태로 전환된 후. 100개를 초과하여 시도된 연결 수입니다. 0은 연결 수가 한도 내에 있음을 의미합니다. >0인 경우 스로틀 제한이 초과되므로 연결 수를 줄여야 합니다.
NetworkProcessorAvgIdlePercent 클러스터가 ACTIVE 상태로 전환된 후. 네트워크 프로세서가 유휴 상태인 시간의 평균 백분율입니다.
PpsAllowanceExceeded 클러스터가 ACTIVE 상태로 전환된 후.

양방향이 브로커의 최대값을 PPS 초과했기 때문에 형성된 패킷 수입니다.

ProduceLocalTimeMsMean 클러스터가 ACTIVE 상태로 전환된 후. 리더에서 요청이 처리되는 평균 시간(밀리초)입니다.
ProduceMessageConversionsPerSec 주제를 생성한 후. 브로커의 초당 생산 메시지 변환 수입니다.
ProduceMessageConversionsTimeMsMean 클러스터가 ACTIVE 상태로 전환된 후. 메시지 형식 변환에 소요된 평균 시간(밀리초)입니다.
ProduceRequestQueueTimeMsMean 클러스터가 ACTIVE 상태로 전환된 후. 요청 메시지가 대기열에 소비하는 평균 시간(밀리초)입니다.
ProduceResponseQueueTimeMsMean 클러스터가 ACTIVE 상태로 전환된 후. 응답 메시지가 대기열에서 소비하는 평균 시간(밀리초)입니다.
ProduceResponseSendTimeMsMean 클러스터가 ACTIVE 상태로 전환된 후. 응답 메시지를 보내는 데 소비한 평균 시간(밀리초)입니다.
ProduceThrottleByteRate 대역폭 조절이 적용된 후. 초당 병목 현상 바이트 수입니다.
ProduceThrottleQueueSize 대역폭 조절이 적용된 후. 조절 대기열에 있는 메시지 수입니다.
ProduceThrottleTime 대역폭 조절이 적용된 후. 평균 생산 조절 시간(밀리초)입니다.
ProduceTotalTimeMsMean 클러스터가 ACTIVE 상태로 전환된 후. 밀리초 단위의 평균 생산 시간.

RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered)

생산자/소비자가 생성된 후.

소비자 가져오기에 대한 응답으로 계층형 스토리지에서 전송된 총 바이트 수입니다. 이 지표에는 다운스트림 데이터 전송 트래픽에 기여하는 모든 주제 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. KIP-405 지표입니다.

RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered)

생산자/소비자가 생성된 후.

로그 세그먼트, 인덱스, 기타 보조 파일의 데이터를 포함하여 계층화된 스토리지로 전송된 총 바이트 수입니다. 이 지표에는 업스트림 데이터 전송 트래픽에 기여하는 모든 토픽 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. KIP-405 지표입니다.

RemoteLogManagerTasksAvgIdlePercent

클러스터가 ACTIVE 상태로 전환된 후.

원격 로그 관리자가 유휴 상태로 보낸 평균 시간 비율입니다. 원격 로그 관리자는 브로커에서 계층화된 스토리지로 데이터를 전송합니다. 범주는 내부 활동입니다. KIP-405 지표입니다.
RemoteLogReaderAvgIdlePercent

클러스터가 ACTIVE 상태로 전환된 후.

원격 로그 리더가 유휴 상태로 보낸 평균 시간 비율입니다. 원격 로그 리더는 소비자의 가져오기에 대한 응답으로 원격 스토리지에서 브로커로 데이터를 전송합니다. 범주는 내부 활동입니다. KIP-405 지표입니다.
RemoteLogReaderTaskQueueSize

클러스터가 ACTIVE 상태로 전환된 후.

예약 대기 중인 계층형 스토리지에서 읽기를 담당하는 작업의 수입니다. 범주는 내부 활동입니다. KIP-405 지표입니다.
RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered)

클러스터가 ACTIVE 상태로 전환된 후.

지정된 브로커가 소비자 가져오기에 대한 응답으로 데이터를 검색하기 위해 계층화된 스토리지로 전송한 읽기 요청에 대한 총 오류 발생율입니다. 이 지표에는 다운스트림 데이터 전송 트래픽에 영향을 미치는 모든 주제 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. KIP-405 지표입니다.
RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered)

클러스터가 ACTIVE 상태로 전환된 후.

지정한 브로커가 소비자 가져오기에 대한 응답으로 데이터를 검색하기 위해 계층화된 스토리지로 전송한 총 읽기 요청 수입니다. 이 지표에는 다운스트림 데이터 전송 트래픽에 영향을 미치는 모든 주제 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. KIP-405 지표입니다.
RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered)

클러스터가 ACTIVE 상태로 전환된 후.

지정된 브로커가 데이터를 업스트림으로 전송하기 위해 계층화된 스토리지로 전송한 쓰기 요청에 대한 응답으로 발생한 총 오류 발생율입니다. 이 지표에는 업스트림 데이터 전송 트래픽에 영향을 미치는 모든 주제 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. KIP-405 지표입니다.
ReplicationBytesInPerSec 주제를 생성한 후. 다른 브로커로부터 수신하는 초당 바이트 수입니다.
ReplicationBytesOutPerSec 주제를 생성한 후. 다른 브로커로 전송되는 초당 바이트 수입니다.
RequestExemptFromThrottleTime 요청 조절이 적용된 후. 브로커 네트워크 및 I/O 스레드가 조절에서 제외된 요청을 처리하는 데 소비한 평균 시간(밀리초)입니다.
RequestHandlerAvgIdlePercent 클러스터가 ACTIVE 상태로 전환된 후. 요청 핸들러 스레드가 유휴 상태인 시간의 평균 백분율입니다.
RequestThrottleQueueSize 요청 조절이 적용된 후. 조절 대기열에 있는 메시지 수입니다.
RequestThrottleTime 요청 조절이 적용된 후. 평균 요청 조절 시간(밀리초)입니다.
TcpConnections 클러스터가 ACTIVE 상태로 전환된 후.

SYN 플래그가 설정된 수신 및 발신 TCP 세그먼트 수를 표시합니다.

RemoteCopyLagBytes (TotalTierBytesLag in v2.8.2.tiered) 주제를 생성한 후. 브로커에서 계층화할 수 있지만 아직 계층화된 스토리지로 전송되지 않은 데이터의 총 바이트 수입니다. 이 지표는 업스트림 데이터 전송의 효율성을 보여줍니다. 지연이 증가하면 계층형 스토리지에 유지되지 않는 데이터의 양이 증가합니다. 범주는 아카이브 지연입니다. 이는 KIP-405 지표가 아닙니다.
TrafficBytes 클러스터가 ACTIVE 상태로 전환된 후.

클라이언트(생산자 및 소비자)와 브로커 간의 네트워크 트래픽을 전체 바이트 단위로 표시합니다. 브로커 사이의 트래픽은 보고되지 않습니다.

VolumeQueueLength 클러스터가 ACTIVE 상태로 전환된 후.

지정된 기간 동안 완료되기를 기다리는 읽기 및 쓰기 작업 요청의 수입니다.

VolumeReadBytes 클러스터가 ACTIVE 상태로 전환된 후.

지정된 기간 동안 읽은 바이트 수입니다.

VolumeReadOps 클러스터가 ACTIVE 상태로 전환된 후.

지정된 기간 동안의 읽기 작업 횟수입니다.

VolumeTotalReadTime 클러스터가 ACTIVE 상태로 전환된 후.

지정된 기간에 완료된 모든 읽기 작업에 소요된 총 시간(초)입니다.

VolumeTotalWriteTime 클러스터가 ACTIVE 상태로 전환된 후.

지정된 기간에 완료된 모든 쓰기 작업에 소요된 총 시간(초)입니다.

VolumeWriteBytes 클러스터가 ACTIVE 상태로 전환된 후.

지정된 기간 동안 기록된 바이트 수입니다.

VolumeWriteOps 클러스터가 ACTIVE 상태로 전환된 후.

지정된 기간 동안의 쓰기 작업 횟수입니다.

PER_TOPIC_PER_BROKER 수준 모니터링

모니터링 수준을 로 설정하면 PER_BROKER 및 DEFAULT 수준의 모든 지표 외에도 다음 표에 설명된 지표를 PER_TOPIC_PER_BROKER얻을 수 있습니다. DEFAULT 수준 지표만 무료입니다. 이 표에 있는 지표의 차원은 클러스터 이름, 브로커 ID, 주제입니다.

중요

Apache Kafka 2.4.1 이상 버전을 사용하는 Amazon MSK 클러스터의 경우 다음 표의 지표는 값이 0이 아닌 상태가 된 후에만 나타납니다. 예를 들어, BytesInPerSec를 보려면 하나 이상의 생산자가 먼저 클러스터로 데이터를 전송해야 합니다.

PER_TOPIC_PER_BROKER 모니터링 수준부터 사용할 수 있는 추가 지표
명칭 표시되는 경우 설명
FetchMessageConversionsPerSec 주제를 생성한 후. 초당 가져와서 변환한 메시지 수입니다.
MessagesInPerSec 주제를 생성한 후. 초당 수신된 메시지 수입니다.
ProduceMessageConversionsPerSec 주제를 생성한 후. 생산된 메시지의 초당 변환 수입니다.
RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered)

주제 생성 후 해당 주제가 생산/소비되고 있는 경우.

지정된 주제 및 브로커에 대한 소비자 가져오기에 대한 응답으로 계층형 스토리지에서 전송된 바이트 수입니다. 이 지표에는 지정된 브로커의 다운스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. KIP-405 지표입니다.

RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered) 주제 생성 후 해당 주제가 생산/소비되고 있는 경우.

지정된 주제 및 브로커에 대해 계층형 스토리지로 전송된 바이트 수입니다. 이 지표에는 지정된 브로커의 업스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. 이는 KIP-405 지표입니다.

RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered) 주제 생성 후 해당 주제가 생산/소비되고 있는 경우. 지정된 주제에 대한 소비자 가져오기에 대한 응답으로 데이터를 검색하기 위해 지정된 브로커가 계층화된 스토리지로 보내는 읽기 요청에 대한 응답으로 발생하는 오류의 비율입니다. 이 지표에는 지정된 브로커의 다운스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. KIP-405 지표입니다.
RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered) 주제 생성 후 해당 주제가 생산/소비되고 있는 경우. 지정된 주제에 대한 소비자 가져오기에 대한 응답으로 데이터를 검색하기 위해 지정한 브로커가 계층화된 스토리지로 보내는 읽기 요청의 수입니다. 이 지표에는 지정된 브로커의 다운스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. KIP-405 지표입니다.
RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered) 주제 생성 후 해당 주제가 생산/소비되고 있는 경우. 지정된 브로커가 데이터를 업스트림으로 전송하기 위해 계층형 스토리지로 보내는 쓰기 요청에 대한 응답으로 발생하는 오류의 비율입니다. 이 지표에는 지정된 브로커의 업스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. KIP-405 지표입니다.

PER_TOPIC_PER_PARTITION 수준 모니터링

모니터링 수준을 로 설정하면 PER_TOPIC_PER_PARTITION, PER_TOPIC_PER_BROKER PER_BROKER및 DEFAULT 수준에서 모든 지표 외에도 다음 표에 설명된 지표를 얻을 수 있습니다. DEFAULT 수준 지표만 무료입니다. 이 표의 지표에는 소비자 그룹, 주제, 파티션 등의 차원이 있습니다.

PER_TOPIC_PER_PARTITION 모니터링 수준부터 사용할 수 있는 추가 지표
명칭 표시되는 경우 설명
EstimatedTimeLag 소비자 그룹이 주제에서 소비한 후. 파티션 오프셋 지연을 배출하는 데 걸리는 예상 시간(초)입니다.
OffsetLag 소비자 그룹이 주제에서 소비한 후. 파티션 수준 소비자 지연의 오프셋 수입니다.