Amazon CloudWatch를 사용한 모니터링
Amazon CloudWatch는 Windows File Server용 FSx 파일 시스템에서 원시 데이터를 수집하고 처리하여 실시간에 가까운 가독성 있는 지표로 변환합니다. 이러한 통계는 15개월 동안 보관되므로 과거 정보에 액세스하여 워크플로 또는 파일 시스템의 성능을 파악하는 데 도움이 되는 관점을 얻을 수 있습니다.
FSx for Windows File Server는 다음 도메인에 CloudWatch 지표를 게시합니다.
네트워크 I/O 지표는 파일 시스템에 액세스하는 클라이언트와 파일 서버 간의 활동을 측정합니다.
파일 서버 지표는 네트워크 처리량 사용률, 파일 서버 CPU 및 메모리, 파일 서버 디스크 처리량 및 IOPS 사용률을 측정합니다.
디스크 I/O 지표는 파일 서버와 스토리지 볼륨 간의 활동을 측정합니다.
스토리지 볼륨 지표는 HDD 스토리지 볼륨의 디스크 처리량 사용률과 SSD 스토리지 볼륨의 IOPS 사용률을 측정합니다.
스토리지 용량 지표는 데이터 중복 제거로 인한 스토리지 절감을 포함하여 스토리지 사용량을 측정합니다.
다음 다이어그램은 Windows File Server용 FSx 파일 시스템, 해당 구성 요소 및 지표 도메인을 보여줍니다.
기본적으로 Amazon FSx for Windows File Server는 1분 간격으로 CloudWatch에 지표 데이터를 전송합니다. 단, 5분 간격으로 전송되는 다음 지표는 예외입니다.
FileServerDiskThroughputBalance
FileServerDiskIopsBalance
CloudWatch에 대한 자세한 내용은 Amazon CloudWatch 사용 설명서의 Amazon CloudWatch란 무엇인가요?를 참조하세요.
파일 시스템 유지 관리 또는 인프라 구성 요소 교체 중에는 단일 AZ 파일 시스템에 대한 지표가 게시되지 않고, 기본 파일 서버와 보조 파일 서버 간의 장애 조치 및 페일백 중에는 다중 AZ 파일 시스템에 대한 지표가 게시되지 않을 수 있습니다.
일부 Amazon FSx CloudWatch 지표는 원시 바이트로 보고됩니다. 바이트는 단위의 십진수나 이진수에 반올림되지 않습니다.
CloudWatch 지표 및 차원
FSx for Windows File Server는 모든 파일 시스템에 대해 Amazon CloudWatch의 AWS/FSx
네임스페이스에 다음과 같은 지표를 게시합니다.
DataReadBytes
DataWriteBytes
DataReadOperations
DataWriteOperations
MetadataOperations
FreeStorageCapacity
Windows File Server용 FSx는 처리량 용량이 32MBps 이상으로 구성된 파일 시스템에 대해 다음 섹션에 설명된 지표를 Amazon CloudWatch의 AWS/FSx
네임스페이스에 게시합니다.
네트워크 I/O 지표
AWS/FSx
네임스페이스에는 다음 네트워크 I/O 지표가 포함되어 있습니다.
지표 | 설명 |
---|---|
DataReadBytes |
파일 시스템에 액세스하는 클라이언트의 읽기 작업에 대한 바이트 수입니다. 단위: 바이트 유효한 통계: |
DataWriteBytes |
파일 시스템에 액세스하는 클라이언트의 쓰기 작업에 대한 바이트 수입니다. 단위: 바이트 유효한 통계: |
DataReadOperations |
파일 시스템에 액세스하는 클라이언트의 읽기 작업 수입니다. 단위: 개 유효한 통계: |
DataWriteOperations |
파일 시스템에 액세스하는 클라이언트의 쓰기 작업 수입니다. 단위: 개 유효한 통계: |
MetadataOperations |
파일 시스템에 액세스하는 클라이언트의 메타데이터 작업 수입니다. 단위: 개 유효한 통계: |
ClientConnections |
클라이언트와 파일 서버 간의 활성 연결 수입니다. 단위: 개 |
파일 서버 지표
AWS/FSx
네임스페이스에는 다음과 같은 파일 서버 지표가 포함되어 있습니다.
지표 | 설명 |
---|---|
NetworkThroughputUtilization |
파일 시스템에 액세스하는 클라이언트의 네트워크 처리량(프로비저닝된 한도 대비 백분율)입니다. 단위: 백분율 |
CPUUtilization |
파일 서버의 CPU 리소스 사용률입니다. 단위: 백분율 |
MemoryUtilization |
파일 서버의 메모리 리소스 사용률입니다. 단위: 백분율 |
FileServerDiskThroughputUtilization |
파일 서버와 스토리지 볼륨 간의 디스크 처리량(처리량 용량에 따라 결정된 프로비저닝된 한도의 백분율)입니다. 단위: 백분율 |
FileServerDiskThroughputBalance |
파일 서버와 스토리지 볼륨 간의 디스크 처리량에 사용할 수 있는 버스트 크레딧의 비율입니다. 처리량 용량이 256MBps 이하로 프로비저닝된 파일 시스템에 유효합니다. 단위: 백분율 |
FileServerDiskIopsUtilization |
파일 서버와 스토리지 볼륨 간의 디스크 IOPS(처리량 용량에 따라 결정된 프로비저닝된 한도의 백분율)입니다. 단위: 백분율 |
FileServerDiskIopsBalance |
파일 서버와 스토리지 볼륨 간의 디스크 IOPS에 사용할 수 있는 버스트 크레딧의 비율입니다. 처리량 용량이 256MBps 이하로 프로비저닝된 파일 시스템에 유효합니다. 단위: 백분율 |
디스크 I/O 지표
AWS/FSx
네임스페이스에는 다음 디스크 I/O 지표가 포함되어 있습니다.
지표 | 설명 |
---|---|
DiskReadBytes |
스토리지 볼륨에 액세스하는 읽기 작업의 바이트 수입니다. 단위: 바이트 유효 통계: Sum |
DiskWriteBytes |
스토리지 볼륨에 액세스하는 쓰기 작업의 바이트 수입니다. 단위: 바이트 유효 통계: Sum |
DiskReadOperations |
스토리지 볼륨에 액세스하는 파일 서버의 읽기 작업 수입니다. 단위: 개 유효한 통계: |
DiskWriteOperations |
스토리지 볼륨에 액세스하는 파일 서버의 쓰기 작업 수입니다. 단위: 개 유효한 통계: |
FSx for Windows File 볼륨 지표
AWS/FSx
네임스페이스에는 다음 스토리지 볼륨 지표가 포함되어 있습니다.
지표 | 설명 |
---|---|
DiskThroughputUtilization |
(HDD만 해당) 파일 서버와 스토리지 볼륨 간의 디스크 처리량(스토리지 볼륨에 따라 결정된 프로비저닝된 한도의 백분율)입니다. 단위: 백분율 |
DiskThroughputBalance |
(HDD만 해당) 스토리지 볼륨의 디스크 처리량 및 디스크 IOPS에 사용 가능한 버스트 크레딧의 백분율입니다. 단위: 백분율 |
DiskIopsUtilization |
(SSD만 해당) 파일 서버와 스토리지 볼륨 간의 디스크 IOPS(스토리지 볼륨에 따라 결정된 프로비저닝된 IOPS 한도의 백분율)입니다. 단위: 백분율 |
스토리지 용량 지표
AWS/FSx
네임스페이스에는 다음 스토리지 용량 지표가 포함되어 있습니다.
지표 | 설명 |
---|---|
FreeStorageCapacity |
사용 가능한 스토리지 용량 크기입니다. 단위: 바이트 유효한 통계: |
StorageCapacityUtilization |
사용된 물리적 스토리지 용량(총 스토리지 용량의 백분율)입니다. 단위: 백분율 |
DeduplicationSavedStorage |
데이터 중복 제거(활성화된 경우)를 통해 절감되는 스토리지 공간의 양입니다. 단위: 바이트 |
Windows File Server용 FSx 지표의 네임스페이스 및 차원
Windows File Server용 FSx 지표는 FSx
네임스페이스를 사용하며 단일 측정기준인 FileSystemId
에 대한 지표를 제공합니다. describe-file-systems AWS CLI 명령 또는 DescribeFileSystems API 명령을 사용하여 파일 시스템의 ID를 찾을 수 있습니다. 파일 시스템 ID는 fs-0123456789abcdef0
의 형식을 사용합니다.
파일 시스템 지표 사용
각 Amazon FSx 파일 시스템에는 다음과 같은 두 가지 기본 아키텍처 구성 요소가 있습니다.
파일 시스템에 액세스하는 클라이언트에 데이터를 제공하는 파일 서버.
파일 시스템의 데이터를 호스팅하는 스토리지 볼륨.
FSx for Windows File Server는 파일 시스템의 파일 서버 및 스토리지 볼륨에 대한 성능 및 리소스 사용률을 추적하는 CloudWatch의 지표를 보고합니다. 다음 다이어그램은 해당 아키텍처 구성 요소가 포함된 Amazon FSx 파일 시스템과, 모니터링에 사용할 수 있는 성능 및 리소스 CloudWatch 지표를 보여줍니다. 지표 세트에 표시된 주요 속성은 해당 지표의 용량을 결정하는 파일 시스템 속성입니다. 해당 속성을 조정하면 해당 지표 세트에 대한 파일 시스템의 성능이 수정됩니다.
Amazon FSx 콘솔의 모니터링 및 성능 패널을 사용하면 다음 표에 설명된 Windows File Server용 FSx CloudWatch 지표를 볼 수 있습니다.
모니터링 및 성능 패널 | 방법 | 차트 | 관련 지표 |
---|---|---|---|
요약 | ...파일 시스템의 총 IOPS를 어떻게 확인하나요? |
총 IOPS | 합계( |
...파일 시스템의 총 처리량을 어떻게 확인하나요? |
총 처리량 | 합계( |
|
...파일 시스템에서 사용 가능한 스토리지 용량을 어떻게 확인하나요? | 사용 가능한 스토리지 용량 | FreeStorageCapacity |
|
...클라이언트와 파일 서버 간에 설정된 연결 수를 어떻게 확인하나요? | 클라이언트 연결 | ClientConnections |
|
스토리지 | ...물리적 디스크 공간 사용량(파일 시스템의 총 스토리지 용량의 백분율)을 어떻게 확인하나요? | 스토리지 용량 사용률 | StorageCapacityUtilization |
...데이터 중복 제거로 절감되는 물리적 디스크 공간의 양을 어떻게 확인하나요? | 데이터 중복 제거를 통해 절감된 스토리지 | DeduplicationSavedStorage |
|
성능 - 파일 서버 | ...파일 시스템에 액세스하는 클라이언트의 네트워크 처리량(프로비저닝된 한도 대비 백분율)을 어떻게 확인하나요? | 네트워크 처리량 사용률 | NetworkThroughputUtilization 1 |
...파일 서버와 스토리지 볼륨 간의 디스크 처리량(처리량 용량에 따라 결정된 프로비저닝된 한도의 백분율)을 어떻게 확인하나요? | 디스크 처리량 사용률 | FileServerDiskThroughputUtilization 1 |
|
...파일 서버와 스토리지 볼륨 간의 디스크 처리량에 사용할 수 있는 버스트 크레딧의 비율을 어떻게 확인하나요? | 디스크 처리량 버스트 밸런스 | FileServerDiskThroughputBalance |
|
...파일 서버와 스토리지 볼륨 간의 디스크 IOPS 양(처리량 용량에 따라 결정된 프로비저닝된 한도의 백분율)을 어떻게 확인하나요? | 디스크 IOPS 사용률 | FileServerDiskIopsUtilization |
|
...파일 서버와 스토리지 볼륨 간의 디스크 IOPS에 사용할 수 있는 버스트 크레딧의 비율을 어떻게 확인하나요? | 디스크 IOPS 버스트 밸런스 | FileServerDiskIopsBalance |
|
...파일 서버의 CPU 사용률을 어떻게 확인하나요? | CPU 사용률 | CPUUtilization |
|
...파일 서버의 메모리 사용률을 어떻게 확인하나요? | 메모리 사용률 | MemoryUtilization |
|
성능 - 스토리지 볼륨 | ...스토리지 볼륨에 액세스하는 작업의 처리량(HDD 스토리지 용량에 따라 결정된 프로비저닝된 한도의 백분율)을 어떻게 확인하나요? | 디스크 처리량 사용률(HDD) | DiskThroughputUtilization |
... HDD 스토리지 볼륨에 액세스하는 작업에 대해 사용 가능한 처리량 및 IOPS 버스트 크레딧의 비율을 결정하시겠습니까? | 디스크 처리량 버스트 밸런스(HDD) | DiskThroughputBalance 2 |
|
...스토리지 볼륨에 액세스하는 작업의 IOPS(HDD 스토리지 용량에 따라 결정된 프로비저닝된 한도의 백분율)을 어떻게 확인하나요? | 디스크 IOPS 사용률(HDD) | SUM(DiskReadOperations + DiskWriteOperations ) / Period (초) / (12 * TiB에서 프로비저닝된 HDD 스토리지 용량) |
|
...스토리지 볼륨에 액세스하는 작업의 IOPS(SSD 스토리지 용량에 따라 결정된 프로비저닝된 한도의 백분율)을 어떻게 확인하나요? | 디스크 IOPS 사용률(SSD) | DiskIopsUtilization |
참고
1예상치 못한 워크로드 스파이크는 물론 백그라운드 Windows 스토리지 작업(예: 스토리지 동기화, 중복 제거 또는 섀도우 복사본)에 대비해 충분한 예비 처리량 용량을 확보하려면 평균 처리량 용량 사용률을 50% 미만으로 유지하는 것이 좋습니다.
2HDD 스토리지 볼륨은 워크로드에 따라 상당한 성능 변화를 경험할 수 있습니다. IOPS 또는 처리량이 갑자기 급증하면 디스크 성능이 저하될 수 있습니다. 자세한 내용은 HDD 버스트 성능을 참조하십시오.
성능 경고 및 권장 사항
FSx for Windows는 처리량 용량이 32MBps 이상으로 구성된 파일 시스템에 대한 성능 경고를 제공합니다. Amazon FSx는 CloudWatch 지표 세트 중 하나가 연속된 여러 데이터 포인트에 대해 미리 정해진 임계값에 도달하거나 이를 초과할 때마다 CloudWatch 지표 세트에 대한 경고를 표시합니다. 이러한 경고는 파일 시스템 성능을 최적화하는 데 사용할 수 있는 실행 가능한 권장 사항을 제공합니다.
모니터링 및 성능 대시보드의 여러 영역에서 경고에 액세스할 수 있습니다. 모든 활성 또는 최신 Amazon FSx 성능 경고와 경보 상태인 파일 시스템에 대해 구성된 모든 CloudWatch 경보가 요약 섹션의 모니터링 및 성능 패널에 표시됩니다. 이 경고는 지표 그래프가 표시되는 대시보드 섹션에도 표시됩니다.
모든 Amazon FSx 지표에 대해 CloudWatch 경보를 생성할 수 있습니다. 자세한 내용은 CloudWatch 경보 생성 섹션을 참조하세요.
성능 경고를 사용하면 파일 시스템 성능을 개선할 수 있습니다.
Amazon FSx는 파일 시스템 성능을 최적화하는 데 사용할 수 있는 실행 가능한 권장 사항을 제공합니다. 이러한 권장 사항은 잠재적인 성능 병목 현상을 해결할 수 있는 방법을 설명합니다. 활동이 계속될 것으로 예상되거나 이로 인해 파일 시스템 성능이 저하되는 경우 권장 조치를 취할 수 있습니다. 경고를 트리거한 지표에 따라 다음 표에 설명된 대로 파일 시스템의 처리량 용량 또는 스토리지 용량을 늘려 경고를 해결할 수 있습니다.
이 지표에 대한 경고가 있는 경우 | 조치 |
---|---|
네트워크 처리량 - 사용률 | 처리량 용량 늘리기 |
파일 서버 > 디스크 IOPS – 사용률 | |
파일 서버 > 디스크 처리량 - 사용률 | |
파일 서버 > 디스크 IOPS – 버스트 밸런스 | |
파일 서버 > 디스크 처리량 – 버스트 밸런스 | |
스토리지 용량 사용률 | 스토리지 용량 늘리기 |
스토리지 볼륨 > 디스크 처리량 - 사용률(HDD) | 스토리지 용량을 늘리거나 SDD 스토리지 유형으로 전환 |
스토리지 볼륨 > 디스크 처리량 - 버스트 밸런스(HDD) | |
스토리지 볼륨 > 디스크 IOPS – 사용률 (SSD) | SSD IOPS 늘리기 |
참고
특정 파일 시스템 이벤트는 디스크 I/O 성능 리소스를 사용하므로 잠재적으로 성능 경고를 트리거할 수 있습니다. 예:
스토리지 용량 증가 및 파일 시스템 성능에 설명된 대로 스토리지 용량 확장의 최적화 단계에서 디스크 처리량이 증가할 수 있습니다.
다중 AZ 파일 시스템의 경우 처리량 용량 확장, 하드웨어 교체 또는 가용 영역 중단과 같은 이벤트로 인해 자동 장애 조치 및 페일백 이벤트가 발생합니다. 이 기간 동안 발생하는 모든 데이터 변경 사항은 기본 및 보조 파일 서버 간에 동기화되어야 하며, Windows Server는 디스크 I/O 리소스를 소비할 수 있는 데이터 동기화 작업을 실행합니다. 자세한 내용은 Windows File Server용 FSx 파일 시스템의 처리량 용량 관리 섹션을 참조하세요.
파일 시스템 성능에 대한 자세한 내용은 FSx for Windows File Server 성능 섹션을 참조하세요.