엔드포인트 모니터링 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

엔드포인트 모니터링

SageMaker AI 호스팅 엔드포인트를 생성한 후 원시 데이터를 수집하여 읽기 가능하며 실시간에 가까운 지표로 처리하는 Amazon CloudWatch를 사용하여 엔드포인트를 모니터링할 수 있습니다. 이들 지표를 사용하여 기록 정보에 액세스하고 엔드포인트가 어떻게 실행되고 있는지를 더 잘 파악할 수 있습니다. 자세한 내용은 Amazon CloudWatch 사용 설명서를 참조하세요.

엔드포인트 세부 정보 페이지의 모니터링 탭에서는 엔드포인트에서 수집된 CloudWatch 지표 데이터를 볼 수 있습니다.

모니터링 탭에 있는 섹션은 다음과 같습니다.

  • 운영 지표: 엔드포인트 리소스의 사용률(예: CPU 사용률, 메모리 사용률)을 추적하는 보기 지표입니다.

  • 호출 지표: 엔드포인트로 들어오는 InvokeEndpoint 요청의 수와 상태(예: 호출 모델 오류, 모델 지연 시간)를 추적하는 보기 지표입니다.

  • 상태 지표: 엔드포인트의 전반적인 상태(예: 호출 실패, 알림 실패)를 추적하는 보기 지표입니다.

각 지표에 대한 자세한 설명은 CloudWatch를 사용하여 SageMaker AI 모니터링을 참조하세요.

다음 스크린샷은 서버리스 엔드포인트의 운영 지표 섹션을 보여줍니다.

엔드포인트 세부 정보 페이지의 운영 지표 섹션에 있는 지표 그래프의 스크린샷

특정 섹션의 지표에 대해 추적할 기간통계는 물론, 지표 데이터를 볼 기간의 길이도 조정할 수 있습니다. 위젯 추가를 선택하여 각 섹션의 뷰에서 지표 위젯을 추가하거나 삭제할 수도 있습니다. 위젯 추가 대화 상자에서 보고자 하는 지표를 선택하거나, 지표에 대한 선택을 취소할 수 있습니다.

사용 가능한 지표는 엔드포인트 유형에 따라 달라질 수 있습니다. 그 예로 서버리스 엔드포인트의 일부 지표는 실시간 엔드포인트에 사용할 수 없습니다. 구체적인 엔드포인트 유형별 지표 정보는 다음 페이지를 참조하세요.