분석에 고급 지표 사용 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

분석에 고급 지표 사용

다음 섹션에서는 Amazon SageMaker Canvas에서 모델의 고급 지표를 찾고 해석하는 방법을 설명합니다.

참고

고급 지표는 현재 숫자 및 범주형 예측 모델에서만 사용할 수 있습니다.

고급 지표 탭을 찾으려면 다음을 수행합니다.

  1. SageMaker Canvas 애플리케이션을 엽니다.

  2. 왼쪽 탐색 창에서 내 모델을 선택합니다.

  3. 빌드한 모델을 선택합니다.

  4. 탐색 창에서 분석 탭을 선택합니다.

  5. 분석 탭에서 고급 지표 탭을 선택합니다.

고급 지표 탭에서 성능 탭을 찾을 수 있습니다. 페이지는 다음 스크린샷과 같습니다.

범주형 예측 모델에 대한 고급 지표 탭의 스크린샷입니다.

상단에서 모델을 구축할 때 최적화하기 위해 선택한 지표(또는 Canvas가 기본적으로 선택됨)인 최적화 지표 를 포함한 지표 점수의 개요를 볼 수 있습니다.

다음 섹션에서는 고급 지표 내의 성능 탭에 대한 자세한 정보를 설명합니다.

성능

성능 탭에는 Canvas가 모델 유형에 따라 생성하는 시각화와 함께 지표 테이블이 표시됩니다. 범주형 예측 모델의 경우 Canvas는 혼동 행렬을 제공하는 반면, 숫자 예측 모델의 경우 Canvas는 잔차오류 밀도 차트를 제공합니다.

지표 표 에는 페이지 상단의 점수 개요보다 더 포괄적인 각 고급 지표에 대한 모델 점수의 전체 목록이 제공됩니다. 여기에 표시된 지표는 모델 유형에 따라 다릅니다. 각 지표를 이해하고 해석하는 데 도움이 되는 참조는 섹션을 참조하세요지표 참조.

모델 유형에 따라 나타날 수 있는 시각화를 이해하려면 다음 옵션을 참조하세요.

  • 혼동 행렬 - Canvas는 혼동 행렬을 사용하여 모델이 올바르게 예측할 때 시각화하는 데 도움이 됩니다. 혼동 행렬에서는 예측값을 실제 값과 비교하도록 결과를 정렬합니다. 다음 예제에서는 양성 레이블과 음성 레이블을 예측하는 2개 범주 예측 모형에 대해 혼동 행렬이 작동하는 방법을 설명합니다:

    • 참양성 - 실제 레이블이 양성인 경우 모델이 양성을 올바르게 예측했습니다.

    • 참음성 – 실제 레이블이 음수일 때 모델이 음수를 올바르게 예측했습니다.

    • 거짓양성 – 실제 레이블이 음수일 때 모델이 양성을 잘못 예측했습니다.

    • 거짓 음성 – 실제 레이블이 양성일 때 모델이 음성을 잘못 예측했습니다.

  • 정밀 리콜 곡선 - 정밀 리콜 곡선은 모델의 리콜 점수와 비교하여 그려진 모델의 정밀도 점수를 시각화한 것입니다. 일반적으로 완벽한 예측을 할 수 있는 모델은 정밀도와 회상 점수가 모두 1입니다. 상당히 정확한 모델의 정밀도 리콜 곡선은 정밀도와 리콜 모두에서 상당히 높습니다.

  • 잔차 - 잔차는 실제 값과 모델에서 예측한 값 간의 차이입니다. 잔차 차트는 잔차를 해당 값과 비교하여 도표화하여 분포와 패턴 또는 이상치를 시각화합니다. 잔차가 0에 가까워지면 모델이 데이터에 적합함을 나타냅니다. 그러나 잔차가 크게 왜곡되거나 이상치가 있는 경우 모델이 데이터에 과적합하거나 해결해야 할 다른 문제가 있음을 나타낼 수 있습니다.

  • 오류 밀도 - 오류 밀도 플롯은 모델에 의해 발생한 오류의 분포를 나타냅니다. 각 시점에서 오류의 확률 밀도를 표시하여 모델이 과적합하거나 체계적인 오류를 일으킬 수 있는 영역을 식별하는 데 도움이 됩니다.