기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
SHAP 설명 가능성의 기준
설명은 주로 대조적입니다.즉, 대부분 기준으로부터의 편차를 설명합니다. 따라서 동일한 모델 예측의 경우 기준마다 다른 설명이 나올 것으로 예상할 수 있습니다. 따라서 기준을 선택하는 것이 중요합니다. ML 컨텍스트에서 기준은 정보를 제공하지 않거나 정보를 제공할 수 있는 가상의 인스턴스에 해당합니다. Shapley 값을 계산하는 동안 SageMaker Clarify는 특성의 부재를 기준 값으로 설정하여 모델링하고 특성의 존재를 해당 인스턴스의 특성 값으로 설정하여 모델링하는 기준 인스턴스와 지정된 인스턴스 사이에 몇 가지 새 인스턴스를 생성합니다. 따라서 모든 특징의 부재는 기준에 해당하고 모든 특징이 존재하는 것은 주어진 인스턴스에 해당합니다.
어떻게 하면 좋은 기준을 선택할 수 있을까요? 정보 내용이 매우 적은 기준을 선택하는 것이 바람직한 경우가 많습니다. 예를 들어, 수치적 특징의 경우 중앙값 또는 평균을 취하고 범주형 특징에 대해서는 모드를 사용하여 훈련 데이터 세트로부터 평균 인스턴스를 구성할 수 있습니다. 대학 입학 예제의 경우, 평균 지원자를 기준으로 한 기준 합격률과 비교하여 특정 지원자가 합격한 이유를 설명하는 데 관심이 있을 수 있습니다. 제공되지 않으면 입력 데이터 세트에서 K-평균 또는 K-프로토타입을 사용하여 SageMaker Clarify가 기준선을 자동으로 계산합니다.
또는 정보 기준에 대한 설명을 생성하도록 선택할 수 있습니다. 대학 입학 시나리오의 경우 인구통계학적 배경이 비슷한 다른 지원자와 비교했을 때 특정 지원자가 거부된 이유를 설명해야 할 수 있습니다. 이 경우 관심 지원자, 즉 인구통계학적 배경이 비슷한 지원자를 나타내는 기준을 선택할 수 있습니다. 따라서 유익한 기준을 사용하여 특정 모델 예측의 특정 측면에 분석을 집중할 수 있습니다. 인구통계학적 속성 및 조치를 취할 수 없는 기타 특징을 주어진 경우와 동일한 값으로 설정하여 평가 대상 특징을 분리할 수 있습니다.