SHAPLíneas de base para la explicabilidad - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

SHAPLíneas de base para la explicabilidad

Las explicaciones suelen ser de contraste, es decir, tienen en cuenta las desviaciones con respecto a una referencia. Como resultado, para la misma predicción del modelo, cabe esperar obtener diferentes explicaciones con respecto a distintas referencias. Por lo tanto, la elección de una referencia es crucial. En un contexto de ML, la referencia corresponde a un caso hipotético que puede ser no informativo o informativo. Durante el cálculo de los valores de Shapley, SageMaker Clarify genera varias instancias nuevas entre la línea base y la instancia dada, en las que la ausencia de una entidad se modela estableciendo el valor de la entidad en el de la línea base y la presencia de una entidad se modela estableciendo el valor de la entidad en cuestión en el de la instancia dada. Por lo tanto, la ausencia de todas las características corresponde a la referencia y la presencia de todas las características corresponde a la instancia dada.

¿Cómo se pueden elegir buenas referencias? A menudo es conveniente seleccionar una referencia con un contenido de información muy bajo. Por ejemplo, puede construir una instancia promedio a partir del conjunto de datos de entrenamiento tomando la mediana o el promedio para las características numéricas y la moda para las características categóricas. Para el ejemplo de admisión a la universidad, tal vez le interese explicar por qué se aceptó a un candidato en particular en comparación con las aceptaciones iniciales basadas en un solicitante promedio. Si no se proporciona, SageMaker Clarify calcula automáticamente una línea base utilizando K-medias o prototipos K en el conjunto de datos de entrada.

Como alternativa, puede elegir generar explicaciones con respecto a las referencias informativas. En el caso de la admisión a la universidad, es posible que desees explicar por qué se rechazó a un candidato en particular en comparación con otros solicitantes de orígenes demográficos similares. En este caso, puede elegir una referencia que represente a los candidatos de interés, es decir, aquellos con antecedentes demográficos similares. Por lo tanto, puede utilizar referencias informativas para concentrar el análisis en los aspectos específicos de la predicción de un modelo concreto. Para aislar las características para la evaluación, configure los atributos demográficos y otras características sobre las que no puede actuar con el mismo valor que la instancia dada.