Invocación del punto de conexión - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Invocación del punto de conexión

Una vez que el punto final esté en ejecución, utilice el SageMaker Runtime InvokeEndpointAPIen el servicio SageMaker Runtime para enviar solicitudes al punto final o invocarlo. En respuesta, el explicador de Clarify gestiona las solicitudes como solicitudes de explicabilidad. SageMaker

nota

Para invocar un punto de conexión, elija una de las siguientes opciones:

Solicitud

InvokeEndpointAPITiene un parámetro opcionalEnableExplanations, que se asigna al encabezado. HTTP X-Amzn-SageMaker-Enable-Explanations Si se proporciona este parámetro, anula el parámetro EnableExplanationsde ClarifyExplainerConfig.

nota

Los Accept parámetros ContentType y del InvokeEndpoint API son obligatorios. Los formatos admitidos incluyen el MIME tipo text/csv yapplication/jsonlines.

Utilice sagemaker_runtime_client para enviar una solicitud al punto de conexión de la siguiente manera:

response = sagemaker_runtime_client.invoke_endpoint( EndpointName='name-of-your-endpoint', EnableExplanations='`true`', ContentType='text/csv', Accept='text/csv', Body='1,2,3,4', # single record (of four numerical features) )

Para los puntos finales multimodelo, pase un TargetModel parámetro adicional en la solicitud de ejemplo anterior para especificar el modelo al que dirigirse en el punto final. El punto de conexión multimodelo carga dinámicamente los modelos de destino según sea necesario. Para obtener más información sobre los puntos finales multimodelo, consulte. Puntos de conexión multimodelo Consulte el cuaderno de muestra SageMaker Clarify Online sobre la explicabilidad de los terminales multimodelo para ver un ejemplo de cómo configurar e invocar varios modelos de destino desde un único punto final.

Respuesta

Si el punto de conexión se crea con ExplainerConfig, entonces, se utiliza un nuevo esquema de respuesta. Este nuevo esquema es diferente y no es compatible con un punto de conexión que carezca del parámetro ExplainerConfig proporcionado.

El MIME tipo de respuesta esapplication/json, y la carga útil de la respuesta se puede decodificar de UTF 8 bytes a un objeto. JSON A continuación se muestra que los miembros de este JSON objeto son los siguientes:

  • version: la versión del esquema de respuesta en formato de cadena. Por ejemplo, 1.0.

  • predictions: las predicciones que hace la solicitud son las siguientes:

    • content_type: El MIME tipo de predicciones, en referencia a la respuesta ContentType del contenedor del modelo.

    • data: la cadena de datos de las predicciones entregada como carga de la respuesta del contenedor de modelos a la solicitud.

  • label_headers: los encabezados de las etiquetas del parámetro LabelHeaders. Esto se proporciona en la configuración del explicador o en la salida del contenedor de modelos.

  • explanations: las explicaciones que figuran en la carga de la solicitud. Si no se explica ningún registro, este miembro devuelve el objeto {} vacío.

    • kernel_shap: una clave que hace referencia a una serie de SHAP explicaciones del núcleo para cada registro de la solicitud. Si un registro no tiene explicación, la explicación correspondiente es null.

El elemento kernel_shap tiene los siguientes miembros:

  • feature_header: el nombre del encabezado de las características que proporciona el parámetro FeatureHeaders en la configuración del explicador ExplainerConfig.

  • feature_type: el tipo de característica inferido por el explicador o proporcionado en el parámetro FeatureTypes en ExplainerConfig. Este elemento solo está disponible para problemas de NLP explicabilidad.

  • attributions: una matriz de objetos de atribución. Las características de texto pueden tener varios objetos de atribución, cada uno para una unidad. El objeto de atribución tiene los siguientes miembros:

    • attribution: una lista de valores de probabilidad, proporcionada para cada clase.

    • description: La descripción de las unidades de texto, disponible solo para problemas de NLP explicabilidad.

      • partial_text: la parte del texto explicada por el explicador.

      • start_idx: un índice de base cero para identificar la ubicación de la matriz al principio del fragmento de texto parcial.