Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Invocación del punto de conexión
Una vez que el punto final esté en ejecución, utilice el SageMaker Runtime InvokeEndpointAPIen el servicio SageMaker Runtime para enviar solicitudes al punto final o invocarlo. En respuesta, el explicador de Clarify gestiona las solicitudes como solicitudes de explicabilidad. SageMaker
nota
Para invocar un punto de conexión, elija una de las siguientes opciones:
-
Para obtener instrucciones sobre cómo usar Boto3 o para invocar un punto final, AWS CLI consulte. Invoque modelos para realizar inferencias en tiempo real
-
Para usar Python SageMaker SDK para invocar un punto final, consulte el APIPredictor
.
Solicitud
InvokeEndpoint
APITiene un parámetro opcionalEnableExplanations
, que se asigna al encabezado. HTTP X-Amzn-SageMaker-Enable-Explanations
Si se proporciona este parámetro, anula el parámetro EnableExplanations
de ClarifyExplainerConfig
.
nota
Los Accept
parámetros ContentType
y del InvokeEndpoint
API son obligatorios. Los formatos admitidos incluyen el MIME tipo text/csv
yapplication/jsonlines
.
Utilice sagemaker_runtime_client
para enviar una solicitud al punto de conexión de la siguiente manera:
response = sagemaker_runtime_client.invoke_endpoint( EndpointName='name-of-your-endpoint', EnableExplanations='`true`', ContentType='text/csv', Accept='text/csv', Body='1,2,3,4', # single record (of four numerical features) )
Para los puntos finales multimodelo, pase un TargetModel
parámetro adicional en la solicitud de ejemplo anterior para especificar el modelo al que dirigirse en el punto final. El punto de conexión multimodelo carga dinámicamente los modelos de destino según sea necesario. Para obtener más información sobre los puntos finales multimodelo, consulte. Puntos de conexión multimodelo Consulte el cuaderno de muestra SageMaker Clarify Online sobre la explicabilidad de los terminales multimodelo
Respuesta
Si el punto de conexión se crea con ExplainerConfig
, entonces, se utiliza un nuevo esquema de respuesta. Este nuevo esquema es diferente y no es compatible con un punto de conexión que carezca del parámetro ExplainerConfig
proporcionado.
El MIME tipo de respuesta esapplication/json
, y la carga útil de la respuesta se puede decodificar de UTF 8 bytes a un objeto. JSON A continuación se muestra que los miembros de este JSON objeto son los siguientes:
-
version
: la versión del esquema de respuesta en formato de cadena. Por ejemplo,1.0
. -
predictions
: las predicciones que hace la solicitud son las siguientes:-
content_type
: El MIME tipo de predicciones, en referencia a la respuestaContentType
del contenedor del modelo. -
data
: la cadena de datos de las predicciones entregada como carga de la respuesta del contenedor de modelos a la solicitud.
-
-
label_headers
: los encabezados de las etiquetas del parámetroLabelHeaders
. Esto se proporciona en la configuración del explicador o en la salida del contenedor de modelos. -
explanations
: las explicaciones que figuran en la carga de la solicitud. Si no se explica ningún registro, este miembro devuelve el objeto{}
vacío. -
-
kernel_shap
: una clave que hace referencia a una serie de SHAP explicaciones del núcleo para cada registro de la solicitud. Si un registro no tiene explicación, la explicación correspondiente esnull
.
-
El elemento kernel_shap
tiene los siguientes miembros:
-
feature_header
: el nombre del encabezado de las características que proporciona el parámetroFeatureHeaders
en la configuración del explicadorExplainerConfig
. -
feature_type
: el tipo de característica inferido por el explicador o proporcionado en el parámetroFeatureTypes
enExplainerConfig
. Este elemento solo está disponible para problemas de NLP explicabilidad. -
attributions
: una matriz de objetos de atribución. Las características de texto pueden tener varios objetos de atribución, cada uno para una unidad. El objeto de atribución tiene los siguientes miembros:-
attribution
: una lista de valores de probabilidad, proporcionada para cada clase. -
description
: La descripción de las unidades de texto, disponible solo para problemas de NLP explicabilidad.-
partial_text
: la parte del texto explicada por el explicador. -
start_idx
: un índice de base cero para identificar la ubicación de la matriz al principio del fragmento de texto parcial.
-
-