As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Invoque o endpoint
Depois que o endpoint estiver em execução, use o SageMaker Runtime InvokeEndpointAPIno serviço SageMaker Runtime para enviar solicitações ou invocar o endpoint. Em resposta, as solicitações são tratadas como solicitações de explicabilidade pelo explicador do SageMaker Clarify.
nota
Para chamar um endpoint, escolha uma das seguintes opções:
-
Para obter instruções sobre como usar o Boto3 ou AWS CLI para invocar um endpoint, consulte. Invoque modelos para inferência em tempo real
-
Para usar o SageMaker SDK for Python para invocar um endpoint, consulte o Predictor.
API
Solicitação
O InvokeEndpoint
API tem um parâmetro opcionalEnableExplanations
, que é mapeado para o HTTP cabeçalhoX-Amzn-SageMaker-Enable-Explanations
. Se esse parâmetro for fornecido, ele substituirá o parâmetro EnableExplanations
do ClarifyExplainerConfig
.
nota
Os Accept
parâmetros ContentType
e do InvokeEndpoint
API são obrigatórios. Os formatos suportados incluem MIME tipo text/csv
application/jsonlines
e.
Use o sagemaker_runtime_client
para enviar uma solicitação ao endpoint, da seguinte forma:
response = sagemaker_runtime_client.invoke_endpoint( EndpointName='name-of-your-endpoint', EnableExplanations='`true`', ContentType='text/csv', Accept='text/csv', Body='1,2,3,4', # single record (of four numerical features) )
Para endpoints de vários modelos, passe um TargetModel
parâmetro adicional na solicitação do exemplo anterior para especificar qual modelo deve ser direcionado ao endpoint. O endpoint de vários modelos carrega dinamicamente os modelos de destino conforme necessário. Para obter mais informações sobre endpoints de vários modelos, consulte. Endpoints multimodelo Consulte o caderno de amostra SageMaker Clarify Online Explicability on Multimodel Endpoint
Resposta
Se o endpoint for criado com ExplainerConfig
, um novo esquema de resposta será usado. Esse novo esquema é diferente e não é compatível com um endpoint que não tem o parâmetro fornecido ExplainerConfig
.
O MIME tipo da resposta éapplication/json
, e a carga útil da resposta pode ser decodificada de UTF -8 bytes para um objeto. JSON O seguinte mostra que os membros desse JSON objeto são os seguintes:
-
version
: a versão do esquema de resposta em formato de string. Por exemplo,1.0
. -
predictions
: as previsões que a solicitação faz são as seguintes:-
content_type
: o MIME tipo das previsões, referindo-se à respostaContentType
do contêiner do modelo. -
data
: a sequência de dados de previsões fornecida como carga útil da resposta do contêiner do modelo para a solicitação.
-
-
label_headers
: os cabeçalhos do rótulo do parâmetroLabelHeaders
. Isso é fornecido na configuração do explicador ou na saída do contêiner do modelo. -
explanations
: as explicações fornecidas na carga da solicitação. Se nenhum registro for explicado, esse membro retornará o objeto vazio{}
. -
-
kernel_shap
: uma chave que se refere a uma matriz de SHAP explicações do Kernel para cada registro na solicitação. Se um registro não for explicado, a explicação correspondente seránull
.
-
O elemento kernel_shap
tem os seguintes membros:
-
feature_header
: o nome do cabeçalho dos recursos fornecidos pelo parâmetroFeatureHeaders
na configuração do explicadorExplainerConfig
. -
feature_type
: o tipo de recurso inferido pelo explicador ou fornecido no parâmetroFeatureTypes
noExplainerConfig
. Esse elemento só está disponível para problemas de NLP explicabilidade. -
attributions
: uma matriz de objetos de atribuição. Os recursos de texto podem ter vários objetos de atribuição, cada um para uma unidade. O objeto de atribuição tem os seguintes membros:-
attribution
: uma lista de valores de probabilidade, fornecida para cada classe. -
description
: a descrição das unidades de texto, disponível somente para problemas de NLP explicabilidade.-
partial_text
: a parte do texto explicada pelo explicador. -
start_idx
: um índice baseado em zero para identificar a localização da matriz no início do fragmento de texto parcial.
-
-