Invoque o endpoint

Depois que o endpoint estiver em execução, use o SageMaker Runtime InvokeEndpointAPIno serviço SageMaker Runtime para enviar solicitações ou invocar o endpoint. Em resposta, as solicitações são tratadas como solicitações de explicabilidade pelo explicador do SageMaker Clarify.

nota

Para chamar um endpoint, escolha uma das seguintes opções:

Para obter instruções sobre como usar o Boto3 ou AWS CLI para invocar um endpoint, consulte. Invoque modelos para inferência em tempo real
Para usar o SageMaker SDK for Python para invocar um endpoint, consulte o Predictor. API

Solicitação

O InvokeEndpoint API tem um parâmetro opcionalEnableExplanations, que é mapeado para o HTTP cabeçalhoX-Amzn-SageMaker-Enable-Explanations. Se esse parâmetro for fornecido, ele substituirá o parâmetro EnableExplanations do ClarifyExplainerConfig.

nota

Os Accept parâmetros ContentType e do InvokeEndpoint API são obrigatórios. Os formatos suportados incluem MIME tipo text/csv application/jsonlines e.

Use o sagemaker_runtime_client para enviar uma solicitação ao endpoint, da seguinte forma:


response = sagemaker_runtime_client.invoke_endpoint(
    EndpointName='name-of-your-endpoint',
    EnableExplanations='`true`',
    ContentType='text/csv',
    Accept='text/csv',
    Body='1,2,3,4',  # single record (of four numerical features)
)

Para endpoints de vários modelos, passe um TargetModel parâmetro adicional na solicitação do exemplo anterior para especificar qual modelo deve ser direcionado ao endpoint. O endpoint de vários modelos carrega dinamicamente os modelos de destino conforme necessário. Para obter mais informações sobre endpoints de vários modelos, consulte. Endpoints multimodelo Consulte o caderno de amostra SageMaker Clarify Online Explicability on Multimodel Endpoint para obter um exemplo de como configurar e invocar vários modelos de destino a partir de um único endpoint.

Resposta

Se o endpoint for criado com ExplainerConfig, um novo esquema de resposta será usado. Esse novo esquema é diferente e não é compatível com um endpoint que não tem o parâmetro fornecido ExplainerConfig.

O MIME tipo da resposta éapplication/json, e a carga útil da resposta pode ser decodificada de UTF -8 bytes para um objeto. JSON O seguinte mostra que os membros desse JSON objeto são os seguintes:

version: a versão do esquema de resposta em formato de string. Por exemplo, 1.0.
predictions: as previsões que a solicitação faz são as seguintes:
- content_type: o MIME tipo das previsões, referindo-se à resposta ContentType do contêiner do modelo.
- data: a sequência de dados de previsões fornecida como carga útil da resposta do contêiner do modelo para a solicitação.
label_headers: os cabeçalhos do rótulo do parâmetro LabelHeaders. Isso é fornecido na configuração do explicador ou na saída do contêiner do modelo.
explanations: as explicações fornecidas na carga da solicitação. Se nenhum registro for explicado, esse membro retornará o objeto vazio {}.
- kernel_shap: uma chave que se refere a uma matriz de SHAP explicações do Kernel para cada registro na solicitação. Se um registro não for explicado, a explicação correspondente será null.

O elemento kernel_shap tem os seguintes membros:

feature_header: o nome do cabeçalho dos recursos fornecidos pelo parâmetro FeatureHeaders na configuração do explicador ExplainerConfig.
feature_type: o tipo de recurso inferido pelo explicador ou fornecido no parâmetro FeatureTypes no ExplainerConfig. Esse elemento só está disponível para problemas de NLP explicabilidade.
attributions: uma matriz de objetos de atribuição. Os recursos de texto podem ter vários objetos de atribuição, cada um para uma unidade. O objeto de atribuição tem os seguintes membros:
- attribution: uma lista de valores de probabilidade, fornecida para cada classe.
- description: a descrição das unidades de texto, disponível somente para problemas de NLP explicabilidade.
  - partial_text: a parte do texto explicada pelo explicador.
  - start_idx: um índice baseado em zero para identificar a localização da matriz no início do fragmento de texto parcial.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Conjuntos de dados sintéticos

Exemplos de código: SDK para Python