Resposta de endpoint para dados tabulares - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Resposta de endpoint para dados tabulares

Depois que o trabalho de processamento do SageMaker Clarify recebe a resposta de uma invocação de endpoint de inferência, ele desserializa a carga útil da resposta e extrai previsões dela. Use o parâmetro accept_type de configuração de análise para especificar o formato de dados da carga útil de resposta. Se não accept_type for fornecido, o trabalho de processamento do SageMaker Clarify usará o valor do parâmetro content_type como formato de saída do modelo. Para obter mais informações sobre o accept_type, consulte Arquivos de configuração de análise.

As previsões podem consistir em rótulos previstos para análise de viés ou valores de probabilidade (pontuações) para análise de importância do recurso. Na configuração da análise predictor, os três parâmetros a seguir extraem as previsões.

  • O parâmetro probability é usado para localizar os valores de probabilidade (pontuações) na resposta do endpoint.

  • O parâmetro label é usado para localizar os rótulos previstos na resposta do endpoint.

  • (Opcional) O parâmetro label_headers fornece os rótulos previstos para um modelo multiclasse.

As diretrizes a seguir se referem às respostas dos endpoints emCSV, JSON linhas e JSON formatos.

O Endpoint Response está em formato CSV

Se a carga de resposta estiver no CSV formato (MIMEtipo:text/csv), a tarefa de processamento do SageMaker Clarify desserializará cada linha. Em seguida, ele extrai as previsões dos dados desserializados usando os índices de coluna fornecidos na configuração da análise. As linhas na carga de resposta devem corresponder aos registros na carga da solicitação.

As tabelas a seguir fornecem exemplos de dados de resposta em diferentes formatos e para diferentes tipos de problemas. Seus dados podem variar desses exemplos, desde que as previsões possam ser extraídas de acordo com a configuração da análise.

As seções a seguir mostram exemplos de respostas de endpoints em CSV formatos.

A tabela a seguir é um exemplo de resposta de endpoint para problemas de regressão e classificação binária.

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único

'0.6'

Dois registros (resultados em uma linha, divididos por vírgula).

'0.6,0.3'

Dois registros (resultados em duas linhas)

'0.6\n0.3'

Para o exemplo anterior, o endpoint gera um único valor de probabilidade (pontuação) do rótulo previsto. Para extrair probabilidades usando o índice e usá-las para análise da importância do recurso, defina o parâmetro probability de configuração da análise como índice da coluna 0. Essas probabilidades também podem ser usadas para análise de desvio se forem convertidas em valor binário usando o parâmetro probability_threshold. Para obter mais informações sobre o probability_threshold, consulte Arquivos de configuração de análise.

A tabela a seguir é um exemplo de resposta de endpoint para um problema multiclasse.

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único de um modelo multiclasse (três classes).

'0.1,0.6,0.3'

Dois registros de um modelo multiclasse (três classes).

'0.1,0.6,0.3\n0.2,0.5,0.3'

Para o exemplo anterior, o endpoint gera uma lista de probabilidades (pontuações). Se nenhum índice for fornecido, todos os valores serão extraídos e usados para análise de importância do recurso. Se o parâmetro de configuração de análise label_headers for fornecido. Em seguida, o trabalho de processamento do SageMaker Clarify pode selecionar o cabeçalho do rótulo com a probabilidade máxima como o rótulo previsto, que pode ser usado para análise de viés. Para obter mais informações sobre o label_headers, consulte Arquivos de configuração de análise.

A tabela a seguir é um exemplo de resposta de endpoint para problemas de regressão e classificação binária.

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único

'1'

Dois registros (resultados em uma linha, divididos por vírgula).

'1,0'

Dois registros (resultados em duas linhas)

'1\n0'

Para o exemplo anterior, o endpoint gera o rótulo previsto em vez da probabilidade. Defina o parâmetro label da configuração predictor para o índice da coluna 0 para que os rótulos previstos possam ser extraídos usando o índice e usados para análise de polarização.

A tabela a seguir é um exemplo de resposta de endpoint para problemas de regressão e classificação binária.

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único

'1,0.6'

Dois registros

'1,0.6\n0,0.3'

Para o exemplo anterior, o endpoint gera o rótulo previsto seguido por sua probabilidade. Defina o label parâmetro da predictor configuração como índice 0 da coluna e probability defina como índice da coluna 1 para extrair os dois valores do parâmetro.

Um modelo multiclasse treinado pelo Amazon SageMaker Autopilot pode ser configurado para gerar a representação em sequência da lista de rótulos e probabilidades previstos. A tabela de exemplo a seguir mostra um exemplo de resposta de endpoint de um modelo configurado para gerar predicted_label, probability, labels e probabilities.

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único

'"dog",0.6,"[\'cat\', \'dog\', \'fish\']","[0.1, 0.6, 0.3]"'

Dois registros

'"dog",0.6,"[\'cat\', \'dog\', \'fish\']","[0.1, 0.6, 0.3]"\n""cat",0.7,[\'cat\', \'dog\', \'fish\']","[0.7, 0.2, 0.1]"'

No exemplo anterior, o trabalho de processamento do SageMaker Clarify pode ser configurado das seguintes maneiras para extrair as previsões.

Para análise de desvio, o exemplo anterior pode ser configurado como um dos seguintes.

  • Defina o parâmetro label da predictor configuração 0 para extrair o rótulo previsto.

  • Defina o parâmetro para 2 extrair os rótulos previstos e probability defina como 3 para extrair as probabilidades correspondentes. O trabalho de processamento do SageMaker Clarify pode determinar automaticamente o rótulo previsto identificando o rótulo com o maior valor de probabilidade. Referindo-se ao exemplo anterior de um único registro, o modelo prevê três rótulos: cat, dog e fish, com probabilidades correspondentes de 0.1, 0.6 e 0.3. Com base nessas probabilidades, o rótulo previsto é dog, pois tem o maior valor de probabilidade de 0.6.

  • Defina probability como 3 para extrair as probabilidades. Se label_headers for fornecido, o trabalho de processamento do SageMaker Clarify poderá determinar automaticamente o rótulo previsto identificando o cabeçalho do rótulo com o maior valor de probabilidade.

Para análise da importância do recurso, o exemplo anterior pode ser configurado da seguinte forma.

  • Defina probability para 3 extrair as probabilidades de todos os rótulos previstos. Em seguida, as atribuições de recursos serão computadas para todos os rótulos. Se o cliente não especificar label_headers, as etiquetas previstas serão usadas como cabeçalhos de etiquetas no relatório de análise.

O Endpoint Response está no formato JSON de linhas

Se a carga de resposta estiver no formato JSON Linhas (MIMEtipo:application/jsonlines), a tarefa de processamento do SageMaker Clarify desserializará cada linha como. JSON Em seguida, ele extrai as previsões dos dados desserializados usando JMESPath expressões fornecidas na configuração da análise. As linhas na carga da resposta devem corresponder aos registros na carga da solicitação. As tabelas a seguir mostram exemplos de dados de resposta em diferentes formatos. Seus dados podem variar desses exemplos, desde que as previsões possam ser extraídas de acordo com a configuração da análise.

As seções a seguir mostram exemplos de respostas de endpoint em formatos de JSON linhas.

A tabela a seguir é um exemplo de resposta de endpoint que gera apenas o valor de probabilidade (pontuação).

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único

'{"score":0.6}'

Dois registros

'{"score":0.6}\n{"score":0.3}'

Para o exemplo anterior, defina o parâmetro de configuração de análise probability como JMESPath expressão “pontuação” para extrair seu valor.

A tabela a seguir é um exemplo de resposta de endpoint que gera apenas o rótulo previsto.

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único

'{"prediction":1}'

Dois registros

'{"prediction":1}\n{"prediction":0}'

Para o exemplo anterior, defina o label parâmetro da configuração do preditor como JMESPath expressãoprediction. Em seguida, o trabalho de processamento do SageMaker Clarify pode extrair os rótulos previstos para análise de viés. Para obter mais informações, consulte Arquivos de configuração de análise.

A tabela a seguir é um exemplo de resposta de endpoint que gera o rótulo previsto e sua pontuação.

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único

'{"prediction":1,"score":0.6}'

Dois registros

'{"prediction":1,"score":0.6}\n{"prediction":0,"score":0.3}'

No exemplo anterior, defina o label parâmetro da predictor configuração como JMESPath expressão “previsão” para extrair os rótulos previstos. probabilityDefina a JMESPath expressão “pontuação” para extrair a probabilidade. Para obter mais informações, consulte Arquivos de configuração de análise.

A tabela a seguir é um exemplo de resposta de endpoint de um modelo multiclasse que gera o seguinte:

  • Uma lista de rótulos previstos.

  • Probabilidades e o rótulo previsto selecionado e sua probabilidade.

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único

'{"predicted_label":"dog","probability":0.6,"predicted_labels":["cat","dog","fish"],"probabilities":[0.1,0.6,0.3]}'

Dois registros

'{"predicted_label":"dog","probability":0.6,"predicted_labels":["cat","dog","fish"],"probabilities":[0.1,0.6,0.3]}\n{"predicted_label":"cat","probability":0.7,"predicted_labels":["cat","dog","fish"],"probabilities":[0.7,0.2,0.1]}'

No exemplo anterior, a tarefa de processamento do SageMaker Clarify pode ser configurada de várias maneiras para extrair as previsões.

Para análise de desvio, o exemplo anterior pode ser configurado como um dos seguintes.

  • Defina o label parâmetro da predictor configuração para a JMESPath expressão “predicted_label” para extrair o rótulo previsto.

  • Defina o parâmetro como a JMESPath expressão “predicted_labels” para extrair os rótulos previstos. probabilityDefina a JMESPath expressão “probabilidades” para extrair suas probabilidades. A tarefa SageMaker Clarify determina automaticamente o rótulo previsto identificando o rótulo com o maior valor de probabilidade.

  • probabilityDefina a JMESPath expressão “probabilidades” para extrair suas probabilidades. Se label_headers for fornecido, o trabalho de processamento do SageMaker Clarify poderá determinar automaticamente o rótulo previsto identificando o rótulo com o maior valor de probabilidade.

Para analisar a importância do recurso, faça o seguinte.

  • probabilityDefina a JMESPath expressão “probabilidades” para extrair suas probabilidades de todos os rótulos previstos. Em seguida, as atribuições de recursos serão computadas para todos os rótulos.

O Endpoint Response está em formato JSON

Se a carga de resposta estiver no JSON formato (MIMEtipo:application/json), a tarefa de processamento do SageMaker Clarify desserializará toda a carga como. JSON Em seguida, ele extrai as previsões dos dados desserializados usando JMESPath expressões fornecidas na configuração da análise. Os registros na carga útil da resposta devem corresponder aos registros na carga útil da solicitação.

As seções a seguir mostram exemplos de respostas de endpoints em JSON formatos. As tabelas a seguir fornecem exemplos de dados de resposta em diferentes formatos e para diferentes tipos de problemas. Seus dados podem variar desses exemplos, desde que as previsões possam ser extraídas de acordo com a configuração da análise.

A tabela a seguir é um exemplo de resposta de um endpoint que gera apenas o valor de probabilidade (pontuação).

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único

'[0.6]'

Dois registros

'[0.6,0.3]'

No exemplo anterior, não há quebra de linha na carga de resposta. Em vez disso, um único JSON objeto contém uma lista de pontuações, uma para cada registro na solicitação. Defina o parâmetro de configuração da análise probability para a JMESPath expressão “[*]” para extrair o valor.

A tabela a seguir é um exemplo de resposta de um endpoint que gera apenas o rótulo previsto.

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único

'{"predicted_labels":[1]}'

Dois registros

'{"predicted_labels":[1,0]}'

Defina o label parâmetro da predictor configuração para a JMESPath expressão “predicted_labels” e, em seguida, o trabalho de processamento do SageMaker Clarify poderá extrair os rótulos previstos para análise de viés.

A tabela a seguir é um exemplo de resposta de endpoint que gera o rótulo previsto e sua pontuação.

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único

'{"predictions":[{"label":1,"score":0.6}'

Dois registros

{"predictions":[{"label":1,"score":0.6},{"label":0,"score":0.3}]}'

No exemplo anterior, defina o label parâmetro da predictor configuração para a JMESPath expressão “predictions [*] .label” para extrair os rótulos previstos. probabilityDefina a JMESPath expressão “predictions [*] .score” para extrair a probabilidade.

A tabela a seguir é um exemplo de resposta de um endpoint de um modelo multiclasse que gera o seguinte:

  • Uma lista de rótulos previstos.

  • Probabilidades e o rótulo previsto selecionado e sua probabilidade.

Carga da solicitação de endpoint Carga útil de resposta do endpoint (representação de string)

Registro único

'[{"predicted_label":"dog","probability":0.6,"predicted_labels":["cat","dog","fish"],"probabilities":[0.1,0.6,0.3]}]'

Dois registros

'[{"predicted_label":"dog","probability":0.6,"predicted_labels":["cat","dog","fish"],"probabilities":[0.1,0.6,0.3]},{"predicted_label":"cat","probability":0.7,"predicted_labels":["cat","dog","fish"],"probabilities":[0.7,0.2,0.1]}]'

O trabalho de processamento do SageMaker Clarify pode ser configurado de várias maneiras para extrair as previsões.

Para análise de desvio, o exemplo anterior pode ser configurado como um dos seguintes.

  • Defina o label parâmetro da predictor configuração para a JMESPath expressão “[*] .predicted_label” para extrair o rótulo previsto.

  • Defina o parâmetro como a JMESPath expressão “[*] .predicted_labels” para extrair os rótulos previstos. probabilityDefina a JMESPath expressão “[*] .probabilidades” para extrair suas probabilidades. O trabalho de processamento do SageMaker Clarify pode determinar automaticamente a etiqueta prevista identificando a etiqueta com o maior valor de proximidade.

  • probabilityDefina a JMESPath expressão “[*] .probabilidades” para extrair suas probabilidades. Se label_headers for fornecido, o trabalho de processamento do SageMaker Clarify poderá determinar automaticamente o rótulo previsto identificando o rótulo com o maior valor de probabilidade.

Para análise da importância do recurso, probability defina a JMESPath expressão “[*] .probabilidades” para extrair suas probabilidades de todos os rótulos previstos. Em seguida, as atribuições de recursos serão computadas para todos os rótulos.