Detalhes do trabalho do Autopilot Relatório de qualidade do modelo

Relatório de performance do modelo

Um relatório de qualidade de SageMaker modelo da Amazon (também conhecido como relatório de desempenho) fornece insights e informações de qualidade para o melhor candidato a modelo gerado por um trabalho no AutoML. Isso inclui informações sobre os detalhes do trabalho, o tipo de problema do modelo, a função objetivo e várias métricas. Esta seção detalha o conteúdo de um relatório de desempenho para problemas de classificação de texto e explica como acessar as métricas como dados brutos em um JSON arquivo.

Você pode encontrar o prefixo Amazon S3 para os artefatos do relatório de qualidade do modelo gerados para o melhor candidato na resposta a DescribeAutoMLJobV2 em BestCandidate.CandidateProperties.CandidateArtifactLocations.ModelInsights.

O relatório de desempenho contém duas seções:

A primeira seção contém detalhes sobre o trabalho do Autopilot que produziu o modelo.
A segunda seção contém um relatório de qualidade do modelo com várias métricas de performance.

Detalhes do trabalho do Autopilot

Esta primeira seção do relatório fornece algumas informações gerais sobre o trabalho do Autopilot que produziu o modelo. Esses detalhes incluem as seguintes informações:

Nome do candidato ao Autopilot: o nome do candidato do melhor modelo.
Nome do trabalho do Autopilot: o nome do trabalho.
Tipo de problema: o tipo de problema. No nosso caso, classificação de texto.
Métrica objetiva: a métrica objetiva usada para otimizar o desempenho do modelo. No nosso caso, Precisão.
Direção da otimização: indica se a métrica objetiva deve ser minimizada ou maximizada.

Relatório de qualidade do modelo

As informações de qualidade do modelo são geradas pelos insights de modelo do Autopilot. O conteúdo do relatório gerado depende do tipo de problema abordado. O relatório especifica o número de linhas que foram incluídas no conjunto de dados da avaliação e a hora em que a avaliação ocorreu.

Tabelas de métricas

A primeira parte do relatório de qualidade do modelo contém tabelas de métricas. Eles são apropriados para o tipo de problema abordado pelo modelo.

A imagem a seguir é um exemplo de uma tabela de métricas gerada pelo Autopilot para um problema de classificação de imagens ou textos. Ele mostra o nome, o valor e o desvio padrão da métrica.

Exemplo de relatório de métricas de classificação por imagem ou texto do Amazon SageMaker Autopilot model Insights.

Informações gráficas de performance do modelo

A segunda parte do relatório de qualidade do modelo contém informações gráficas para ajudá-lo a avaliar a performance do modelo. O conteúdo desta seção depende do tipo de problema selecionado.

Matriz de confusão

Uma matriz de confusão fornece uma maneira de visualizar a precisão das previsões feitas por um modelo para classificação binária e multiclasse para problemas diferentes.

Um resumo dos componentes do gráfico da taxa de falsos positivos (FPR) e da taxa de verdadeiros positivos (TPR) é definido da seguinte forma.

Previsões corretas
- Positivo verdadeiro (TP): o valor previsto é 1 e o valor verdadeiro é 1.
- Negativo verdadeiro (TN): o valor previsto é 0 e o valor verdadeiro é 0.
Previsões incorretas
- Falso-positivo (FP): o valor previsto é 1, mas o valor verdadeiro é 0.
- Falso-negativo (FN): o valor previsto é 0, mas o valor verdadeiro é 1.

A matriz de confusão no relatório de qualidade do modelo contém o seguinte.

O número e a porcentagem de previsões corretas e incorretas para os rótulos reais
O número e a porcentagem de previsões precisas na diagonal do canto superior esquerdo ao canto inferior direito
O número e a porcentagem de previsões imprecisas na diagonal do canto superior direito ao canto inferior esquerdo

As previsões incorretas em uma matriz de confusão são os valores de confusão.

O diagrama a seguir é um exemplo de matriz de confusão para um problema de classificação multiclasse. A matriz de confusão no relatório de qualidade do modelo contém o seguinte.

O eixo vertical é dividido em três linhas contendo três rótulos reais diferentes.
O eixo horizontal é dividido em três colunas contendo rótulos que foram previstos pelo modelo.
A barra de cores atribui um tom mais escuro a um número maior de amostras para indicar visualmente o número de valores que foram classificados em cada categoria.

No exemplo abaixo, o modelo previu corretamente os valores reais de 354 para o rótulo f, 1094 valores para o rótulo i e 852 valores para o rótulo m. A diferença de tom indica que o conjunto de dados não está balanceado porque há muito mais rótulos para o valor i do que para f ou m.

Exemplo de matriz de confusão multiclasse do Amazon SageMaker Autopilot.

A matriz de confusão no relatório de qualidade do modelo fornecido pode acomodar no máximo 15 rótulos para tipos de problemas de classificação multiclasse. Se uma linha correspondente a um rótulo mostrar um valor Nan, isso significa que o conjunto de dados da validação usado para verificar as previsões do modelo não contém dados com esse rótulo.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Relatório de Explicabilidade

Crie um trabalho de previsão de séries temporais usando o AutoML API