Configurações avançadas de construção de modelos - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configurações avançadas de construção de modelos

O Amazon SageMaker Canvas oferece suporte a várias configurações avançadas que você pode configurar ao criar um modelo. A página a seguir lista todas as configurações avançadas junto com informações adicionais sobre suas opções e configurações.

nota

Atualmente, as configurações avançadas a seguir são suportadas somente para tipos de modelos de previsão numéricos, categóricos e de séries temporais.

Configurações avançadas do modelo de predição numérica e categórica

O Canvas suporta as seguintes configurações avançadas para tipos de modelos de predição numéricos e categóricos.

Métrica objetiva

A métrica objetivo é a métrica que você deseja que o Canvas otimize ao criar seu modelo. Se você não selecionar uma métrica, o Canvas escolherá uma para você por padrão. Para obter descrições das métricas disponíveis, consulte Referência de métricas o.

Método de treinamento

O Canvas pode selecionar automaticamente o método de treinamento com base no tamanho do conjunto de dados, ou você pode selecioná-lo manualmente. Os seguintes métodos de treinamento estão disponíveis para você escolher:

  • Ensembling — SageMaker aproveita a AutoGluon biblioteca para treinar vários modelos básicos. Para encontrar a melhor combinação para seu conjunto de dados, o modo ensemble executa de 5 a 10 ensaios com diferentes configurações de modelo e meta-parâmetros. Em seguida, esses modelos são combinados usando um método de conjunto de empilhamento para criar um modelo preditivo ideal. Para obter uma lista de algoritmos compatíveis com o modo de conjunto para dados tabulares, consulte a seção a seguir. Algoritmos

  • Otimização de hiperparâmetros (HPO) — SageMaker encontra a melhor versão de um modelo ajustando hiperparâmetros usando otimização bayesiana ou otimização multifidelidade enquanto executa trabalhos de treinamento em seu conjunto de dados. HPOO modo seleciona os algoritmos que são mais relevantes para seu conjunto de dados e seleciona a melhor variedade de hiperparâmetros para ajustar seus modelos. Para ajustar seus modelos, o HPO modo executa até 100 ensaios (padrão) para encontrar as configurações ideais dos hiperparâmetros dentro da faixa selecionada. Se o tamanho do conjunto de dados for menor que 100 MB, SageMaker use a otimização bayesiana. SageMaker escolhe a otimização de multifidelidade se seu conjunto de dados for maior que 100 MB.

    Para obter uma lista de algoritmos compatíveis com o HPO modo para dados tabulares, consulte a Algoritmos seção a seguir.

  • Automático — escolhe SageMaker automaticamente o modo de agrupamento ou HPO o modo com base no tamanho do seu conjunto de dados. Se seu conjunto de dados for maior que 100 MB, SageMaker escolha o modo. HPO Caso contrário, ele escolhe o modo de agrupamento.

Algoritmos

No modo Ensembling, o Canvas suporta os seguintes algoritmos de aprendizado de máquina:

  • Light GBM — Uma estrutura otimizada que usa algoritmos baseados em árvore com aumento de gradiente. Esse algoritmo usa árvores que crescem em largura, em vez de profundidade, e é altamente otimizado para velocidade.

  • CatBoost— Uma estrutura que usa algoritmos baseados em árvore com aumento de gradiente. Otimizado para lidar com variáveis categóricas.

  • XGBoost— Uma estrutura que usa algoritmos baseados em árvore com aumento de gradiente que cresce em profundidade, em vez de amplitude.

  • Random Forest – Um algoritmo baseado em árvore que usa várias árvores de decisão em subamostras aleatórias dos dados com substituição. As árvores são divididas em nós ideais em cada nível. As decisões de cada árvore são calculadas em conjunto para evitar ajustes excessivos e melhorar as previsões.

  • Árvores extras – Um algoritmo baseado em árvore que usa várias árvores de decisão em todo o conjunto de dados. As árvores são divididas aleatoriamente em cada nível. As decisões de cada árvore são calculadas para evitar ajustes excessivos e melhorar as previsões. Árvores extras adicionam um grau de randomização em comparação com o algoritmo de floresta aleatória.

  • Modelos lineares – Uma estrutura que usa uma equação linear para modelar a relação entre duas variáveis nos dados observados.

  • Tocha de rede neural – Um modelo de rede neural implementado usando Pytorch.

  • Rede neural fast.ai – Um modelo de rede neural implementado usando fast.ai.

No HPOmodo, o Canvas suporta os seguintes algoritmos de aprendizado de máquina:

  • XGBoost— Um algoritmo de aprendizado supervisionado que tenta prever com precisão uma variável alvo combinando um conjunto de estimativas de um conjunto de modelos mais simples e mais fracos.

  • Algoritmo de aprendizado profundo — Um perceptron (MLP) multicamada e uma rede neural artificial de feedback. Esse algoritmo pode lidar com dados que não são linearmente separáveis.

Divisão de dados

Você tem a opção de especificar como deseja dividir seu conjunto de dados entre o conjunto de treinamento (a parte do conjunto de dados usada para criar o modelo) e o conjunto de validação (a parte do conjunto de dados usada para verificar a precisão do modelo). Por exemplo, uma taxa de divisão comum é 80% de treinamento e 20% de validação, em que 80% dos seus dados são usados para criar o modelo, enquanto 20% são salvos para medir o desempenho do modelo. Se você não especificar uma proporção personalizada, o Canvas dividirá seu conjunto de dados automaticamente.

Número máximo de candidatos

nota

Esse recurso só está disponível no modo HPO de treinamento.

Você pode especificar o número máximo de candidatos a modelos que o Canvas gera ao construir seu modelo. Recomendamos que você use o número padrão de candidatos, que é 100, para criar os modelos mais precisos. O número máximo que você pode especificar é 250. Diminuir o número de candidatos a modelos pode afetar a precisão do seu modelo.

Tempo máximo de execução do trabalho

Você pode especificar o tempo máximo de execução do trabalho ou a quantidade máxima de tempo que o Canvas gasta construindo seu modelo. Após o limite de tempo, o Canvas para de construir e seleciona o melhor candidato a modelo.

O tempo máximo que você pode especificar é de 720 horas. É altamente recomendável que você mantenha o tempo máximo de execução do trabalho superior a 30 minutos para garantir que o Canvas tenha tempo suficiente para gerar candidatos a modelos e concluir a construção do seu modelo.

Configurações avançadas do modelo de previsão de séries temporais

Para modelos de previsão de séries temporais, o Canvas suporta a métrica Objetivo, que está listada na seção anterior.

Os modelos de previsão de séries temporais também oferecem suporte à seguinte configuração avançada:

Seleção de algoritmo

Quando você cria um modelo de previsão de séries temporais, o Canvas usa um conjunto (ou uma combinação) de algoritmos estatísticos e de aprendizado de máquina para fornecer previsões de séries temporais altamente precisas. Por padrão, o Canvas seleciona a combinação ideal de todos os algoritmos disponíveis com base na série temporal do seu conjunto de dados. No entanto, você tem a opção de especificar um ou mais algoritmos para usar em seu modelo de previsão. Nesse caso, o Canvas determina a melhor combinação usando somente os algoritmos selecionados. Se você não tiver certeza sobre qual algoritmo selecionar para treinar seu modelo, recomendamos que você escolha todos os algoritmos disponíveis.

nota

A seleção de algoritmos só é suportada para compilações padrão. Se você não selecionar nenhum algoritmo nas configurações avançadas, por padrão, SageMaker executa uma criação rápida e treina candidatos a modelo usando um único algoritmo de aprendizado baseado em árvore. Para obter mais informações sobre a diferença entre compilações rápidas e compilações padrão, consulte. Criar um modelo personalizado

O Canvas suporta os seguintes algoritmos de previsão de séries temporais:

  • Média móvel integrada autorregressiva (ARIMA) — Um modelo estocástico simples de série temporal que usa análise estatística para interpretar os dados e fazer previsões futuras. Esse algoritmo é útil para conjuntos de dados simples com menos de 100 séries temporais.

  • Rede Neural Convolucional - Regressão Quantílica (CNN-QR) — Um algoritmo de aprendizado supervisionado e proprietário que treina um modelo global a partir de uma grande coleção de séries temporais e usa um decodificador quantílico para fazer previsões. CNN-QR funciona melhor com grandes conjuntos de dados contendo centenas de séries temporais.

  • DeepAr+ — Um algoritmo de aprendizado supervisionado proprietário para prever séries temporais escalares usando redes neurais recorrentes (RNNs) para treinar um único modelo em conjunto em todas as séries temporais. O DeepAR+ funciona melhor com grandes conjuntos de dados contendo centenas de séries temporais de recursos.

  • Série temporal não paramétrica (NPTS) — Um previsor de linha de base probabilístico e escalável que prevê a distribuição futura de valores de uma determinada série temporal por meio de amostragem de observações passadas. NPTSé útil ao trabalhar com séries temporais esparsas ou intermitentes (por exemplo, prever a demanda de itens individuais em que a série temporal tem muitos 0s ou contagens baixas).

  • Suavização exponencial (ETS) — Um método de previsão que produz previsões que são médias ponderadas de observações passadas em que os pesos das observações mais antigas diminuem exponencialmente. O algoritmo é útil para conjuntos de dados simples com menos de 100 séries temporais e conjuntos de dados com padrões de sazonalidade.

  • Prophet — Um modelo de regressão aditiva que funciona melhor com séries temporais que têm fortes efeitos sazonais e várias temporadas de dados históricos. O algoritmo é útil para conjuntos de dados com tendências de crescimento não lineares que se aproximam de um limite.

Quantiles de previsão

Para previsão de séries temporais, SageMaker treine 6 candidatos modelo com sua série temporal alvo. Em seguida, SageMaker combina esses modelos usando um método de conjunto de empilhamento para criar um modelo de previsão ideal para uma determinada métrica objetiva. Cada modelo de previsão gera uma previsão probabilística produzindo previsões em quantis entre P1 e P99. Esses quantis são usados para contabilizar a incerteza da previsão. Por padrão, as previsões são geradas para 0,1 (p10), 0,5 (p50) e 0,9 (p90). Você pode optar por especificar até cinco de seus próprios quantis de 0,01 (p1) a 0,99 (p99), por incrementos de 0,01 ou mais.