CatBoost - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

CatBoost

CatBoosté uma implementação de código aberto popular e de alto desempenho do algoritmo Gradient Boosting Decision Tree (). GBDT GBDTé um algoritmo de aprendizado supervisionado que tenta prever com precisão uma variável alvo combinando um conjunto de estimativas de um conjunto de modelos mais simples e mais fracos.

CatBoost introduz dois avanços algorítmicos críticos para: GBDT

  1. A implementação do aumento ordenado, uma alternativa baseada em permutação ao algoritmo clássico

  2. Um algoritmo inovador para processar recursos categóricos

Ambas as técnicas foram criadas para combater uma mudança de previsão causada por um tipo especial de vazamento de alvo presente em todas as implementações atualmente existentes de algoritmos de aumento de gradiente. Esta página inclui informações sobre recomendações de EC2 instâncias da Amazon e exemplos de notebooks para CatBoost.

Recomendação de EC2 instância da Amazon para o CatBoost algoritmo

SageMaker CatBoost atualmente, apenas trens usandoCPUs. CatBoost é um algoritmo limitado à memória (em oposição ao limitado à computação). Portanto, uma instância de computação de uso geral (por exemplo, M5) é uma opção melhor do que uma instância otimizada para computação (por exemplo, C5). Além disso, recomendamos que você tenha memória total suficiente em instâncias específicas para armazenar os dados de treinamento.

CatBoost cadernos de amostra

A tabela a seguir descreve uma variedade de exemplos de notebooks que abordam diferentes casos de uso do algoritmo da Amazon SageMaker CatBoost .

Título do caderno Descrição

Classificação tabular com Amazon SageMaker Light GBM e algoritmo CatBoost

Este notebook demonstra o uso do SageMaker CatBoost algoritmo da Amazon para treinar e hospedar um modelo de classificação tabular.

Regressão tabular com Amazon SageMaker Light GBM e algoritmo CatBoost

Este notebook demonstra o uso do SageMaker CatBoost algoritmo da Amazon para treinar e hospedar um modelo de regressão tabular.

Para obter instruções sobre como criar e acessar instâncias do notebook Jupyter que você pode usar para executar o exemplo SageMaker, consulte. Instâncias do Amazon SageMaker Notebook Depois de criar uma instância do notebook e abri-la, escolha a guia SageMakerExemplos para ver uma lista de todas as SageMaker amostras. Para abrir um caderno, escolha sua guia Use (Uso) e depois escolha Create copy (Criar cópia).