CatBoost - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

CatBoost

CatBoosté uma implementação de código aberto popular e de alto desempenho do algoritmo Gradient Boosting Decision Tree (GBDT). GBDT é um algoritmo de aprendizado supervisionado que tenta prever com precisão uma variável de destino. Para isso, combina um grupo de estimativas de um conjunto de modelos mais simples e mais fracos.

CatBoost introduz dois avanços algorítmicos críticos no GBDT:

  1. A implementação do aumento ordenado, uma alternativa baseada em permutação ao algoritmo clássico

  2. Um algoritmo inovador para processar atributos categóricos

Ambas as técnicas foram criadas para combater uma mudança de predição causada por um tipo especial de vazamento de alvo presente em todas as implementações atualmente existentes de algoritmos de aumento de gradiente. Esta página inclui informações sobre recomendações de EC2 instâncias da Amazon e exemplos de notebooks para CatBoost.

Recomendação de EC2 instância da Amazon para o CatBoost algoritmo

SageMaker CatBoost Atualmente, a IA treina apenas usando CPUs. CatBoost é um algoritmo limitado à memória (em oposição ao limitado à computação). Portanto, uma instância de computação de uso geral (por exemplo, M5) é uma opção melhor do que uma instância otimizada para computação (por exemplo, C5). Além disso, recomendamos que você tenha memória total suficiente em instâncias específicas para armazenar os dados de treinamento.

CatBoost cadernos de amostra

A tabela a seguir descreve uma variedade de exemplos de cadernos que abordam diferentes casos de uso do algoritmo Amazon SageMaker AI CatBoost .

Título do caderno Descrição

Classificação tabular com Amazon SageMaker AI LightGBM e algoritmo CatBoost

Este caderno demonstra o uso do CatBoost algoritmo Amazon SageMaker AI para treinar e hospedar um modelo de classificação tabular.

Regressão tabular com Amazon SageMaker AI LightGBM e algoritmo CatBoost

Este caderno demonstra o uso do CatBoost algoritmo Amazon SageMaker AI para treinar e hospedar um modelo de regressão tabular.

Para obter instruções sobre como criar e acessar instâncias do notebook Jupyter que você pode usar para executar o exemplo em SageMaker IA, consulte. Instâncias do Amazon SageMaker Notebook Depois de criar uma instância do notebook e abri-la, escolha a guia Exemplos de SageMaker IA para ver uma lista de todas as amostras de SageMaker IA. Para abrir um caderno, escolha a guia Uso e depois escolha Criar cópia.