CatBoost - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

CatBoost

CatBoostadalah implementasi open-source yang populer dan berkinerja tinggi dari algoritma Gradient Boosting Decision Tree (GBDT). GBDT adalah algoritma pembelajaran yang diawasi yang mencoba memprediksi variabel target secara akurat dengan menggabungkan ansambel perkiraan dari serangkaian model yang lebih sederhana dan lebih lemah.

CatBoost memperkenalkan dua kemajuan algoritmik penting ke GBDT:

  1. Implementasi peningkatan berurutan, alternatif yang digerakkan oleh permutasi untuk algoritme klasik

  2. Algoritma inovatif untuk memproses fitur kategoris

Kedua teknik diciptakan untuk melawan pergeseran prediksi yang disebabkan oleh jenis kebocoran target khusus yang ada di semua implementasi algoritma peningkatan gradien yang ada saat ini. Halaman ini mencakup informasi tentang rekomendasi EC2 instans Amazon dan contoh buku catatan untuk CatBoost.

Rekomendasi EC2 instans Amazon untuk CatBoost algoritme

SageMaker AI CatBoost saat ini hanya menggunakan CPUs kereta. CatBoost adalah algoritma yang terikat memori (sebagai lawan dari compute-bound). Jadi, instance komputasi tujuan umum (misalnya, M5) adalah pilihan yang lebih baik daripada instance yang dioptimalkan komputasi (misalnya, C5). Selanjutnya, kami menyarankan Anda memiliki memori total yang cukup dalam instance yang dipilih untuk menyimpan data pelatihan.

CatBoost contoh notebook

Tabel berikut menguraikan berbagai contoh notebook yang membahas berbagai kasus penggunaan algoritma Amazon SageMaker AI CatBoost .

Judul Notebook Deskripsi

Klasifikasi tabel dengan Amazon SageMaker AI LightGBM dan algoritma CatBoost

Notebook ini menunjukkan penggunaan CatBoost algoritma Amazon SageMaker AI untuk melatih dan menjadi tuan rumah model klasifikasi tabel.

Regresi tabular dengan Amazon SageMaker AI LightGBM dan algoritma CatBoost

Notebook ini menunjukkan penggunaan CatBoost algoritma Amazon SageMaker AI untuk melatih dan menjadi tuan rumah model regresi tabular.

Untuk petunjuk tentang cara membuat dan mengakses instance notebook Jupyter yang dapat Anda gunakan untuk menjalankan contoh di SageMaker AI, lihat. Instans SageMaker Notebook Amazon Setelah Anda membuat instance notebook dan membukanya, pilih tab Contoh SageMaker AI untuk melihat daftar semua sampel SageMaker AI. Untuk membuka buku catatan, pilih tab Use dan pilih Create copy.