Cahaya GBM - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Cahaya GBM

Light GBM adalah implementasi open-source yang populer dan efisien dari algoritma Gradient Boosting Decision Tree ()GBDT. GBDTadalah algoritma pembelajaran yang diawasi yang mencoba untuk secara akurat memprediksi variabel target dengan menggabungkan ansambel perkiraan dari serangkaian model yang lebih sederhana dan lebih lemah. Cahaya GBM menggunakan teknik tambahan untuk secara signifikan meningkatkan efisiensi dan skalabilitas konvensionalGBDT. Halaman ini mencakup informasi tentang rekomendasi EC2 instans Amazon dan contoh buku catatan untuk LightGBM.

Rekomendasi EC2 instans Amazon untuk GBM algoritma Light

SageMaker Light GBM saat ini mendukung pelatihan instans tunggal dan multi-instanceCPU. Untuk pelatihan multi-instance (CPUpelatihan terdistribusi), tentukan instance_count lebih besar dari 1 saat Anda menentukan Estimator Anda. Untuk informasi selengkapnya tentang pelatihan terdistribusi dengan LightGBM, lihat pelatihan Amazon SageMaker Light GBM Distributed menggunakan Dask.

Cahaya GBM adalah algoritma yang terikat memori (sebagai lawan dari terikat komputasi). Jadi, instance komputasi tujuan umum (misalnya, M5) adalah pilihan yang lebih baik daripada instance yang dioptimalkan komputasi (misalnya, C5). Selanjutnya, kami menyarankan Anda memiliki memori total yang cukup dalam instance yang dipilih untuk menyimpan data pelatihan.

Notebook GBM sampel ringan

Tabel berikut menguraikan berbagai contoh notebook yang membahas kasus penggunaan yang berbeda dari algoritma Amazon SageMaker LightGBM.

Judul Notebook Deskripsi

Klasifikasi tabel dengan Amazon SageMaker Light GBM dan algoritma CatBoost

Notebook ini menunjukkan penggunaan GBM algoritma Amazon SageMaker Light untuk melatih dan menjadi tuan rumah model klasifikasi tabular.

Regresi tabular dengan Amazon SageMaker Light dan algoritma GBM CatBoost

Notebook ini menunjukkan penggunaan GBM algoritma Amazon SageMaker Light untuk melatih dan menjadi tuan rumah model regresi tabular.

Pelatihan Amazon SageMaker Light GBM Distributed menggunakan Dask

Notebook ini menunjukkan pelatihan terdistribusi dengan GBM algoritma Amazon SageMaker Light menggunakan kerangka Dask.

Untuk petunjuk tentang cara membuat dan mengakses instance notebook Jupyter yang dapat Anda gunakan untuk menjalankan contoh, lihat. SageMaker Instans SageMaker Notebook Amazon Setelah Anda membuat instance notebook dan membukanya, pilih tab SageMakerContoh untuk melihat daftar semua SageMaker sampel. Untuk membuka buku catatan, pilih tab Use dan pilih Create copy.