Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan Instans Notebook untuk membuat model
Salah satu cara terbaik bagi praktisi machine learning (ML) untuk menggunakan Amazon SageMaker adalah dengan melatih dan menerapkan model ML menggunakan instance SageMaker notebook. Instans SageMaker notebook membantu menciptakan lingkungan dengan memulai server Jupyter di Amazon Elastic Compute Cloud (Amazon EC2) dan menyediakan kernel yang telah dikonfigurasi sebelumnya dengan paket-paket berikut: Amazon SageMaker Python SDK,,AWS CLI(), Conda, Pandas, pustaka kerangka pembelajaran mendalam AWS SDK for Python (Boto3) AWS Command Line Interface , dan pustaka lain untuk ilmu data dan pembelajaran mesin.
Machine Learning dengan SageMaker Python SDK
Untuk melatih, memvalidasi, menyebarkan, dan mengevaluasi model ML dalam instance SageMaker notebook, gunakan Python SageMaker SDK. SageMaker Python SDK abstrak AWS SDK for Python (Boto3) dan operasi API. SageMaker Ini memungkinkan Anda untuk berintegrasi dengan dan mengatur AWS layanan lain, seperti Amazon Simple Storage Service (Amazon S3) untuk menyimpan data dan artefak model, Amazon Elastic Container Registry (ECR) untuk mengimpor dan melayani model ML, Amazon Elastic Compute Cloud (Amazon EC2) untuk pelatihan dan inferensi.
Anda juga dapat memanfaatkan SageMaker fitur yang membantu Anda menangani setiap tahap siklus ML lengkap: pelabelan data, pra-pemrosesan data, pelatihan model, penerapan model, evaluasi kinerja prediksi, dan pemantauan kualitas model dalam produksi.
Jika Anda adalah SageMaker pengguna pertama kali, kami sarankan Anda untuk menggunakan SageMaker Python SDK, mengikuti end-to-end tutorial ML. Untuk menemukan dokumentasi open source, lihat Amazon SageMaker Python
Ikhtisar Tutorial
Tutorial Memulai ini memandu Anda melalui cara membuat instance SageMaker notebook, membuka notebook Jupyter dengan kernel yang telah dikonfigurasi sebelumnya dengan lingkungan Conda untuk pembelajaran mesin, dan memulai SageMaker sesi untuk menjalankan siklus ML. end-to-end Anda akan mempelajari cara menyimpan kumpulan data ke bucket Amazon S3 default yang dipasangkan secara otomatis dengan SageMaker sesi, mengirimkan tugas pelatihan model ML ke Amazon EC2, dan menerapkan model terlatih untuk prediksi dengan hosting atau inferensi batch melalui Amazon EC2.
Tutorial ini secara eksplisit menunjukkan alur lengkap dari pelatihan model XGBoost dari kumpulan model bawaan. SageMaker Anda menggunakan kumpulan data Sensus Dewasa AS
-
SageMakerXGBoost - Model XGBoost
disesuaikan dengan SageMaker lingkungan dan dikonfigurasikan sebelumnya sebagai wadah Docker. SageMakermenyediakan serangkaian algoritma bawaan yang disiapkan untuk menggunakan SageMaker fitur. Untuk mempelajari selengkapnya tentang algoritma ML yang disesuaikan SageMaker, lihat Memilih Algoritma dan Menggunakan Algoritma SageMaker Bawaan Amazon. Untuk operasi API algoritma SageMaker bawaan, lihat Algoritma Pihak Pertama di Amazon Python SageMaker SDK. -
Dataset Sensus Dewasa
— Dataset dari database biro Sensus 1994 oleh Ronny Kohavi dan Barry Becker (Data Mining and Visualization, Silicon Graphics). Model SageMaker XGBoost dilatih menggunakan dataset ini untuk memprediksi apakah seseorang menghasilkan lebih dari $50.000 per tahun atau kurang.
Topik
- Langkah 1: Buat Instans SageMaker Notebook Amazon untuk tutorial
- Langkah 2: Buat notebook Jupyter di instance notebook SageMaker
- Langkah 3: Unduh, Jelajahi, dan Ubah Dataset
- Langkah 4: Latih Model
- Langkah 5: Menyebarkan Model ke Amazon EC2
- Langkah 6: Evaluasi Model
- Langkah 7: Bersihkan sumber daya instans SageMaker notebook Amazon