SageMaker Autopilot

penting

Pada 30 November 2023, UI Autopilot bermigrasi ke Amazon SageMaker Canvas sebagai bagian dari pengalaman Amazon Studio yang diperbarui. SageMaker SageMaker Canvas memberikan analis dan ilmuwan data warga kemampuan tanpa kode untuk tugas-tugas seperti persiapan data, rekayasa fitur, pemilihan algoritme, pelatihan dan penyetelan, inferensi, dan banyak lagi. Pengguna dapat memanfaatkan visualisasi bawaan dan analisis bagaimana-jika untuk mengeksplorasi data mereka dan skenario yang berbeda, dengan prediksi otomatis yang memungkinkan mereka untuk dengan mudah memproduksi model mereka. Canvas mendukung berbagai kasus penggunaan, termasuk visi komputer, peramalan permintaan, pencarian cerdas, dan AI generatif.

Pengguna Amazon SageMaker Studio Classic, pengalaman Studio sebelumnya, dapat terus menggunakan Autopilot UI di Studio Classic. Pengguna dengan pengalaman pengkodean dapat terus menggunakan semua referensi API di SDK apa pun yang didukung untuk implementasi teknis.

Jika Anda telah menggunakan Autopilot di Studio Classic sampai sekarang dan ingin bermigrasi ke SageMaker Canvas, Anda mungkin harus memberikan izin tambahan ke profil pengguna atau peran IAM Anda sehingga Anda dapat membuat dan menggunakan aplikasi Canvas. SageMaker Untuk informasi selengkapnya, lihat (Opsional) Migrasi dari Autopilot di Studio Classic ke Canvas SageMaker .

Semua instruksi terkait UI dalam panduan ini berkaitan dengan fitur mandiri Autopilot sebelum bermigrasi ke Amazon Canvas. SageMaker Pengguna yang mengikuti petunjuk ini harus menggunakan Studio Classic.

Amazon SageMaker Autopilot adalah rangkaian fitur yang menyederhanakan dan mempercepat berbagai tahapan alur kerja pembelajaran mesin dengan mengotomatiskan proses pembuatan dan penerapan model pembelajaran mesin (AutoML). Halaman berikut menjelaskan informasi penting tentang Amazon SageMaker Autopilot.

Autopilot melakukan tugas-tugas utama berikut yang dapat Anda gunakan pada autopilot atau dengan berbagai tingkat bimbingan manusia:

Analisis dan pra-pemrosesan data: Autopilot mengidentifikasi jenis masalah spesifik Anda, menangani nilai yang hilang, menormalkan data Anda, memilih fitur, dan secara keseluruhan menyiapkan data untuk pelatihan model.
Pemilihan model: Autopilot mengeksplorasi berbagai algoritma dan menggunakan teknik resampling validasi silang untuk menghasilkan metrik yang mengevaluasi kualitas prediktif algoritme berdasarkan metrik objektif yang telah ditentukan sebelumnya.
Optimasi Hyperparameter: Autopilot mengotomatiskan pencarian untuk konfigurasi hyperparameter yang optimal.
Pelatihan dan evaluasi model: Autopilot mengotomatiskan proses pelatihan dan mengevaluasi berbagai kandidat model. Ini membagi data menjadi set pelatihan dan validasi, melatih kandidat model yang dipilih menggunakan data pelatihan, dan mengevaluasi kinerja mereka pada data tak terlihat dari set validasi. Terakhir, ini memberi peringkat kandidat model yang dioptimalkan berdasarkan kinerja mereka dan mengidentifikasi model berkinerja terbaik.
Penerapan model: Setelah Autopilot mengidentifikasi model berkinerja terbaik, Autopilot memberikan opsi untuk menerapkan model secara otomatis dengan menghasilkan artefak model dan titik akhir yang mengekspos API. Aplikasi eksternal dapat mengirim data ke titik akhir dan menerima prediksi atau kesimpulan yang sesuai.

Autopilot mendukung pembuatan model pembelajaran mesin pada kumpulan data besar hingga ratusan. GBs

Diagram berikut menguraikan tugas-tugas proses AutoML ini yang dikelola oleh Autopilot.

Ikhtisar proses SageMaker AutoML Amazon Autopilot.

Bergantung pada tingkat kenyamanan Anda dengan proses pembelajaran mesin dan pengalaman pengkodean, Anda dapat menggunakan Autopilot dengan berbagai cara:

Menggunakan UI Studio Classic, pengguna dapat memilih antara pengalaman tanpa kode atau memiliki beberapa tingkat input manusia.

catatan
Hanya eksperimen yang dibuat dari data tabular untuk tipe masalah seperti regresi atau klasifikasi yang tersedia melalui UI Studio Classic.
Menggunakan AutoML API, pengguna dengan pengalaman coding dapat menggunakan tersedia SDKs untuk membuat pekerjaan AutoML. Pendekatan ini memberikan fleksibilitas dan opsi penyesuaian yang lebih besar dan tersedia untuk semua jenis masalah.

Autopilot saat ini mendukung jenis masalah berikut:

catatan

Untuk masalah regresi atau klasifikasi yang melibatkan data tabular, pengguna dapat memilih di antara dua opsi: menggunakan antarmuka pengguna Studio Classic atau Referensi API.

Tugas seperti klasifikasi teks dan gambar, peramalan deret waktu, dan fine-tuning model bahasa besar tersedia secara eksklusif melalui API REST AutoML versi 2. Jika bahasa pilihan Anda adalah Python, Anda dapat merujuk ke AWS SDK for Python (Boto3)atau MLV2 objek Auto dari Amazon SageMaker Python SDK secara langsung.

Pengguna yang lebih menyukai kenyamanan antarmuka pengguna dapat menggunakan Amazon SageMaker Canvas untuk mengakses model pra-terlatih dan model dasar AI generatif, atau membuat model khusus yang disesuaikan untuk teks tertentu, klasifikasi gambar, kebutuhan peramalan, atau AI generatif.

Klasifikasi regresi, biner, dan multikelas dengan data tabular yang diformat sebagai file CSV atau Parket di mana setiap kolom berisi fitur dengan tipe data tertentu dan setiap baris berisi pengamatan. Tipe data kolom yang diterima meliputi numerik, kategoris, teks, dan deret waktu yang terdiri dari string angka yang dipisahkan koma.
- Untuk membuat pekerjaan Autopilot sebagai percobaan percontohan menggunakan referensi SageMaker API, lihat. Membuat Pekerjaan Regresi atau Klasifikasi untuk Data Tabular Menggunakan AutoML API
- Untuk membuat pekerjaan Autopilot sebagai percobaan percontohan menggunakan UI Studio Classic, lihat. Membuat eksperimen Autopilot Regresi atau Klasifikasi untuk data tabular menggunakan UI Studio Classic
- Jika Anda seorang administrator yang ingin melakukan pra-konfigurasi infrastruktur default, jaringan, atau parameter keamanan eksperimen Autopilot di Studio Classic UI, lihat. Konfigurasikan parameter default eksperimen Autopilot (untuk administrator)
Klasifikasi teks dengan data yang diformat sebagai file CSV atau Parket di mana kolom menyediakan kalimat yang akan diklasifikasikan, sementara kolom lain harus memberikan label kelas yang sesuai. Lihat Membuat pekerjaan AutoML untuk klasifikasi teks menggunakan API.
Klasifikasi gambar dengan format gambar seperti PNG, JPEG, atau kombinasi keduanya. Lihat. Membuat Job Klasifikasi Gambar menggunakan AutoML API
Peramalan deret waktu dengan data deret waktu yang diformat sebagai file CSV atau Parket. Lihat. Buat pekerjaan AutoML untuk peramalan deret waktu menggunakan API
Fine-tuning model bahasa besar (LLMs) untuk pembuatan teks dengan data yang diformat sebagai file CSV atau Parquet. Lihat. Buat pekerjaan AutoML untuk menyempurnakan model pembuatan teks menggunakan API

Selain itu, Autopilot membantu pengguna memahami bagaimana model membuat prediksi dengan secara otomatis menghasilkan laporan yang menunjukkan pentingnya setiap fitur individu. Ini memberikan transparansi dan wawasan tentang faktor-faktor yang mempengaruhi prediksi, yang dapat digunakan oleh tim risiko dan kepatuhan serta regulator eksternal. Autopilot juga menyediakan laporan kinerja model, yang mencakup ringkasan metrik evaluasi, matriks kebingungan, berbagai visualisasi seperti kurva karakteristik operasi penerima dan kurva penarikan presisi, dan banyak lagi. Isi spesifik dari setiap laporan bervariasi tergantung pada jenis masalah eksperimen Autopilot.

Laporan penjelasan dan kinerja untuk kandidat model terbaik dalam eksperimen Autopilot tersedia untuk jenis masalah klasifikasi data teks, gambar, dan tabel.

Untuk kasus penggunaan data tabular seperti regresi atau klasifikasi, Autopilot menawarkan visibilitas tambahan tentang bagaimana data diperdebatkan dan bagaimana kandidat model dipilih, dilatih, dan disetel dengan menghasilkan notebook yang berisi kode yang digunakan untuk mengeksplorasi data dan menemukan model berkinerja terbaik. Notebook ini menyediakan lingkungan interaktif dan eksplorasi untuk membantu Anda mempelajari tentang dampak berbagai input atau trade-off yang dibuat dalam eksperimen. Anda dapat bereksperimen lebih lanjut dengan kandidat model berkinerja lebih tinggi dengan membuat modifikasi Anda sendiri pada eksplorasi data dan notebook definisi kandidat yang disediakan oleh Autopilot.

Dengan Amazon SageMaker AI, Anda hanya membayar untuk apa yang Anda gunakan. Anda membayar sumber daya komputasi dan penyimpanan yang mendasarinya dalam SageMaker AI atau AWS layanan lain, berdasarkan penggunaan Anda. Untuk informasi selengkapnya tentang biaya penggunaan SageMaker AI, lihat Harga Amazon SageMaker AI.

Topik

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

ML otomatis, tanpa kode, atau kode rendah

Membuat Pekerjaan Regresi atau Klasifikasi Menggunakan AutoML API