Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
SageMaker Autopilot
penting
Pada 30 November 2023, UI Autopilot bermigrasi ke Amazon SageMaker Canvas sebagai bagian dari pengalaman Amazon Studio yang diperbarui. SageMaker SageMaker Canvas memberikan analis dan ilmuwan data warga kemampuan tanpa kode untuk tugas-tugas seperti persiapan data, rekayasa fitur, pemilihan algoritme, pelatihan dan penyetelan, inferensi, dan banyak lagi. Pengguna dapat memanfaatkan visualisasi bawaan dan analisis bagaimana-jika untuk mengeksplorasi data mereka dan skenario yang berbeda, dengan prediksi otomatis yang memungkinkan mereka untuk dengan mudah memproduksi model mereka. Canvas mendukung berbagai kasus penggunaan, termasuk visi komputer, peramalan permintaan, pencarian cerdas, dan AI generatif.
Pengguna Amazon SageMaker Studio Classic, pengalaman Studio sebelumnya, dapat terus menggunakan Autopilot UI di Studio Classic. Pengguna dengan pengalaman pengkodean dapat terus menggunakan semua APIreferensi dalam apa pun yang didukung SDK untuk implementasi teknis.
Jika Anda telah menggunakan Autopilot di Studio Classic sampai sekarang dan ingin bermigrasi ke SageMaker Canvas, Anda mungkin harus memberikan izin tambahan ke profil pengguna atau IAM peran Anda sehingga Anda dapat membuat dan menggunakan aplikasi Canvas. SageMaker Untuk informasi selengkapnya, lihat (Opsional) Migrasi dari Autopilot di Studio Classic ke Canvas SageMaker .
Semua instruksi terkait UI dalam panduan ini berkaitan dengan fitur mandiri Autopilot sebelum bermigrasi ke Amazon Canvas. SageMaker Pengguna yang mengikuti petunjuk ini harus menggunakan Studio Classic.
Amazon SageMaker Autopilot adalah rangkaian fitur yang menyederhanakan dan mempercepat berbagai tahapan alur kerja pembelajaran mesin dengan mengotomatiskan proses pembuatan dan penerapan model pembelajaran mesin (AutoML). Halaman berikut menjelaskan informasi penting tentang Amazon SageMaker Autopilot.
Autopilot melakukan tugas-tugas utama berikut yang dapat Anda gunakan pada autopilot atau dengan berbagai tingkat bimbingan manusia:
-
Analisis dan pra-pemrosesan data: Autopilot mengidentifikasi jenis masalah spesifik Anda, menangani nilai yang hilang, menormalkan data Anda, memilih fitur, dan secara keseluruhan menyiapkan data untuk pelatihan model.
-
Pemilihan model: Autopilot mengeksplorasi berbagai algoritma dan menggunakan teknik resampling validasi silang untuk menghasilkan metrik yang mengevaluasi kualitas prediktif algoritme berdasarkan metrik objektif yang telah ditentukan sebelumnya.
-
Optimasi Hyperparameter: Autopilot mengotomatiskan pencarian untuk konfigurasi hyperparameter yang optimal.
-
Pelatihan dan evaluasi model: Autopilot mengotomatiskan proses pelatihan dan mengevaluasi berbagai kandidat model. Ini membagi data menjadi set pelatihan dan validasi, melatih kandidat model yang dipilih menggunakan data pelatihan, dan mengevaluasi kinerja mereka pada data tak terlihat dari set validasi. Terakhir, ini memberi peringkat kandidat model yang dioptimalkan berdasarkan kinerja mereka dan mengidentifikasi model berkinerja terbaik.
-
Penerapan model: Setelah Autopilot mengidentifikasi model berkinerja terbaik, ia memberikan opsi untuk menerapkan model secara otomatis dengan menghasilkan artefak model dan titik akhir yang mengekspos file. API Aplikasi eksternal dapat mengirim data ke titik akhir dan menerima prediksi atau kesimpulan yang sesuai.
Autopilot mendukung pembuatan model pembelajaran mesin pada kumpulan data besar hingga ratusan. GBs
Diagram berikut menguraikan tugas-tugas proses AutoML ini yang dikelola oleh Autopilot.
Bergantung pada tingkat kenyamanan Anda dengan proses pembelajaran mesin dan pengalaman pengkodean, Anda dapat menggunakan Autopilot dengan berbagai cara:
-
Menggunakan UI Studio Classic, pengguna dapat memilih antara pengalaman tanpa kode atau memiliki beberapa tingkat input manusia.
catatan
Hanya eksperimen yang dibuat dari data tabular untuk tipe masalah seperti regresi atau klasifikasi yang tersedia melalui UI Studio Classic.
-
Menggunakan AutoML API, pengguna dengan pengalaman pengkodean dapat menggunakan yang tersedia SDKs untuk membuat pekerjaan AutoML. Pendekatan ini memberikan fleksibilitas dan opsi penyesuaian yang lebih besar dan tersedia untuk semua jenis masalah.
Autopilot saat ini mendukung jenis masalah berikut:
catatan
Tugas-tugas seperti klasifikasi teks dan gambar, peramalan deret waktu, dan fine-tuning model bahasa besar tersedia secara eksklusif melalui AutoML versi 2. REST API Jika bahasa pilihan Anda adalah Python, Anda dapat merujuk ke AWS SDK for Python (Boto3)
Pengguna yang lebih menyukai kenyamanan antarmuka pengguna dapat menggunakan Amazon SageMaker Canvas untuk mengakses model pra-terlatih dan model dasar AI generatif, atau membuat model khusus yang disesuaikan untuk teks tertentu, klasifikasi gambar, kebutuhan peramalan, atau AI generatif.
-
Klasifikasi regresi, biner, dan multikelas dengan data tabular yang diformat sebagai CSV atau file Parket di mana setiap kolom berisi fitur dengan tipe data tertentu dan setiap baris berisi pengamatan. Tipe data kolom yang diterima meliputi numerik, kategoris, teks, dan deret waktu yang terdiri dari string angka yang dipisahkan koma.
-
Untuk membuat pekerjaan Autopilot sebagai percobaan percontohan menggunakan SageMaker API referensi, lihat. Buat Pekerjaan Regresi atau Klasifikasi untuk Data Tabular Menggunakan AutoML API
-
Untuk membuat pekerjaan Autopilot sebagai percobaan percontohan menggunakan UI Studio Classic, lihat. Membuat eksperimen Autopilot Regresi atau Klasifikasi untuk data tabular menggunakan UI Studio Classic
-
Jika Anda seorang administrator yang ingin melakukan pra-konfigurasi infrastruktur default, jaringan, atau parameter keamanan eksperimen Autopilot di Studio Classic UI, lihat. Konfigurasikan parameter default eksperimen Autopilot (untuk administrator)
-
-
Klasifikasi teks dengan data yang diformat sebagai CSV atau file Parket di mana kolom menyediakan kalimat yang akan diklasifikasikan, sementara kolom lain harus memberikan label kelas yang sesuai. Lihat Buat pekerjaan AutoML untuk klasifikasi teks menggunakan API.
-
Klasifikasi gambar dengan format gambar sepertiPNG,JPEG, atau kombinasi keduanya. LihatBuat Job Klasifikasi Gambar menggunakan AutoML API.
-
Peramalan deret waktu dengan data deret waktu yang diformat sebagai CSV atau file parket.Lihat. Buat pekerjaan AutoML untuk peramalan deret waktu menggunakan API
-
Fine-tuning model bahasa besar (LLMs) untuk pembuatan teks dengan data yang diformat sebagai CSV atau file parket.Lihat. Buat pekerjaan AutoML untuk menyempurnakan model pembuatan teks menggunakan API
Selain itu, Autopilot membantu pengguna memahami bagaimana model membuat prediksi dengan secara otomatis menghasilkan laporan yang menunjukkan pentingnya setiap fitur individu. Ini memberikan transparansi dan wawasan tentang faktor-faktor yang mempengaruhi prediksi, yang dapat digunakan oleh tim risiko dan kepatuhan serta regulator eksternal. Autopilot juga menyediakan laporan kinerja model, yang mencakup ringkasan metrik evaluasi, matriks kebingungan, berbagai visualisasi seperti kurva karakteristik operasi penerima dan kurva penarikan presisi, dan banyak lagi. Isi spesifik dari setiap laporan bervariasi tergantung pada jenis masalah eksperimen Autopilot.
Laporan penjelasan dan kinerja untuk kandidat model terbaik dalam eksperimen Autopilot tersedia untuk jenis masalah klasifikasi data teks, gambar, dan tabel.
Untuk kasus penggunaan data tabular seperti regresi atau klasifikasi, Autopilot menawarkan visibilitas tambahan tentang bagaimana data diperdebatkan dan bagaimana kandidat model dipilih, dilatih, dan disetel dengan menghasilkan notebook yang berisi kode yang digunakan untuk mengeksplorasi data dan menemukan model berkinerja terbaik. Notebook ini menyediakan lingkungan interaktif dan eksplorasi untuk membantu Anda mempelajari tentang dampak berbagai input atau trade-off yang dibuat dalam eksperimen. Anda dapat bereksperimen lebih lanjut dengan kandidat model berkinerja lebih tinggi dengan membuat modifikasi Anda sendiri pada eksplorasi data dan notebook definisi kandidat yang disediakan oleh Autopilot.
Dengan Amazon SageMaker, Anda hanya membayar untuk apa yang Anda gunakan. Anda membayar sumber daya komputasi dan penyimpanan yang mendasarinya di dalam SageMaker atau AWS layanan lain, berdasarkan penggunaan Anda. Untuk informasi selengkapnya tentang biaya penggunaan SageMaker, lihat SageMakerHarga Amazon
Topik
- Buat Pekerjaan Regresi atau Klasifikasi untuk Data Tabular Menggunakan AutoML API
- Buat Job Klasifikasi Gambar menggunakan AutoML API
- Buat pekerjaan AutoML untuk klasifikasi teks menggunakan API
- Buat pekerjaan AutoML untuk peramalan deret waktu menggunakan API
- Buat pekerjaan AutoML untuk menyempurnakan model pembuatan teks menggunakan API
- Membuat eksperimen Autopilot Regresi atau Klasifikasi untuk data tabular menggunakan UI Studio Classic
- Notebook SageMaker contoh Amazon Autopilot
- Video: Gunakan Autopilot untuk mengotomatisasi dan menjelajahi proses pembelajaran mesin
- Tutorial: Memulai dengan Amazon SageMaker Autopilot
- Kuota autopilot
- APIPanduan referensi untuk Autopilot