Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Persyaratan dan praktik terbaik untuk membuat produk pembelajaran mesin
Adalah penting bahwa pembeli Anda merasa mudah untuk menguji paket model dan produk algoritma Anda. Bagian berikut menjelaskan persyaratan untuk membuat daftar produk machine learning (ML) dan praktik terbaik untuk produk ML. Untuk ringkasan lengkap persyaratan dan rekomendasi, lihatRingkasan persyaratan dan rekomendasi untuk daftar produk ML.
catatan
AWS Marketplace Perwakilan dapat menghubungi Anda untuk membantu Anda memenuhi persyaratan ini jika produk yang Anda publikasikan tidak memenuhi persyaratan tersebut.
Topik
Aset yang dibutuhkan
Sebelum membuat daftar produk pembelajaran mesin, pastikan Anda memiliki aset wajib berikut:
-
Amazon Resource Name (ARN) - Menyediakan paket model atau sumber daya algoritme di tempat Wilayah AWS Anda menerbitkan (lihatDidukung Wilayah AWS untuk penerbitan). ARN
-
Paket ARN untuk model memiliki formulir ini:
arn:aws:sagemaker:<region>:<account-id>:model-package/<model-package-name>
-
Sebuah ARN untuk algoritma memiliki bentuk ini:
arn:aws:sagemaker:<region>:<account-id>:algorithm/<algorithm-name>
-
-
Persyaratan untuk informasi penggunaan— Berikan detail tentang input, output, dan contoh kode.
-
Persyaratan untuk input dan output— Menyediakan file atau teks.
-
Persyaratan untuk notebook Jupyter— Menunjukkan penggunaan produk lengkap.
Praktik terbaik umum untuk produk ML
Berikan informasi berikut untuk produk pembelajaran mesin Anda:
-
Untuk deskripsi produk, sertakan yang berikut ini:
-
Apa yang dilakukan model Anda
-
Siapa target pelanggan
-
Apa kasus penggunaan yang paling penting
-
Bagaimana model Anda dilatih atau jumlah data yang digunakan
-
Apa metrik kinerja dan data validasi yang digunakan
-
Jika medis, apakah model Anda untuk penggunaan diagnostik atau tidak
-
-
Secara default, produk pembelajaran mesin dikonfigurasi untuk memiliki visibilitas publik. Namun, Anda dapat membuat produk dengan visibilitas pribadi. Untuk informasi selengkapnya, lihat Membuat daftar produk Anda.
-
(Opsional) Untuk produk berbayar, tawarkan uji coba gratis selama 14-30 hari bagi pelanggan untuk mencoba produk Anda. Untuk informasi selengkapnya, lihat Harga produk pembelajaran mesin untuk AWS Marketplace.
-
(Opsional) Untuk produk paket model, jika Anda ingin mengaktifkan demo produk real-time di halaman daftar produk Anda, hubungi tim Operasi AWS Marketplace Penjual
. Demo produk memungkinkan calon pembeli untuk mencoba model Anda langsung di halaman daftar tanpa berlangganan atau menggunakan model itu sendiri.
Persyaratan untuk informasi penggunaan
Informasi penggunaan yang jelas yang menggambarkan input dan output yang diharapkan dari produk Anda (dengan contoh) sangat penting untuk mendorong pengalaman pembeli yang positif.
Dengan setiap versi baru sumber daya Anda yang Anda tambahkan ke daftar produk Anda, Anda harus memberikan informasi penggunaan.
Untuk menambahkan informasi penggunaan untuk produk baru yang Anda terbitkan untuk pertama kalinya, masuk ke Portal Manajemen AWS Marketplace konsol. Dari dropdown Produk, pilih Pembelajaran mesin. Pilih produk Anda. Dalam Ikhtisar Produk di bawah opsi Peluncuran, berikan paket model atau sumber daya algoritme Anda, dan pilih Tambah. ARN
Untuk mengedit informasi penggunaan yang ada untuk versi tertentu, pilih Edit di bawah opsi Luncurkan dan kemudian Edit versi.
Persyaratan untuk input dan output
Penjelasan yang jelas tentang format Anda, dengan contoh input dan output, penting untuk membantu pembeli Anda memahami dan menggunakan produk Anda. Pemahaman ini membantu pembeli Anda untuk melakukan transformasi yang diperlukan pada data input untuk mendapatkan hasil inferensi terbaik.
Anda akan diminta untuk hal berikut saat menambahkan SageMaker sumber daya Amazon Anda ke daftar produk Anda.
Input dan output inferensi
Untuk input inferensi, sediakan format input untuk titik akhir real-time dan pekerjaan transformasi batch. Sertakan cuplikan kode untuk setiap pra-pemrosesan data yang diperlukan. Sertakan jenis MIME konten yang didukung (misalnya, image/jpeg, image/png, image/bmp), deskripsi nilai jika berlaku, dan batasan. Sertakan sampel masukan yang dihosting di GitHub
Untuk output inferensi, sediakan format output untuk titik akhir real-time dan pekerjaan transformasi batch. Sertakan jenis MIME konten keluaran (misalnya, aplikasi/json, gambar/jpeg) dan deskripsi nilai jika berlaku. Sertakan sampel keluaran yang dihosting di GitHub
Untuk sampel, berikan file input yang berfungsi dengan produk Anda. Jika model Anda melakukan klasifikasi multiclass, berikan setidaknya satu file input sampel untuk setiap kelas.
Input pelatihan
Di bagian Informasi untuk melatih model, berikan format data input dan cuplikan kode untuk setiap pra-pemrosesan data yang diperlukan. Sertakan jenis MIME konten yang didukung (misalnya, image/jpeg, image/png, image/bmp), deskripsi nilai jika berlaku, dan batasan. Pastikan untuk menyertakan sampel masukan yang di-host GitHub
Jelaskan fitur opsional dan wajib yang dapat disediakan oleh pembeli, dan tentukan apakah mode PIPE
input didukung. Jika pelatihan terdistribusi (pelatihan dengan lebih dari CPU GPU 1/instance) didukung, tentukan ini. Untuk penyetelan, daftarkan hyperparameters yang direkomendasikan.
Persyaratan untuk notebook Jupyter
Saat menambahkan SageMaker sumber daya Anda ke daftar produk Anda, berikan tautan ke contoh buku catatan Jupyter yang dihosting GitHub
Gunakan AWS SDK for Python (Boto). Notebook sampel yang dikembangkan dengan baik memudahkan pembeli untuk mencoba dan menggunakan daftar Anda.
Untuk produk paket model, notebook sampel Anda mendemonstrasikan persiapan data input, pembuatan titik akhir untuk inferensi waktu nyata, dan kinerja pekerjaan transformasi batch. Untuk informasi selengkapnya, lihat daftar Model Package dan Contoh notebook
catatan
Contoh notebook Jupyter yang belum berkembang yang tidak menunjukkan beberapa kemungkinan input dan langkah pra-pemrosesan data mungkin menyulitkan pembeli untuk sepenuhnya memahami proposisi nilai produk Anda.
Untuk produk algoritme, notebook sampel menunjukkan pelatihan lengkap, penyetelan, pembuatan model, pembuatan titik akhir untuk inferensi waktu nyata, dan kinerja pekerjaan transformasi batch. Untuk informasi selengkapnya, lihat Daftar algoritma dan Contoh buku catatan
catatan
Kurangnya contoh data pelatihan dapat mencegah pembeli Anda menjalankan notebook Jupyter dengan sukses. Notebook sampel yang kurang berkembang dapat mencegah pembeli Anda menggunakan produk Anda dan menghambat adopsi.
Ringkasan persyaratan dan rekomendasi untuk daftar produk ML
Tabel berikut memberikan ringkasan persyaratan dan rekomendasi untuk halaman daftar produk pembelajaran mesin.
Detail | Untuk daftar paket model | Untuk daftar algoritma |
---|---|---|
Product descriptions | ||
Jelaskan secara rinci apa yang dilakukan produk untuk jenis konten yang didukung (misalnya, “mendeteksi X dalam gambar”). | Diperlukan | Diperlukan |
Berikan informasi yang menarik dan membedakan tentang produk (hindari kata sifat seperti klaim “terbaik” atau tidak berdasar). | Disarankan | Disarankan |
Sebutkan kasus penggunaan terpenting untuk produk ini. | Diperlukan | Diperlukan |
Jelaskan data (sumber dan ukuran) yang dilatih dan buat daftar batasan yang diketahui. | Diperlukan | Tidak berlaku |
Jelaskan kerangka inti tempat model dibangun. | Disarankan | Disarankan |
Ringkas metrik kinerja model pada data validasi (misalnya, “Akurasi persen XX.YY yang dibenchmark menggunakan dataset Z”). | Diperlukan | Tidak berlaku |
Meringkas metrik latensi dan/atau throughput model pada jenis instans yang direkomendasikan. | Diperlukan | Tidak berlaku |
Jelaskan kategori algoritma. Misalnya, “Algoritma regresi hutan keputusan ini didasarkan pada ansambel pengklasifikasi terstruktur pohon yang dibangun menggunakan teknik umum agregasi bootstrap dan pilihan fitur acak.” | Tidak berlaku | Diperlukan |
Usage information | ||
Untuk inferensi, sediakan format input untuk pekerjaan endpoint real-time dan batch transform. Sertakan jenis MIME konten yang didukung (misalnya, image/jpeg, image/png, image/bmp), deskripsi nilai jika berlaku, dan batasan. Lihat Persyaratan untuk input dan output. | Diperlukan | Diperlukan |
Untuk inferensi, berikan sampel input untuk pekerjaan endpoint real-time dan batch transform. Sampel harus di-host di GitHub. Lihat Persyaratan untuk input dan output. | Diperlukan | Diperlukan |
Untuk inferensi, sediakan format output untuk titik akhir real-time dan pekerjaan transformasi batch. Sertakan jenis MIME konten keluaran (misalnya, aplikasi/json, gambar/jpeg) dan deskripsi nilai jika berlaku. Lihat Persyaratan untuk input dan output. | Diperlukan | Diperlukan |
Untuk inferensi, berikan sampel keluaran untuk pekerjaan endpoint real-time dan batch transform. Sampel harus di-host di GitHub. Lihat Persyaratan untuk input dan output. | Diperlukan | Diperlukan |
Untuk inferensi, berikan contoh penggunaan pekerjaan endpoint atau batch transform. Sertakan contoh kode menggunakan perintah AWS Command Line Interface (AWS CLI) atau menggunakan file AWS SDK. | Diperlukan | Diperlukan |
Untuk pelatihan, berikan format input. Sertakan jenis MIME konten yang didukung (misalnya, image/jpeg, image/png, image/bmp), deskripsi nilai jika berlaku, dan batasan (misalnya, baris minimum data yang diperlukan). Lihat Persyaratan untuk input dan output. | Tidak berlaku | Diperlukan |
Untuk pelatihan, berikan sampel masukan yang dihosting di GitHub. Lihat Persyaratan untuk input dan output. | Tidak berlaku | Diperlukan |
Untuk pelatihan, berikan contoh melakukan pekerjaan pelatihan. Jelaskan hiperparameter yang didukung, rentangnya, dan dampak keseluruhannya. Tentukan apakah algoritme mendukung penyetelan hyperparameter, pelatihan terdistribusi, atau GPU instance. Sertakan contoh kode seperti AWS CLI perintah atau menggunakan AWS SDK, misalnya. | Tidak berlaku | Diperlukan |
Sediakan notebook Jupyter yang dihosting untuk GitHub menunjukkan penggunaan lengkap produk Anda. Lihat Persyaratan untuk notebook Jupyter. | Diperlukan | Diperlukan |
Memberikan informasi teknis terkait penggunaan produk, termasuk manual pengguna dan data sampel. | Disarankan | Disarankan |