Persyaratan dan praktik terbaik untuk membuat produk pembelajaran mesin - AWS Marketplace

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Persyaratan dan praktik terbaik untuk membuat produk pembelajaran mesin

Adalah penting bahwa pembeli Anda merasa mudah untuk menguji paket model dan produk algoritma Anda. Bagian berikut menjelaskan persyaratan untuk membuat daftar produk machine learning (ML) dan praktik terbaik untuk produk ML. Untuk ringkasan lengkap persyaratan dan rekomendasi, lihatRingkasan persyaratan dan rekomendasi untuk daftar produk ML.

catatan

AWS Marketplace Perwakilan dapat menghubungi Anda untuk membantu Anda memenuhi persyaratan ini jika produk yang Anda publikasikan tidak memenuhi persyaratan tersebut.

Aset yang dibutuhkan

Sebelum membuat daftar produk pembelajaran mesin, pastikan Anda memiliki aset wajib berikut:

Praktik terbaik umum untuk produk ML

Berikan informasi berikut untuk produk pembelajaran mesin Anda:

  • Untuk deskripsi produk, sertakan yang berikut ini:

    • Apa yang dilakukan model Anda

    • Siapa target pelanggan

    • Apa kasus penggunaan yang paling penting

    • Bagaimana model Anda dilatih atau jumlah data yang digunakan

    • Apa metrik kinerja dan data validasi yang digunakan

    • Jika medis, apakah model Anda untuk penggunaan diagnostik atau tidak

  • Secara default, produk pembelajaran mesin dikonfigurasi untuk memiliki visibilitas publik. Namun, Anda dapat membuat produk dengan visibilitas pribadi. Untuk informasi selengkapnya, lihat Membuat daftar produk Anda.

  • (Opsional) Untuk produk berbayar, tawarkan uji coba gratis selama 14-30 hari bagi pelanggan untuk mencoba produk Anda. Untuk informasi selengkapnya, lihat Harga produk pembelajaran mesin untuk AWS Marketplace.

  • (Opsional) Untuk produk paket model, jika Anda ingin mengaktifkan demo produk real-time di halaman daftar produk Anda, hubungi tim Operasi AWS Marketplace Penjual. Demo produk memungkinkan calon pembeli untuk mencoba model Anda langsung di halaman daftar tanpa berlangganan atau menggunakan model itu sendiri.

Persyaratan untuk informasi penggunaan

Informasi penggunaan yang jelas yang menggambarkan input dan output yang diharapkan dari produk Anda (dengan contoh) sangat penting untuk mendorong pengalaman pembeli yang positif.

Dengan setiap versi baru sumber daya Anda yang Anda tambahkan ke daftar produk Anda, Anda harus memberikan informasi penggunaan.

Untuk menambahkan informasi penggunaan untuk produk baru yang Anda terbitkan untuk pertama kalinya, masuk ke Portal Manajemen AWS Marketplace konsol. Dari dropdown Produk, pilih Pembelajaran mesin. Pilih produk Anda. Dalam Ikhtisar Produk di bawah opsi Peluncuran, berikan paket model atau sumber daya algoritme Anda, dan pilih Tambah. ARN

Untuk mengedit informasi penggunaan yang ada untuk versi tertentu, pilih Edit di bawah opsi Luncurkan dan kemudian Edit versi.

Persyaratan untuk input dan output

Penjelasan yang jelas tentang format Anda, dengan contoh input dan output, penting untuk membantu pembeli Anda memahami dan menggunakan produk Anda. Pemahaman ini membantu pembeli Anda untuk melakukan transformasi yang diperlukan pada data input untuk mendapatkan hasil inferensi terbaik.

Anda akan diminta untuk hal berikut saat menambahkan SageMaker sumber daya Amazon Anda ke daftar produk Anda.

Input dan output inferensi

Untuk input inferensi, sediakan format input untuk titik akhir real-time dan pekerjaan transformasi batch. Sertakan cuplikan kode untuk setiap pra-pemrosesan data yang diperlukan. Sertakan jenis MIME konten yang didukung (misalnya, image/jpeg, image/png, image/bmp), deskripsi nilai jika berlaku, dan batasan. Sertakan sampel masukan yang dihosting di GitHub.

Untuk output inferensi, sediakan format output untuk titik akhir real-time dan pekerjaan transformasi batch. Sertakan jenis MIME konten keluaran (misalnya, aplikasi/json, gambar/jpeg) dan deskripsi nilai jika berlaku. Sertakan sampel keluaran yang dihosting di GitHub.

Untuk sampel, berikan file input yang berfungsi dengan produk Anda. Jika model Anda melakukan klasifikasi multiclass, berikan setidaknya satu file input sampel untuk setiap kelas.

Input pelatihan

Di bagian Informasi untuk melatih model, berikan format data input dan cuplikan kode untuk setiap pra-pemrosesan data yang diperlukan. Sertakan jenis MIME konten yang didukung (misalnya, image/jpeg, image/png, image/bmp), deskripsi nilai jika berlaku, dan batasan. Pastikan untuk menyertakan sampel masukan yang di-host GitHub.

Jelaskan fitur opsional dan wajib yang dapat disediakan oleh pembeli, dan tentukan apakah mode PIPE input didukung. Jika pelatihan terdistribusi (pelatihan dengan lebih dari CPU GPU 1/instance) didukung, tentukan ini. Untuk penyetelan, daftarkan hyperparameters yang direkomendasikan.

Persyaratan untuk notebook Jupyter

Saat menambahkan SageMaker sumber daya Anda ke daftar produk Anda, berikan tautan ke contoh buku catatan Jupyter yang dihosting GitHubyang menunjukkan alur kerja lengkap tanpa meminta pembeli untuk mengunggah atau menemukan data apa pun.

Gunakan AWS SDK for Python (Boto). Notebook sampel yang dikembangkan dengan baik memudahkan pembeli untuk mencoba dan menggunakan daftar Anda.

Untuk produk paket model, notebook sampel Anda mendemonstrasikan persiapan data input, pembuatan titik akhir untuk inferensi waktu nyata, dan kinerja pekerjaan transformasi batch. Untuk informasi selengkapnya, lihat daftar Model Package dan Contoh notebook di GitHub. Untuk contoh buku catatan, lihat auto_insurance. Notebook berfungsi secara keseluruhan Wilayah AWS, tanpa memasukkan parameter apa pun dan tanpa pembeli yang perlu mencari data sampel.

catatan

Contoh notebook Jupyter yang belum berkembang yang tidak menunjukkan beberapa kemungkinan input dan langkah pra-pemrosesan data mungkin menyulitkan pembeli untuk sepenuhnya memahami proposisi nilai produk Anda.

Untuk produk algoritme, notebook sampel menunjukkan pelatihan lengkap, penyetelan, pembuatan model, pembuatan titik akhir untuk inferensi waktu nyata, dan kinerja pekerjaan transformasi batch. Untuk informasi selengkapnya, lihat Daftar algoritma dan Contoh buku catatan di GitHub. Untuk contoh buku catatan, lihat amazon_demo_product dan automl on. GitHub Notebook sampel ini bekerja di semua Wilayah tanpa memasukkan parameter apa pun dan tanpa pembeli yang perlu mencari data sampel.

catatan

Kurangnya contoh data pelatihan dapat mencegah pembeli Anda menjalankan notebook Jupyter dengan sukses. Notebook sampel yang kurang berkembang dapat mencegah pembeli Anda menggunakan produk Anda dan menghambat adopsi.

Ringkasan persyaratan dan rekomendasi untuk daftar produk ML

Tabel berikut memberikan ringkasan persyaratan dan rekomendasi untuk halaman daftar produk pembelajaran mesin.

Detail Untuk daftar paket model Untuk daftar algoritma
Product descriptions
Jelaskan secara rinci apa yang dilakukan produk untuk jenis konten yang didukung (misalnya, “mendeteksi X dalam gambar”). Diperlukan Diperlukan
Berikan informasi yang menarik dan membedakan tentang produk (hindari kata sifat seperti klaim “terbaik” atau tidak berdasar). Disarankan Disarankan
Sebutkan kasus penggunaan terpenting untuk produk ini. Diperlukan Diperlukan
Jelaskan data (sumber dan ukuran) yang dilatih dan buat daftar batasan yang diketahui. Diperlukan Tidak berlaku
Jelaskan kerangka inti tempat model dibangun. Disarankan Disarankan
Ringkas metrik kinerja model pada data validasi (misalnya, “Akurasi persen XX.YY yang dibenchmark menggunakan dataset Z”). Diperlukan Tidak berlaku
Meringkas metrik latensi dan/atau throughput model pada jenis instans yang direkomendasikan. Diperlukan Tidak berlaku
Jelaskan kategori algoritma. Misalnya, “Algoritma regresi hutan keputusan ini didasarkan pada ansambel pengklasifikasi terstruktur pohon yang dibangun menggunakan teknik umum agregasi bootstrap dan pilihan fitur acak.” Tidak berlaku Diperlukan
Usage information
Untuk inferensi, sediakan format input untuk pekerjaan endpoint real-time dan batch transform. Sertakan jenis MIME konten yang didukung (misalnya, image/jpeg, image/png, image/bmp), deskripsi nilai jika berlaku, dan batasan. Lihat Persyaratan untuk input dan output. Diperlukan Diperlukan
Untuk inferensi, berikan sampel input untuk pekerjaan endpoint real-time dan batch transform. Sampel harus di-host di GitHub. Lihat Persyaratan untuk input dan output. Diperlukan Diperlukan
Untuk inferensi, sediakan format output untuk titik akhir real-time dan pekerjaan transformasi batch. Sertakan jenis MIME konten keluaran (misalnya, aplikasi/json, gambar/jpeg) dan deskripsi nilai jika berlaku. Lihat Persyaratan untuk input dan output. Diperlukan Diperlukan
Untuk inferensi, berikan sampel keluaran untuk pekerjaan endpoint real-time dan batch transform. Sampel harus di-host di GitHub. Lihat Persyaratan untuk input dan output. Diperlukan Diperlukan
Untuk inferensi, berikan contoh penggunaan pekerjaan endpoint atau batch transform. Sertakan contoh kode menggunakan perintah AWS Command Line Interface (AWS CLI) atau menggunakan file AWS SDK. Diperlukan Diperlukan
Untuk pelatihan, berikan format input. Sertakan jenis MIME konten yang didukung (misalnya, image/jpeg, image/png, image/bmp), deskripsi nilai jika berlaku, dan batasan (misalnya, baris minimum data yang diperlukan). Lihat Persyaratan untuk input dan output. Tidak berlaku Diperlukan
Untuk pelatihan, berikan sampel masukan yang dihosting di GitHub. Lihat Persyaratan untuk input dan output. Tidak berlaku Diperlukan
Untuk pelatihan, berikan contoh melakukan pekerjaan pelatihan. Jelaskan hiperparameter yang didukung, rentangnya, dan dampak keseluruhannya. Tentukan apakah algoritme mendukung penyetelan hyperparameter, pelatihan terdistribusi, atau GPU instance. Sertakan contoh kode seperti AWS CLI perintah atau menggunakan AWS SDK, misalnya. Tidak berlaku Diperlukan
Sediakan notebook Jupyter yang dihosting untuk GitHub menunjukkan penggunaan lengkap produk Anda. Lihat Persyaratan untuk notebook Jupyter. Diperlukan Diperlukan
Memberikan informasi teknis terkait penggunaan produk, termasuk manual pengguna dan data sampel. Disarankan Disarankan