Requisiti e best practice per la creazione di prodotti di machine learning - Marketplace AWS

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Requisiti e best practice per la creazione di prodotti di machine learning

È importante che i tuoi acquirenti trovino facile testare il tuo pacchetto modello e i tuoi prodotti algoritmici. Le sezioni seguenti descrivono i requisiti per la creazione di elenchi di prodotti di machine learning (ML) e le migliori pratiche per i prodotti ML. Per un riepilogo completo dei requisiti e dei consigli, consulta laRiepilogo dei requisiti e dei consigli per gli elenchi di prodotti ML.

Nota

Un Marketplace AWS rappresentante potrebbe contattarti per aiutarti a soddisfare questi requisiti se i prodotti pubblicati non li soddisfano.

Risorse richieste

Prima di creare un elenco di prodotti per l'apprendimento automatico, assicurati di disporre delle seguenti risorse obbligatorie:

Migliori pratiche generali per i prodotti ML

Fornisci le seguenti informazioni per il tuo prodotto di machine learning:

  • Per le descrizioni dei prodotti, includi quanto segue:

    • Cosa fa il tuo modello

    • Chi è il cliente target

    • Qual è il caso d'uso più importante

    • Come è stato addestrato il modello o la quantità di dati utilizzata

    • Quali sono le metriche delle prestazioni e i dati di convalida utilizzati

    • Se medico, indipendentemente dal fatto che il modello sia destinato o meno a uso diagnostico

  • Per impostazione predefinita, i prodotti di machine learning sono configurati per avere visibilità pubblica. Tuttavia, puoi creare un prodotto con visibilità privata. Per ulteriori informazioni, consulta Creare la tua scheda di prodotti.

  • (Facoltativo) Per i prodotti a pagamento, offri ai clienti una prova gratuita di 14-30 giorni per consentire ai clienti di provare il prodotto. Per ulteriori informazioni, consulta Prezzi dei prodotti di machine learning per Marketplace AWS.

  • (Facoltativo) Per i prodotti in confezione modello, se desideri abilitare una demo del prodotto in tempo reale nella pagina di elenco dei prodotti, contatta il team operativo del Marketplace AWS venditore. La demo del prodotto consente a un potenziale acquirente di provare il modello direttamente nella pagina dell'inserzione senza abbonarsi o utilizzare il modello autonomamente.

Requisiti per le informazioni sull'utilizzo

Informazioni chiare sull'utilizzo che descrivano gli input e gli output previsti del prodotto (con esempi) sono fondamentali per garantire un'esperienza positiva all'acquirente.

Per ogni nuova versione della risorsa che aggiungi all'elenco dei prodotti, devi fornire informazioni sull'utilizzo.

Per aggiungere informazioni sull'utilizzo di un nuovo prodotto che pubblichi per la prima volta, accedi alla Portale di gestione Marketplace AWS console. Dal menu a discesa Prodotti, scegli Apprendimento automatico. Seleziona il tuo prodotto. Nella panoramica del prodotto sotto l'opzione Launch, fornisci l'ARN del pacchetto modello o della risorsa dell'algoritmo e scegli Aggiungi.

Per modificare le informazioni di utilizzo esistenti per una versione specifica, scegli Modifica sotto l'opzione Launch, quindi Modifica versione.

Requisiti per ingressi e uscite

Una spiegazione chiara del formato, con esempi di input e output, è importante per aiutare gli acquirenti a comprendere e utilizzare il prodotto. Questa comprensione aiuta gli acquirenti a eseguire le trasformazioni necessarie sui dati di input per ottenere i migliori risultati di inferenza.

Quando aggiungi la tua risorsa Amazon SageMaker AI alla tua scheda di prodotto, ti verrà richiesto quanto segue.

Ingressi e uscite di inferenza

Per l'input di inferenza, fornite il formato di input sia per l'endpoint in tempo reale che per il processo di trasformazione in batch. Includi frammenti di codice per qualsiasi preelaborazione necessaria dei dati. Includi i tipi di contenuto MIME supportati (ad esempio, image/jpeg, image/png, image/bmp), le descrizioni dei valori, se applicabili, e le limitazioni. GitHubIncludi esempi di input ospitati su.

Per l'output di inferenza, fornite il formato di output sia per l'endpoint in tempo reale che per il processo di trasformazione in batch. Includi il tipo di contenuto MIME di output (ad esempio, application/json, image/jpeg) e la descrizione dei valori, se applicabile. Includi esempi di output ospitati su. GitHub

Per gli esempi, fornisci file di input compatibili con il tuo prodotto. Se il tuo modello esegue una classificazione multiclasse, fornisci almeno un file di input di esempio per ogni classe.

Input di formazione

Nella sezione Informazioni per addestrare un modello, fornisci il formato dei dati di input e i frammenti di codice per l'eventuale preelaborazione necessaria dei dati. Includi i tipi di contenuto MIME supportati (ad esempio, image/jpeg, image/png, image/bmp), la descrizione dei valori, se applicabile, e le limitazioni. Assicurati di includere GitHubesempi di input ospitati su.

Spiega le funzionalità opzionali e obbligatorie che possono essere fornite dall'acquirente e specifica se la modalità PIPE di input è supportata. Se è supportata la formazione distribuita (formazione con più di 1 istanza CPU/GPU), specificalo. Per l'ottimizzazione, elenca gli iperparametri consigliati.

Requisiti per il notebook Jupyter

Quando aggiungi la tua risorsa di SageMaker intelligenza artificiale all'elenco dei tuoi prodotti, fornisci un link a un esempio di notebook Jupyter ospitato su GitHubcui sia illustrato il flusso di lavoro completo senza chiedere all'acquirente di caricare o trovare dati.

Utilizzo della AWS SDK for Python (Boto). Un taccuino di esempio ben sviluppato consente agli acquirenti di provare a utilizzare la tua inserzione in modo più semplice.

Per quanto riguarda i prodotti con pacchetto modello, il notebook di esempio illustra la preparazione dei dati di input, la creazione di un endpoint per l'inferenza in tempo reale e le prestazioni dei processi di trasformazione in batch. Per ulteriori informazioni, vedere Model Package listing e Sample notebook su GitHub. Per un taccuino di esempio, vedi auto_insurance. Il notebook funziona in tutto Regioni AWS, senza inserire alcun parametro e senza che l'acquirente debba reperire dati di esempio.

Nota

Un esempio di notebook Jupyter sottosviluppato che non mostri diversi input possibili e le fasi di preelaborazione dei dati potrebbe rendere difficile per l'acquirente comprendere appieno la proposta di valore del prodotto.

Per quanto riguarda i prodotti basati su algoritmi, il notebook di esempio illustra l'addestramento completo, l'ottimizzazione, la creazione di modelli, la creazione di un endpoint per l'inferenza in tempo reale e l'esecuzione di processi di trasformazione in batch. Per ulteriori informazioni, vedere Algorithm listing e Sample notebook on. GitHub Per alcuni notebook di esempio, consulta amazon_demo_product e automl on. GitHub Questi taccuini di esempio funzionano in tutte le regioni senza inserire alcun parametro e senza che l'acquirente debba reperire dati di esempio.

Nota

La mancanza di esempi di dati di formazione potrebbe impedire all'acquirente di utilizzare correttamente il notebook Jupyter. Un modello di notebook poco sviluppato potrebbe impedire agli acquirenti di utilizzare il prodotto e ostacolarne l'adozione.

Riepilogo dei requisiti e dei consigli per gli elenchi di prodotti ML

La tabella seguente fornisce un riepilogo dei requisiti e dei consigli per una pagina di elenco di prodotti di machine learning.

Dettagli Per gli elenchi dei pacchetti modello Per elenchi di algoritmi
Product descriptions
Spiega in dettaglio cosa fa il prodotto per i tipi di contenuto supportati (ad esempio, «rileva X nelle immagini»). Richiesto Richiesto
Fornisci informazioni convincenti e differenzianti sul prodotto (evita aggettivi come «migliore» o affermazioni prive di fondamento). Consigliato Consigliato
Elenca i casi d'uso più importanti per questo prodotto. Richiesto Richiesto
Descrivi i dati (fonte e dimensione) su cui è stato addestrato ed elenca le eventuali limitazioni note. Richiesto Non applicabile
Descrivi il framework di base su cui è stato costruito il modello. Consigliato Consigliato
Riassumi la metrica delle prestazioni del modello sui dati di convalida (ad esempio, «precisione percentuale XX.YY confrontata utilizzando il set di dati Z»). Richiesto Non applicabile
Riepiloga le metriche relative alla latenza e/o al throughput del modello in base al tipo di istanza consigliato. Richiesto Non applicabile
Descrivi la categoria dell'algoritmo. Ad esempio, «Questo algoritmo di regressione delle foreste decisionali si basa su un insieme di classificatori con struttura ad albero creati utilizzando la tecnica generale dell'aggregazione bootstrap e una scelta casuale di funzionalità». Non applicabile Richiesto
Usage information
Per l'inferenza, fornite il formato di input sia per l'endpoint in tempo reale che per il processo di trasformazione in batch. Includi i tipi di contenuto MIME supportati (ad esempio, image/jpeg, image/png, image/bmp), la descrizione dei valori, se applicabile, e le limitazioni. Per informazioni, consulta Requisiti per ingressi e uscite. Richiesto Richiesto
Per l'inferenza, fornisci esempi di input sia per l'endpoint in tempo reale che per il processo di trasformazione in batch. I campioni devono essere ospitati su. GitHub Per informazioni, consulta Requisiti per ingressi e uscite. Richiesto Richiesto
Per l'inferenza, fornite il formato di output sia per l'endpoint in tempo reale che per il processo di trasformazione in batch. Includi il tipo di contenuto MIME di output (ad esempio, application/json, image/jpeg) e la descrizione dei valori, se applicabile. Per informazioni, consulta Requisiti per ingressi e uscite. Richiesto Richiesto
Per l'inferenza, fornisci esempi di output sia per l'endpoint in tempo reale che per il processo di trasformazione in batch. I campioni devono essere ospitati su. GitHub Per informazioni, consulta Requisiti per ingressi e uscite. Richiesto Richiesto
Per l'inferenza, fornisci un esempio di utilizzo di un endpoint o di un processo di trasformazione batch. Includi un esempio di codice utilizzando i comandi AWS Command Line Interface (AWS CLI) o utilizzando un AWS SDK. Richiesto Richiesto
Per la formazione, fornite il formato di input. Includi i tipi di contenuto MIME supportati (ad esempio, image/jpeg, image/png, image/bmp), la descrizione dei valori, se applicabile, e le limitazioni (ad esempio, è richiesto un numero minimo di righe di dati). Per informazioni, consulta Requisiti per ingressi e uscite. Non applicabile Richiesto
Per la formazione, fornisci esempi di input ospitati su. GitHub Per informazioni, consulta Requisiti per ingressi e uscite. Non applicabile Richiesto
Per quanto riguarda la formazione, fornisci un esempio di esecuzione di lavori di formazione. Descrivi gli iperparametri supportati, i relativi intervalli e il loro impatto complessivo. Specificate se l'algoritmo supporta l'ottimizzazione degli iperparametri, l'addestramento distribuito o le istanze GPU. Includi esempi di codice come AWS CLI comandi o utilizzo di un AWS SDK, ad esempio. Non applicabile Richiesto
Fornisci un notebook Jupyter ospitato per GitHub dimostrare l'uso completo del prodotto. Per informazioni, consulta Requisiti per il notebook Jupyter. Richiesto Richiesto
Fornisci informazioni tecniche relative all'utilizzo del prodotto, inclusi manuali utente e dati di esempio. Consigliato Consigliato