Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Requisiti e best practice per la creazione di prodotti di machine learning
È importante che i tuoi acquirenti trovino facile testare il tuo pacchetto modello e i tuoi prodotti algoritmici. Le sezioni seguenti descrivono i requisiti per la creazione di elenchi di prodotti di machine learning (ML) e le migliori pratiche per i prodotti ML. Per un riepilogo completo dei requisiti e dei consigli, consulta laRiepilogo dei requisiti e dei consigli per gli elenchi di prodotti ML.
Nota
Un Marketplace AWS rappresentante potrebbe contattarti per aiutarti a soddisfare questi requisiti se i prodotti pubblicati non li soddisfano.
Argomenti
Risorse richieste
Prima di creare un elenco di prodotti per l'apprendimento automatico, assicurati di disporre delle seguenti risorse obbligatorie:
-
Amazon Resource Name (ARN): fornisci l'ARN del pacchetto del modello o della risorsa dell'algoritmo da Regione AWS cui stai pubblicando (vedi). Supportato per la pubblicazione Regioni AWS
-
Un ARN per un pacchetto modello ha la seguente forma:
arn:aws:sagemaker:<region>:<account-id>:model-package/<model-package-name>
-
Un ARN per un algoritmo ha la seguente forma:
arn:aws:sagemaker:<region>:<account-id>:algorithm/<algorithm-name>
-
-
Requisiti per le informazioni sull'utilizzo— Fornisci dettagli su input, output ed esempi di codice.
-
Requisiti per ingressi e uscite— Fornisci file o testo.
-
Requisiti per il notebook Jupyter— Dimostrare l'utilizzo completo del prodotto.
Migliori pratiche generali per i prodotti ML
Fornisci le seguenti informazioni per il tuo prodotto di machine learning:
-
Per le descrizioni dei prodotti, includi quanto segue:
-
Cosa fa il tuo modello
-
Chi è il cliente target
-
Qual è il caso d'uso più importante
-
Come è stato addestrato il modello o la quantità di dati utilizzata
-
Quali sono le metriche delle prestazioni e i dati di convalida utilizzati
-
Se medico, indipendentemente dal fatto che il modello sia destinato o meno a uso diagnostico
-
-
Per impostazione predefinita, i prodotti di machine learning sono configurati per avere visibilità pubblica. Tuttavia, puoi creare un prodotto con visibilità privata. Per ulteriori informazioni, consulta Creare la tua scheda di prodotti.
-
(Facoltativo) Per i prodotti a pagamento, offri ai clienti una prova gratuita di 14-30 giorni per consentire ai clienti di provare il prodotto. Per ulteriori informazioni, consulta Prezzi dei prodotti di machine learning per Marketplace AWS.
-
(Facoltativo) Per i prodotti in confezione modello, se desideri abilitare una demo del prodotto in tempo reale nella pagina di elenco dei prodotti, contatta il team operativo del Marketplace AWS venditore
. La demo del prodotto consente a un potenziale acquirente di provare il modello direttamente nella pagina dell'inserzione senza abbonarsi o utilizzare il modello autonomamente.
Requisiti per le informazioni sull'utilizzo
Informazioni chiare sull'utilizzo che descrivano gli input e gli output previsti del prodotto (con esempi) sono fondamentali per garantire un'esperienza positiva all'acquirente.
Per ogni nuova versione della risorsa che aggiungi all'elenco dei prodotti, devi fornire informazioni sull'utilizzo.
Per aggiungere informazioni sull'utilizzo di un nuovo prodotto che pubblichi per la prima volta, accedi alla Portale di gestione Marketplace AWS console. Dal menu a discesa Prodotti, scegli Apprendimento automatico. Seleziona il tuo prodotto. Nella panoramica del prodotto sotto l'opzione Launch, fornisci l'ARN del pacchetto modello o della risorsa dell'algoritmo e scegli Aggiungi.
Per modificare le informazioni di utilizzo esistenti per una versione specifica, scegli Modifica sotto l'opzione Launch, quindi Modifica versione.
Requisiti per ingressi e uscite
Una spiegazione chiara del formato, con esempi di input e output, è importante per aiutare gli acquirenti a comprendere e utilizzare il prodotto. Questa comprensione aiuta gli acquirenti a eseguire le trasformazioni necessarie sui dati di input per ottenere i migliori risultati di inferenza.
Quando aggiungi la tua risorsa Amazon SageMaker AI alla tua scheda di prodotto, ti verrà richiesto quanto segue.
Ingressi e uscite di inferenza
Per l'input di inferenza, fornite il formato di input sia per l'endpoint in tempo reale che per il processo di trasformazione in batch. Includi frammenti di codice per qualsiasi preelaborazione necessaria dei dati. Includi i tipi di contenuto MIME supportati (ad esempio, image/jpeg, image/png, image/bmp), le descrizioni dei valori, se applicabili, e le limitazioni. GitHub
Per l'output di inferenza, fornite il formato di output sia per l'endpoint in tempo reale che per il processo di trasformazione in batch. Includi il tipo di contenuto MIME di output (ad esempio, application/json, image/jpeg) e la descrizione dei valori, se applicabile. Includi esempi di output ospitati su. GitHub
Per gli esempi, fornisci file di input compatibili con il tuo prodotto. Se il tuo modello esegue una classificazione multiclasse, fornisci almeno un file di input di esempio per ogni classe.
Input di formazione
Nella sezione Informazioni per addestrare un modello, fornisci il formato dei dati di input e i frammenti di codice per l'eventuale preelaborazione necessaria dei dati. Includi i tipi di contenuto MIME supportati (ad esempio, image/jpeg, image/png, image/bmp), la descrizione dei valori, se applicabile, e le limitazioni. Assicurati di includere GitHub
Spiega le funzionalità opzionali e obbligatorie che possono essere fornite dall'acquirente e specifica se la modalità PIPE
di input è supportata. Se è supportata la formazione distribuita (formazione con più di 1 istanza CPU/GPU), specificalo. Per l'ottimizzazione, elenca gli iperparametri consigliati.
Requisiti per il notebook Jupyter
Quando aggiungi la tua risorsa di SageMaker intelligenza artificiale all'elenco dei tuoi prodotti, fornisci un link a un esempio di notebook Jupyter ospitato su GitHub
Utilizzo della AWS SDK for Python (Boto). Un taccuino di esempio ben sviluppato consente agli acquirenti di provare a utilizzare la tua inserzione in modo più semplice.
Per quanto riguarda i prodotti con pacchetto modello, il notebook di esempio illustra la preparazione dei dati di input, la creazione di un endpoint per l'inferenza in tempo reale e le prestazioni dei processi di trasformazione in batch. Per ulteriori informazioni, vedere Model Package listing e Sample notebook
Nota
Un esempio di notebook Jupyter sottosviluppato che non mostri diversi input possibili e le fasi di preelaborazione dei dati potrebbe rendere difficile per l'acquirente comprendere appieno la proposta di valore del prodotto.
Per quanto riguarda i prodotti basati su algoritmi, il notebook di esempio illustra l'addestramento completo, l'ottimizzazione, la creazione di modelli, la creazione di un endpoint per l'inferenza in tempo reale e l'esecuzione di processi di trasformazione in batch. Per ulteriori informazioni, vedere Algorithm
Nota
La mancanza di esempi di dati di formazione potrebbe impedire all'acquirente di utilizzare correttamente il notebook Jupyter. Un modello di notebook poco sviluppato potrebbe impedire agli acquirenti di utilizzare il prodotto e ostacolarne l'adozione.
Riepilogo dei requisiti e dei consigli per gli elenchi di prodotti ML
La tabella seguente fornisce un riepilogo dei requisiti e dei consigli per una pagina di elenco di prodotti di machine learning.
Dettagli | Per gli elenchi dei pacchetti modello | Per elenchi di algoritmi |
---|---|---|
Product descriptions | ||
Spiega in dettaglio cosa fa il prodotto per i tipi di contenuto supportati (ad esempio, «rileva X nelle immagini»). | Richiesto | Richiesto |
Fornisci informazioni convincenti e differenzianti sul prodotto (evita aggettivi come «migliore» o affermazioni prive di fondamento). | Consigliato | Consigliato |
Elenca i casi d'uso più importanti per questo prodotto. | Richiesto | Richiesto |
Descrivi i dati (fonte e dimensione) su cui è stato addestrato ed elenca le eventuali limitazioni note. | Richiesto | Non applicabile |
Descrivi il framework di base su cui è stato costruito il modello. | Consigliato | Consigliato |
Riassumi la metrica delle prestazioni del modello sui dati di convalida (ad esempio, «precisione percentuale XX.YY confrontata utilizzando il set di dati Z»). | Richiesto | Non applicabile |
Riepiloga le metriche relative alla latenza e/o al throughput del modello in base al tipo di istanza consigliato. | Richiesto | Non applicabile |
Descrivi la categoria dell'algoritmo. Ad esempio, «Questo algoritmo di regressione delle foreste decisionali si basa su un insieme di classificatori con struttura ad albero creati utilizzando la tecnica generale dell'aggregazione bootstrap e una scelta casuale di funzionalità». | Non applicabile | Richiesto |
Usage information | ||
Per l'inferenza, fornite il formato di input sia per l'endpoint in tempo reale che per il processo di trasformazione in batch. Includi i tipi di contenuto MIME supportati (ad esempio, image/jpeg, image/png, image/bmp), la descrizione dei valori, se applicabile, e le limitazioni. Per informazioni, consulta Requisiti per ingressi e uscite. | Richiesto | Richiesto |
Per l'inferenza, fornisci esempi di input sia per l'endpoint in tempo reale che per il processo di trasformazione in batch. I campioni devono essere ospitati su. GitHub Per informazioni, consulta Requisiti per ingressi e uscite. | Richiesto | Richiesto |
Per l'inferenza, fornite il formato di output sia per l'endpoint in tempo reale che per il processo di trasformazione in batch. Includi il tipo di contenuto MIME di output (ad esempio, application/json, image/jpeg) e la descrizione dei valori, se applicabile. Per informazioni, consulta Requisiti per ingressi e uscite. | Richiesto | Richiesto |
Per l'inferenza, fornisci esempi di output sia per l'endpoint in tempo reale che per il processo di trasformazione in batch. I campioni devono essere ospitati su. GitHub Per informazioni, consulta Requisiti per ingressi e uscite. | Richiesto | Richiesto |
Per l'inferenza, fornisci un esempio di utilizzo di un endpoint o di un processo di trasformazione batch. Includi un esempio di codice utilizzando i comandi AWS Command Line Interface (AWS CLI) o utilizzando un AWS SDK. | Richiesto | Richiesto |
Per la formazione, fornite il formato di input. Includi i tipi di contenuto MIME supportati (ad esempio, image/jpeg, image/png, image/bmp), la descrizione dei valori, se applicabile, e le limitazioni (ad esempio, è richiesto un numero minimo di righe di dati). Per informazioni, consulta Requisiti per ingressi e uscite. | Non applicabile | Richiesto |
Per la formazione, fornisci esempi di input ospitati su. GitHub Per informazioni, consulta Requisiti per ingressi e uscite. | Non applicabile | Richiesto |
Per quanto riguarda la formazione, fornisci un esempio di esecuzione di lavori di formazione. Descrivi gli iperparametri supportati, i relativi intervalli e il loro impatto complessivo. Specificate se l'algoritmo supporta l'ottimizzazione degli iperparametri, l'addestramento distribuito o le istanze GPU. Includi esempi di codice come AWS CLI comandi o utilizzo di un AWS SDK, ad esempio. | Non applicabile | Richiesto |
Fornisci un notebook Jupyter ospitato per GitHub dimostrare l'uso completo del prodotto. Per informazioni, consulta Requisiti per il notebook Jupyter. | Richiesto | Richiesto |
Fornisci informazioni tecniche relative all'utilizzo del prodotto, inclusi manuali utente e dati di esempio. | Consigliato | Consigliato |