Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Ottieni immediatamente istanze potenziali
Inference Recommender può anche fornirti un elenco di potenziali istanze, o tipi di istanze che potrebbero essere adatti al tuo modello, nella pagina dei dettagli del modello. SageMaker Il suggeritore di inferenza esegue automaticamente il benchmarking preliminare rispetto al modello per fornire le cinque istanze potenziali principali. Poiché si tratta di raccomandazioni preliminari, consigliamo di eseguire ulteriori processi di raccomandazione delle istanze per ottenere risultati più accurati.
Puoi visualizzare un elenco di potenziali istanze per il tuo modello a livello di codice utilizzando SageMaker SDK Python o DescribeModelAPIla console. SageMaker
Nota
Non riceverai istanze potenziali per i modelli creati prima che questa funzionalità diventasse disponibile. SageMaker
Per visualizzare le istanze potenziali del modello tramite la console, effettua quanto segue:
-
Vai alla SageMaker console all'indirizzo. https://console.aws.amazon.com/sagemaker/
-
Nel riquadro di navigazione a sinistra, seleziona Inferenza e poi Moduli.
-
Dall'elenco dei modelli, scegli il tuo modello.
Nella pagina dei dettagli del modello, vai alla sezione Istanze potenziali per implementare il modello. Lo screenshot seguente mostra questa sezione.
In questa sezione, puoi visualizzare le potenziali istanze ottimizzate in termini di costi, velocità effettiva e latenza per l'implementazione dei modelli, insieme a informazioni aggiuntive per ogni tipo di istanza, come le dimensioni della memoria, il GPU numero CPU e il costo orario.
Se decidi di voler eseguire il benchmark di un payload di esempio ed eseguire un processo completo di raccomandazione di inferenza per il tuo modello, puoi avviare un processo di raccomandazione di inferenza predefinito da questa pagina. Per avviare un processo predefinito tramite la console, effettua quanto segue:
-
Nella pagina dei dettagli del modello, nella sezione sulle istanze potenziali per implementare il modello, seleziona Avvia processo del suggeritore di inferenza.
-
Nella finestra di dialogo che appare, per bucket S3 per l'esecuzione del benchmark del payload, inserisci la posizione Amazon S3 in cui hai archiviato un payload di esempio per il tuo modello.
-
Per il tipo di contenuto Payload, inserisci i MIME tipi di dati del payload.
-
(Facoltativo) Nella sezione Compilazione del modello con SageMaker Neo, per la configurazione di input dei dati, inserisci una forma di dati in formato dizionario.
-
Scegli Esegui processo.
Inference Recommender avvia il job ed è possibile visualizzare il job e i relativi risultati dalla pagina con l'elenco dei programmi di raccomandazione Inference nella console. SageMaker
Se desideri eseguire un processo avanzato ed eseguire test di carico personalizzati o se desideri configurare impostazioni e parametri aggiuntivi per il processo, consulta Esegui un test di carico personalizzato.