Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Distribuzione di modelli su un endpoint
In Amazon SageMaker Canvas, puoi distribuire i tuoi modelli su un endpoint per fare previsioni. SageMaker fornisce l'infrastruttura ML per ospitare il modello su un endpoint con le istanze di calcolo che preferisci. Quindi, puoi invocare l'endpoint (inviare una richiesta di previsione) e ottenere una previsione in tempo reale dal tuo modello. Con questa funzionalità, puoi utilizzare il modello in produzione per rispondere alle richieste in arrivo e puoi integrarlo con applicazioni e flussi di lavoro esistenti.
Per iniziare, dovresti avere un modello che desideri implementare. Puoi distribuire versioni di modelli personalizzate che hai creato, modelli Amazon SageMaker JumpStart Foundation e modelli di base ottimizzati JumpStart . Per ulteriori informazioni sulla creazione di un modello in Canvas, consulta Come funzionano i modelli personalizzati. Per ulteriori informazioni sui modelli di JumpStart base in Canvas, consulta. Modelli di base generativi di intelligenza artificiale in Canvas SageMaker
Consulta la sezione Permissions management, quindi inizia a creare nuove distribuzioni nella sezione Deploy a model.
Gestione delle autorizzazioni
Per impostazione predefinita, disponi delle autorizzazioni per distribuire modelli sugli endpoint di SageMaker hosting. SageMaker concede queste autorizzazioni per tutti i profili utente Canvas nuovi ed esistenti tramite la AmazonSageMakerCanvasFullAccesspolicy, che è associata al ruolo di AWS IAM esecuzione per il SageMaker dominio che ospita l'applicazione Canvas.
Se l'amministratore di Canvas sta configurando un nuovo dominio o profilo utente, quando configura il dominio e segue le istruzioni sui prerequisiti contenute inPrerequisiti per la configurazione di Amazon Canvas SageMaker , SageMaker attiva le autorizzazioni di distribuzione del modello tramite l'opzione Abilita la distribuzione diretta dei modelli Canvas, che è abilitata per impostazione predefinita.
L’amministratore di Canvas può gestire le autorizzazioni per distribuire il modello anche a livello di profilo utente. Ad esempio, se l'amministratore non desidera concedere le autorizzazioni di distribuzione del modello a tutti i profili utente durante la configurazione di un dominio, può concedere le autorizzazioni a utenti specifici dopo aver creato il dominio.
La procedura seguente mostra come modificare le autorizzazioni di distribuzione del modello per un profilo utente specifico:
-
Apri la SageMaker console all'indirizzo https://console.aws.amazon.com/sagemaker/
. -
Nel riquadro di navigazione a sinistra, scegli Configurazioni admin.
-
In Configurazioni admin, scegli Domini.
-
Dall'elenco dei domini, seleziona il dominio del profilo utente.
-
Nella pagina dei dettagli del dominio, seleziona la scheda Profili utente.
-
Scegli il tuo profilo utente.
-
Nella pagina del profilo utente, seleziona la scheda Configurazioni app.
-
Nella sezione Canvas, scegli Modifica.
-
Nella sezione di configurazione ML Ops, attiva l'interruttore Abilita la distribuzione diretta dei modelli Canvas per abilitare le autorizzazioni di distribuzione.
-
Scegli Invia per salvare le modifiche alle impostazioni del dominio.
Il profilo utente dovrebbe ora disporre delle autorizzazioni di distribuzione del modello.
Dopo aver concesso le autorizzazioni al dominio o al profilo utente, assicurati che l'utente si disconnetta dall'applicazione Canvas e acceda nuovamente per applicare le modifiche alle autorizzazioni.
Distribuzione di un modello
Per iniziare a distribuire il modello, crea una nuova distribuzione in Canvas e specifica la versione del modello che desideri distribuire, oltre all'infrastruttura ML, ad esempio il tipo e il numero di istanze di calcolo che desideri utilizzare per ospitare il modello.
Canvas suggerisce un tipo e un numero di istanze predefiniti in base al tipo di modello, oppure puoi saperne di più sui vari tipi di SageMaker istanza nella pagina SageMaker dei prezzi di Amazon
Quando si distribuiscono i modelli di JumpStart base, è inoltre possibile specificare la durata del tempo di implementazione. È possibile distribuire il modello su un endpoint a tempo indeterminato (il che significa che l'endpoint è attivo fino a quando non si elimina la distribuzione). Oppure, se hai bisogno dell'endpoint solo per un breve periodo di tempo e desideri ridurre i costi, puoi implementare il modello su un endpoint per un periodo di tempo specificato, dopodiché SageMaker spegnere l'endpoint automaticamente.
Nota
Se distribuisci un modello per un periodo di tempo specificato, resta connesso all'applicazione Canvas per tutta la durata dell'endpoint. Se ti disconnetti o elimini l'applicazione, Canvas non è in grado di spegnere l'endpoint all'ora specificata.
Dopo aver distribuito il modello su un endpoint di inferenza in tempo reale di SageMaker Hosting, puoi iniziare a fare previsioni richiamando l'endpoint.
Esistono diversi modi per distribuire un modello dall'applicazione Canvas. Puoi accedere all'opzione di distribuzione del modello tramite uno dei seguenti metodi:
-
Nella pagina I miei modelli dell'applicazione Canvas, scegli il modello che desideri distribuire. Quindi, dalla pagina Versioni del modello, scegli l'icona Altre opzioni ( ) accanto alla versione del modello e seleziona Distribuisci.
-
Nella pagina dei dettagli di una versione del modello, nella scheda Analizza, scegli l'opzione Deploy.
-
Nella pagina dei dettagli di una versione del modello, nella scheda Predict, scegliete l'icona Altre opzioni ( ) nella parte superiore della pagina e selezionate Deploy.
-
Nella pagina ML Ops dell'applicazione Canvas, scegli la scheda Distribuzioni, quindi scegli Crea distribuzione.
-
Per i modelli di JumpStart base e i modelli di base ottimizzati, vai alla pagina dei Ready-to-use modelli dell'applicazione Canvas. Scegli Genera, estrai e riepiloga il contenuto. Quindi, trova il modello di JumpStart base o il modello di base ottimizzato che desideri implementare. Scegli il modello e, nella pagina di chat del modello, scegli il pulsante Deploy.
Tutti questi metodi aprono il pannello laterale Distribuisci modello, in cui puoi specificare la configurazione di distribuzione per il tuo modello. Per distribuire il modello da questo pannello, procedi come segue:
-
(Facoltativo) Se stai creando una distribuzione dalla pagina ML Ops, avrai la possibilità di selezionare modello e versione. Utilizza i menu a discesa per selezionare il modello e la versione del modello che desideri distribuire.
-
Immetti un nome nel campo Nome distribuzione.
-
(Solo per i modelli di JumpStart base e i modelli di base ottimizzati) Scegli una durata di implementazione. Seleziona Indefinito per lasciare l'endpoint attivo fino a quando non lo spegni, oppure seleziona Specificare la lunghezza e quindi inserisci il periodo di tempo per il quale desideri che l'endpoint rimanga attivo.
-
Per Tipo di istanza, SageMaker rileva un tipo e un numero di istanza predefiniti adatti al modello. Tuttavia, puoi modificare il tipo di istanza che desideri utilizzare per ospitare il modello.
Nota
Se esaurisci la quota di istanze per il tipo di istanza scelto sul tuo AWS account, puoi richiedere un aumento della quota. Per ulteriori informazioni sulle quote predefinite e su come richiedere un aumento, consulta gli SageMaker endpoint e le quote di Amazon nella guida di riferimento AWS generale.
-
Per il numero di istanze, puoi impostare il numero di istanze attive utilizzate per il tuo endpoint. SageMaker rileva un numero predefinito adatto al tuo modello, ma puoi modificare questo numero.
-
Quando sei pronto per distribuire il modello, scegli Distribuisci.
Il modello dovrebbe ora essere distribuito su un endpoint.