Distribuzione di modelli su un endpoint

Modalità Focus

Distribuzione di modelli su un endpoint - Amazon SageMaker AI

Gestione delle autorizzazioni Distribuzione di un modello

In Amazon SageMaker Canvas, puoi distribuire i tuoi modelli su un endpoint per fare previsioni. SageMaker L'intelligenza artificiale ti fornisce l'infrastruttura ML per ospitare il tuo modello su un endpoint con le istanze di calcolo che preferisci. Quindi, puoi invocare l'endpoint (inviare una richiesta di previsione) e ottenere una previsione in tempo reale dal tuo modello. Con questa funzionalità, puoi utilizzare il modello in produzione per rispondere alle richieste in arrivo e puoi integrarlo con applicazioni e flussi di lavoro esistenti.

Per iniziare, dovresti avere un modello che desideri implementare. Puoi distribuire versioni di modelli personalizzate che hai creato, modelli Amazon SageMaker JumpStart Foundation e modelli di base ottimizzati JumpStart . Per ulteriori informazioni sulla creazione di un modello in Canvas, consulta Come funzionano i modelli personalizzati. Per ulteriori informazioni sui modelli di JumpStart base in Canvas, consulta. Modelli di base generativi di intelligenza artificiale in Canvas SageMaker

Consulta la sezione Permissions management, quindi inizia a creare nuove distribuzioni nella sezione Deploy a model.

Gestione delle autorizzazioni

Per impostazione predefinita, disponi delle autorizzazioni per distribuire modelli sugli endpoint di SageMaker AI Hosting. SageMaker L'intelligenza artificiale concede queste autorizzazioni per tutti i profili utente Canvas nuovi ed esistenti tramite la AmazonSageMakerCanvasFullAccesspolicy, che è allegata al ruolo di esecuzione AWS IAM per il dominio SageMaker AI che ospita l'applicazione Canvas.

Se l'amministratore di Canvas sta configurando un nuovo dominio o profilo utente, quando configura il dominio e segue le istruzioni preliminari contenute inPrerequisiti per la configurazione di Amazon Canvas SageMaker , SageMaker AI attiva le autorizzazioni di distribuzione del modello tramite l'opzione Abilita la distribuzione diretta dei modelli Canvas, che è abilitata per impostazione predefinita.

L’amministratore di Canvas può gestire le autorizzazioni per distribuire il modello anche a livello di profilo utente. Ad esempio, se l'amministratore non desidera concedere le autorizzazioni di distribuzione del modello a tutti i profili utente durante la configurazione di un dominio, può concedere le autorizzazioni a utenti specifici dopo aver creato il dominio.

La procedura seguente mostra come modificare le autorizzazioni di distribuzione del modello per un profilo utente specifico:

Apri la console SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.
Nel riquadro di navigazione a sinistra, scegli Configurazioni admin.
In Configurazioni admin, scegli Domini.
Dall'elenco dei domini, seleziona il dominio del profilo utente.
Nella pagina dei dettagli del dominio, seleziona la scheda Profili utente.
Scegli il tuo profilo utente.
Nella pagina del profilo utente, seleziona la scheda Configurazioni app.
Nella sezione Canvas, scegli Modifica.
Nella sezione di configurazione ML Ops, attiva l'interruttore Abilita la distribuzione diretta dei modelli Canvas per abilitare le autorizzazioni di distribuzione.
Scegli Invia per salvare le modifiche alle impostazioni del dominio.

Il profilo utente dovrebbe ora disporre delle autorizzazioni di distribuzione del modello.

Dopo aver concesso le autorizzazioni al dominio o al profilo utente, assicurati che l'utente si disconnetta dall'applicazione Canvas e acceda nuovamente per applicare le modifiche alle autorizzazioni.

Distribuzione di un modello

Per iniziare a distribuire il modello, crea una nuova distribuzione in Canvas e specifica la versione del modello che desideri distribuire, oltre all'infrastruttura ML, ad esempio il tipo e il numero di istanze di calcolo che desideri utilizzare per ospitare il modello.

Canvas suggerisce un tipo e un numero di istanze predefiniti in base al tipo di modello, oppure puoi saperne di più sui vari tipi di istanze SageMaker AI nella pagina dei prezzi di Amazon SageMaker AI. L'addebito si basa sul prezzo dell'istanza SageMaker AI mentre l'endpoint è attivo.

Quando implementate i modelli di JumpStart base, avete anche la possibilità di specificare la durata del tempo di implementazione. È possibile distribuire il modello su un endpoint a tempo indeterminato (il che significa che l'endpoint è attivo fino a quando non si elimina la distribuzione). Oppure, se hai bisogno dell'endpoint solo per un breve periodo di tempo e desideri ridurre i costi, puoi implementare il modello su un endpoint per un determinato periodo di tempo, dopodiché l' SageMaker IA spegne l'endpoint per te.

Nota

Se distribuisci un modello per un periodo di tempo specificato, resta connesso all'applicazione Canvas per tutta la durata dell'endpoint. Se ti disconnetti o elimini l'applicazione, Canvas non è in grado di spegnere l'endpoint all'ora specificata.

Dopo che il modello è stato distribuito su un endpoint di inferenza in tempo reale di SageMaker AI Hosting, puoi iniziare a fare previsioni richiamando l'endpoint.

Esistono diversi modi per distribuire un modello dall'applicazione Canvas. Puoi accedere all'opzione di distribuzione del modello tramite uno dei seguenti metodi:

Nella pagina I miei modelli dell'applicazione Canvas, scegli il modello che desideri distribuire. Quindi, dalla pagina Versioni del modello, scegli l'icona Altre opzioni ( ) accanto alla versione del modello e seleziona Distribuisci.
Nella pagina dei dettagli di una versione del modello, nella scheda Analizza, scegli l'opzione Deploy.
Nella pagina dei dettagli di una versione del modello, nella scheda Predict, scegliete l'icona Altre opzioni ( ) nella parte superiore della pagina e selezionate Deploy.
Nella pagina ML Ops dell'applicazione Canvas, scegli la scheda Distribuzioni, quindi scegli Crea distribuzione.
Per i modelli di JumpStart base e i modelli di base ottimizzati, vai alla pagina dei Ready-to-use modelli dell'applicazione Canvas. Scegli Genera, estrai e riepiloga il contenuto. Quindi, trova il modello di JumpStart base o il modello di base ottimizzato che desideri implementare. Scegli il modello e, nella pagina di chat del modello, scegli il pulsante Deploy.

Tutti questi metodi aprono il pannello laterale Distribuisci modello, in cui puoi specificare la configurazione di distribuzione per il tuo modello. Per distribuire il modello da questo pannello, procedi come segue:

(Facoltativo) Se stai creando una distribuzione dalla pagina ML Ops, avrai la possibilità di selezionare modello e versione. Utilizza i menu a discesa per selezionare il modello e la versione del modello che desideri distribuire.
Immetti un nome nel campo Nome distribuzione.
(Solo per i modelli di JumpStart base e i modelli di base ottimizzati) Scegli una durata di implementazione. Seleziona Indefinito per lasciare l'endpoint attivo fino a quando non lo spegni, oppure seleziona Specificare la lunghezza e quindi inserisci il periodo di tempo per il quale desideri che l'endpoint rimanga attivo.
Per Tipo di istanza, SageMaker AI rileva un tipo e un numero di istanza predefiniti adatti al tuo modello. Tuttavia, puoi modificare il tipo di istanza che desideri utilizzare per ospitare il modello.

Nota
Se esaurisci la quota di istanze per il tipo di istanza scelto sul tuo AWS account, puoi richiedere un aumento della quota. Per ulteriori informazioni sulle quote predefinite e su come richiedere un aumento, consulta gli endpoint e le quote di Amazon SageMaker AI nella guida di riferimento AWS generale.
Per quanto riguarda il numero di istanze, puoi impostare il numero di istanze attive utilizzate per il tuo endpoint. SageMaker L'intelligenza artificiale rileva un numero predefinito adatto al tuo modello, ma puoi modificare questo numero.
Quando sei pronto per distribuire il modello, scegli Distribuisci.

Il modello dovrebbe ora essere distribuito su un endpoint.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Registra una versione del modello nel registro dei modelli AI SageMaker

Visualizzazione delle distribuzioni

In questa pagina

Seleziona le tue preferenze relative ai cookie

Personalizza le tue preferenze relative ai cookie

Essenziali

Prestazione

Funzionali

Pubblicitari

Impossibile salvare le preferenze dei cookie

Distribuzione di modelli su un endpoint

Gestione delle autorizzazioni

Distribuzione di un modello

Nota

Nota

In questa pagina

Related resources

Questa pagina ti è stata utile?

Related resources

Argomento successivo:

Argomento precedente:

Hai bisogno di aiuto?