SageMaker Procedura dettagliata del progetto MLOps utilizzando repository Git di terze parti - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

SageMaker Procedura dettagliata del progetto MLOps utilizzando repository Git di terze parti

Importante

A partire dal 30 novembre 2023, la precedente esperienza Amazon SageMaker Studio è ora denominata Amazon SageMaker Studio Classic. La sezione seguente è specifica per l'utilizzo dell'applicazione Studio Classic. Per informazioni sull'utilizzo dell'esperienza Studio aggiornata, consultaAmazon SageMaker Studio.

Questa procedura dettagliata utilizza il modello Modello MLOPS per la creazione, la formazione e la distribuzione di modelli con repository Git di terze parti utilizzando CodePipeline per mostrare come usare i progetti MLOps per creare un sistema CI/CD per creare, addestrare e distribuire modelli.

Prerequisiti

Per completare questa procedura guidata, devi:

Fase 1: Configurare la connessione GitHub

In questo passaggio, ti connetti ai tuoi GitHub repository utilizzando una AWS CodeStar connessione. Il SageMaker progetto utilizza questa connessione per accedere ai repository del codice sorgente.

Per configurare la GitHub connessione:
  1. Accedere alla CodePipeline console all'indirizzo https://console.aws.amazon.com/codepipeline/

  2. Da Impostazioni nel riquadro di navigazione, seleziona Connessioni.

  3. Scegli Crea connessione.

  4. Per Seleziona un provider, seleziona GitHub.

  5. In Nome connessione, immetti un nome.

  6. Scegli Connect a GitHub.

  7. Se l' GitHub app AWS Connector non è stata installata in precedenza, scegli Installa nuova app.

    Viene visualizzato un elenco di tutti gli account e le organizzazioni GitHub personali a cui hai accesso.

  8. Scegliete l'account a cui desiderate stabilire la connettività da utilizzare con SageMaker progetti e GitHub repository.

  9. Scegli Configura.

  10. Facoltativamente, puoi selezionare i tuoi repository specifici o scegliere Tutti i repository.

  11. Selezionare Salva. Una volta installata l'app, verrai reindirizzato alla GitHub pagina Connect to e l'ID di installazione viene compilato automaticamente.

  12. Scegli Connetti.

  13. Aggiungi un tag con la chiave sagemaker e il valore true a questa AWS CodeStar connessione.

  14. Copia l'ARN connessione per salvarlo per dopo. L'ARN viene utilizzato come parametro nella fase di creazione del progetto.

Fase 1: creazione del progetto

In questo passaggio, crei un progetto SageMaker MLOps utilizzando un modello SageMaker di progetto fornito per creare, addestrare e distribuire modelli.

Per creare il progetto MLOps SageMaker
  1. Accedi a Studio Classic. Per ulteriori informazioni, consulta Panoramica SageMaker del dominio Amazon.

  2. Nella barra laterale di Studio Classic, scegli l'icona Home ( ).

  3. Seleziona Implementazioni dal menu, quindi seleziona Progetti.

  4. Seleziona Crea progetto.

    Viene visualizzata la scheda Crea progetto.

  5. Per i modelli di SageMaker progetto, scegli il modello MLOps per la creazione di modelli, la formazione e la distribuzione con repository Git di terze parti.

  6. Scegli Seleziona modello di progetto.

  7. In ModelBuild CodeRepository Informazioni, fornisci i seguenti parametri:

    • Per l'URL, inserisci l'URL del tuo repository Git per il codice di compilazione del modello nel formato https://git-url.git.

    • Per Rami, inserisci il ramo da utilizzare dal tuo repository Git per le attività della pipeline.

    • Per Nome repository completo, inserisci il nome del repository Git nel formato di nome utente/nome del repository o organizzazione/nome del repository.

    • Per Codestar Connection ARN, inserisci l'ARN della AWS CodeStar connessione che hai creato nel passaggio 1.

    • Il tasto attiva/disattiva Codice di esempio ti consente di scegliere se popolare il repository con il codice iniziale di compilazione del modello. Possiamo lasciarlo attivato per questa demo.

  8. In ModelDeploy CodeRepository Info, fornisci i seguenti parametri:

    • Per l'URL, inserisci l'URL del tuo repository Git per il codice di distribuzione del modello nel formato https://git-url.git.

    • Per Rami, inserisci il ramo da utilizzare dal tuo repository Git per le attività della pipeline.

    • Per Nome repository completo, inserisci il nome del repository Git nel formato di nome utente/nome del repository o organizzazione/nome del repository.

    • Per Codestar Connection ARN, inserisci l'ARN della AWS CodeStar connessione che hai creato nel passaggio 1.

    • Il tasto attiva/disattiva Codice di esempio ti consente di scegliere se popolare il repository con il codice iniziale di distribuzione del modello. Possiamo lasciarlo attivato per questa demo.

  9. Scegli Crea progetto.

Il progetto viene visualizzato nell'elenco Progetti con lo stato di Creato.

Fase 3: modifiche al codice

Ora apporta una modifica al codice della pipeline che compila il modello e conferma la modifica per avviare una nuova esecuzione della pipeline. L'esecuzione della pipeline registra una nuova versione del modello.

Per apportare modifiche al codice
  1. Nel GitHub repository della build del modello, accedi alla cartella. pipelines/abalone Fai doppio clic su pipeline.py per aprire il file di codice.

  2. Nel file pipeline.py, trova la riga che imposta il tipo di istanza di addestramento.

    training_instance_type = ParameterString( name="TrainingInstanceType", default_value="ml.m5.xlarge"

    Apri il file per modificarlo, cambia ml.m5.xlarge in ml.m5.large e poi conferma.

Dopo aver confermato la modifica del codice, il sistema MLOps avvia un'esecuzione della pipeline che crea una nuova versione del modello. Nella fase successiva, si approva la nuova versione del modello per distribuirla in produzione.

Fase 4: approvazione del modello

Ora approvi la nuova versione del modello creata nel passaggio precedente per avviare una distribuzione della versione del modello su un endpoint. SageMaker

Per approvare la versione del modello
  1. Nella barra laterale di Studio Classic, scegli l'icona Home ().

  2. Seleziona Implementazioni dal menu, quindi seleziona Progetti.

  3. Trova il nome del progetto che hai creato nella prima fase e fai doppio clic su di esso per aprire la scheda del progetto.

  4. Nella scheda progetto, scegli Gruppi di modelli, quindi fai doppio clic sul nome del gruppo di modelli visualizzato.

    Viene visualizzata la scheda del gruppo di modelli.

  5. Nella scheda del gruppo di modelli, fai doppio clic su Versione 1. Si apre la scheda Versione 1. Scegli Aggiorna stato.

  6. Nella finestra di dialogo Aggiorna lo stato della versione del modello nel modello, nell'elenco a discesa Stato, seleziona Approva, quindi scegli Aggiorna stato.

    L'approvazione della versione del modello fa sì che il sistema MLOps distribuisca il modello allo staging. Per visualizzare l'endpoint, scegli la scheda Endpoint nella scheda del progetto.

(Facoltativo) Fase 5: distribuzione della versione del modello per la produzione

Ora puoi distribuire la versione del modello nell'ambiente di produzione.

Nota

Per completare questo passaggio, devi essere un amministratore del tuo dominio Studio Classic. Se non sei un amministratore, salta questa fase.

Per distribuire la versione del modello nell'ambiente di produzione
  1. Accedi alla CodePipeline console all'indirizzo https://console.aws.amazon.com/codepipeline/

  2. Scegli Pipeline, quindi scegli la pipeline con il nome sagemaker- projectname-projectid-modeldeploy, dove projectname è il nome del progetto e projectid è l'ID del progetto.

  3. Nella DeployStagingfase, scegli Revisione.

  4. Nella finestra di dialogo Revisione, scegli Approva.

    L'approvazione della DeployStagingfase fa sì che il sistema MLOPS distribuisca il modello in produzione. Per visualizzare l'endpoint, scegliete la scheda Endpoints nella scheda del progetto in Studio Classic.

Fase 6: eliminazione delle risorse

Per interrompere gli addebiti, ripulisci le risorse create in questa procedura dettagliata.

Nota

Per eliminare lo AWS CloudFormation stack e il bucket Amazon S3, devi essere un amministratore in Studio Classic. Se non sei un amministratore, chiedi al tuo amministratore di completare queste fasi.

  1. Nella barra laterale di Studio Classic, scegli l'icona Home ().

  2. Seleziona Implementazioni dal menu, quindi seleziona Progetti.

  3. Seleziona il progetto di destinazione dall'elenco a discesa. Se non vedi il tuo progetto, digita il nome del progetto e applica il filtro per trovarlo.

  4. Seleziona il progetto per visualizzarne i dettagli nel pannello principale.

  5. Nel menu Azioni seleziona Elimina.

  6. Conferma la tua scelta selezionando Elimina dalla finestra Elimina progetto.

    Ciò elimina il prodotto con provisioning del catalogo servizi creato dal progetto. Ciò include le CodeCommit e CodePipeline le CodeBuild risorse create per il progetto.

  7. Elimina gli AWS CloudFormation stack creati dal progetto. Esistono due stack, uno per lo staging e uno per la produzione. I nomi degli stack sono sagemaker-projectname-project-id-deploy-staging e sagemaker-projectname-project-id-deploy-prod, dove projectname è il nome del progetto e project-id è l'ID del progetto.

    Per informazioni su come eliminare uno AWS CloudFormation stack, consulta Eliminazione di uno stack sulla AWS CloudFormation console nella Guida per l'utente.AWS CloudFormation

  8. Elimina il bucket Amazon S3 creato dal progetto. Il nome del bucket è sagemaker-project-project-id, dove project-id è l'ID del progetto.