Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
SageMaker Lavori su notebook
Puoi usare Amazon SageMaker per creare, addestrare e distribuire in modo interattivo modelli di machine learning dal tuo notebook Jupyter in qualsiasi ambiente. JupyterLab Tuttavia, esistono diversi scenari in cui potresti voler eseguire il tuo notebook come un processo pianificato e non interattivo. Ad esempio, è possibile creare rapporti di controllo periodici che analizzino tutti i processi di addestramento eseguiti in un determinato periodo di tempo e analizzino il valore aziendale derivante dall'implementazione di tali modelli in produzione. Potresti anche voler ampliare un processo di progettazione delle funzionalità dopo aver testato la logica di trasformazione dei dati su un sottoinsieme di dati ridotto. Altri casi d’uso comuni comprendono:
-
Pianificazione dei processi per il monitoraggio delle variazioni dei modelli
-
Esplorazione dello spazio dei parametri per modelli ottimizzati
In questi scenari, puoi utilizzare SageMaker Notebook Jobs per creare un processo non interattivo (che SageMaker viene eseguito come processo di formazione sottostante) da eseguire su richiesta o secondo una pianificazione. SageMaker Notebook Jobs offre un'interfaccia utente intuitiva che consente di pianificare i lavori direttamente JupyterLab scegliendo il widget Notebook Jobs ( ) nel notebook. Puoi anche pianificare i tuoi lavori usando SageMaker PythonSDK, che offre la flessibilità di pianificare più lavori su notebook in un flusso di lavoro di pipeline. È possibile eseguire più notebook in parallelo e parametrizzare le celle dei notebook per personalizzare i parametri di input.
Questa funzionalità sfrutta i servizi Amazon EventBridge, SageMaker Training e Pipelines ed è disponibile per l'uso nel notebook Jupyter in uno dei seguenti ambienti:
-
Istanze Studio, Studio Lab, Studio Classic o Notebook
-
Configurazione locale, ad esempio sul computer locale, su cui si esegue JupyterLab
Prerequisiti
Per pianificare un processo relativo al notebook, verifica che siano soddisfatti i seguenti criteri:
-
Assicurati che il tuo notebook Jupyter e tutti gli script di inizializzazione o avvio siano autonomi per quanto riguarda il codice e i pacchetti software. In caso contrario, il processo non interattivo potrebbe comportare errori.
-
Controlla Vincoli e considerazioni per assicurarti di aver configurato correttamente il notebook Jupyter, le impostazioni di rete e le impostazioni del container.
-
Assicurati che il tuo notebook possa accedere alle risorse esterne necessarie, come EMR i cluster Amazon.
-
Se stai configurando Notebook Jobs su un notebook Jupyter locale, completa l'installazione. Per istruzioni, consulta Guida all'installazione.
-
Se ti connetti a un EMR cluster Amazon sul tuo notebook e desideri parametrizzare il comando di EMR connessione Amazon, devi applicare una soluzione alternativa utilizzando le variabili di ambiente per passare i parametri. Per informazioni dettagliate, consultare Connect a un EMR cluster Amazon dal tuo notebook.
-
Se ti connetti a un EMR cluster Amazon utilizzando Kerberos o l'autenticazione HTTP Basic Auth, devi utilizzare l' AWS Secrets Manager per passare le credenziali di sicurezza al tuo comando di connessione Amazon. LDAP EMR Per informazioni dettagliate, consultare Connect a un EMR cluster Amazon dal tuo notebook.
-
(opzionale) Se desideri che l'interfaccia utente precarichi uno script da eseguire all'avvio del notebook, l'amministratore deve installarlo con una configurazione del ciclo di vita (). LCC Per informazioni su come utilizzare LCC uno script, consulta Personalizzare un'istanza di Notebook utilizzando uno script di configurazione del ciclo di vita.