Crea un'istanza Amazon SageMaker Notebook - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Crea un'istanza Amazon SageMaker Notebook

Importante

Le politiche IAM personalizzate che consentono ad Amazon SageMaker Studio o Amazon SageMaker Studio Classic di creare SageMaker risorse Amazon devono inoltre concedere le autorizzazioni per aggiungere tag a tali risorse. L'autorizzazione per aggiungere tag alle risorse è necessaria perché Studio e Studio Classic taggano automaticamente tutte le risorse che creano. Se una policy IAM consente a Studio e Studio Classic di creare risorse ma non consente l'aggiunta di tag, si possono verificare errori AccessDenied "" durante il tentativo di creare risorse. Per ulteriori informazioni, consulta Fornire le autorizzazioni per l' SageMakeretichettatura delle risorse.

AWS Policy gestite per Amazon SageMakerche danno i permessi per creare SageMaker risorse includono già le autorizzazioni per aggiungere tag durante la creazione di tali risorse.

Un'istanza Amazon SageMaker Notebook è un'istanza di calcolo ML che esegue l'applicazione Jupyter Notebook. SageMaker gestisce la creazione dell'istanza e delle relative risorse. Usa i notebook Jupyter nell'istanza del tuo notebook per:

  • preparare ed elaborare i dati

  • scrivi codice per addestrare i modelli

  • distribuisci i modelli all'hosting SageMaker

  • testa o convalida i tuoi modelli

Per creare un'istanza di notebook, usa la SageMaker console o CreateNotebookInstanceAPI.

Il tipo di istanza del notebook scelta dipende da come utilizzi l'istanza del notebook. Assicurati che l'istanza del tuo notebook non sia vincolata da memoria, CPU o IO. Per caricare un set di dati in memoria sull'istanza del notebook per l'esplorazione o la preelaborazione, scegli un tipo di istanza con memoria RAM sufficiente per il set di dati. Ciò richiede un'istanza con almeno 16 GB di memoria (.xlarge o superiore). Se prevedi di utilizzare l’istanza del notebook per la preelaborazione intensiva di elaborazione, ti consigliamo di scegliere un'istanza ottimizzata per il calcolo, ad esempio c4 o c5.

Una procedura ottimale per l'utilizzo di un SageMaker notebook consiste nell'utilizzare l'istanza del notebook per orchestrare altri servizi. AWS Ad esempio, è possibile utilizzare l'istanza notebook per gestire l'elaborazione di set di dati di grandi dimensioni. A tale scopo, effettua chiamate ai servizi AWS Glue for ETL (extract, transform, and load) o Amazon EMR per la mappatura e la riduzione dei dati tramite Hadoop. Puoi utilizzare AWS i servizi come forme temporanee di calcolo o archiviazione per i tuoi dati.

Puoi archiviare e recuperare i dati di allenamento e test utilizzando un bucket Amazon Simple Storage Service. Potrai quindi SageMaker utilizzarlo per addestrare e costruire il tuo modello. Di conseguenza, il tipo di istanza del notebook non influirebbe sulla velocità di addestramento e test del modello.

Dopo aver ricevuto la richiesta, SageMaker effettua le seguenti operazioni:

  • Crea un'interfaccia di rete: se scegli la configurazione VPC opzionale SageMaker , crea l'interfaccia di rete nel tuo VPC. Utilizza l'ID di sottorete fornito nella richiesta per determinare in quale zona di disponibilità creare la sottorete. SageMaker associa il gruppo di sicurezza fornito nella richiesta alla sottorete. Per ulteriori informazioni, consulta Connessione di un'istanza del notebook in un VPC a risorse esterne.

  • Avvia un'istanza di calcolo ML: SageMaker avvia un'istanza di calcolo ML in un VPC. SageMaker SageMaker esegue le attività di configurazione che le consentono di gestire l'istanza del notebook. Se hai specificato il tuo VPC, SageMaker abilita il traffico tra il tuo VPC e l'istanza del notebook.

  • Installa pacchetti e librerie Anaconda per le piattaforme di deep learning più comuni: SageMaker installa tutti i pacchetti Anaconda inclusi nel programma di installazione. Per ulteriori informazioni, consulta l'elenco dei pacchetti di Anaconda. SageMaker installa anche le librerie di TensorFlow deep learning e Apache MXNet.

  • Allega un volume di archiviazione ML: SageMaker collega un volume di archiviazione ML all'istanza di calcolo ML. Puoi utilizzare il volume come un'area di lavoro per pulire il set di dati di addestramento o per archiviare temporaneamente dati di convalida, testo o altri dati. Scegli qualsiasi dimensione tra 5 e 16384 GB, in incrementi di 1 GB, per il volume. Il valore predefinito è 5 GB. I volumi di archiviazione ML sono crittografati, quindi non è SageMaker possibile determinare la quantità di spazio libero disponibile sul volume. Per questo motivo è possibile aumentare, ma non ridurre, le dimensioni del volume quando si aggiorna un'istanza del notebook. Per ridurre le dimensioni del volume di storage ML in uso, è necessario creare una nuova istanza del notebook con le dimensioni desiderate.

    Solo i file e i dati salvati all'interno della cartella /home/ec2-user/SageMaker persistono tra sessioni di istanze del notebook. I file e i dati che vengono salvati all'esterno di questa directory vengono sovrascritti quando l'istanza del notebook viene arrestata e riavviata. Ogni directory/tmp dell'istanza del notebook offre un minimo di 10 GB di storage in un archivio dell'istanza. Un archivio dell'istanza è uno storage temporaneo a livello di blocco che non è persistente. Quando l'istanza viene arrestata o riavviata, SageMaker elimina il contenuto della directory. Questo storage temporaneo fa parte del volume root dell'istanza del notebook.

    Se il tipo di istanza utilizzato dall'istanza notebook supporta NVMe, i clienti possono utilizzare i volumi di Instance Store NVMe disponibili per quel tipo di istanza. Per le istanze con volumi NVMe Store, tutti i volumi di Instance Store vengono collegati automaticamente all'istanza al momento del lancio. Per ulteriori informazioni sui tipi di istanze e sui volumi di archiviazione NVMe associati, consulta i dettagli sul tipo di istanza Amazon Elastic Compute Cloud.

    Per rendere disponibile il volume di archiviazione NVMe collegato per l'istanza del notebook, completa i passaggi in Rendere disponibili i volumi di archivio delle istanze sull'istanza. Completa i passaggi con accesso root o utilizzando uno script di configurazione del ciclo di vita.

    Nota

    I volumi di Instance Store NVMe non sono storage persistente. Questo storage è di breve durata per l'istanza e deve essere riconfigurato ogni volta che viene avviata un'istanza con questo storage.

  • Copie di esempio i notebook Jupyter — Questi esempi di codice Python mostrano esercizi di addestramento e hosting di modelli che utilizzano algoritmi e set di dati di addestramento diversi.

Per creare un'istanza di SageMaker notebook:
  1. Apri la SageMaker console all'indirizzo https://console.aws.amazon.com/sagemaker/.

  2. Scegli Istanze del notebook, quindi Crea un'istanza del notebook.

  3. Nella pagina Crea un'istanza del notebook, fornisci le seguenti informazioni:

    1. In Nome dell’istanza notebook, digita un nome per l'istanza del notebook.

    2. Per il Tipo di istanza notebook, scegli una dimensione dell'istanza adatta al tuo caso d'uso. Per un elenco dei tipi di istanze e delle quote supportati, consulta Amazon SageMaker Service Quotas.

    3. Per Elastic Inference, scegli un tipo di acceleratore di inferenza da associare all'istanza del notebook se prevedi di condurre inferenze dall'istanza del notebook. Se non intendi condurre inferenze dall'istanza del notebook, scegli nessuna. Per informazioni sull'inferenza elastica, consulta Usa Amazon SageMaker Elastic Inference (EI) .

    4. Per Identificatore piattaforma, scegli un tipo di piattaforma su cui creare l'istanza del notebook. Questo tipo di piattaforma determina il sistema operativo e la JupyterLab versione con cui viene creata l'istanza del notebook. Per informazioni sul tipo di identificatore piattaforma, consulta Istanze del notebook Amazon Linux 2. Per ulteriori informazioni sulle versioni JupyterLab, consulta JupyterLab controllo delle versioni.

    5. (Facoltativo) L'opzione Configurazione aggiuntiva consente agli utenti avanzati di creare uno script shell che può essere eseguito durante la creazione o l'avvio dell'istanza. Questo script, chiamato script di configurazione del ciclo di vita, può essere utilizzato per impostare l'ambiente per il notebook o per eseguire altre funzioni. Per informazioni, consulta Personalizza un'istanza di SageMaker notebook utilizzando uno script LCC.

    6. (Facoltativo) Configurazione aggiuntiva consente inoltre di specificare la dimensione, in GB, del volume di storage ML collegato all'istanza del notebook. È possibile scegliere una dimensione compresa tra 5 GB e 16.384 GB, in incrementi di 1 GB. Puoi utilizzare il volume per pulire il set di dati di addestramento o per archiviare temporaneamente dati di convalida o di altro tipo.

    7. (Facoltativo) Per Versione minima di IMDS, seleziona una versione dall'elenco a discesa. Se questo valore è impostato su v1, con l'istanza del notebook si possono utilizzare entrambe le versioni. Se è selezionata la versione v2, con l'istanza del notebook si può utilizzare solo IMDSv2. Per informazioni su IMDSv2, consulta Use IMDSv2.

      Nota

      A partire dal 31 ottobre 2022, la versione IMDS minima predefinita per le istanze dei SageMaker notebook cambia da IMDSv1 a IMDSv2.

      A partire dal 1° febbraio 2023, IMDSv1 non è più disponibile per la creazione di nuove istanze del notebook. Dopo questa data, potrai creare istanze del notebook con una versione minima di IMDS di 2.

    8. Per il ruolo IAM, scegli un ruolo IAM esistente nel tuo account con le autorizzazioni necessarie per accedere alle risorse o Crea un nuovo ruolo. SageMaker Se scegli Crea un nuovo ruolo, SageMaker crea un ruolo IAM denominatoAmazonSageMaker-ExecutionRole-YYYYMMDDTHHmmSS. La policy AWS gestita AmazonSageMakerFullAccess è allegata al ruolo. Il ruolo fornisce autorizzazioni che consentono all'istanza del notebook di chiamare SageMaker Amazon S3.

    9. Per l'accesso root, per concedere l'accesso root a tutti gli utenti di istanze notebook, scegli Abilita. Per rimuovere l'accesso root per gli utenti, scegli Disabilita. Se concedi l'accesso root, tutti gli utenti delle istanze notebook dispongono dei privilegi di amministratore e possono accedere e modificare tutti i file presenti sull'istanza notebook.

    10. (Facoltativo) L'opzione Chiave di crittografia consente di crittografare i dati sul volume di storage ML collegato all'istanza del notebook utilizzando una chiave AWS Key Management Service (AWS KMS). Se si prevede di archiviare informazioni sensibili nel volume di storage ML, valutare se crittografare le informazioni.

    11. (Facoltativo) Rete consente di inserire l'istanza del notebook in cloud privato virtuale (VPC, Virtual Private Cloud). Un VPC offre una sicurezza aggiuntiva e limita l'accesso alle risorse del VPC da fonti esterne al VPC. Per ulteriori informazioni sul VPC, consulta la Guida per l’utente di Amazon VPC.

      Per aggiungere l'istanza del notebook a un VPC:

      1. Scegli il VPC e un. SubnetId

      2. Per (Gruppo di sicurezza, scegli il gruppo di sicurezza predefinito del VPC.

      3. Se l'istanza del notebook deve disporre dell'accesso a Internet, abilita l'accesso diretto a Internet. Per Accesso diretto a Internet, scegli Abilita. L'accesso a Internet può ridurre la sicurezza dell'istanza del notebook. Per ulteriori informazioni, consulta Connessione di un'istanza del notebook in un VPC a risorse esterne.

    12. (Facoltativo) Per associare i repository Git all'istanza del notebook, scegli un repository di default e fino a tre repository aggiuntivi. Per ulteriori informazioni, consulta Associa i repository Git alle istanze di SageMaker Notebook.

    13. Scegli Crea un'istanza del notebook.

      In pochi minuti, Amazon SageMaker avvia un'istanza di calcolo ML, in questo caso un'istanza notebook, e vi allega un volume di storage ML. L'istanza del notebook include un server Notebook Jupyter preconfigurato e un set di librerie Anaconda. Per ulteriori informazioni, consulta l'API CreateNotebookInstance.

  4. Quando lo stato dell'istanza del notebook è InService, nella console, l'istanza del notebook è pronta per l'uso. Scegli Apri Jupyter accanto al nome notebook per aprire il panello di controllo di Jupyter in formato classico.

    Nota

    Per aumentare la sicurezza della tua istanza di SageMaker notebook Amazon, tutti i notebook.region.sagemaker.aws domini regionali sono registrati nella Public Suffix List (PSL) di Internet. Per una maggiore sicurezza, ti consigliamo di utilizzare i cookie con un __Host- prefisso per impostare i cookie sensibili per i domini delle istanze del tuo notebook. SageMaker Questa pratica ti aiuterà a difendere il tuo dominio dai tentativi CSRF (cross-site request forgery). Per ulteriori informazioni, consulta la pagina Set-Cookie nel sito web della documentazione per gli sviluppatori di mozilla.org.

    Puoi scegliere Apri per aprire la dashboard. JupyterLab JupyterLab La dashboard fornisce l'accesso all'istanza del notebook e ai SageMaker taccuini di esempio che contengono procedure dettagliate complete sul codice. Queste procedure dettagliate mostrano come utilizzarle per eseguire attività comuni di machine learning. SageMaker Per ulteriori informazioni, consulta Notebook di esempio. Per ulteriori informazioni, consultare Controlla l'accesso root a un'istanza di notebook SageMaker .

    Per ulteriori informazioni sui notebook Jupyter, consulta il notebook Jupyter .