View a markdown version of this page

Creare un notebook in EMR Studio - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creare un notebook in EMR Studio

Nota

I Notebooks EMR sono disponibili come EMR Studio Workspace nella console. Il pulsante Crea area di lavoro nella console consente di creare nuovi notebook. Per accedere ai Workspace o crearne di nuovi, gli utenti di Notebook EMR necessitano di ulteriori autorizzazioni per i ruoli IAM. Per ulteriori informazioni, consulta Amazon EMR Notebooks are Amazon EMR Studio Workspace nella console e nella console Amazon EMR.

Per creare un notebook EMR, puoi utilizzare la vecchia console Amazon EMR. La creazione di notebook utilizzando o AWS CLI l'API Amazon EMR non è supportata.

Creazione di un notebook EMR
  1. Apri la console di Amazon EMR all'indirizzo https://console.aws.amazon.com/elasticmapreduce/.

  2. Scegli Notebook, Crea un notebook.

  3. Immetti un Nome notebook e una Descrizione notebook facoltativa.

  4. Se disponi di un cluster attivo a cui desideri collegare il notebook, lascia selezionata l'impostazione Scegli un cluster esistente predefinita, fai clic su Scegli, seleziona un cluster dall'elenco, quindi fai clic su Scegli cluster. Per informazioni sui requisiti del cluster per Notebook EMR, consulta Requisiti, differenze nelle versioni di rilascio e sicurezza per i notebook EMR.

    —oppure—

    Scegli Crea un cluster, immetti un Nome cluster e scegli le opzioni in base alle linee guida riportate di seguito. Il cluster viene creato nel VPC predefinito per l'account utilizzando On-Demand le istanze.

    Impostazione Description

    Nome cluster

    Nome descrittivo utilizzato per identificare il cluster.

    Versione

    Non si può modificare. Il valore predefinito è l'ultima versione di Amazon EMR (5.36.2).

    Applicazioni

    Non si può modificare. Elenca le applicazioni installate nel cluster.

    Istanza

    Immetti il numero di istanze e seleziona il tipo di istanza EC2. Per il nodo primario viene utilizzata un'istanza. Le altre vengono utilizzate per i nodi principali. Il tipo di istanza determina il numero di notebook che possono si possono collegare simultaneamente al cluster. Per ulteriori informazioni, consulta Limiti di notebook EMR collegati contemporaneamente.

    Ruolo EMR

    Lascia l'impostazione predefinita o scegli il collegamento per specificare un ruolo di servizio personalizzato per Amazon EMR. Per ulteriori informazioni, consulta Ruolo di servizio per Amazon EMR (ruolo EMR).

    Profilo dell'istanza EC2

    Lascia l'impostazione predefinita o scegli il collegamento per specificare un ruolo di servizio personalizzato per le istanze EC2. Per ulteriori informazioni, consulta Ruolo di servizio per istanze EC2 del cluster (profilo istanza EC2).

    Coppia di chiavi EC2

    Scegli una coppia di chiavi EC2 per poterti connettere alle istanze del cluster. Per ulteriori informazioni, consulta Connect al nodo primario del cluster Amazon EMR tramite SSH.

    Auto-termination Auto-termination è supportato per le versioni di Amazon EMR 5.30.0 e 6.1.0 e successive.

    Seleziona la casella di spunta per abilitare la terminazione automatica, quindi specifica il tempo di inattività dopo il quale il cluster dovrebbe spegnersi in automatico. Per ulteriori informazioni, consulta Utilizzo di una politica di terminazione automatica per la pulizia dei cluster Amazon EMR.

  5. Per Gruppo di sicurezza, scegli Usa gruppi di sicurezza predefiniti. In alternativa, fai clic su Scegli gruppi di sicurezza e seleziona i gruppi di sicurezza personalizzati disponibili nel VPC del cluster. Selezionane uno per l'istanza primaria e un altro per l'istanza client del notebook. Per ulteriori informazioni, consulta Specifica dei gruppi di sicurezza EC2 per EMR Notebooks.

  6. Per Ruolo di servizio AWS , lascia l'impostazione predefinita o scegli un ruolo personalizzato dall'elenco. L'istanza client per il notebook utilizza questo ruolo. Per ulteriori informazioni, consulta Ruolo di servizio per EMR Notebooks.

  7. Per Notebook location (Percorso notebook) scegli il percorso Amazon S3 in cui è salvato il file del notebook, oppure specifica un percorso. Se il bucket e la cartella non esistono, Amazon EMR li crea.

    Amazon EMR crea una cartella con Notebook ID (ID notebook) come nome della cartella e salva il notebook in un file denominato NotebookName.ipynb. Ad esempio, se si specifica il percorso Amazon S3 s3://amzn-s3-demo-bucket/MyNotebooks per un notebook denominato MyFirstEMRManagedNotebook, il file del notebook viene salvato in s3://amzn-s3-demo-bucket/MyNotebooks/NotebookID/MyFirstEMRManagedNotebook.ipynb.

    Se si specifica un percorso crittografato in Amazon S3, è necessario impostare Ruolo di servizio per EMR Notebooks come utente chiave. Il ruolo di servizio predefinito è EMR_Notebooks_DefaultRole. Se utilizzi una AWS KMS chiave per la crittografia, consulta Using key policies in AWS KMS nella AWS Key Management Service Developer Guide e l'articolo di supporto per l'aggiunta di utenti chiave.

  8. Facoltativamente, se hai aggiunto un Git-based repository ad Amazon EMR che desideri associare a questo notebook, scegli repository Git, seleziona Scegli repository e quindi seleziona un repository dall'elenco. Per ulteriori informazioni, consulta Associazione degli Git-based archivi ai Notebooks EMR.

  9. Facoltativamente, puoi scegliere Tag e quindi aggiungere ulteriori tag chiave-valore per il notebook.

    Importante

    Ai fini dell'accesso vengono applicati un tag predefinito con la stringa Chiave impostata su creatorUserID e il valore impostato per l'ID dell'utente IAM. Consigliamo di non modificare o rimuovere questo tag perché può essere utilizzato per controllare l'accesso. Per ulteriori informazioni, consulta Utilizzo di tag di cluster e notebook con policy IAM per il controllo degli accessi.

  10. Scegli Crea un notebook.