Crea un taccuino in Studio EMR - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Crea un taccuino in Studio EMR

Nota

EMRI notebook sono disponibili come spazi di lavoro EMR Studio nella console. Il pulsante Crea area di lavoro nella console consente di creare nuovi taccuini. Per accedere o creare aree di lavoro, gli utenti di EMR Notebooks necessitano di autorizzazioni di ruolo aggiuntive. IAM Per ulteriori informazioni, consulta Amazon EMR Notebooks are Amazon EMR Studio Workspace nella console e nella console Amazon. EMR

Crei un EMR notebook utilizzando la vecchia EMR console Amazon. La creazione di notebook utilizzando Amazon o Amazon non EMR API è supportata. AWS CLI

Per creare un taccuino EMR
  1. Apri la EMR console Amazon all'indirizzo https://console.aws.amazon.com/elasticmapreduce/.

  2. Scegli Notebook, Crea un notebook.

  3. Immetti un Nome notebook e una Descrizione notebook facoltativa.

  4. Se disponi di un cluster attivo a cui desideri collegare il notebook, lascia selezionata l'impostazione Scegli un cluster esistente predefinita, fai clic su Scegli, seleziona un cluster dall'elenco, quindi fai clic su Scegli cluster. Per informazioni sui requisiti del cluster per i EMR notebook, consulta. Requisiti, differenze nelle versioni di rilascio e sicurezza per i notebook EMR

    —oppure—

    Scegli Crea un cluster, immetti un Nome cluster e scegli le opzioni in base alle linee guida riportate di seguito. Il cluster viene creato come impostazione predefinita VPC per l'account utilizzando istanze On-Demand.

    Impostazione Descrizione

    Nome cluster

    Nome descrittivo utilizzato per identificare il cluster.

    Versione

    Non si può modificare. Il valore predefinito è l'ultima EMR versione di Amazon (5.36.2).

    Applicazioni

    Non si può modificare. Elenca le applicazioni installate nel cluster.

    Istanza

    Inserisci il numero di istanze e seleziona il tipo di istanza. EC2 Per il nodo primario viene utilizzata un'istanza. Le altre vengono utilizzate per i nodi principali. Il tipo di istanza determina il numero di notebook che possono si possono collegare simultaneamente al cluster. Per ulteriori informazioni, consulta Limiti per i notebook collegati contemporaneamente EMR.

    EMRruolo

    Lascia l'impostazione predefinita o scegli il link per specificare un ruolo di servizio personalizzato per AmazonEMR. Per ulteriori informazioni, consulta Ruolo di servizio per Amazon EMR (EMRruolo).

    EC2profilo dell'istanza

    Lascia il valore predefinito o scegli il link per specificare un ruolo di servizio personalizzato per EC2 le istanze. Per ulteriori informazioni, consulta Ruolo di servizio per le EC2 istanze del cluster (profilo dell'EC2istanza).

    EC2coppia di key pair

    Scegli una EC2 key pair per connetterti alle istanze del cluster. Per ulteriori informazioni, consulta Connect al nodo primario EMR del cluster Amazon tramite SSH.

    Terminazione automatica La terminazione automatica è supportata per EMR le versioni Amazon 5.30.0 e 6.1.0 e successive.

    Seleziona la casella di spunta per abilitare la terminazione automatica, quindi specifica il tempo di inattività dopo il quale il cluster dovrebbe spegnersi in automatico. Per ulteriori informazioni, consulta Utilizzo di una politica di terminazione automatica per la pulizia dei cluster Amazon EMR.

  5. Per Gruppo di sicurezza, scegli Usa gruppi di sicurezza predefiniti. In alternativa, scegli Scegli i gruppi di sicurezza e seleziona i gruppi di sicurezza personalizzati disponibili nel cluster. VPC Selezionane uno per l'istanza primaria e un altro per l'istanza client del notebook. Per ulteriori informazioni, consulta Specificazione EC2 dei gruppi di sicurezza per i notebook EMR.

  6. Per Ruolo di servizio AWS , lascia l'impostazione predefinita o scegli un ruolo personalizzato dall'elenco. L'istanza client per il notebook utilizza questo ruolo. Per ulteriori informazioni, consulta Ruolo di servizio per i notebook EMR.

  7. Per Notebook location (Percorso notebook) scegli il percorso Amazon S3 in cui è salvato il file del notebook, oppure specifica un percorso. Se il bucket e la cartella non esistono, Amazon li EMR crea.

    Amazon EMR crea una cartella con l'ID Notebook come nome della cartella e salva il taccuino in un file denominatoNotebookName.ipynb. Ad esempio, se si specifica il percorso Amazon S3 s3://amzn-s3-demo-bucket/MyNotebooks per un notebook denominato MyFirstEMRManagedNotebook, il file del notebook viene salvato in s3://amzn-s3-demo-bucket/MyNotebooks/NotebookID/MyFirstEMRManagedNotebook.ipynb.

    Se si specifica un percorso crittografato in Amazon S3, è necessario impostare Ruolo di servizio per i notebook EMR come utente chiave. Il ruolo di servizio predefinito è EMR_Notebooks_DefaultRole. Se utilizzi una AWS KMS chiave per la crittografia, consulta Using key policy AWS KMS nella AWS Key Management Service Developer Guide e l'articolo di supporto per l'aggiunta di utenti chiave.

  8. Facoltativamente, se hai aggiunto ad EMR Amazon un repository basato su Git che desideri associare a questo notebook, scegli Git repository, seleziona Scegli repository e quindi seleziona un repository dall'elenco. Per ulteriori informazioni, consulta Associazione di repository basati su Git ai notebook EMR.

  9. Facoltativamente, puoi scegliere Tag e quindi aggiungere ulteriori tag chiave-valore per il notebook.

    Importante

    Ai fini dell'accesso viene applicato un tag predefinito con la stringa Key impostata su creatorUserID e il valore impostato sul tuo ID IAM utente. Consigliamo di non modificare o rimuovere questo tag perché può essere utilizzato per controllare l'accesso. Per ulteriori informazioni, consulta Usa i tag cluster e Notebook con IAM politiche per il controllo degli accessi.

  10. Scegli Crea un notebook.