Panoramica dei EMR notebook Amazon - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Panoramica dei EMR notebook Amazon

Nota

EMRI notebook EMR sono disponibili come spazi di lavoro Studio nella console. Il pulsante Crea area di lavoro nella console consente di creare nuovi taccuini. Per accedere o creare aree di lavoro, gli utenti di EMR Notebooks necessitano di autorizzazioni di ruolo aggiuntive. IAM Per ulteriori informazioni, consulta Amazon EMR Notebooks are Amazon EMR Studio Workspace nella console e nella console Amazon. EMR

Puoi utilizzare Amazon EMR Notebooks insieme ai EMR cluster Amazon che eseguono Apache Spark per creare e aprire Jupyter Notebook e interfacce all'interno della console Amazon. JupyterLab EMR Un EMR notebook è un notebook «serverless» che puoi utilizzare per eseguire query e codice. A differenza di un taccuino tradizionale, il contenuto di un EMR notebook, vale a dire le equazioni, le interrogazioni, i modelli, il codice e il testo narrativo all'interno delle celle del notebook, viene eseguito in un client. I comandi vengono eseguiti utilizzando un kernel sul cluster. EMR I contenuti del notebook vengono salvati in Amazon S3 separatamente dai dati del cluster per una maggiore durata e un riutilizzo flessibile.

È possibile avviare un cluster, collegare un EMR notebook per l'analisi e quindi terminare il cluster. Inoltre, puoi chiudere un notebook collegato a un cluster in esecuzione e passare a un altro. Più utenti possono collegare notebook allo stesso cluster contemporaneamente e condividere i file dei notebook tra loro in Amazon S3. Queste funzionalità consentono di eseguire cluster on demand per risparmiare sui costi e ridurre il tempo richiesto per riconfigurare i notebook per cluster e set di dati diversi.

Puoi anche eseguire un EMR notebook a livello di codice utilizzando Amazon EMRAPI, senza la necessità di interagire con la EMR console Amazon («esecuzione senza testa»). È necessario includere una cella nel EMR notebook con un tag di parametri. Questa cella consente a uno script di passare nuovi valori di input al notebook. I notebook parametrizzati possono essere riutilizzati con diversi set di valori di input. Non è necessario creare copie dello stesso notebook per modificarlo ed eseguirlo con nuovi valori di input. Amazon EMR crea e salva il notebook di output su S3 per ogni esecuzione del notebook con parametri. Per esempi di API codice per EMR notebook, consulta. Esempi di comandi programmatici per notebook EMR

Importante

La funzionalità EMR Notebooks supporta i cluster che utilizzano le EMR versioni di Amazon 5.18.0 e successive. Ti consigliamo di utilizzare EMR notebook con cluster che utilizzano la versione più recente di Amazon o almeno 5.30.0EMR, 5.32.0 o 6.2.0. Con questi rilasci, i kernel Jupyter vengono eseguiti sul cluster collegato anziché su un'istanza Jupyter. Ciò migliora le prestazioni e aumenta la possibilità di personalizzare kernel e librerie. Per ulteriori informazioni, consulta Differenze nelle funzionalità in base alla versione del cluster.

Si applicano i costi applicabili per lo storage Amazon S3 e per i EMR cluster Amazon.