Installa kernel e librerie in uno EMR Studio Workspace - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Installa kernel e librerie in uno EMR Studio Workspace

Ogni Amazon EMR Studio Workspace viene fornito con un set di librerie e kernel preinstallati.

Kernel e librerie su cluster eseguiti su Amazon EC2

Puoi anche personalizzare l'ambiente per EMR Studio nei seguenti modi quando utilizzi EMR cluster in esecuzione su AmazonEC2:

  • Installazione dei kernel Jupyter Notebook e delle librerie Python su un nodo primario del cluster: quando si installano le librerie utilizzando questa opzione, tutti i WorkSpace collegati allo stesso cluster condividono quelle librerie. Puoi installare kernel o librerie dall'interno di una cella notebook o mentre sei connesso utilizzando SSH il nodo primario di un cluster.

  • Utilizzare librerie con ambito notebook: quando gli utenti delle istanze WorkSpace installano e utilizzano le librerie all'interno di una cella del notebook, tali librerie sono disponibili solo per quel notebook. Questa opzione consente a diversi notebook utilizzando lo stesso cluster di lavorare senza preoccuparsi di versioni di libreria in conflitto.

EMRGli spazi di lavoro di Studio hanno la stessa architettura di base dei notebook. EMR Puoi installare e utilizzare i kernel di Jupyter Notebook e le librerie Python EMR con Studio nello stesso modo in cui faresti con Notebooks. EMR Per istruzioni, consulta Installazione e utilizzo di kernel e librerie in Studio EMR.

Kernel e librerie su Amazon EMR su cluster EKS

Amazon EMR on EKS clusters include i kernel Python 3.7 PySpark e Python con un set di librerie preinstallate. Amazon EMR on EKS non supporta l'installazione di librerie o cluster aggiuntivi.

Ogni Amazon EMR on EKS cluster viene fornito con i seguenti Python e le seguenti PySpark librerie installate:

  • Python – boto3, cffi, future, ggplot, jupyter, kubernetes, matplotlib, numpy, pandas, plotly, pycryptodomex, py4j, requests, scikit-learn, scipy, seaborn

  • PySpark – ggplot, jupyter, matplotlib, numpy, pandas, plotly, pycryptodomex, py4j, requests, scikit-learn, scipy, seaborn

Kernel e librerie su applicazioni serverless EMR

Ogni applicazione EMR Serverless viene fornita con i seguenti Python PySpark e le seguenti librerie installate:

  • Python – ggplot, matplotlib, numpy, pandas, plotly, bokeh, scikit-learn, scipy, seaborn

  • PySpark – ggplot, matplotlib,numpy, pandas, plotly, bokeh, scikit-learn, scipy, seaborn