JupyterHub - Amazon EMR

JupyterHub

Jupyter Notebook es una aplicación web de código abierto que puede utilizar para crear y compartir documentos que contienen código activo, ecuaciones, visualizaciones y texto narrativo. JupyterHubpermite alojar varias instancias de un servidor portátil Jupyter de un solo usuario. Al crear un clúster con JupyterHub, Amazon EMR crea un contenedor Docker en el nodo principal del clúster. JupyterHub, todos los componentes necesarios para Jupyter y Sparkmagic se ejecutan en el contenedor.

Sparkmagic es una biblioteca de kernels que permite que los blocs de notas de Jupyter interactúen con Apache Spark que se ejecuta en Amazon EMR a través de Apache Livy, que es un servidor de REST para Spark. Spark y Apache Livy se instalan automáticamente al crear un clúster con JupyterHub. El núcleo de Python 3 predeterminado para Jupyter está disponible junto con los núcleos PySpark 3 PySpark, y Spark que están disponibles con Sparkmagic. Puede utilizar estos kernels para ejecutar código Spark ad hoc y consultas SQL interactiva con Python y Scala. Puede instalar kernels adicionales en el contenedor de Docker manualmente. Para obtener más información, consulte Instalación de kernels y bibliotecas adicionales.

El siguiente diagrama muestra los componentes de JupyterHub Amazon EMR con los métodos de autenticación correspondientes para los usuarios de portátiles y el administrador. Para obtener más información, consulte Agregar usuarios y administradores de Cuadernos de Jupyter.

JupyterHub architecture on EMR showing user authentication and component interactions.

En la siguiente tabla se muestra la versión JupyterHub incluida en la última versión de la serie Amazon EMR 7.x, junto con los componentes con los que se instala Amazon EMR. JupyterHub

Para ver la versión de los componentes que se incluyen JupyterHub en esta versión, consulte Versiones de componentes de la versión 7.8.0.

JupyterHub información sobre la versión de emr-7.8.0
Etiqueta de versión de Amazon EMR	JupyterHub Versión	Componentes instalados con JupyterHub
emr-7.8.0	JupyterHub 1.5.0	emrfs, emr-goodies, emr-ddb, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hudi, hudi-spark, r, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, livy-server, jupyterhub

En la siguiente tabla se muestra la versión JupyterHub incluida en la última versión de la serie Amazon EMR 6.x, junto con los componentes con los que se instala Amazon EMR. JupyterHub

Para ver la versión de los componentes que se incluyen JupyterHub en esta versión, consulte Versiones de componentes de la versión 6.15.0.

JupyterHub información sobre la versión de emr-6.15.0
Etiqueta de versión de Amazon EMR	JupyterHub Versión	Componentes instalados con JupyterHub
emr-6.15.0	JupyterHub 1.5.0	aws-sagemaker-spark-sdk, emrfs, emr-goodies, emr-ddb, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hudi, hudi-spark, r, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, livy-server, jupyterhub

En la siguiente tabla se muestra la versión JupyterHub incluida en la última versión de la serie Amazon EMR 5.x, junto con los componentes con los que se instala Amazon EMR. JupyterHub

Para ver la versión de los componentes que se incluyen JupyterHub en esta versión, consulte Versiones de componentes de la versión 5.36.2.

JupyterHub información sobre la versión de emr-5.36.2
Etiqueta de versión de Amazon EMR	JupyterHub Versión	Componentes instalados con JupyterHub
emr-5.36.2	JupyterHub 1.4.1	aws-sagemaker-spark-sdk, emrfs, emr-goodies, emr-ddb, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hudi, hudi-spark, r, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, livy-server, jupyterhub

El núcleo de Python 3 incluido JupyterHub en Amazon EMR es 3.6.4.

Las bibliotecas instaladas en el jupyterhub contenedor pueden variar entre las versiones de lanzamiento de Amazon EMR y las versiones de Amazon EC2 AMI.

Para enumerar las bibliotecas instaladas utilizando `conda`

Ejecute el siguiente comando en la línea de comandos del nodo principal:
```
sudo docker exec jupyterhub bash -c "conda list"
```

Para enumerar las bibliotecas instaladas utilizando `pip`

Ejecute el siguiente comando en la línea de comandos del nodo principal:
```
sudo docker exec jupyterhub bash -c "pip freeze"
```

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Cuaderno de EMR

Cree un clúster con JupyterHub

Seleccione sus preferencias de cookies

Personalizar preferencias de cookies

Esenciales

De rendimiento

Funcionales

De publicidad

No se pueden guardar las preferencias de cookies

JupyterHub

Para enumerar las bibliotecas instaladas utilizando `conda`

Para enumerar las bibliotecas instaladas utilizando `pip`

Temas

¿Le ha servido de ayuda esta página?

Tema siguiente:

Tema anterior:

¿Necesita ayuda?

JupyterHub architecture on EMR showing user authentication and component interactions.

Seleccione sus preferencias de cookies

JupyterHub

Para enumerar las bibliotecas instaladas utilizando conda

Para enumerar las bibliotecas instaladas utilizando pip

Temas

¿Le ha servido de ayuda esta página?

Tema siguiente:

Tema anterior:

¿Necesita ayuda?

Para enumerar las bibliotecas instaladas utilizando `conda`

Para enumerar las bibliotecas instaladas utilizando `pip`