Cree un clúster con JupyterHub - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cree un clúster con JupyterHub

Puede crear un clúster de Amazon EMR con la AWS Management Console AWS Command Line Interface, o la JupyterHub API de Amazon EMR. Asegúrese de que el clúster no se crea con la opción de terminar automáticamente después de completar los pasos (opción --auto-terminate de la AWS CLI). Además, asegúrese de que los administradores y los usuarios de blocs de notas puedan obtener acceso al par de claves que utiliza al crear el clúster. Para obtener más información, consulte Usar un par de claves para credenciales SSH en la Guía de administración de Amazon EMR.

Cree un clúster con la JupyterHub consola

Utilice el siguiente procedimiento para crear un clúster JupyterHub instalado mediante las opciones avanzadas de la consola de Amazon EMR.

Para crear un clúster de Amazon EMR JupyterHub instalado mediante la consola Amazon EMR
  1. Vaya hasta la nueva consola de Amazon EMR y seleccione Ir a la consola antigua en el panel de navegación lateral. Para más información sobre lo que puede esperar al cambiar a la consola antigua, consulte Uso de la consola antigua.

  2. Elija Crear clúster e Ir a las opciones avanzadas.

  3. En Software Configuration (Configuración de software):

    • Para Release, seleccione emr-5.36.2 y elija. JupyterHub

    • Si usas Spark, para usar el catálogo de datos de AWS Glue como metaalmacén de Spark SQL, selecciona Usar para metadatos de tablas de Spark. Para obtener más información, consulte Usa el catálogo de AWS Glue Data Catalog con Spark en Amazon EMR.

    • En Edit software settings (Editar configuración de software) elija Enter configuration (Escribir la configuración) y especifique los valores o elija Load JSON from S3 (Cargar JSON desde S3) y especifique un archivo de configuración JSON. Para obtener más información, consulte Configurando JupyterHub.

  4. En Add steps (optional) (Añadir pasos (opcional)) configure los pasos que se ejecutarán cuando se cree el clúster, asegúrese de que no se ha seleccionado Auto-terminate cluster after the last step is completed (Terminar automáticamente el clúster después de que se complete el último paso) y elija Next (Siguiente).

  5. Elija opciones de Hardware Configuration (Configuración de hardware) y Next (Siguiente). Para obtener más información, consulte Configuración del hardware y las redes de los clústeres en la Guía de administración de Amazon EMR.

  6. Elija las opciones de General Cluster Settings (Configuración general del clúster) y Next (Siguiente).

  7. Elija Security Options (Opciones de seguridad), especifique un par de claves y, a continuación, elija Create Cluster (Crear clúster).

Crea un clúster JupyterHub con el AWS CLI

Para lanzar un clúster con JupyterHub, utilice el aws emr create-cluster comando y, para la --applications opción, especifiqueName=JupyterHub. En el siguiente ejemplo, se lanza un JupyterHub clúster en Amazon EMR con dos EC2 instancias (una instancia principal y una instancia principal). Además, la depuración está habilitada y los registros se almacenan en la ubicación de Amazon S3 especificada mediante --log-uri. El par de claves especificado proporciona acceso a EC2 las instancias de Amazon del clúster.

nota

Se incluyen caracteres de continuación de línea de Linux (\) para facilitar la lectura. Se pueden eliminar o utilizar en los comandos de Linux. En Windows, elimínelos o sustitúyalos por un signo de intercalación (^).

aws emr create-cluster --name="MyJupyterHubCluster" --release-label emr-5.36.2 \ --applications Name=JupyterHub --log-uri s3://amzn-s3-demo-bucket/MyJupyterClusterLogs \ --use-default-roles --instance-type m5.xlarge --instance-count 2 --ec2-attributes KeyName=MyKeyPair