Crear un cuaderno en EMR Studio - Amazon EMR

Crear un cuaderno en EMR Studio

nota

Cuadernos de EMR está disponible como Espacios de trabajo de EMR Studio en la nueva consola. El botón Crear espacio de trabajo de la consola le permite crear nuevos cuadernos. Para crear espacios de trabajo o acceder a ellos, los usuarios de Cuadernos de EMR necesitan permisos de rol de IAM adicionales. Para obtener más información, consulte Cuadernos de Amazon EMR es Espacios de trabajo de Amazon EMR Studio en la consola y Consola Amazon EMR.

Puede crear un cuaderno de EMR con la antigua consola de Amazon EMR. No se admite la creación de cuadernos mediante la AWS CLI o la API de Amazon EMR.

Para crear un bloc de notas de EMR
  1. Abra la consola de Amazon EMR enhttps://console.aws.amazon.com/elasticmapreduce/.

  2. Elija Notebooks (Blocs de notas), Create notebook (Crear bloc de notas).

  3. Introduzca el Notebook name (Nombre del bloc de notas) y una Notebook description (Descripción del bloc de notas) opcional.

  4. Si tiene un clúster activo al que desea asociar el cuaderno, deje el valor predeterminado Elegir un clúster existente seleccionado, haga clic en Elegir, seleccione un clúster en la lista y, a continuación, haga clic en Elegir clúster. Para obtener información sobre los requisitos de clúster para Cuadernos de EMR, consulte Requisitos, diferencias en las versiones de lanzamiento y seguridad de los cuadernos de EMR.

    —o bien—

    Elija Create a cluster (Crear un clúster), introduzca un Cluster name (Nombre de clúster) y elija opciones según las siguientes directrices. El clúster se crea en la VPC predeterminada para la cuenta mediante instancias bajo demanda.

    Opción Descripción

    Cluster name (Nombre del clúster)

    Nombre descriptivo utilizado para identificar el clúster.

    Release (Versión)

    No se puede modificar. El valor predeterminado es la versión de Amazon EMR más reciente (5.36.2).

    Aplicaciones

    No se puede modificar. Enumera las aplicaciones que están instaladas en el clúster.

    Instancia

    Introduzca el número de instancias y seleccione el tipo de instancia EC2. Una instancia se utiliza para el nodo principal. El resto se utiliza para nodos principales. El tipo de instancia determina el número de blocs de notas que se pueden asociar simultáneamente al clúster. Para obtener más información, consulte Límites para cuadernos asociados de forma simultánea.

    Rol de EMR

    Deje el valor predeterminado o elija el vínculo para el que desea especificar un rol de servicio personalizado de Amazon EMR. Para obtener más información, consulte Rol de servicio para Amazon EMR (rol de EMR).

    Perfil de instancia EC2

    Deje el valor predeterminado o elija el enlace para especificar un rol de servicio personalizado para las instancias EC2. Para obtener más información, consulte Rol de servicio para instancias de EC2 del clúster (perfil de instancia de EC2).

    EC2 key pair (Par de claves de EC2)

    Elija un par de claves EC2 para poder conectarse a instancias de clúster. Para obtener más información, consulte Conexión al nodo principal del clúster de Amazon EMR mediante SSH.

    Terminación automática La terminación automática es compatible con las versiones 5.30.0 y 6.1.0 y posteriores de Amazon EMR.

    Seleccione la casilla de verificación para habilitar la terminación automática y, a continuación, especifique la cantidad de tiempo de inactividad tras el cual el clúster debe apagarse automáticamente. Para obtener más información, consulte Uso de una política de finalización automática para la limpieza de clústeres de Amazon EMR..

  5. En Security groups (Grupos de seguridad), elija Use default security groups (Usar grupos de seguridad predeterminados). También puede elegir Choose security groups (Elegir grupos de seguridad) y seleccionar grupos de seguridad personalizados disponibles en la VPC del clúster. Seleccione uno para la instancia principal y otro para la instancia de cliente de cuaderno. Para obtener más información, consulte Especificación de grupos de seguridad de EC2 para Cuadernos de Amazon EMR.

  6. En Rol de servicio de AWS, deje el valor predeterminado o elija un rol personalizado en la lista. La instancia de cliente para el bloc de notas utiliza este rol. Para obtener más información, consulte Rol de servicio para Cuadernos de Amazon EMR.

  7. En Ubicación del cuaderno, elija la ubicación de Amazon S3 donde se guarda el archivo del cuaderno o especifique su propia ubicación. Si el bucket y la carpeta no existen, Amazon EMR los creará.

    Amazon EMR crea una carpeta cuyo nombre es el valor indicado en ID del cuaderno y guarda el cuaderno en un archivo denominado NotebookName.ipynb. Por ejemplo, si especifica la ubicación de Amazon S3 s3://amzn-s3-demo-bucket/MyNotebooks para un cuaderno denominado MyFirstEMRManagedNotebook, el archivo del cuaderno se guardará en s3://amzn-s3-demo-bucket/MyNotebooks/NotebookID/MyFirstEMRManagedNotebook.ipynb.

    Si especifica una ubicación cifrada en Amazon S3, debe configurar Rol de servicio para Cuadernos de Amazon EMR como usuario de claves. El rol de servicio predeterminado es EMR_Notebooks_DefaultRole. Si utiliza una clave de AWS KMS para el cifrado, consulte Uso políticas de claves en AWS KMS en la Guía para desarrolladores de AWS Key Management Service y el artículo de soporte técnico para agregar usuarios de claves.

  8. Opcionalmente, si ha agregado un repositorio basado en Git a Amazon EMR que desea asociar con este cuaderno, elija Repositorio de Git, haga clic en Elegir repositorio y, a continuación, seleccione un repositorio de la lista. Para obtener más información, consulte Asociación de repositorios basados en Git con Cuadernos de EMR.

  9. También puede elegir Tags (Etiquetas) y, a continuación, añadir etiquetas de clave-valor adicionales para el bloc de notas.

    importante

    Se aplicará una etiqueta predeterminada con la cadena Key (Clave) establecida en creatorUserID y el valor definido como su ID de usuario de IAM para poder obtener acceso. Recomendamos que no cambie ni elimine esta etiqueta, ya que se puede utilizar para controlar el acceso. Para obtener más información, consulte Uso de etiquetas de clúster y cuaderno con políticas de IAM para el control de acceso.

  10. Elija Create Notebook (Crear bloc de notas).