Introducción a las sesiones interactivas de AWS Glue - AWS Glue

Introducción a las sesiones interactivas de AWS Glue

En estas secciones, se describe cómo ejecutar sesiones interactivas de AWS Glue de forma local.

Requisitos previos para configurar las sesiones interactivas de manera local

A continuación, se indican los requisitos previos para instalar sesiones interactivas:

  • Las versiones compatibles de Python son de la 3.6 a la 3.10+.

  • Consulte las secciones siguientes para obtener instrucciones para macOS, Linux y Windows.

Instalación de Jupyter y kernels de Jupyter de las sesiones interactivas de AWS Glue

Use lo siguiente para instalar el kernel localmente.

El comando, install-glue-kernels, instala la especificación de kernel de jupyter para los kernels pyspark y spark y también instala los logotipos en el directorio correcto.

pip3 install --upgrade jupyter boto3 aws-glue-sessions
install-glue-kernels

Ejecución de Jupyter

Para ejecutar el cuaderno de Jupyter, complete los siguientes pasos.

  1. Para lanzar el cuaderno de Jupyter, ejecute el siguiente comando.

    jupyter notebook
  2. Elija New (Nuevo) y, a continuación, elija uno de los kernels de AWS Glue para comenzar a escribir código en AWS Glue.

Configuración de credenciales de sesión y región

Instrucciones para macOS/Linux

Las sesiones interactivas de AWS Glue requieren los mismos permisos de IAM que los trabajos y los puntos de conexión de desarrollo de AWS Glue. Especifique el rol que se utiliza con las sesiones interactivas de una de estas dos formas:

  1. Con los comandos mágicos %iam_role y %region

  2. Con una línea adicional en ~/.aws/config

Configuración de un rol de sesión con un comando mágico

En la primera celda, escriba %iam_role <YourGlueServiceRole> en la primera celda que se ejecuta.

Configuración de un rol de sesión con ~/.aws/config

El rol de servicio de AWS Glue para las sesiones interactivas se puede especificar en el propio cuaderno, o bien almacenarse junto con la configuración de la AWS CLI. Si tiene un rol que utiliza normalmente con los trabajos de AWS Glue, este será ese rol. Si no tiene un rol que utilice para los trabajos de AWS Glue, siga esta guía, Configuración de permisos de IAM para AWS Glue, para configurar uno.

Para establecer este rol como rol predeterminado de las sesiones interactivas:

  1. Con un editor de texto, abra ~/.aws/config.

  2. Busque el perfil que utiliza para AWS Glue. Si no utiliza un perfil, use el perfil [Default].

  3. Agregue una línea en el perfil para el rol que quiera utilizar, como glue_role_arn=<AWSGlueServiceRole>.

  4. [Opcional]: Si el perfil no tiene un conjunto de regiones predeterminadas, se recomienda agregar uno con region=us-east-1 y reemplazar us-east-1 con la región deseada.

  5. Guarde la configuración.

Para obtener más información, consulte Sesiones interactivas con IAM.

Instrucciones para Windows

Las sesiones interactivas de AWS Glue requieren los mismos permisos de IAM que los trabajos y los puntos de conexión de desarrollo de AWS Glue. Especifique el rol que se utiliza con las sesiones interactivas de una de estas dos formas:

  1. Con los comandos mágicos %iam_role y %region

  2. Con una línea adicional en ~/.aws/config

Configuración de un rol de sesión con un comando mágico

En la primera celda, escriba %iam_role <YourGlueServiceRole> en la primera celda que se ejecuta.

Configuración de un rol de sesión con ~/.aws/config

El rol de servicio de AWS Glue para las sesiones interactivas se puede especificar en el propio cuaderno, o bien almacenarse junto con la configuración de la AWS CLI. Si tiene un rol que utiliza normalmente con los trabajos de AWS Glue, este será ese rol. Si no tiene un rol que utiliza para los trabajos de AWS Glue, siga esta guía, Configuración de permisos de IAM para AWS Glue, para configurar uno.

Para establecer este rol como rol predeterminado de las sesiones interactivas:

  1. Con un editor de texto, abra ~/.aws/config.

  2. Busque el perfil que utiliza para AWS Glue. Si no utiliza un perfil, use el perfil [Default].

  3. Agregue una línea en el perfil para el rol que quiera utilizar, como glue_role_arn=<AWSGlueServiceRole>.

  4. [Opcional]: Si el perfil no tiene un conjunto de regiones predeterminadas, se recomienda agregar uno con region=us-east-1 y reemplazar us-east-1 con la región deseada.

  5. Guarde la configuración.

Para obtener más información, consulte Sesiones interactivas con IAM.

Actualización desde la versión preliminar de las sesiones interactivas

El kernel se actualizó con nuevos nombres cuando se lanzó con la versión 0.27. Para limpiar las versiones preliminares de los kernels, ejecute lo siguiente desde un terminal o PowerShell.

nota

Si forma parte de cualquier otra versión preliminar de AWS Glue que requiera un modelo de servicio personalizado, al eliminar el kernel se eliminará también el modelo de servicio personalizado.

# Remove Old Glue Kernels jupyter kernelspec remove glue_python_kernel jupyter kernelspec remove glue_scala_kernel # Remove Custom Model cd ~/.aws/models rm -rf glue/