Introducción a las sesiones interactivas de AWS Glue
En estas secciones, se describe cómo ejecutar sesiones interactivas de AWS Glue de forma local.
Requisitos previos para configurar las sesiones interactivas de manera local
A continuación, se indican los requisitos previos para instalar sesiones interactivas:
-
Las versiones compatibles de Python son de la 3.6 a la 3.10+.
-
Consulte las secciones siguientes para obtener instrucciones para macOS, Linux y Windows.
Instalación de Jupyter y kernels de Jupyter de las sesiones interactivas de AWS Glue
Use lo siguiente para instalar el kernel localmente.
El comando, install-glue-kernels
, instala la especificación de kernel de jupyter para los kernels pyspark y spark y también instala los logotipos en el directorio correcto.
pip3 install --upgrade jupyter boto3 aws-glue-sessions
install-glue-kernels
Ejecución de Jupyter
Para ejecutar el cuaderno de Jupyter, complete los siguientes pasos.
-
Para lanzar el cuaderno de Jupyter, ejecute el siguiente comando.
jupyter notebook
-
Elija New (Nuevo) y, a continuación, elija uno de los kernels de AWS Glue para comenzar a escribir código en AWS Glue.
Configuración de credenciales de sesión y región
Instrucciones para macOS/Linux
Las sesiones interactivas de AWS Glue requieren los mismos permisos de IAM que los trabajos y los puntos de conexión de desarrollo de AWS Glue. Especifique el rol que se utiliza con las sesiones interactivas de una de estas dos formas:
-
Con los comandos mágicos
%iam_role
y%region
-
Con una línea adicional en
~/.aws/config
Configuración de un rol de sesión con un comando mágico
En la primera celda, escriba %iam_role <YourGlueServiceRole>
en la primera celda que se ejecuta.
Configuración de un rol de sesión con ~/.aws/config
El rol de servicio de AWS Glue para las sesiones interactivas se puede especificar en el propio cuaderno, o bien almacenarse junto con la configuración de la AWS CLI. Si tiene un rol que utiliza normalmente con los trabajos de AWS Glue, este será ese rol. Si no tiene un rol que utilice para los trabajos de AWS Glue, siga esta guía, Configuración de permisos de IAM para AWS Glue, para configurar uno.
Para establecer este rol como rol predeterminado de las sesiones interactivas:
-
Con un editor de texto, abra
~/.aws/config
. -
Busque el perfil que utiliza para AWS Glue. Si no utiliza un perfil, use el perfil
[Default]
. -
Agregue una línea en el perfil para el rol que quiera utilizar, como
glue_role_arn=<AWSGlueServiceRole>
. -
[Opcional]: Si el perfil no tiene un conjunto de regiones predeterminadas, se recomienda agregar uno con
region=us-east-1
y reemplazarus-east-1
con la región deseada. -
Guarde la configuración.
Para obtener más información, consulte Sesiones interactivas con IAM.
Instrucciones para Windows
Las sesiones interactivas de AWS Glue requieren los mismos permisos de IAM que los trabajos y los puntos de conexión de desarrollo de AWS Glue. Especifique el rol que se utiliza con las sesiones interactivas de una de estas dos formas:
-
Con los comandos mágicos
%iam_role
y%region
-
Con una línea adicional en
~/.aws/config
Configuración de un rol de sesión con un comando mágico
En la primera celda, escriba %iam_role <YourGlueServiceRole>
en la primera celda que se ejecuta.
Configuración de un rol de sesión con ~/.aws/config
El rol de servicio de AWS Glue para las sesiones interactivas se puede especificar en el propio cuaderno, o bien almacenarse junto con la configuración de la AWS CLI. Si tiene un rol que utiliza normalmente con los trabajos de AWS Glue, este será ese rol. Si no tiene un rol que utiliza para los trabajos de AWS Glue, siga esta guía, Configuración de permisos de IAM para AWS Glue, para configurar uno.
Para establecer este rol como rol predeterminado de las sesiones interactivas:
-
Con un editor de texto, abra
~/.aws/config
. -
Busque el perfil que utiliza para AWS Glue. Si no utiliza un perfil, use el perfil
[Default]
. -
Agregue una línea en el perfil para el rol que quiera utilizar, como
glue_role_arn=<AWSGlueServiceRole>
. -
[Opcional]: Si el perfil no tiene un conjunto de regiones predeterminadas, se recomienda agregar uno con
region=us-east-1
y reemplazarus-east-1
con la región deseada. -
Guarde la configuración.
Para obtener más información, consulte Sesiones interactivas con IAM.
Actualización desde la versión preliminar de las sesiones interactivas
El kernel se actualizó con nuevos nombres cuando se lanzó con la versión 0.27. Para limpiar las versiones preliminares de los kernels, ejecute lo siguiente desde un terminal o PowerShell.
nota
Si forma parte de cualquier otra versión preliminar de AWS Glue que requiera un modelo de servicio personalizado, al eliminar el kernel se eliminará también el modelo de servicio personalizado.
# Remove Old Glue Kernels jupyter kernelspec remove glue_python_kernel jupyter kernelspec remove glue_scala_kernel # Remove Custom Model cd ~/.aws/models rm -rf glue/