Información general sobre el uso de cuaderno
AWS Glue Studio permite crear trabajos de forma interactiva en una interfaz de cuaderno basada en cuadernos de Jupyter. A través de los cuaderno en AWS Glue Studio, es posible editar scripts de trabajos y el código de integración de datos y ver el resultado sin que sea necesario ejecutar un trabajo completo. También es posible agregar un marcado y guardar cuaderno como archivos .ipynb y scripts de trabajo. Puede iniciar un cuaderno sin instalar software en forma local ni administrar servidores. Una vez que esté satisfecho con el código, AWS Glue Studio puede convertir el cuaderno en un trabajo de Glue con solo hacer clic en un botón.
Algunos de los beneficios de utilizar cuaderno son:
-
No hay clúster que aprovisionar o administrar
-
No hay que pagar por clústeres inactivos
-
No se requiere una configuración inicial
-
No se requiere instalación de cuadernos de Jupyter
-
Mismo tiempo de ejecución y plataforma que ETL de AWS Glue
Al iniciar un cuaderno a través de AWS Glue Studio, todos los pasos de configuración ya han sido completados para que, apenas después de unos segundos, pueda explorar los datos y comenzar a desarrollar el script de trabajo. AWS Glue Studio configura un cuaderno de Jupyter con el kernel de Jupyter de AWS Glue. No es necesario configurar VPC, conexiones de red ni puntos de conexión de desarrollo para utilizar este cuaderno.
Para crear trabajos mediante la interfaz de cuaderno:
-
Configure los permisos de IAM necesarios.
-
Inicie una sesión de cuaderno para crear un trabajo.
-
Escriba código en las celdas en el cuaderno.
-
Ejecute y pruebe el código para ver el resultado.
-
Guarde el trabajo.
Una vez guardado, el cuaderno es un trabajo completo de AWS Glue. Puede administrar todos los aspectos del trabajo, tales como la programación de ejecuciones de trabajos, la configuración de parámetros del trabajo y la visualización del historial de ejecuciones de trabajos justo al lado del cuaderno.