Descripción general de Amazon EMR Notebooks - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Descripción general de Amazon EMR Notebooks

nota

EMRLos cuadernos están disponibles como espacios de trabajo de EMR Studio en la consola. El botón Crear espacio de trabajo de la consola permite crear nuevos cuadernos. Para acceder a los espacios de trabajo o crearlos, los usuarios de EMR Notebooks necesitan permisos de rol adicionalesIAM. Para obtener más información, consulte Amazon EMR Notebooks son Amazon EMR Studio Workspaces en la consola y Amazon EMR console.

Puedes usar Amazon EMR Notebooks junto con EMR clústeres de Amazon que ejecuten Apache Spark para crear y abrir Jupyter Notebook e JupyterLab interfaces dentro de la consola de Amazon. EMR Una EMR libreta es una libreta «sin servidor» que puedes usar para ejecutar consultas y código. A diferencia de una libreta tradicional, el contenido de una EMR libreta (las ecuaciones, las consultas, los modelos, el código y el texto narrativo dentro de las celdas de una libreta) se ejecuta en un cliente. Los comandos se ejecutan mediante un núcleo del EMR clúster. El contenido del cuaderno también se guarda en Amazon S3 separado de los datos del clúster para mayor durabilidad y flexibilidad en la reutilización.

Puede iniciar un clúster, adjuntar un EMR bloc de notas para analizarlo y, a continuación, cerrar el clúster. También puede cerrar un bloc de notas asociado a un clúster en ejecución y cambiar a otro. Varios usuarios pueden asociar cuadernos al mismo clúster de forma simultánea y compartir entre sí archivos de cuaderno en Amazon S3. Estas características le permiten ejecutar clústeres bajo demanda para ahorrar costes y reducir el tiempo dedicado a reconfigurar blocs de notas para diferentes clústeres y conjuntos de datos.

También puede ejecutar un EMR bloc de notas mediante programación utilizando Amazon EMRAPI, sin necesidad de interactuar con la EMR consola de Amazon («ejecución sin cabeza»). Debe incluir una celda en el EMR cuaderno que tenga una etiqueta de parámetros. Esa celda permite que un script pase nuevos valores de entrada al cuaderno. Los cuadernos parametrizados se pueden reutilizar con diferentes conjuntos de valores de entrada. No es necesario hacer copias del mismo cuaderno para editarlo y ejecutarlo con nuevos valores de entrada. Amazon EMR crea y guarda el bloc de notas de salida en S3 para cada ejecución del bloc de notas parametrizado. Para ver ejemplos de API códigos de EMR cuadernos, consulte. Ejemplos de comandos programáticos para cuadernos EMR

importante

La función EMR Notebooks admite clústeres que utilizan las EMR versiones 5.18.0 y superiores de Amazon. Te recomendamos que utilices EMR blocs de notas con clústeres que utilicen la última versión de AmazonEMR, o al menos las 5.30.0, 5.32.0 o 6.2.0. Con estas versiones, los kernels de Jupyter se ejecutan en el clúster asociado, en lugar de hacerlo en una instancia de Jupyter. Este cambio mejora el rendimiento y mejora su capacidad para personalizar kernels y bibliotecas. Para obtener más información, consulte Diferencias en capacidades por versión de clúster.

Se aplican los cargos aplicables al almacenamiento de Amazon S3 y a EMR los clústeres de Amazon.