Amazon EMR Studio - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Amazon EMR Studio

Amazon EMR Studio es un entorno de desarrollo integrado (IDE) basado en web para cuadernos de Jupyter completamente administrados que se ejecutan en clústeres de Amazon EMR. Puede configurar un estudio de EMR para que su equipo desarrolle, visualice y depure aplicaciones escritas en R, Python, Scala y. PySpark EMR Studio está integrado con AWS Identity and Access Management (IAM) e IAM Identity Center para que los usuarios puedan iniciar sesión con sus credenciales corporativas.

Puede crear un EMR Studio sin costo alguno. Cuando utiliza EMR Studio, se aplican cargos por almacenamiento de Amazon S3 y por clústeres de Amazon EMR. Para obtener detalles y aspectos destacados del producto, consulte la página de servicio de Amazon EMR Studio.

Características principales de EMR Studio

Amazon EMR Studio ofrece las siguientes características:

  • Autentique a los usuarios con AWS Identity and Access Management (IAM) o con AWS IAM Identity Center, con o sin la propagación de identidades de confianza y su proveedor de identidad empresarial.

  • Lance clústeres de Amazon EMR y acceda a ellos bajo demanda para ejecutar trabajos del cuaderno de Jupyter.

  • Conéctese a Amazon EMR en los clústeres de EKS para enviar el trabajo como ejecuciones de trabajo.

  • Explore y guarde cuadernos de muestra. Para obtener más información sobre cuadernos de ejemplo, consulte el repositorio de ejemplos de GitHub cuadernos de EMR Studio.

  • Analice los datos con Python PySpark, Spark Scala, Spark R o SparkSQL e instale kernels y bibliotecas personalizados.

  • Colabore en tiempo real con otros usuarios del mismo espacio de trabajo. Para obtener más información, consulte Configuración de la colaboración en el espacio de trabajo.

  • Utilice el Explorador de SQL de EMR Studio para examinar su catálogo de datos, ejecutar consultas SQL y descargar los resultados antes de trabajar con los datos de un cuaderno.

  • Ejecute cuadernos parametrizados como parte de los flujos de trabajo programados con una herramienta de orquestación como Apache Airflow o Amazon Managed Workflows para Apache Airflow. Para obtener más información, consulte Orquestación de trabajos de análisis en Cuadernos de EMR mediante MWAA en el blog de macrodatos de AWS.

  • Enlaza repositorios de código como y. GitHub BitBucket

  • Haga un seguimiento y depure las tareas mediante el servidor de historial de Spark, la interfaz de usuario de Tez o el servidor de cronogramas YARN.

EMR Studio también cumple con los requisitos de la HIPAA y cuenta con la certificación de HITRUST CSF y de SOC 2. Para obtener más información acerca de la conformidad con la HIPAA de los servicios de AWS, consulte https://aws.amazon.com/compliance/hipaa-compliance/. Para obtener más información sobre la conformidad de los servicios con la CSF de HITRUST de los servicios de AWS, consulte https://aws.amazon.com/compliance/hitrust/. Para obtener más información sobre otros programas de conformidad para los servicios de AWS, consulte Servicios de AWS en el ámbito del programa de conformidad.

Historial de características de Amazon EMR Studio

En esta tabla se enumeran las actualizaciones de la capacidad de Escalado administrado de Amazon EMR.

Fecha de publicación Capability
5 de enero de 2024

Se agregó soporte para EMR Studio en AWS GovCloud (EE. UU. Este) y AWS GovCloud (EE. UU. Oeste).

26 de noviembre de 2023

Se agregó la compatibilidad con la propagación de identidades de confianza para EMR Studio con la autenticación de IAM Identity Center.

26 de octubre de 2023

Se agregó la posibilidad de crear una aplicación de EMR sin servidor con capacidad interactiva.

28 de febrero de 2023

Se agregó compatibilidad con claves de AWS KMS administrada por el cliente para el almacenamiento de registros de aplicaciones para aplicaciones de EMR sin servidor.

23 de febrero de 2023

Se agregó la creación de roles de IAM con un solo clic para el envío de trabajos de EMR sin servidor. Se agregó la búsqueda de ECR para cuando se selecciona una imagen personalizada para las aplicaciones de EMR sin servidor.

27 de enero de 2023

Los cuadernos de ejecución Headless pueden hacer un seguimiento del progreso de la ejecución de cada celda con magia de %execute_notebook.

23 de enero de 2023

Las aplicaciones persistentes se han optimizado para acelerar los tiempos de lanzamiento.