Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Guía del usuario
En esta sección, se explica cómo los científicos de datos y los ingenieros de datos pueden inicializar, detectar, finalizar un clúster de Amazon EMR o conectarse a él desde Studio o Studio Classic.
Para que los usuarios puedan enumerar o inicializar clústeres, los administradores deben haber configurado los ajustes necesarios en el entorno de Studio. Para obtener más información sobre cómo los administradores pueden configurar un entorno de Studio para permitir el autoaprovisionamiento y la enumeración de clústeres de Amazon EMR, consulte Guía de administración.
Temas
Inicialización de un clúster de Amazon EMR desde Studio o Studio Classic
Enumeración de clústeres de Amazon EMR desde Studio o Studio Classic
Conéctese a un clúster de Amazon EMR desde SageMaker Studio o Studio Classic
Finalización de un clúster de Amazon EMR desde Studio o Studio Classic
Acceso a la interfaz de usuario de Spark desde Studio o Studio Classic
Imágenes y kernels compatibles para conectarse a un clúster de Amazon EMR desde Studio o Studio Classic
Las siguientes imágenes y núcleos vienen con sagemaker-studio-analytics-extension
-
Para los usuarios de Studio: SageMaker Distribution es un entorno de Docker para la ciencia de datos que se utiliza como imagen predeterminada de las instancias de notebook. JupyterLab Todas las versiones de SageMaker AI Distribution
vienen sagemaker-studio-analytics-extension
preinstaladas. -
Para los usuarios de Studio Classic: las siguientes imágenes vienen preinstaladas con
sagemaker-studio-analytics-extension
:-
DataScience — Núcleo de Python 3
-
DataScience 2.0 — Núcleo de Python 3
-
DataScience 3.0 — Núcleo de Python 3
-
SparkAnalytics 1.0 — SparkMagic y PySpark núcleos
-
SparkAnalytics 2.0 — SparkMagic y núcleos PySpark
-
SparkMagic — SparkMagic y granos PySpark
-
PyTorch 1.8 — Núcleos de Python 3
-
TensorFlow 2.6 — Núcleo de Python 3
-
TensorFlow 2.11 — Núcleo de Python 3
-
Para conectarse a los clústeres de Amazon EMR mediante otra imagen integrada o su propia imagen, siga las instrucciones que se indican en Traiga su propia imagen.
Traiga su propia imagen
Para incorporar su propia imagen a Studio o Studio Classic y permitir que sus portátiles se conecten a los clústeres de Amazon EMR, instale la sagemaker-studio-analytics-extension
pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension
Además, para conectarse a Amazon EMR con la autenticación Kerberos, debe instalar el cliente kinit. En función del sistema operativo, el comando para instalar el cliente kinit puede variar. Para obtener una imagen de Ubuntu (basada en Debian), utilice el comando apt-get
install -y -qq krb5-user
.
Para obtener más información sobre cómo crear tu propia imagen en SageMaker Studio o Studio Classic, consulta Crea tu propia imagen de SageMaker IA.