Guía del usuario - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Guía del usuario

En esta sección se explica cómo los científicos de datos y los ingenieros de datos pueden lanzar, descubrir, conectarse o finalizar un EMR clúster de Amazon desde Studio o Studio Classic.

Para que los usuarios puedan enumerar o lanzar clústeres, los administradores deben haber configurado los ajustes necesarios en el entorno de Studio. Para obtener información sobre cómo los administradores pueden configurar un entorno de Studio para permitir el autoaprovisionamiento y la publicación de EMR clústeres de Amazon, consulte. Guía de administración

Imágenes y núcleos compatibles para conectarse a un EMR clúster de Amazon desde Studio o Studio Classic

Las siguientes imágenes y núcleos vienen con sagemaker-studio-analytics-extensionla JupyterLab extensión que se conecta a un clúster remoto de Spark (AmazonEMR) a través de la SparkMagicbiblioteca mediante Apache Livy.

  • Para los usuarios de Studio: SageMaker Distribution es un entorno de Docker para la ciencia de datos que se utiliza como imagen predeterminada de las instancias de JupyterLab notebook. Todas las versiones de SageMakerDistribution vienen sagemaker-studio-analytics-extension preinstaladas.

  • Para los usuarios de Studio Classic: las siguientes imágenes vienen preinstaladas con: sagemaker-studio-analytics-extension

    • DataScience — Núcleo de Python 3

    • DataScience 2.0 — Núcleo de Python 3

    • DataScience 3.0 — Núcleo de Python 3

    • SparkAnalytics 1.0 — SparkMagic y PySpark núcleos

    • SparkAnalytics 2.0 — SparkMagic y núcleos PySpark

    • SparkMagic — SparkMagic y granos PySpark

    • PyTorch 1.8 — Núcleos de Python 3

    • TensorFlow 2.6 — Núcleo de Python 3

    • TensorFlow 2.11 — Núcleo de Python 3

Para conectarse a EMR los clústeres de Amazon mediante otra imagen integrada o la suya propia, siga las instrucciones que se indican enLleve su propia imagen.

Lleve su propia imagen

Para incorporar su propia imagen a Studio o Studio Classic y permitir que sus portátiles se conecten a EMR los clústeres de Amazon, instale la siguiente sagemaker-studio-analytics-extensionextensión en su núcleo. Admite la conexión de portátiles SageMaker Studio o Studio Classic a clústeres de Spark (AmazonEMR) a través de la SparkMagicbiblioteca.

pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension

Además, para conectarse a Amazon EMR con la autenticación Kerberos, debe instalar el cliente kinit. En función del sistema operativo, el comando para instalar el cliente kinit puede variar. Para obtener una imagen de Ubuntu (basada en Debian), utilice el comando apt-get install -y -qq krb5-user.

Para obtener más información sobre cómo crear su propia imagen en SageMaker Studio o Studio Classic, consulte Traiga su propia SageMaker imagen.