Guía del usuario - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Guía del usuario

En esta sección, se explica cómo los científicos de datos y los ingenieros de datos pueden inicializar, detectar, finalizar un clúster de Amazon EMR o conectarse a él desde Studio o Studio Classic.

Para que los usuarios puedan enumerar o inicializar clústeres, los administradores deben haber configurado los ajustes necesarios en el entorno de Studio. Para obtener más información sobre cómo los administradores pueden configurar un entorno de Studio para permitir el autoaprovisionamiento y la enumeración de clústeres de Amazon EMR, consulte Guía de administración.

Imágenes y kernels compatibles para conectarse a un clúster de Amazon EMR desde Studio o Studio Classic

Las siguientes imágenes y núcleos vienen con sagemaker-studio-analytics-extensionla JupyterLab extensión que se conecta a un clúster remoto de Spark (Amazon EMR) a través de SparkMagicla biblioteca mediante Apache Livy.

  • Para los usuarios de Studio: SageMaker Distribution es un entorno de Docker para la ciencia de datos que se utiliza como imagen predeterminada de las instancias de notebook. JupyterLab Todas las versiones de SageMaker AI Distribution vienen sagemaker-studio-analytics-extension preinstaladas.

  • Para los usuarios de Studio Classic: las siguientes imágenes vienen preinstaladas con sagemaker-studio-analytics-extension:

    • DataScience — Núcleo de Python 3

    • DataScience 2.0 — Núcleo de Python 3

    • DataScience 3.0 — Núcleo de Python 3

    • SparkAnalytics 1.0 — SparkMagic y PySpark núcleos

    • SparkAnalytics 2.0 — SparkMagic y núcleos PySpark

    • SparkMagic — SparkMagic y granos PySpark

    • PyTorch 1.8 — Núcleos de Python 3

    • TensorFlow 2.6 — Núcleo de Python 3

    • TensorFlow 2.11 — Núcleo de Python 3

Para conectarse a los clústeres de Amazon EMR mediante otra imagen integrada o su propia imagen, siga las instrucciones que se indican en Traiga su propia imagen.

Traiga su propia imagen

Para incorporar su propia imagen a Studio o Studio Classic y permitir que sus portátiles se conecten a los clústeres de Amazon EMR, instale la sagemaker-studio-analytics-extensionsiguiente extensión en el núcleo. Admite la conexión de portátiles SageMaker Studio o Studio Classic a clústeres de Spark (Amazon EMR) a través SparkMagicde la biblioteca.

pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension

Además, para conectarse a Amazon EMR con la autenticación Kerberos, debe instalar el cliente kinit. En función del sistema operativo, el comando para instalar el cliente kinit puede variar. Para obtener una imagen de Ubuntu (basada en Debian), utilice el comando apt-get install -y -qq krb5-user.

Para obtener más información sobre cómo crear tu propia imagen en SageMaker Studio o Studio Classic, consulta Crea tu propia imagen de SageMaker IA.