Guide de l'utilisateur - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Guide de l'utilisateur

Cette section explique comment les data scientists et les ingénieurs de données peuvent lancer, découvrir, se connecter ou résilier un EMR cluster Amazon depuis Studio ou Studio Classic.

Avant que les utilisateurs puissent répertorier ou lancer des clusters, les administrateurs doivent avoir configuré les paramètres nécessaires dans l'environnement Studio. Pour plus d'informations sur la manière dont les administrateurs peuvent configurer un environnement Studio afin de permettre l'auto-approvisionnement et la liste des EMR clusters Amazon, consultez. Guide de l'administrateur

Images et noyaux pris en charge pour se connecter à un EMR cluster Amazon depuis Studio ou Studio Classic

Les images et noyaux suivants sont fournis avec sagemaker-studio-analytics-extensionl' JupyterLab extension qui se connecte à un cluster Spark (AmazonEMR) distant via la SparkMagicbibliothèque à l'aide d'Apache Livy.

  • Pour les utilisateurs de Studio : SageMaker Distribution est un environnement Docker pour la science des données utilisé comme image par défaut des instances de JupyterLab bloc-notes. Toutes les versions de SageMakerDistribution sont sagemaker-studio-analytics-extension préinstallées.

  • Pour les utilisateurs de Studio Classic : les images suivantes sont préinstallées avec sagemaker-studio-analytics-extension :

    • DataScience — Noyau Python 3

    • DataScience 2.0 — Noyau Python 3

    • DataScience 3.0 — Noyau Python 3

    • SparkAnalytics 1.0 — SparkMagic et PySpark noyaux

    • SparkAnalytics 2.0 — SparkMagic et PySpark noyaux

    • SparkMagic — SparkMagic et PySpark cerneaux

    • PyTorch 1.8 — Noyaux Python 3

    • TensorFlow 2.6 — Noyau Python 3

    • TensorFlow 2.11 — Noyau Python 3

Pour vous connecter aux EMR clusters Amazon à l'aide d'une autre image intégrée ou de votre propre image, suivez les instructions indiquées dansApporter votre propre image.

Apporter votre propre image

Pour importer votre propre image dans Studio ou Studio Classic et permettre à vos blocs-notes de se connecter aux EMR clusters Amazon, installez l'sagemaker-studio-analytics-extensionextension suivante sur votre noyau. Il permet de connecter les blocs-notes SageMaker Studio ou Studio Classic aux clusters Spark (AmazonEMR) via la SparkMagicbibliothèque.

pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension

En outre, pour vous connecter à Amazon EMR avec l'authentification Kerberos, vous devez installer le client kinit. Selon votre système d'exploitation, la commande d'installation du client kinit peut varier. Pour apporter une image Ubuntu (basée sur Debian), utilisez la commande apt-get install -y -qq krb5-user.

Pour plus d'informations sur l'importation de votre propre image dans SageMaker Studio ou Studio Classic, voir Apporter votre propre SageMaker image.