Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Guide de l'utilisateur
Cette section explique comment les data scientists et les ingénieurs de données peuvent lancer, découvrir, se connecter ou résilier un EMR cluster Amazon depuis Studio ou Studio Classic.
Avant que les utilisateurs puissent répertorier ou lancer des clusters, les administrateurs doivent avoir configuré les paramètres nécessaires dans l'environnement Studio. Pour plus d'informations sur la manière dont les administrateurs peuvent configurer un environnement Studio afin de permettre l'auto-approvisionnement et la liste des EMR clusters Amazon, consultez. Guide de l'administrateur
Rubriques
- Images et noyaux pris en charge pour se connecter à un EMR cluster Amazon depuis Studio ou Studio Classic
- Apporter votre propre image
- Lancer un EMR cluster Amazon depuis Studio ou Studio Classic
- EMRRépertorier les clusters Amazon depuis Studio ou Studio Classic
- Connectez-vous à un EMR cluster Amazon depuis SageMaker Studio ou Studio Classic
- Mettre fin à un EMR cluster Amazon depuis Studio ou Studio Classic
- Accédez à l'interface utilisateur de Spark depuis Studio ou Studio Classic
Images et noyaux pris en charge pour se connecter à un EMR cluster Amazon depuis Studio ou Studio Classic
Les images et noyaux suivants sont fournis avec sagemaker-studio-analytics-extension
-
Pour les utilisateurs de Studio : SageMaker Distribution est un environnement Docker pour la science des données utilisé comme image par défaut des instances de JupyterLab bloc-notes. Toutes les versions de SageMakerDistribution
sont sagemaker-studio-analytics-extension
préinstallées. -
Pour les utilisateurs de Studio Classic : les images suivantes sont préinstallées avec
sagemaker-studio-analytics-extension
:-
DataScience — Noyau Python 3
-
DataScience 2.0 — Noyau Python 3
-
DataScience 3.0 — Noyau Python 3
-
SparkAnalytics 1.0 — SparkMagic et PySpark noyaux
-
SparkAnalytics 2.0 — SparkMagic et PySpark noyaux
-
SparkMagic — SparkMagic et PySpark cerneaux
-
PyTorch 1.8 — Noyaux Python 3
-
TensorFlow 2.6 — Noyau Python 3
-
TensorFlow 2.11 — Noyau Python 3
-
Pour vous connecter aux EMR clusters Amazon à l'aide d'une autre image intégrée ou de votre propre image, suivez les instructions indiquées dansApporter votre propre image.
Apporter votre propre image
Pour importer votre propre image dans Studio ou Studio Classic et permettre à vos blocs-notes de se connecter aux EMR clusters Amazon, installez l'sagemaker-studio-analytics-extension
pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension
En outre, pour vous connecter à Amazon EMR avec l'authentification Kerberos, vous devez installer le client kinit. Selon votre système d'exploitation, la commande d'installation du client kinit peut varier. Pour apporter une image Ubuntu (basée sur Debian), utilisez la commande apt-get
install -y -qq krb5-user
.
Pour plus d'informations sur l'importation de votre propre image dans SageMaker Studio ou Studio Classic, voir Apporter votre propre SageMaker image.