Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Guida per l'utente
Questa sezione spiega come data scientist e data engineer possono avviare, scoprire, connettersi o terminare un cluster Amazon EMR da Studio o Studio Classic.
Prima che gli utenti possano elencare o avviare i cluster, gli amministratori devono aver configurato le impostazioni necessarie nell'ambiente Studio. Per informazioni su come gli amministratori possono configurare un ambiente Studio per consentire il provisioning automatico e l'elenco dei cluster Amazon EMR, consulta. Guida per gli amministratori
Argomenti
Immagini e kernel supportati per la connessione a un cluster Amazon EMR da Studio o Studio Classic
Le immagini e i kernel seguenti vengono forniti con sagemaker-studio-analytics-extension
-
Per gli utenti di Studio: SageMaker Distribution è un ambiente Docker per la scienza dei dati utilizzato come immagine predefinita delle istanze dei notebook. JupyterLab Tutte le versioni di SageMaker AI Distribution sono preinstallate
sagemaker-studio-analytics-extension
. -
Per gli utenti di Studio Classic: le seguenti immagini sono preinstallate con:
sagemaker-studio-analytics-extension
-
DataScience — Kernel Python 3
-
DataScience 2.0 — Kernel Python 3
-
DataScience 3.0 — Kernel Python 3
-
SparkAnalytics 1.0 — SparkMagic e kernel PySpark
-
SparkAnalytics 2.0 — SparkMagic e PySpark kernel
-
SparkMagic — SparkMagic e PySpark kernel
-
PyTorch 1.8 — Kernel Python 3
-
TensorFlow 2.6 — Kernel Python 3
-
TensorFlow 2.11 — Kernel Python 3
-
Per connetterti ai cluster Amazon EMR utilizzando un'altra immagine integrata o la tua immagine, segui le istruzioni riportate in Utilizza la tua immagine.
Utilizza la tua immagine
Per importare la tua immagine in Studio o Studio Classic e consentire ai notebook di connettersi ai cluster Amazon EMR, installa la seguente estensione nel kernel. sagemaker-studio-analytics-extension
pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension
Inoltre, per connetterti ad Amazon EMR con l'autenticazione di Kerberos, è necessario installare il client kinit. Il comando per installare il client kinit può variare a seconda del sistema operativo. Per utilizzare un'immagine di Ubuntu (basata su Debian), usa il comando apt-get
install -y -qq krb5-user
.