Guida per l'utente - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Guida per l'utente

Questa sezione spiega come data scientist e data engineer possono avviare, scoprire, connettersi o terminare un EMR cluster Amazon da Studio o Studio Classic.

Prima che gli utenti possano elencare o avviare i cluster, gli amministratori devono aver configurato le impostazioni necessarie nell'ambiente Studio. Per informazioni su come gli amministratori possono configurare un ambiente Studio per consentire il provisioning automatico e l'elenco dei EMR cluster Amazon, consulta. Guida per gli amministratori

Immagini e kernel supportati per la connessione a un EMR cluster Amazon da Studio o Studio Classic

Vengono fornite le seguenti immagini e kernel sagemaker-studio-analytics-extension, l' JupyterLab estensione che si connette a un cluster Spark EMR (Amazon) remoto tramite la SparkMagiclibreria utilizzando Apache Livy.

  • Per gli utenti di Studio: SageMaker Distribution è un ambiente Docker per la scienza dei dati utilizzato come immagine predefinita delle istanze dei notebook. JupyterLab Tutte le versioni di SageMakerDistribution sono preinstallatesagemaker-studio-analytics-extension.

  • Per gli utenti di Studio Classic: le seguenti immagini sono preinstallate con: sagemaker-studio-analytics-extension

    • DataScience — Kernel Python 3

    • DataScience 2.0 — Kernel Python 3

    • DataScience 3.0 — Kernel Python 3

    • SparkAnalytics 1.0 — SparkMagic e kernel PySpark

    • SparkAnalytics 2.0 — SparkMagic e PySpark kernel

    • SparkMagic — SparkMagic e PySpark kernel

    • PyTorch 1.8 — Kernel Python 3

    • TensorFlow 2.6 — Kernel Python 3

    • TensorFlow 2.11 — Kernel Python 3

Per connetterti ai EMR cluster Amazon utilizzando un'altra immagine integrata o la tua immagine, segui le istruzioni riportate inPortare la propria immagine.

Portare la propria immagine

Per portare la tua immagine in Studio o Studio Classic e consentire ai tuoi notebook di connettersi ai EMR cluster Amazon, installa la seguente sagemaker-studio-analytics-extensionestensione nel tuo kernel. Supporta il collegamento di notebook SageMaker Studio o Studio Classic ai cluster Spark (EMRAmazon) tramite la libreria. SparkMagic

pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension

Inoltre, per connetterti ad Amazon EMR con l'autenticazione Kerberos, devi installare il client kinit. Il comando per installare il client kinit può variare a seconda del sistema operativo. Per utilizzare un'immagine di Ubuntu (basata su Debian), usa il comando apt-get install -y -qq krb5-user.

Per ulteriori informazioni su come portare la tua immagine in SageMaker Studio o Studio Classic, consulta Bring your own image. SageMaker