Connectez-vous à une application EMR sans serveur depuis Studio - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Connectez-vous à une application EMR sans serveur depuis Studio

Les data scientists et les ingénieurs de données peuvent découvrir puis se connecter à une application EMR Serverless directement depuis l'interface utilisateur de Studio. Avant de commencer, assurez-vous d'avoir créé une application EMR sans serveur en suivant les instructions de. Créez des applications EMR sans serveur à partir de Studio

Vous pouvez connecter une application EMR sans serveur à un nouveau JupyterLab bloc-notes directement depuis l'interface utilisateur de Studio, ou choisir d'établir la connexion dans le bloc-notes d'une JupyterLab application en cours d'exécution.

Important

Lorsque vous utilisez Studio, vous ne pouvez découvrir et vous connecter aux applications EMR sans serveur que pour JupyterLab les applications lancées depuis des espaces privés. Assurez-vous que les applications EMR sans serveur sont situées dans la même AWS région que votre environnement Studio. Votre JupyterLab espace doit utiliser une version image de SageMaker distribution 1.10 ou supérieure.

Pour connecter une application EMR sans serveur à un nouveau JupyterLab bloc-notes depuis l'interface utilisateur de Studio, procédez comme suit :
  1. Dans l'interface utilisateur de Studio, accédez au panneau de gauche et sélectionnez le nœud Data dans le menu de navigation de gauche. Ensuite, faites défiler la page et choisissez l'option Amazon EMR applications and clusters. Cela ouvre une page qui affiche les EMR applications Amazon auxquelles vous pouvez accéder depuis l'environnement Studio, sous l'onglet Applications sans serveur.

    Note

    Si vous ou votre administrateur avez configuré les autorisations pour autoriser l'accès entre comptes aux applications EMR sans serveur, vous pouvez consulter une liste consolidée des applications pour tous les comptes auxquels vous avez accordé l'accès à Studio.

  2. Sélectionnez une application EMR sans serveur que vous souhaitez connecter à un nouveau bloc-notes, puis choisissez Attacher au bloc-notes. Cela ouvre une fenêtre modale affichant la liste de vos JupyterLab espaces.

    • Sélectionnez l'espace privé à partir duquel vous souhaitez lancer une JupyterLab application, puis choisissez Ouvrir un bloc-notes. Cela lance une JupyterLab application depuis l'espace que vous avez choisi et ouvre un nouveau bloc-notes.

    • Vous pouvez également créer un nouvel espace privé en cliquant sur le bouton Créer un nouvel espace en haut de la fenêtre modale. Entrez un nom pour votre espace, puis choisissez Créer un espace et ouvrir un bloc-notes. Cela crée un espace privé avec le type d'instance par défaut et SageMaker la dernière image de distribution disponible, lance une JupyterLab application et ouvre un nouveau bloc-notes.

  3. Choisissez le nom du rôle IAM d'exécution que votre application EMR Serverless peut assumer pour l'exécution de la tâche. Lors de la sélection, une commande de connexion remplit la première cellule de votre bloc-notes et établit la connexion avec l'application EMR Serverless.

    Important

    Pour connecter correctement un JupyterLab bloc-notes à une application EMR sans serveur, vous devez d'abord associer la liste des rôles d'exécution à votre domaine ou à votre profil utilisateur, comme indiqué dansConfigurez les autorisations pour activer la mise en vente et le lancement d'EMRapplications Amazon depuis SageMaker Studio. Si vous ne parvenez pas à effectuer cette étape, vous ne pourrez pas établir la connexion.

    Une fois la connexion établie, un message confirme la connexion, démarre votre application EMR Serverless et lance votre session Spark.

    Note

    Lorsque vous vous connectez à une application EMR sans serveur, son statut passe de l'un à l'autre Stopped ou Created àStarted.

Vous pouvez également vous connecter à un cluster à partir d'un JupyterLab bloc-notes.
  1. Cliquez sur le bouton Cluster en haut à droite de votre bloc-notes. Cela ouvre une fenêtre modale répertoriant les applications EMR sans serveur auxquelles vous pouvez accéder. Vous pouvez voir les applications dans l'onglet Applications sans serveur.

  2. Sélectionnez l'application à laquelle vous souhaitez vous connecter, puis choisissez Connect.

  3. EMRServerless prend en charge IAM les rôles d'exécution qui ont été préchargés lors de la définition des autorisations requises, comme indiqué dans. Configurez les autorisations pour activer la mise en vente et le lancement d'EMRapplications Amazon depuis SageMaker Studio Si vous ne parvenez pas à effectuer cette étape, vous ne pourrez pas établir la connexion.

    Vous pouvez sélectionner votre rôle dans le menu déroulant des rôles EMR d'exécution Amazon. Lorsque vous vous connectez à un EMR serveur sans serveur, Studio ajoute un bloc de code à une cellule active de votre bloc-notes pour établir la connexion.

  4. Une cellule active se remplit et s'exécute. Cette cellule contient la commande magique de connexion permettant de connecter votre bloc-notes à votre application.

    Une fois la connexion établie, un message confirme la connexion et le démarrage de l'application Spark. Vous pouvez commencer à soumettre vos tâches de traitement de données à votre application EMR Serverless.