Connectez-vous à un EMR cluster Amazon depuis SageMaker Studio ou Studio Classic - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Connectez-vous à un EMR cluster Amazon depuis SageMaker Studio ou Studio Classic

Les utilisateurs de Studio peuvent se connecter à leurs EMR clusters Amazon en cours d'exécution à partir d'un JupyterLab bloc-notes en utilisant leur système par défautSageMaker Images de distribution. Les utilisateurs de Studio Classic peuvent se connecter à leurs clusters depuis un bloc-notes Studio Classic en utilisant l'un des noyaux pris en charge.

Connectez-vous à un EMR cluster Amazon à l'aide de l'interface utilisateur de Studio

Pour vous connecter à votre cluster à l'aide de l'interface utilisateur de Studio ou de Studio Classic, vous pouvez établir une connexion à partir de la liste des clusters auxquels vous accédez ou à partir d'un bloc-notes dans SageMaker Studio ou Studio Classic. EMRRépertorier les clusters Amazon depuis Studio ou Studio Classic

Pour vous connecter à un cluster spécifique à partir de votre liste de clusters
  1. Choisissez le nom du cluster dans votre liste. Cela active le bouton Attacher au nouveau bloc-notes.

  2. Choisissez Attacher au nouveau bloc-notes. Cela ouvre la boîte de sélection des images et des noyaux.

  3. Sélectionnez votre image et votre noyau, puis choisissez Sélectionner. Pour obtenir la liste des images prises en charge, consultez Images et noyaux pris en charge pour se connecter à un EMR cluster Amazon depuis Studio ou Studio Classic ou référez-vous à Apporter votre propre image.

  4. Si le cluster que vous sélectionnez n'utilise pas Kerberos ou l'authentification des rôles d'exécution, Studio ou Studio Classic vous invite à sélectionner le type d'identifiant. LDAP Choisissez entre Authentification de base HTTP ou Aucune information d'identification, puis entrez vos informations d'identification, le cas échéant. Une commande de connexion remplit la première cellule de votre bloc-notes et initie la connexion avec le cluster AmazonEMR.

    Une fois la connexion établie, un message confirme la connexion et le démarrage de l'application Spark.

Vous pouvez également vous connecter à un cluster depuis un bloc-notes.
  1. Choisissez Cluster en haut de votre bloc-notes.

    Le Cluster n'est visible que lorsque vous utilisez un noyau depuis Images et noyaux pris en charge pour se connecter à un EMR cluster Amazon depuis Studio ou Studio Classic ou Apporter votre propre image. Si vous ne voyez pas Cluster en haut de votre bloc-notes, assurez-vous que votre administrateur a configuré la découvrabilité de vos clusters et passez à un noyau compatible.

    Cela ouvre une liste des clusters disponibles dans un Running état.

  2. Sélectionnez le cluster auquel vous souhaitez vous connecter, puis choisissez Connecter.

  3. Si vous avez configuré vos EMR clusters Amazon pour prendre en charge IAM les rôles d'exécution et que votre administrateur a préchargé vos rôles dans une configuration de rôle d'exécutionJSON, vous pouvez sélectionner votre rôle EMR d'accès Amazon dans le menu déroulant des rôles EMRd'exécution Amazon. Si vos rôles ne sont pas préchargés, Studio ou Studio Classic utilise votre rôle d'exécution Studio ou Studio Classic par défaut. Pour plus d'informations sur l'utilisation des rôles d'exécution avec AmazonEMR, consultezConnectez-vous à un EMR cluster Amazon depuis Studio Classic à l'aide de IAM rôles d'exécution. Lorsque vous vous connectez à un cluster, Studio ou Studio Classic ajoute un bloc de code à une cellule active pour établir la connexion.

    Sinon, si le cluster que vous choisissez n'utilise pas Kerberos ou l'authentification par rôle d'exécution, Studio ou Studio Classic vous invite à sélectionner le type d'identifiant. LDAP Vous pouvez choisir l'authentification HTTP de base ou l'absence d'informations d'identification.

  4. Une cellule active se remplit et s'exécute. Cette cellule contient la commande de connexion permettant de se connecter à votre EMR cluster Amazon.

    Une fois la connexion établie, un message confirme la connexion et le démarrage de l'application Spark.

Connectez-vous à un EMR cluster Amazon à l'aide d'une commande de connexion

Pour établir une connexion à un EMR cluster Amazon, vous pouvez exécuter des commandes de connexion dans une cellule de bloc-notes.

Lorsque vous établissez la connexion, vous pouvez vous authentifier à l'aide de Kerberos, du Lightweight Directory Access Protocol (LDAP) ou de l'authentification par rôle d'exécution IAM. La méthode d'authentification que vous choisissez dépend de la configuration de votre cluster.

Vous pouvez vous référer à cet exemple : accédez à Apache Livy à l'aide d'un Network Load Balancer sur un EMR cluster Amazon compatible Kerberos pour configurer un cluster Amazon utilisant l'authentification Kerberos. EMR Vous pouvez également explorer les CloudFormation exemples de modèles à l'aide de Kerberos ou de l'LDAPauthentification dans le référentiel sagemaker-studio-emr GitHub aws-samples/.

Si votre administrateur a activé l'accès entre comptes, vous pouvez vous connecter à votre EMR cluster Amazon depuis un bloc-notes Studio Classic, que votre application Studio Classic et votre cluster résident sur le même AWS compte ou sur des comptes différents.

Pour chacun des types d'authentification suivants, utilisez la commande spécifiée pour vous connecter à votre cluster depuis votre bloc-notes Studio ou Studio Classic.

  • Kerberos

    Ajoutez l'--assumable-role-arnargument si vous avez besoin d'un accès Amazon EMR multicompte. Ajoutez l'--verify-certificateargument si vous vous connectez à votre cluster avecHTTPS.

    %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id cluster_id \ --auth-type Kerberos --language python [--assumable-role-arn EMR_access_role_ARN ] [--verify-certificate /home/user/certificateKey.pem]
  • LDAP

    Ajoutez l'--assumable-role-arnargument si vous avez besoin d'un accès Amazon EMR multicompte. Ajoutez l'--verify-certificateargument si vous vous connectez à votre cluster avecHTTPS.

    %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id cluster_id \ --auth-type Basic_Access --language python [--assumable-role-arn EMR_access_role_ARN ] [--verify-certificate /home/user/certificateKey.pem]
  • NoAuth

    Ajoutez l'--assumable-role-arnargument si vous avez besoin d'un accès Amazon EMR multicompte. Ajoutez l'--verify-certificateargument si vous vous connectez à votre cluster avecHTTPS.

    %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id cluster_id \ --auth-type None --language python [--assumable-role-arn EMR_access_role_ARN ] [--verify-certificate /home/user/certificateKey.pem]
  • IAMRôles d'exécution

    Ajoutez l'--assumable-role-arnargument si vous avez besoin d'un accès Amazon EMR multicompte. Ajoutez l'--verify-certificateargument si vous vous connectez à votre cluster avecHTTPS.

    Pour plus d'informations sur la connexion à un EMR cluster Amazon à l'aide de IAM rôles d'exécution, consultezConnectez-vous à un EMR cluster Amazon depuis Studio Classic à l'aide de IAM rôles d'exécution.

    %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id cluster_id \ --auth-type Basic_Access \ --emr-execution-role-arn arn:aws:iam::studio_account_id:role/emr-execution-role-name [--assumable-role-arn EMR_access_role_ARN] [--verify-certificate /home/user/certificateKey.pem]

Connectez-vous à un EMR cluster Amazon via HTTPS

Si vous avez configuré votre EMR cluster Amazon avec le chiffrement de transit activé et le serveur Apache Livy pour HTTPS lequel vous souhaitez que Studio ou Studio Classic communique avec Amazon EMRHTTPS, vous devez configurer Studio ou Studio Classic pour accéder à votre clé de certificat.

Pour les certificats autosignés ou signés par l'autorité de certification (CA) locale, vous pouvez procéder en deux étapes :

  1. Téléchargez le PEM fichier de votre certificat sur votre système de fichiers local à l'aide de l'une des options suivantes :

  2. Activez la validation du certificat en fournissant le chemin d'accès à votre certificat dans l'argument --verify-certificate de votre commande de connexion.

    %sm_analytics emr connect --cluster-id cluster_id \ --verify-certificate /home/user/certificateKey.pem ...

Pour les certificats publics émis par une autorité de certification, définissez la validation du certificat en définissant le paramètre --verify-certificate comme true.

Vous pouvez également désactiver la validation du certificat en définissant le paramètre --verify-certificate comme false.

Vous trouverez la liste des commandes de connexion disponibles à un EMR cluster Amazon dansConnectez-vous à un EMR cluster Amazon à l'aide d'une commande de connexion.