Démarrage avec AWS Glue séances interactives - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Démarrage avec AWS Glue séances interactives

Ces sections décrivent comment exécuter AWS Glue séances interactives localement.

Conditions préalables à la configuration locale des séances interactives

Les conditions suivantes sont requises pour installer des séances interactives :

  • Les versions de Python prises en charge vont des versions 3.6 à 3.10 et ultérieures.

  • Consultez les sections ci-dessous pour les instructions MacOS/Linux et Windows.

Installation de Jupyter et des noyaux Jupyter AWS Glue des séances interactives

Pour installer le noyau localement, procédez comme suit.

La commande install-glue-kernels installe les KernelSpec Jupyter pour les noyaux Pyspark et Spark et installe également les logos dans le bon répertoire.

pip3 install --upgrade jupyter boto3 aws-glue-sessions
install-glue-kernels

Exécution de Jupyter

Pour exécuter Jupyter Notebook, effectuez les étapes suivantes.

  1. Pour lancer Jupyter Notebook, exécutez la commande suivante.

    jupyter notebook
  2. Choisissez Nouveau, puis choisissez l'une des AWS Glue noyaux contre lesquels commencer à coder AWS Glue.

Configuration des informations d'identification de séance et de région

Instructions MacOS/Linux

AWS Glue les sessions interactives nécessitent les mêmes IAM autorisations que AWS Glue Emplois et points de terminaison de développement. Spécifiez le rôle utilisé avec des séances interactives de l'une des deux manières suivantes :

  1. Avec magics %iam_role et %region

  2. Avec une ligne supplémentaire dans ~/.aws/config

Configuration d'un rôle de séance avec magic

Dans la première cellule, saisissez %iam_role <YourGlueServiceRole> dans la première cellule exécutée.

Configuration d'un rôle de séance avec ~/.aws/config

AWS Glue La fonction du service pour les séances interactives peut être spécifiée dans le bloc-notes lui-même ou stockée en même temps que la AWS CLI configuration. Si vous avez un rôle que vous utilisez généralement avec AWS Glue Emplois, ce sera ce rôle. Si vous n'avez pas de rôle que vous utilisez pour AWS Glue emplois, veuillez suivre ce guide, Configuration des IAM autorisations pour AWS Glue, pour en créer un.

Pour définir ce rôle comme rôle par défaut pour les séances interactives, procédez comme suit :

  1. Ouvrez ~/.aws/config avec un éditeur de texte.

  2. Recherchez le profil que vous utilisez pour AWS Glue. Si vous n'avez pas de profil, utilisez le [Default] profil.

  3. Ajoutez une ligne dans le profil pour le rôle que vous avez l'intention d'utiliser comme glue_role_arn=<AWSGlueServiceRole>.

  4. [Facultatif] : si votre profil ne possède pas de région par défaut, je vous recommande d'en ajouter une avec region=us-east-1, en remplaçant us-east-1 par la région de votre choix.

  5. Enregistrez la configuration.

Pour de plus amples informations, veuillez consulter Sessions interactives avec IAM.

Instructions Windows

AWS Glue les sessions interactives nécessitent les mêmes IAM autorisations que AWS Glue Emplois et points de terminaison de développement. Spécifiez le rôle utilisé avec des séances interactives de l'une des deux manières suivantes :

  1. Avec magics %iam_role et %region

  2. Avec une ligne supplémentaire dans ~/.aws/config

Configuration d'un rôle de séance avec magic

Dans la première cellule, saisissez %iam_role <YourGlueServiceRole> dans la première cellule exécutée.

Configuration d'un rôle de session avec ~/.aws/config

AWS Glue La fonction du service pour les séances interactives peut être spécifiée dans le bloc-notes lui-même ou stockée en même temps que la AWS CLI configuration. Si vous avez un rôle que vous utilisez généralement avec AWS Glue Emplois, ce sera ce rôle. Si vous n'avez pas de rôle que vous utilisez pour AWS Glue emplois, veuillez suivre ce guide, Configuration IAM des autorisations pour AWS Glue, pour en créer un.

Pour définir ce rôle comme rôle par défaut pour les séances interactives, procédez comme suit :

  1. Ouvrez ~/.aws/config avec un éditeur de texte.

  2. Recherchez le profil que vous utilisez pour AWS Glue. Si vous n'avez pas de profil, utilisez le [Default] profil.

  3. Ajoutez une ligne dans le profil pour le rôle que vous avez l'intention d'utiliser comme glue_role_arn=<AWSGlueServiceRole>.

  4. [Facultatif] : si votre profil ne possède pas de région par défaut, je vous recommande d'en ajouter une avec region=us-east-1, en remplaçant us-east-1 par la région de votre choix.

  5. Enregistrez la configuration.

Pour de plus amples informations, veuillez consulter Sessions interactives avec IAM.

Mise à niveau à partir de l'aperçu des séances interactives

Le noyau a été mis à niveau avec de nouveaux noms lors de sa sortie avec la version 0.27. Pour nettoyer les versions d'aperçu des noyaux, exécutez les opérations suivantes à partir d'un terminal ou PowerShell.

Note

Si vous faites partie d'un autre AWS Glue aperçu qui nécessite un modèle de service personnalisé, la suppression du noyau supprimera le modèle de service personnalisé.

# Remove Old Glue Kernels jupyter kernelspec remove glue_python_kernel jupyter kernelspec remove glue_scala_kernel # Remove Custom Model cd ~/.aws/models rm -rf glue/