Tutoriel : Utiliser un bloc-notes SageMaker AI avec votre terminal de développement - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Tutoriel : Utiliser un bloc-notes SageMaker AI avec votre terminal de développement

Entrée AWS Glue, vous pouvez créer un point de terminaison de développement, puis créer un bloc-notes d' SageMaker IA pour vous aider à développer vos scripts ETL et ceux de machine learning. Un bloc-notes SageMaker AI est une instance de calcul d'apprentissage automatique entièrement gérée qui exécute l'application Jupyter Notebook.

  1. Dans le volet AWS Glue console, choisissez Dev endpoints pour accéder à la liste des endpoints de développement.

  2. Cochez la case à côté du nom du point de terminaison de développement que vous souhaitez utiliser, puis dans le menu Action, choisissez Créer un SageMaker bloc-notes.

  3. Complétez la page Create and configure a notebook (Créer et configurer un bloc-notes) comme suit :

    1. Entrez un nom de bloc-notes.

    2. Sous Attach to development endpoint (Attacher au point de terminaison de développement), vérifiez le point de terminaison de développement.

    3. Créez ou choisissez un AWS Identity and Access Management (IAM) rôle.

      La création d'un rôle est recommandée. Si vous utilisez un rôle existant, assurez-vous qu'il dispose des autorisations requises. Pour de plus amples informations, veuillez consulter Étape 6 : créer une IAM politique pour les ordinateurs portables dotés d' SageMaker intelligence artificielle.

    4. (Facultatif) Choisissez unVPC, un sous-réseau et un ou plusieurs groupes de sécurité.

    5. (Facultatif) Choisissez une clé AWS Key Management Service de chiffrement.

    6. (Facultatif) Ajoutez des balises pour l'instance de bloc-notes.

  4. Choisissez Create Notebook (Créer un bloc-notes). Sur la page Notebooks (Bloc-notes), choisissez l'icône d’actualisation en haut à droite, puis continuez jusqu'à ce que l'état Ready s'affiche.

  5. Sélectionnez la case à cocher en regard du nom du nouveau bloc-notes, puis choisissez Open notebook (Ouvrir le bloc-notes).

  6. Créez un nouveau bloc-notes : sur la page Jupyter, choisissez Nouveau, puis Sparkmagic (). PySpark

    Votre écran doit maintenant avoir l'aspect suivant :

    La page jupyter comporte une barre de menus, une barre d'outils et un grand champ de texte dans lequel vous pouvez entrer des instructions.
  7. (Facultatif) En haut de la page, choisissez Untitled (Sans titre), et donnez un nom au bloc-notes.

  8. Pour démarrer une application Spark, entrez la commande suivante dans le bloc-notes, puis dans la barre d'outils, choisissez Run (Exécuter).

    spark

    Après un court délai, vous devriez voir la réponse suivante :

    La réponse du système indique l'état de l'application Spark et affiche le message suivant : SparkSession disponible sous la forme « Spark ».
  9. Créez un cadre dynamique et exécutez une requête sur celui-ci : copiez, collez et exécutez le code suivant, qui génère le nombre et le schéma de la table persons_json.

    import sys from pyspark.context import SparkContext from awsglue.context import GlueContext from awsglue.transforms import * glueContext = GlueContext(SparkContext.getOrCreate()) persons_DyF = glueContext.create_dynamic_frame.from_catalog(database="legislators", table_name="persons_json") print ("Count: ", persons_DyF.count()) persons_DyF.printSchema()