Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Commencez avec des sessions AWS Glue interactives
Dans ce guide, vous apprendrez à lancer une session AWS Glue interactive dans SageMaker AI Studio Classic et à gérer votre environnement avec Jupyter magics.
Autorisations pour les sessions AWS Glue interactives dans Studio ou Studio Classic
Cette section répertorie les politiques requises pour exécuter des sessions AWS Glue interactives dans Studio ou Studio Classic et explique comment les configurer. Elle explique notamment comment :
-
Associez la politique
AwsGlueSessionUserRestrictedServiceRole
gérée à votre rôle d'exécution de l' SageMaker IA. -
Créez une politique personnalisée en ligne pour votre rôle d'exécution de l' SageMaker IA.
-
Modifiez la relation de confiance de votre rôle d'exécution de l' SageMaker IA.
Pour associer la politique gérée par AwsGlueSessionUserRestrictedServiceRole
à votre rôle d'exécution
-
Ouvrez la IAM console
. -
Sélectionnez Roles (Rôles) dans le panneau de gauche.
-
Trouvez le rôle d'exécution Studio Classic utilisé par votre profil utilisateur. Pour plus d'informations sur la façon de consulter un profil utilisateur, consultezAfficher les profils des utilisateurs dans un domaine.
-
Choisissez le nom de votre rôle pour accéder à la page récapitulative du rôle.
-
Sous l'onglet Permissions (Autorisations), sélectionnez Attach policies (Attacher des politiques) dans le menu déroulant Add Permissions (Ajouter des autorisations).
-
Cochez la case à côté de la politique gérée
AwsGlueSessionUserRestrictedServiceRole
. -
Choisissez Attach Policies (Attacher des politiques).
La page récapitulative affiche les politiques gérées que vous venez d'ajouter.
Pour créer une politique personnalisée intégrée à votre rôle d'exécution
-
Sélectionnez Create inline policy (Créer une politique en ligne) dans le menu déroulant Add Permissions (Ajouter des autorisations).
-
Sélectionnez l'onglet JSON.
-
Copiez-collez ce contenu dans la politique suivante.
{ "Version": "2012-10-17", "Statement": [ { "Sid": "
unique_statement_id
", "Effect": "Allow", "Action": [ "iam:GetRole", "iam:PassRole", "sts:GetCallerIdentity" ], "Resource": "*" } ] } -
Choisissez Review policy (Examiner une politique).
-
Entrez un nom et choisissez Create policy (Créer une politique).
La page récapitulative affiche la politique personnalisée que vous venez d'ajouter.
Pour modifier la relation d'approbation de votre rôle d'exécution
-
Sélectionnez l'onglet Trust Relationships (Relations d'approbation).
-
Choisissez Edit trust policy (Modifier la politique d'approbation).
-
Copiez-collez ce contenu dans la politique suivante.
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "glue.amazonaws.com", "sagemaker.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ] }
-
Choisissez Mettre à jour une politique.
Vous pouvez ajouter des rôles et des politiques supplémentaires si vous avez besoin d'accéder à d'autres ressources AWS . Pour une description des rôles et politiques supplémentaires que vous pouvez inclure, consultez les sessions interactives IAM dans la AWS Glue documentation.
Propagation de balises
Les balises sont couramment utilisées pour suivre et répartir les coûts, contrôler l'accès à votre session, isoler vos ressources, etc. Pour en savoir plus sur l'ajout de métadonnées à vos ressources AWS à l'aide du balisage, ou pour plus de détails sur les cas d'utilisation courants, consultez Informations supplémentaires.
Vous pouvez activer la propagation automatique des AWS balises vers les nouvelles sessions AWS Glue interactives créées depuis l'interface utilisateur de Studio ou de Studio Classic. Lorsqu'une session AWS Glue
interactive est créée à partir de Studio ou Studio Classic, toutes les balises définies par l'utilisateur associées au profil utilisateur ou à l'espace partagé sont transférées vers la nouvelle session AWS Glue interactive. En outre, Studio et Studio Classic ajoutent automatiquement deux balises internes AWS générées ((sagemaker:user-profile-arn
etsagemaker:domain-arn
) ou (sagemaker:shared-space-arn
et)sagemaker:domain-arn
) aux nouvelles sessions AWS Glue interactives créées à partir de leur interface utilisateur. Vous pouvez utiliser ces balises pour agréger les coûts entre des domaines, des profils d'utilisateurs ou des espaces individuels.
Activation de la propagation des balises
Pour activer la propagation automatique des balises vers les nouvelles sessions AWS Glue interactives, définissez les autorisations suivantes pour votre rôle d'exécution SageMaker AI et le IAM rôle associé à votre AWS Glue session :
Note
Par défaut, le rôle associé à la session AWS Glue interactive est le même que le rôle d'exécution de l' SageMaker IA. Vous pouvez définir un rôle d'exécution différent pour la session AWS Glue interactive à l'aide de la commande %iam_role
magique. Pour en savoir plus sur les commandes magiques de Jupyter disponibles pour configurer des sessions interactives AWS Glue , consultez Configuration de votre session AWS Glue interactive dans Studio ou Studio Classic.
-
À propos de votre rôle d'exécution de l' SageMaker IA : créez une nouvelle politique intégrée et collez le JSON fichier suivant. La politique accorde au rôle d'exécution l'autorisation de décrire (
DescribeUserProfile
,DescribeSpace
,DescribeDomain
) et de répertorier les balises (ListTag
) définies sur les profils utilisateur, les espaces partagés et le domaine SageMaker AI.{ "Effect": "Allow", "Action": [ "sagemaker:ListTags" ], "Resource": [ "arn:aws:sagemaker:*:*:user-profile/*", "arn:aws:sagemaker:*:*:space/*" ] }, { "Effect": "Allow", "Action": [ "sagemaker:DescribeUserProfile" ], "Resource": [ "arn:aws:sagemaker:*:*:user-profile/*" ] }, { "Effect": "Allow", "Action": [ "sagemaker:DescribeSpace" ], "Resource": [ "arn:aws:sagemaker:*:*:space/*" ] } { "Effect": "Allow", "Action": [ "sagemaker:DescribeDomain" ], "Resource": [ "arn:aws:sagemaker:*:*:domain/*" ] }
-
À propos du IAM rôle de votre AWS Glue session : créez une nouvelle politique intégrée et collez le JSON fichier suivant. La politique accorde à votre rôle l'autorisation d'associer des balises (
TagResource
) à votre session ou de récupérer sa liste de balises (GetTags
).{ "Effect": "Allow", "Action": [ "glue:TagResource", "glue:GetTags" ], "Resource": [ "arn:aws:glue:*:*:session/*" ] }
Note
-
Les défaillances survenant lors de l'application de ces autorisations n'empêchent pas la création de sessions AWS Glue interactives. Vous trouverez des informations sur la raison de l'échec dans les CloudWatchjournaux de Studio ou de Studio Classic.
-
Vous devez redémarrer le noyau de votre session AWS Glue interactive pour propager la mise à jour de la valeur d'une balise.
Il est important de noter les points suivants :
-
Une fois qu'une balise est attachée à une session, elle ne peut pas être supprimée par propagation.
Vous pouvez supprimer des balises d'une session AWS Glue interactive directement via le AWS CLI, le AWS Glue API, ou le https://console.aws.amazon.com/sagemaker/
. Par exemple, à l'aide du AWS CLI, vous pouvez supprimer une balise en fournissant les clés de session ARN et de balise que vous souhaitez supprimer comme suit : aws glue untag-resource \ --resource-arn
arn:aws:glue:region:account-id:session:session-name
\ --tags-to-removetag-key1
,tag-key2
-
Studio et Studio Classic ajoutent deux balises internes AWS générées ((
sagemaker:user-profile-arn
etsagemaker:domain-arn
) ou (sagemaker:shared-space-arn
et)sagemaker:domain-arn
) aux nouvelles sessions AWS Glue interactives créées à partir de leur interface utilisateur. Ces balises sont prises en compte dans la limite de 50 balises fixée pour toutes les AWS ressources. Les deuxsagemaker:user-profile-arn
etsagemaker:shared-space-arn
contiennent l'ID de domaine auquel ils appartiennent. -
Les balises, les touches commençant par
aws:
AWS:
, ou toute combinaison de lettres majuscules et minuscules comme préfixe pour les clés ne sont pas propagées et sont réservées à l'usage. AWS
Informations supplémentaires
Pour plus d'informations sur le balisage, consultez les ressources suivantes.
-
Pour en savoir plus sur l'ajout de métadonnées à vos AWS ressources grâce au balisage, consultez la section Marquage des AWS ressources.
-
Pour plus d'informations sur le suivi des coûts à l'aide de balises, consultez la section Analyse des coûts dans les meilleures pratiques d'administration de Studio.
-
Pour plus d'informations sur le contrôle de l'accès AWS Glue en fonction des clés de balise, reportez-vous à la section ABACavec AWS Glue.
Lancez votre session AWS Glue interactive sur Studio ou Studio Classic
Après avoir créé les rôles, les politiques et le domaine SageMaker AI, vous pouvez lancer votre session AWS Glue interactive dans Studio ou Studio Classic.
-
Connectez-vous à la console SageMaker AI à l'adresse https://console.aws.amazon.com/sagemaker/
. -
Dans le volet de navigation de gauche, choisissez Studio.
-
Sur la page d'accueil de Studio, sélectionnez le domaine et le profil utilisateur pour lancer Studio.
-
Choisissez Open Studio et démarrez une application JupyterLab ou une application Studio Classic.
-
Dans la vue Jupyter, choisissez File (Fichier), puis New (Nouveau), puis Notebook (Bloc-notes).
-
Pour les utilisateurs de Studio Classic : dans le menu déroulant Image, sélectionnez SparkAnalytics 1.0 ou SparkAnalytics2.0. Dans le menu déroulant du noyau, sélectionnez Glue Spark ou Glue Python [PySpark and Ray]. Choisissez Select (Sélectionner).
Pour les utilisateurs de Studio, sélectionnez un noyau Glue Spark ou Glue Python [PySpark and Ray]
-
(facultatif) Utilisez les commandes magiques Jupyter pour personnaliser votre environnement. Pour plus d'informations sur les commandes magiques Jupyter, consultez Configuration de votre session AWS Glue interactive dans Studio ou Studio Classic.
-
Commencez à écrire vos scripts de traitement de données Spark. Le bloc-notes
suivant présente un end-to-end flux de travail pour ETL un ensemble de données volumineux à l'aide d'une session AWS Glue interactive, d'une analyse exploratoire des données, d'un prétraitement des données et, enfin, de l'entraînement d'un modèle sur les données traitées avec l'IA. SageMaker
Configuration de votre session AWS Glue interactive dans Studio ou Studio Classic
Note
Toutes les configurations magiques sont reportées aux sessions suivantes pendant toute la durée de vie du AWS Glue noyau.
Vous pouvez utiliser la magie de Jupyter dans votre session AWS Glue interactive pour modifier vos paramètres de session et de configuration. Les commandes magiques sont de courtes commandes préfixées par %
au début des cellules Jupyter qui fournissent un moyen simple et rapide de vous aider à contrôler votre environnement. Dans votre session AWS Glue interactive, les magies suivantes vous sont proposées par défaut :
Commande magique | Valeur par défaut |
---|---|
%glue_version |
3.0 |
%iam_role |
|
%region |
votre région |
Vous pouvez utiliser les commandes magiques pour personnaliser davantage votre environnement. Par exemple, si vous souhaitez modifier le nombre de collaborateurs alloués à votre tâche du nombre 5 par défaut à 10, vous pouvez spécifier %number_of_workers 10
. Si vous souhaitez configurer votre session pour qu'elle s'arrête après 10 minutes d'inactivité au lieu des 2 880 par défaut, vous pouvez spécifier %idle_timeout 10
.
Toutes les magies Jupyter actuellement disponibles dans le AWS Glue sont également dans Studio ou Studio Classic. Pour la liste complète des AWS Glue magies disponibles, consultez Configuration de sessions AWS Glue interactives pour les blocs-notes Jupyter et AWS Glue Studio.