Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Surveiller, mettre à jour et supprimer les ressources Amazon EMR Studio
Cette section contient des instructions pour vous aider à surveiller, à mettre à jour ou à supprimer une ressource EMR Studio. Pour plus d'informations sur l'attribution d'utilisateurs ou la mise à jour des autorisations utilisateur, consultez Attribuer et gérer les utilisateurs d'EMR Studio.
Afficher les détails de Studio
Surveiller les actions Amazon EMR Studio
Afficher l'activité de l'EMR Studio et de l'API
EMR Studio est intégré à AWS CloudTrail un service qui fournit un enregistrement des actions entreprises par un utilisateur, par un rôle IAM ou par un autre service AWS dans EMR Studio. CloudTrail capture les appels d'API pour EMR Studio sous forme d'événements. Vous pouvez consulter les événements à l'aide de la CloudTrail console à l'adresse https://console.aws.amazon.com/cloudtrail/
Les événements EMR Studio fournissent des informations telles que l'utilisateur Studio ou IAM qui fait une requête et le type de requête.
Note
Les actions sur le cluster, telles que l'exécution de tâches de bloc-notes, n'émettent pas AWS CloudTrail.
Vous pouvez également créer un journal pour la diffusion continue des CloudTrail événements EMR Studio vers un compartiment Amazon S3. Pour plus d’informations, consultez le Guide de l’utilisateur AWS CloudTrail.
Exemple CloudTrail d'événement : un utilisateur appelle l' DescribeStudioAPI
Voici un exemple d' AWS CloudTrail événement créé lorsqu'un utilisateur appelle l'DescribeStudioAPI. admin
CloudTrail enregistre le nom d'utilisateur sous la formeadmin
.
Note
Pour protéger les informations de Studio, l'événement d'API EMR Studio pour DescribeStudio exclut une valeur pour. responseElements
{
"eventVersion":"1.08",
"userIdentity":{
"type":"IAMUser",
"principalId":"AIDXXXXXXXXXXXXXXXXXX",
"arn":"arn:aws:iam::653XXXXXXXXX:user/admin
",
"accountId":"653XXXXXXXXX",
"accessKeyId":"AKIAIOSFODNN7EXAMPLE",
"userName":"admin
"
},
"eventTime":"2021-01-07T19:13:58Z",
"eventSource":"elasticmapreduce.amazonaws.com",
"eventName":"DescribeStudio",
"awsRegion":"us-east-1",
"sourceIPAddress":"72.XX.XXX.XX",
"userAgent":"aws-cli/1.18.188 Python/3.8.5 Darwin/18.7.0 botocore/1.19.28",
"requestParameters":{
"studioId":"es-9O5XXXXXXXXXXXXXXXXXXXXXX"
},
"responseElements":null,
"requestID":"0fxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
"eventID":"b0xxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
"readOnly":true,
"eventType":"AwsApiCall",
"managementEvent":true,
"eventCategory":"Management",
"recipientAccountId":"653XXXXXXXXX"
}
Afficher l'activité des utilisateurs et des tâches Spark
Pour consulter l'activité des tâches Spark par les utilisateurs d'Amazon EMR Studio, vous pouvez configurer l'emprunt d'identité de l'utilisateur sur un cluster. Avec l'emprunt d'identité de l'utilisateur, chaque tâche Spark soumise depuis un espace de travail est associée à l'utilisateur de Studio qui a exécuté le code.
Lorsque l'emprunt d'identité de l'utilisateur est activé, Amazon EMR crée un répertoire d'utilisateurs HDFS sur le nœud primaire du cluster pour chaque utilisateur qui exécute du code dans l'espace de travail. Par exemple, si l'utilisateur studio-user-1@example.com
exécute du code, vous pouvez vous connecter au nœud primaire et voir que hadoop fs -ls /user
a un répertoire pour studio-user-1@example.com
.
Pour configurer l'emprunt d'identité de l'utilisateur Spark, définissez les propriétés suivantes dans les classifications de configuration suivantes :
-
core-site
-
livy-conf
[ { "Classification": "core-site", "Properties": { "hadoop.proxyuser.livy.groups": "*", "hadoop.proxyuser.livy.hosts": "*" } }, { "Classification": "livy-conf", "Properties": { "livy.impersonation.enabled": "true" } } ]
Pour voir les pages du serveur d'historique, consultez Déboguer des applications et des tâches avec EMR Studio. Vous pouvez également vous connecter au nœud primaire du cluster à l'aide de SSH pour afficher les interfaces web des applications. Pour de plus amples informations, veuillez consulter Affichage des interfaces Web hébergées sur des clusters Amazon EMR.
Mettre à jour un Amazon EMR Studio
Après avoir créé un EMR Studio, vous pouvez mettre à jour les attributs suivants à l'aide de l' AWS CLI :
-
Name (Nom)
-
Description
-
Emplacement S3 par défaut
-
Sous-réseaux
Pour mettre à jour un studio EMR à l'aide du AWS CLI
Utilisez la update-studio
AWS CLI commande pour mettre à jour un EMR Studio. Pour plus d’informations, consultez la référence de la commande AWS CLI .
Note
Vous pouvez associer un Studio à un maximum de 5 sous-réseaux. Ces sous-réseaux doivent appartenir au même VPC que le Studio. La liste des sous-réseaux IDs que vous soumettez à la update-studio
commande peut inclure un nouveau sous-réseau IDs, mais doit également inclure tous les sous-réseaux IDs que vous avez déjà associés au Studio. Vous ne pouvez pas supprimer de sous-réseaux d'un Studio.
aws emr update-studio \ --studio-id
<example-studio-id-to-update>
\ --name<example-new-studio-name>
\ --subnet-ids<old-subnet-id-1 old-subnet-id-2 old-subnet-id-3 new-subnet-id>
\
Pour vérifier les modifications, utilisez la describe-studio
AWS CLI commande et spécifiez votre ID de studio. Pour plus d’informations, consultez la référence de la commande AWS CLI .
aws emr describe-studio \ --studio-id
<id-of-updated-studio>
\
Supprimer un Amazon EMR Studio et des espaces de travail
Lorsque vous supprimez un Studio, EMR Studio supprime toutes les attributions d'utilisateurs et de groupes IAM Identity Center associées au Studio.
Note
Lorsque vous supprimez un Studio, Amazon EMR ne supprime pas les espaces de travail associés à ce Studio. Vous devez supprimer les espaces de travail de votre Studio séparément.
Supprimer des espaces de travail
Supprimer un EMR Studio