Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Inizia con le sessioni AWS Glue interattive
In questa guida, imparerai come avviare una sessione AWS Glue interattiva in SageMaker AI Studio Classic e gestire il tuo ambiente con Jupyter magics.
Autorizzazioni per sessioni AWS Glue interattive in Studio o Studio Classic
Questa sezione elenca le politiche richieste per eseguire sessioni AWS Glue interattive in Studio o Studio Classic e spiega come configurarle. In particolare, descrive in dettaglio come:
-
AwsGlueSessionUserRestrictedServiceRole
Associa la policy gestita al tuo ruolo di esecuzione dell' SageMaker IA. -
Crea una policy personalizzata in linea sul tuo ruolo di esecuzione dell' SageMaker IA.
-
Modifica la relazione di fiducia del tuo ruolo di esecuzione dell' SageMaker IA.
Per collegare la policy gestita AwsGlueSessionUserRestrictedServiceRole
al tuo ruolo di esecuzione
-
Apri la console IAM
. -
Selezionare Ruoli nel pannello a sinistra.
-
Trova il ruolo di esecuzione di Studio Classic utilizzato dal tuo profilo utente. Per informazioni su come visualizzare un profilo utente, vedereVisualizzare i profili utente in un dominio.
-
Scegli il nome del tuo ruolo per accedere alla pagina di riepilogo del ruolo.
-
Nella scheda Autorizzazioni, selezionare Collega policy dal menu a discesa Aggiungi autorizzazioni.
-
Seleziona la casella di controllo accanto alla policy gestita
AwsGlueSessionUserRestrictedServiceRole
. -
Scegli Collega policy.
La pagina di riepilogo mostra le policy gestite appena aggiunte.
Per creare una policy personalizzata in linea sul tuo ruolo di esecuzione
-
Seleziona Crea policy in linea nel menu a discesa Aggiungi autorizzazioni.
-
Seleziona la scheda JSON.
-
Copia e incolla nella seguente policy.
{ "Version": "2012-10-17", "Statement": [ { "Sid": "
unique_statement_id
", "Effect": "Allow", "Action": [ "iam:GetRole", "iam:PassRole", "sts:GetCallerIdentity" ], "Resource": "*" } ] } -
Scegli Verifica policy.
-
Inserisci un Nome, quindi seleziona Crea policy.
La pagina di riepilogo mostra le policy personalizzate appena aggiunte.
Per modificare la relazione di attendibilità del ruolo di esecuzione
-
Seleziona la scheda Relazioni di attendibilità.
-
Seleziona Modifica policy di attendibilità.
-
Copia e incolla nella seguente policy.
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "glue.amazonaws.com", "sagemaker.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ] }
-
Scegli Aggiorna policy.
Puoi aggiungere ruoli e policy aggiuntivi se devi accedere ad altre risorse AWS . Per una descrizione dei ruoli e delle policy aggiuntivi che puoi includere, consulta le sessioni interattive con IAM nella AWS Glue documentazione.
Propagazione di tag
I tag vengono comunemente utilizzati per tenere traccia e allocare i costi, controllare l'accesso alla sessione, isolare le risorse e altro ancora. Per ulteriori informazioni sull'aggiunta di metadati alle risorse AWS utilizzando i tag o per dettagli sui casi d'uso comuni, consulta Informazioni aggiuntive.
Puoi abilitare la propagazione automatica dei AWS tag in nuove sessioni AWS Glue interattive create dall'interfaccia utente di Studio o Studio Classic. Quando viene creata una sessione AWS Glue
interattiva da Studio o Studio Classic, tutti i tag definiti dall'utente allegati al profilo utente o allo spazio condiviso vengono trasferiti nella nuova sessione AWS Glue interattiva. Inoltre, Studio e Studio Classic aggiungono automaticamente due tag interni AWS generati (sagemaker:user-profile-arn
esagemaker:domain-arn
) o (sagemaker:shared-space-arn
and)sagemaker:domain-arn
) alle nuove sessioni AWS Glue interattive create dalla relativa interfaccia utente. Puoi utilizzare questi tag per aggregare i costi su singoli domini, profili utente o spazi.
Abilitare la propagazione di tag
Per abilitare la propagazione automatica dei tag in nuove sessioni AWS Glue interattive, imposta le seguenti autorizzazioni per il tuo ruolo di esecuzione SageMaker AI e il ruolo IAM associato alla sessione: AWS Glue
Nota
Per impostazione predefinita, il ruolo associato alla sessione AWS Glue interattiva è lo stesso del ruolo di esecuzione SageMaker AI. È possibile specificare un ruolo di esecuzione diverso per la sessione AWS Glue interattiva utilizzando il comando %iam_role
magico. Per informazioni sui comandi magici di Jupyter disponibili per configurare le sessioni interattive di AWS Glue , consulta Configura la tua sessione AWS Glue interattiva in Studio o Studio Classic.
-
Sul tuo ruolo di esecuzione SageMaker AI: crea una nuova policy in linea e incolla il seguente file JSON. La policy concede al ruolo di esecuzione l'autorizzazione a descrivere (
DescribeUserProfile
,DescribeSpace
,DescribeDomain
) ed elencare i tag (ListTag
) impostati nei profili utente, negli spazi condivisi e SageMaker nel dominio AI.{ "Effect": "Allow", "Action": [ "sagemaker:ListTags" ], "Resource": [ "arn:aws:sagemaker:*:*:user-profile/*", "arn:aws:sagemaker:*:*:space/*" ] }, { "Effect": "Allow", "Action": [ "sagemaker:DescribeUserProfile" ], "Resource": [ "arn:aws:sagemaker:*:*:user-profile/*" ] }, { "Effect": "Allow", "Action": [ "sagemaker:DescribeSpace" ], "Resource": [ "arn:aws:sagemaker:*:*:space/*" ] } { "Effect": "Allow", "Action": [ "sagemaker:DescribeDomain" ], "Resource": [ "arn:aws:sagemaker:*:*:domain/*" ] }
-
Sul ruolo IAM della tua sessione AWS Glue : crea una nuova policy in linea e incolla il seguente file JSON. La policy concede al tuo ruolo l’autorizzazione per collegare tag (
TagResource
) alla sessione o di recuperarne l'elenco di tag (GetTags
).{ "Effect": "Allow", "Action": [ "glue:TagResource", "glue:GetTags" ], "Resource": [ "arn:aws:glue:*:*:session/*" ] }
Nota
-
Gli errori che si verificano durante l'applicazione di tali autorizzazioni non impediscono la creazione di sessioni interattive. AWS Glue I dettagli sul motivo dell'errore sono disponibili nei log di Studio o Studio Classic. CloudWatch
-
È necessario riavviare il kernel della sessione AWS Glue interattiva per propagare l'aggiornamento del valore di un tag.
È importante tenere a mente i seguenti punti:
-
Una volta che un tag è collegato a una sessione, non può essere rimosso mediante propagazione.
È possibile rimuovere i tag da una sessione AWS Glue interattiva direttamente tramite AWS CLI, l' AWS Glue API o il. https://console.aws.amazon.com/sagemaker/
Ad esempio, utilizzando AWS CLI, puoi rimuovere un tag fornendo l'ARN della sessione e le chiavi dei tag che desideri rimuovere come segue: aws glue untag-resource \ --resource-arn
arn:aws:glue:region:account-id:session:session-name
\ --tags-to-removetag-key1
,tag-key2
-
Studio e Studio Classic aggiungono due tag interni AWS generati ((
sagemaker:user-profile-arn
andsagemaker:domain-arn
) o (sagemaker:shared-space-arn
and)sagemaker:domain-arn
) alle nuove sessioni AWS Glue interattive create dalla relativa interfaccia utente. Questi tag vengono conteggiati nel limite di 50 tag impostato su tutte le AWS risorse. Entrambisagemaker:shared-space-arn
contengonosagemaker:user-profile-arn
l'ID di dominio a cui appartengono. -
Le chiavi dei tag che iniziano con
aws:
o qualsiasi combinazione di lettere maiuscole e minuscole come prefisso per le chiavi non vengono propagate e sono riservate all'uso.AWS:
AWS
Informazioni aggiuntive
Per ulteriori informazioni tagging, fai riferimento alle seguenti risorse.
-
Per informazioni sul monitoraggio dei costi tramite tag, consulta Analisi dei costi nelle best practice di amministrazione di Studio.
-
Per informazioni sul controllo dell'accesso AWS Glue basato sulle chiavi dei tag, consulta ABAC with AWS Glue.
Avvia la sessione AWS Glue interattiva su Studio o Studio Classic
Dopo aver creato i ruoli, le politiche e il dominio SageMaker AI, puoi avviare la sessione AWS Glue interattiva in Studio o Studio Classic.
-
Accedi alla console SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/
. -
Dal riquadro di navigazione a sinistra, scegli Studio.
-
Dalla pagina iniziale di Studio, seleziona il dominio e il profilo utente per avviare Studio.
-
Scegli Open Studio e avvia una JupyterLab o più applicazioni Studio Classic.
-
Nella vista Jupyter, scegli File, quindi Nuovo, quindi Notebook.
-
Per gli utenti di Studio Classic: nel menu a discesa Immagine, seleziona SparkAnalytics 1.0 o SparkAnalytics2.0. Nel menu a discesa del kernel, seleziona Glue Spark o Glue Python [and Ray]. PySpark Scegli Seleziona.
Per gli utenti di Studio, selezionate un kernel Glue Spark o Glue Python PySpark [and Ray]
-
(facoltativo) Utilizza le magie Jupyter per personalizzare il tuo ambiente. Per ulteriori informazioni sulle magie Jupyter, consulta Configura la tua sessione AWS Glue interattiva in Studio o Studio Classic.
-
Inizia a scrivere gli script di elaborazione di dati Spark. Il seguente taccuino
illustra un end-to-end flusso di lavoro per ETL su un set di dati di grandi dimensioni utilizzando una sessione AWS Glue interattiva, l'analisi esplorativa dei dati, la preelaborazione dei dati e infine l'addestramento di un modello sui dati elaborati con l'intelligenza artificiale. SageMaker
Configura la tua sessione AWS Glue interattiva in Studio o Studio Classic
Nota
Tutte le configurazioni magiche vengono trasferite alle sessioni successive per tutta la durata del kernel. AWS Glue
Puoi usare Jupyter magics nella tua sessione AWS Glue interattiva per modificare i parametri di sessione e configurazione. Le magie sono brevi comandi con il prefisso %
all’inizio delle celle di Jupyter che forniscono un modo semplice e veloce per aiutarti a controllare l'ambiente. Nella sessione AWS Glue interattiva, le seguenti magie sono impostate automaticamente per te:
Magia | Valore predefinito |
---|---|
%glue_version |
3.0 |
%iam_role |
|
%region |
la tua regione |
Puoi usare le magie per personalizzare ulteriormente il tuo ambiente. Ad esempio, se desideri modificare il numero di worker assegnati al tuo lavoro dal valore predefinito di cinque a 10, puoi specificare %number_of_workers 10
. Se desideri configurare la sessione in modo che si interrompa dopo 10 minuti di inattività anziché il 2880 predefinito, puoi specificare %idle_timeout 10
.
Tutte le magie di Jupyter attualmente disponibili in AWS Glue sono disponibili anche in Studio o Studio Classic. Per l'elenco completo dei AWS Glue magics disponibili, consulta Configurazione delle sessioni AWS Glue interattive per i notebook Jupyter e Studio. AWS Glue