Inizia con le sessioni AWS Glue interattive - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Inizia con le sessioni AWS Glue interattive

In questa guida, imparerai come avviare una sessione AWS Glue interattiva in SageMaker AI Studio Classic e gestire il tuo ambiente con Jupyter magics.

Autorizzazioni per sessioni AWS Glue interattive in Studio o Studio Classic

Questa sezione elenca le politiche richieste per eseguire sessioni AWS Glue interattive in Studio o Studio Classic e spiega come configurarle. In particolare, descrive in dettaglio come:

  • AwsGlueSessionUserRestrictedServiceRoleAssocia la policy gestita al tuo ruolo di esecuzione dell' SageMaker IA.

  • Crea una policy personalizzata in linea sul tuo ruolo di esecuzione dell' SageMaker IA.

  • Modifica la relazione di fiducia del tuo ruolo di esecuzione dell' SageMaker IA.

Per collegare la policy gestita AwsGlueSessionUserRestrictedServiceRole al tuo ruolo di esecuzione
  1. Apri la console IAM.

  2. Selezionare Ruoli nel pannello a sinistra.

  3. Trova il ruolo di esecuzione di Studio Classic utilizzato dal tuo profilo utente. Per informazioni su come visualizzare un profilo utente, vedereVisualizzare i profili utente in un dominio.

  4. Scegli il nome del tuo ruolo per accedere alla pagina di riepilogo del ruolo.

  5. Nella scheda Autorizzazioni, selezionare Collega policy dal menu a discesa Aggiungi autorizzazioni.

  6. Seleziona la casella di controllo accanto alla policy gestita AwsGlueSessionUserRestrictedServiceRole.

  7. Scegli Collega policy.

    La pagina di riepilogo mostra le policy gestite appena aggiunte.

Per creare una policy personalizzata in linea sul tuo ruolo di esecuzione
  1. Seleziona Crea policy in linea nel menu a discesa Aggiungi autorizzazioni.

  2. Seleziona la scheda JSON.

  3. Copia e incolla nella seguente policy.

    { "Version": "2012-10-17", "Statement": [ { "Sid": "unique_statement_id", "Effect": "Allow", "Action": [ "iam:GetRole", "iam:PassRole", "sts:GetCallerIdentity" ], "Resource": "*" } ] }
  4. Scegli Verifica policy.

  5. Inserisci un Nome, quindi seleziona Crea policy.

    La pagina di riepilogo mostra le policy personalizzate appena aggiunte.

Per modificare la relazione di attendibilità del ruolo di esecuzione
  1. Seleziona la scheda Relazioni di attendibilità.

  2. Seleziona Modifica policy di attendibilità.

  3. Copia e incolla nella seguente policy.

    { "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "glue.amazonaws.com", "sagemaker.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ] }
  4. Scegli Aggiorna policy.

Puoi aggiungere ruoli e policy aggiuntivi se devi accedere ad altre risorse AWS . Per una descrizione dei ruoli e delle policy aggiuntivi che puoi includere, consulta le sessioni interattive con IAM nella AWS Glue documentazione.

Propagazione di tag

I tag vengono comunemente utilizzati per tenere traccia e allocare i costi, controllare l'accesso alla sessione, isolare le risorse e altro ancora. Per ulteriori informazioni sull'aggiunta di metadati alle risorse AWS utilizzando i tag o per dettagli sui casi d'uso comuni, consulta Informazioni aggiuntive.

Puoi abilitare la propagazione automatica dei AWS tag in nuove sessioni AWS Glue interattive create dall'interfaccia utente di Studio o Studio Classic. Quando viene creata una sessione AWS Glue interattiva da Studio o Studio Classic, tutti i tag definiti dall'utente allegati al profilo utente o allo spazio condiviso vengono trasferiti nella nuova sessione AWS Glue interattiva. Inoltre, Studio e Studio Classic aggiungono automaticamente due tag interni AWS generati (sagemaker:user-profile-arnesagemaker:domain-arn) o (sagemaker:shared-space-arnand)sagemaker:domain-arn) alle nuove sessioni AWS Glue interattive create dalla relativa interfaccia utente. Puoi utilizzare questi tag per aggregare i costi su singoli domini, profili utente o spazi.

Abilitare la propagazione di tag

Per abilitare la propagazione automatica dei tag in nuove sessioni AWS Glue interattive, imposta le seguenti autorizzazioni per il tuo ruolo di esecuzione SageMaker AI e il ruolo IAM associato alla sessione: AWS Glue

Nota

Per impostazione predefinita, il ruolo associato alla sessione AWS Glue interattiva è lo stesso del ruolo di esecuzione SageMaker AI. È possibile specificare un ruolo di esecuzione diverso per la sessione AWS Glue interattiva utilizzando il comando %iam_role magico. Per informazioni sui comandi magici di Jupyter disponibili per configurare le sessioni interattive di AWS Glue , consulta Configura la tua sessione AWS Glue interattiva in Studio o Studio Classic.

  • Sul tuo ruolo di esecuzione SageMaker AI: crea una nuova policy in linea e incolla il seguente file JSON. La policy concede al ruolo di esecuzione l'autorizzazione a descrivere (DescribeUserProfile,DescribeSpace,DescribeDomain) ed elencare i tag (ListTag) impostati nei profili utente, negli spazi condivisi e SageMaker nel dominio AI.

    { "Effect": "Allow", "Action": [ "sagemaker:ListTags" ], "Resource": [ "arn:aws:sagemaker:*:*:user-profile/*", "arn:aws:sagemaker:*:*:space/*" ] }, { "Effect": "Allow", "Action": [ "sagemaker:DescribeUserProfile" ], "Resource": [ "arn:aws:sagemaker:*:*:user-profile/*" ] }, { "Effect": "Allow", "Action": [ "sagemaker:DescribeSpace" ], "Resource": [ "arn:aws:sagemaker:*:*:space/*" ] } { "Effect": "Allow", "Action": [ "sagemaker:DescribeDomain" ], "Resource": [ "arn:aws:sagemaker:*:*:domain/*" ] }
  • Sul ruolo IAM della tua sessione AWS Glue : crea una nuova policy in linea e incolla il seguente file JSON. La policy concede al tuo ruolo l’autorizzazione per collegare tag (TagResource) alla sessione o di recuperarne l'elenco di tag (GetTags).

    { "Effect": "Allow", "Action": [ "glue:TagResource", "glue:GetTags" ], "Resource": [ "arn:aws:glue:*:*:session/*" ] }
Nota
  • Gli errori che si verificano durante l'applicazione di tali autorizzazioni non impediscono la creazione di sessioni interattive. AWS Glue I dettagli sul motivo dell'errore sono disponibili nei log di Studio o Studio Classic. CloudWatch

  • È necessario riavviare il kernel della sessione AWS Glue interattiva per propagare l'aggiornamento del valore di un tag.

È importante tenere a mente i seguenti punti:

  • Una volta che un tag è collegato a una sessione, non può essere rimosso mediante propagazione.

    È possibile rimuovere i tag da una sessione AWS Glue interattiva direttamente tramite AWS CLI, l' AWS Glue API o il. https://console.aws.amazon.com/sagemaker/ Ad esempio, utilizzando AWS CLI, puoi rimuovere un tag fornendo l'ARN della sessione e le chiavi dei tag che desideri rimuovere come segue:

    aws glue untag-resource \ --resource-arn arn:aws:glue:region:account-id:session:session-name \ --tags-to-remove tag-key1,tag-key2
  • Studio e Studio Classic aggiungono due tag interni AWS generati ((sagemaker:user-profile-arnandsagemaker:domain-arn) o (sagemaker:shared-space-arnand)sagemaker:domain-arn) alle nuove sessioni AWS Glue interattive create dalla relativa interfaccia utente. Questi tag vengono conteggiati nel limite di 50 tag impostato su tutte le AWS risorse. Entrambi sagemaker:shared-space-arn contengono sagemaker:user-profile-arn l'ID di dominio a cui appartengono.

  • Le chiavi dei tag che iniziano con aws: o qualsiasi combinazione di lettere maiuscole e minuscole come prefisso per le chiavi non vengono propagate e sono riservate all'uso. AWS: AWS

Informazioni aggiuntive

Per ulteriori informazioni tagging, fai riferimento alle seguenti risorse.

Avvia la sessione AWS Glue interattiva su Studio o Studio Classic

Dopo aver creato i ruoli, le politiche e il dominio SageMaker AI, puoi avviare la sessione AWS Glue interattiva in Studio o Studio Classic.

  1. Accedi alla console SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.

  2. Dal riquadro di navigazione a sinistra, scegli Studio.

  3. Dalla pagina iniziale di Studio, seleziona il dominio e il profilo utente per avviare Studio.

  4. Scegli Open Studio e avvia una JupyterLab o più applicazioni Studio Classic.

  5. Nella vista Jupyter, scegli File, quindi Nuovo, quindi Notebook.

  6. Per gli utenti di Studio Classic: nel menu a discesa Immagine, seleziona SparkAnalytics 1.0 o SparkAnalytics2.0. Nel menu a discesa del kernel, seleziona Glue Spark o Glue Python [and Ray]. PySpark Scegli Seleziona.

    Per gli utenti di Studio, selezionate un kernel Glue Spark o Glue Python PySpark [and Ray]

  7. (facoltativo) Utilizza le magie Jupyter per personalizzare il tuo ambiente. Per ulteriori informazioni sulle magie Jupyter, consulta Configura la tua sessione AWS Glue interattiva in Studio o Studio Classic.

  8. Inizia a scrivere gli script di elaborazione di dati Spark. Il seguente taccuino illustra un end-to-end flusso di lavoro per ETL su un set di dati di grandi dimensioni utilizzando una sessione AWS Glue interattiva, l'analisi esplorativa dei dati, la preelaborazione dei dati e infine l'addestramento di un modello sui dati elaborati con l'intelligenza artificiale. SageMaker

Configura la tua sessione AWS Glue interattiva in Studio o Studio Classic

Nota

Tutte le configurazioni magiche vengono trasferite alle sessioni successive per tutta la durata del kernel. AWS Glue

Puoi usare Jupyter magics nella tua sessione AWS Glue interattiva per modificare i parametri di sessione e configurazione. Le magie sono brevi comandi con il prefisso % all’inizio delle celle di Jupyter che forniscono un modo semplice e veloce per aiutarti a controllare l'ambiente. Nella sessione AWS Glue interattiva, le seguenti magie sono impostate automaticamente per te:

Magia Valore predefinito
%glue_version

3.0

%iam_role

execution role attached to your SageMaker AI domain

%region

la tua regione

Puoi usare le magie per personalizzare ulteriormente il tuo ambiente. Ad esempio, se desideri modificare il numero di worker assegnati al tuo lavoro dal valore predefinito di cinque a 10, puoi specificare %number_of_workers 10. Se desideri configurare la sessione in modo che si interrompa dopo 10 minuti di inattività anziché il 2880 predefinito, puoi specificare %idle_timeout 10.

Tutte le magie di Jupyter attualmente disponibili in AWS Glue sono disponibili anche in Studio o Studio Classic. Per l'elenco completo dei AWS Glue magics disponibili, consulta Configurazione delle sessioni AWS Glue interattive per i notebook Jupyter e Studio. AWS Glue