Crea uno studio EMR - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Crea uno studio EMR

Puoi creare uno EMR Studio per il tuo team con la EMR console Amazon o il AWS CLI. La creazione di un'istanza Studio fa parte della configurazione di Amazon EMR Studio.

Prerequisiti

Prima di creare uno Studio, assicurati di aver completato i processi precedenti in Configura un Amazon EMR Studio.

Per creare uno Studio utilizzando AWS CLI, è necessario che sia installata la versione più recente. Per ulteriori informazioni, consulta Installare o aggiornare la versione più recente della AWS CLI.

Importante

Disattivate gli strumenti di gestione dei proxy come FoxyProxy o SwitchyOmega presenti nel browser prima di creare uno Studio. I proxy attivi possono generare un messaggio di errore Errore di rete quando scegli Crea Studio.

Amazon ti EMR offre una semplice esperienza di console per creare uno Studio, così puoi iniziare rapidamente con le impostazioni predefinite per eseguire carichi di lavoro interattivi o lavori in batch con le impostazioni predefinite. La creazione di uno EMR Studio crea anche un'applicazione EMR Serverless pronta per i tuoi lavori interattivi.

Se desideri il pieno controllo sulle impostazioni di Studio, puoi scegliere Personalizzato, che ti consente di configurare tutte le impostazioni aggiuntive.

Interactive workloads
Per creare uno EMR Studio per carichi di lavoro interattivi
  1. Apri la EMR console Amazon all'indirizzo https://console.aws.amazon.com/emr.

  2. In EMRStudio sulla barra di navigazione a sinistra, scegli Guida introduttiva. È inoltre possibile creare un nuovo Studio dalla pagina Studio.

  3. Amazon EMR fornisce impostazioni predefinite per te se stai creando uno EMR Studio per carichi di lavoro interattivi, ma puoi modificare queste impostazioni. Le impostazioni configurabili includono il nome EMR dello Studio, la posizione S3 del tuo Workspace, il ruolo di servizio da utilizzare, gli spazi di lavoro che desideri utilizzare, il nome dell'applicazione EMR Serverless e il ruolo di runtime associato.

  4. Scegli Create Studio e avvia Workspace per terminare e accedere alla pagina Studios. Il tuo nuovo Studio appare nell'elenco con dettagli come il nome dello Studio, la data di creazione e l'accesso URL allo Studio. L'area di lavoro si apre in una nuova scheda del browser.

Batch jobs
Per creare uno EMR Studio per carichi di lavoro interattivi
  1. Apri la EMR console Amazon all'indirizzo https://console.aws.amazon.com/emr.

  2. In EMRStudio sulla barra di navigazione a sinistra, scegli Guida introduttiva. È inoltre possibile creare un nuovo Studio dalla pagina Studio.

  3. Amazon EMR fornisce impostazioni predefinite per te se stai creando uno EMR Studio per lavori in batch, ma puoi modificare queste impostazioni. Le impostazioni configurabili includono il nome EMR dello Studio, il nome dell'applicazione EMR Serverless e il ruolo di runtime associato.

  4. Scegli Create Studio e avvia Workspace per terminare e accedere alla pagina Studios. Il tuo nuovo Studio appare nell'elenco con dettagli come il nome dello Studio, la data di creazione e l'accesso URL allo Studio. Il tuo EMR Studio si apre in una nuova scheda del browser.

Custom settings
Per creare uno EMR Studio con impostazioni personalizzate
  1. Apri la EMR console Amazon all'indirizzo https://console.aws.amazon.com/emr.

  2. In EMRStudio sulla barra di navigazione a sinistra, scegli Guida introduttiva. È inoltre possibile creare un nuovo Studio dalla pagina Studio.

  3. Seleziona Crea uno Studio per aprire la pagina Crea uno Studio.

  4. Inserisci il nome di uno studio.

  5. Scegli di creare un nuovo bucket S3 o utilizzare una posizione esistente.

  6. Scegli l'area di lavoro da aggiungere allo Studio. Puoi aggiungere fino a 3 aree di lavoro.

  7. In Autenticazione, scegli una modalità di autenticazione per Studio e fornisci informazioni in base alla seguente tabella. Per ulteriori informazioni sull'autenticazione per EMR Studio, consultaScegli una modalità di autenticazione per Amazon EMR Studio.

    Se utilizzi... Esegui questa operazione…
    IAMautenticazione o federazione

    Il metodo di autenticazione predefinito è AWS Identity and Access Management (IAM). Nella parte inferiore dello schermo, puoi anche aggiungere tag per consentire a utenti specifici di accedere allo Studio, come descritto in Assegna un utente o un gruppo a uno Studio EMR.

    Se desideri che gli utenti federati accedano utilizzando Studio URL e le credenziali per il tuo provider di identità (IdP), seleziona il tuo IdP dall'elenco a discesa e inserisci il nome di accesso e il nome del parametro del provider di identità (IdP). URL RelayState

    Per un elenco di RelayState nomi URLs e autenticazione IdP, consulta. RelayState Parametri e autenticazione del provider di identità URLs

    IAMAutenticazione Identity Center

    Seleziona EMR Studio Service Role e User Role. Per ulteriori informazioni, consulta Crea un ruolo di servizio di EMR Studio e Crea un ruolo utente di EMR Studio per la modalità di autenticazione di IAM Identity Center.

    Quando utilizzi l'autenticazione IAMIdentity Center (precedentemente AWS Single Sign On) per Studio, puoi scegliere di semplificare l'esperienza di accesso per gli utenti con l'opzione Abilita la propagazione dell'identità affidabile. Con la propagazione affidabile delle identità, gli utenti possono accedere con le proprie credenziali Identity Center e far sì che le proprie identità vengano propagate ai servizi downstream quando utilizzano Studio. AWS

    Nella sezione Accesso alle applicazioni, puoi anche specificare se tutti gli utenti e i gruppi del tuo Identity Center devono avere accesso allo Studio o se solo gli utenti e i gruppi assegnati da te possono accedere allo Studio.

    Per ulteriori informazioniIntegra Amazon EMR con AWS IAM Identity Center, vedere e anche Propagazione affidabile dell'identità tra le applicazioni nella Guida per l'utente di Identity Center.AWS IAM

  8. PerVPC, scegli un Amazon Virtual Private Cloud (VPC) per Studio dall'elenco a discesa.

  9. In Sottoreti, seleziona un massimo di cinque sottoreti da associare VPC allo Studio. È possibile aggiungere altre sottoreti dopo aver creato lo Studio.

  10. Per Security groups (Gruppi di sicurezza), scegli i gruppi di sicurezza di default o i gruppi di sicurezza personalizzati. Per ulteriori informazioni, consulta Definisci gruppi di sicurezza per controllare il traffico di rete di Studio EMR.

    Se scegli... Esegui questa operazione…
    I gruppi di sicurezza predefiniti di Studio EMR

    Per abilitare il collegamento del repository basato su Git per il Studio, scegli Enable clusters/endpoints and Git repository (Abilita cluster/endpoint e repository Git). In caso contrario, scegli Abilita cluster/endpoint.

    Gruppi di sicurezza personalizzati per lo Studio
    • In Cluster/endpoint security group (Gruppo di sicurezza cluster/endpoint), seleziona il gruppo di sicurezza del motore configurato dall'elenco a discesa. Lo Studio utilizza questo gruppo di sicurezza per consentire l'accesso in ingresso dai WorkSpace collegati.

    • In WorkSpace security group (Gruppo di sicurezza dell'istanza WorkSpace), seleziona il gruppo di sicurezza dell'istanza WorkSpace configurata dall'elenco a discesa. Il tuo Studio utilizza questo gruppo di sicurezza con Workspaces per fornire l'accesso in uscita ai EMR cluster Amazon collegati e ai repository Git ospitati pubblicamente.

  11. Aggiungi tag al tuo Studio e ad altre risorse. Per ulteriori informazioni sui tag, consulta Tag clusters.

  12. Scegli Create Studio e avvia Workspace per terminare e accedere alla pagina Studios. Il tuo nuovo Studio appare nell'elenco con dettagli come il nome dello Studio, la data di creazione e l'accesso URL allo Studio.

Dopo aver creato uno Studio, segui le istruzioni riportate in Assegna un utente o un gruppo a uno Studio EMR.

CLI
Nota

I caratteri di continuazione della riga Linux (\) sono inclusi per questioni di leggibilità. Possono essere rimossi o utilizzati nei comandi Linux. Per Windows, rimuovili o sostituiscili con un accento circonflesso (^).

Esempio — Crea uno EMR Studio che lo utilizzi IAM per l'autenticazione

Il AWS CLI comando di esempio seguente crea uno EMR Studio con modalità di IAM autenticazione. Quando si utilizza IAM l'autenticazione o la federazione per Studio, non si specifica a--user-role.

Per consentire agli utenti federati di accedere utilizzando Studio URL e le credenziali del tuo provider di identità (IdP), specifica il tuo e. --idp-auth-url --idp-relay-state-parameter-name Per un elenco di RelayState nomi URLs e autenticazione IdP, consulta. RelayState Parametri e autenticazione del provider di identità URLs

aws emr create-studio \ --name <example-studio-name> \ --auth-mode IAM \ --vpc-id <example-vpc-id> \ --subnet-ids <subnet-id-1> <subnet-id-2>... <subnet-id-5> \ --service-role <example-studio-service-role-name> \ --user-role studio-user-role-name \ --workspace-security-group-id <example-workspace-sg-id> \ --engine-security-group-id <example-engine-sg-id> \ --default-s3-location <example-s3-location> \ --idp-auth-url <https://EXAMPLE/login/> \ --idp-relay-state-parameter-name <example-RelayState>
Esempio — Creare uno EMR Studio che utilizzi Identity Center per l'autenticazione

Il comando di AWS CLI esempio seguente crea uno EMR Studio che utilizza la modalità di autenticazione IAM Identity Center. Quando si utilizza l'autenticazione IAM Identity Center, è necessario specificare a--user-role.

Per ulteriori informazioni sulla modalità di autenticazione di IAM Identity Center, vedereConfigura IAM la modalità di autenticazione Identity Center per Amazon EMR Studio.

aws emr create-studio \ --name <example-studio-name> \ --auth-mode SSO \ --vpc-id <example-vpc-id> \ --subnet-ids <subnet-id-1> <subnet-id-2>... <subnet-id-5> \ --service-role <example-studio-service-role-name> \ --user-role <example-studio-user-role-name> \ --workspace-security-group-id <example-workspace-sg-id> \ --engine-security-group-id <example-engine-sg-id> \ --default-s3-location <example-s3-location> --trusted-identity-propagation-enabled \ --idc-user-assignment OPTIONAL \ --idc-instance-arn <iam-identity-center-instance-arn>
Esempio — CLI output per aws emr create-studio

Di seguito è riportato un esempio dell'output visualizzato dopo la creazione di uno Studio.

{ StudioId: "es-123XXXXXXXXX", Url: "https://es-123XXXXXXXXX.emrstudio-prod.us-east-1.amazonaws.com" }

Per ulteriori informazioni sul comando create-studio, consulta la Guida di riferimento ai comandi della AWS CLI .

RelayState Parametri e autenticazione del provider di identità URLs

Quando utilizzi la IAM federazione e desideri che gli utenti accedano utilizzando Studio URL e le credenziali per il tuo provider di identità (IdP), puoi specificare il nome di URL accesso RelayStatee il nome del parametro del provider di identità (IdP) quando lo desideri. Crea uno studio EMR

La tabella seguente mostra l'autenticazione standard URL e il nome RelayState dei parametri per alcuni provider di identità più diffusi.

Provider di identità Parametro Autenticazione URL
Auth0 RelayState https://<sub_domain>.auth0.com/samlp/<app_id>
Account Google RelayState https://accounts.google.com/o/saml2/initsso?idpid=<idp_id>&spid=<sp_id>&forceauthn=false
Microsoft Azure RelayState https://myapps.microsoft.com/signin/<app_name>/<app_id>?tenantId=<tenant_id>
Okta RelayState https://<sub_domain>.okta.com/app/<app_name>/<app_id>/sso/saml
PingFederate TargetResource https://<host>/idp/<idp_id>/startSSO.ping?PartnerSpId=<sp_id>
PingOne TargetResource https://sso.connect.pingidentity.com/sso/sp/initsso?saasid=<app_id>&idpid=<idp_id>