Amazon EMR Studio - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Amazon EMR Studio

Amazon EMR Studio è un ambiente di sviluppo integrato (IDE) basato sul Web per notebook Jupyter completamente gestiti che vengono eseguiti su cluster Amazon EMR. Puoi configurare un EMR Studio per il tuo team per sviluppare, visualizzare ed eseguire il debug di applicazioni scritte in R, Python, Scala e. PySpark EMR Studio è integrato con AWS Identity and Access Management (IAM) e IAM Identity Center per consentire agli utenti di accedere utilizzando le proprie credenziali aziendali.

È possibile creare un EMR Studio in modo totalmente gratuito. Quando si utilizza EMR Studio, si applicano i costi applicabili per l'archiviazione Amazon S3 e per i cluster Amazon EMR. Per i dettagli e le caratteristiche principali del prodotto, consulta la pagina del servizio per Amazon EMR Studio.

Funzionalità principali di EMR Studio

Amazon EMR Studio offre le seguenti funzionalità:

  • Autentica gli utenti con AWS Identity and Access Management (IAM) o con AWS IAM Identity Center con o senza una propagazione delle identità attendibili e il tuo provider di identità aziendale.

  • Accedi e avvia i cluster Amazon EMR on-demand per eseguire i processi di notebook Jupyter.

  • Connetti ai cluster Amazon EMR su EKS per inviare il lavoro durante l'esecuzione del processo.

  • Esplora e salva notebook di esempio. Per ulteriori informazioni sui taccuini di esempio, vedere l'archivio di esempi di notebook EMR Studio. GitHub

  • Analizza i dati usando Python, Spark Scala PySpark, Spark R o SparkSQL e installa kernel e librerie personalizzati.

  • Collabora in tempo reale con altri utenti nello stesso Workspace. Per ulteriori informazioni, consulta Configurazione della collaborazione di WorkSpace.

  • Utilizza SQL Explorer di EMR Studio per sfogliare il catalogo dati, eseguire query SQL e scaricare i risultati prima di lavorare con i dati in un notebook.

  • Esegui notebook parametrizzati nell'ambito dei flussi di lavoro pianificati con uno strumento di orchestrazione come Apache Airflow o Amazon Managed Workflows per Apache Airflow. Per ulteriori informazioni, consulta Orchestrazione dei processi di analisi su Notebook EMR con MWAA nel blog AWS Big Data.

  • Collega repository di codice come e. GitHub BitBucket

  • Monitora ed esegui il debug dei processi utilizzando Spark History Server, l'interfaccia utente Tez o il server della cronologia YARN.

EMR Studio è inoltre idoneo a HIPAA ed è certificato secondo HITRUST CSF e SOC 2. Per ulteriori informazioni sulla conformità HIPAA per i servizi AWS, consulta https://aws.amazon.com/compliance/hipaa-compliance/. Per ulteriori informazioni sulla conformità HITRUST CSF per i servizi AWS, consulta https://aws.amazon.com/compliance/hitrust/. Per ulteriori informazioni su altri programmi di conformità per i servizi AWS, consulta Servizi AWS coperti dal programma di conformità.

Cronologia delle funzionalità di Amazon EMR Studio

Questa tabella elenca gli aggiornamenti della funzionalità di dimensionamento gestito da Amazon EMR.

Data di rilascio Funzionalità
5 gennaio 2024

È stato aggiunto il supporto per EMR Studio in AWS GovCloud (Stati Uniti orientali) e AWS GovCloud (Stati Uniti occidentali).

26 novembre 2023

È stato aggiunto il supporto per la propagazione delle identità attendibili per EMR Studio con autenticazione IAM Identity Center.

26 ottobre 2023

Aggiunta la possibilità di creare un'applicazione EMR Serverless con funzionalità interattive.

28 febbraio 2023

Aggiunto supporto per chiavi AWS KMS gestite dal cliente per l'archiviazione dei log delle applicazioni per le applicazioni EMR serverless.

23 febbraio 2023

Aggiunta creazione di ruoli IAM con un solo clic per l'invio di processi EMR serverless. Aggiunta ricerca ECR per quando si seleziona un'immagine personalizzata per le applicazioni EMR serverless.

27 gennaio 2023

I notebook di esecuzione headless possono tracciare l'avanzamento dell'esecuzione di ogni cella con %execute_notebook magic.

23 gennaio 2023

Le applicazioni persistenti sono state ottimizzate per consentire tempi di avvio più rapidi.