Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Amazon EMR Studio
Amazon EMR Studio è un ambiente di sviluppo integrato (IDE) basato sul Web per notebook Jupyter completamente gestiti che vengono eseguiti su cluster Amazon EMR. Puoi configurare un EMR Studio per il tuo team per sviluppare, visualizzare ed eseguire il debug di applicazioni scritte in R, Python, Scala e. PySpark EMR Studio è integrato con AWS Identity and Access Management (IAM) e IAM Identity Center in modo che gli utenti possano accedere utilizzando le proprie credenziali aziendali.
È possibile creare un EMR Studio in modo totalmente gratuito. Quando si utilizza EMR Studio, si applicano i costi applicabili per l'archiviazione Amazon S3 e per i cluster Amazon EMR. Per i dettagli e le caratteristiche principali del prodotto, consulta la pagina del servizio per Amazon EMR Studio
Funzionalità principali di EMR Studio
Amazon EMR Studio offre le seguenti funzionalità:
-
Autentica gli utenti con AWS Identity and Access Management (IAM), AWS IAM Identity Center con o senza una propagazione affidabile dell'identità e il tuo provider di identità aziendale.
-
Accedi e avvia i cluster Amazon EMR on-demand per eseguire i processi di notebook Jupyter.
-
Connetti ai cluster Amazon EMR su EKS per inviare il lavoro durante l'esecuzione del processo.
-
Esplora e salva notebook di esempio. Per ulteriori informazioni sui taccuini di esempio, vedere l'archivio di esempi di notebook EMR Studio. GitHub
-
Analizza i dati usando Python, Spark Scala PySpark, Spark R o SparkSQL e installa kernel e librerie personalizzati.
-
Collabora in tempo reale con altri utenti nello stesso Workspace. Per ulteriori informazioni, consulta Configurazione della collaborazione Workspace in EMR Studio.
-
Utilizza SQL Explorer di EMR Studio per sfogliare il catalogo dati, eseguire query SQL e scaricare i risultati prima di lavorare con i dati in un notebook.
-
Esegui notebook parametrizzati nell'ambito dei flussi di lavoro pianificati con uno strumento di orchestrazione come Apache Airflow o Amazon Managed Workflows per Apache Airflow. Per ulteriori informazioni, consulta Orchestrare i lavori di analisi sui notebook EMR utilizzando MWAA nel blog Big
Data. AWS -
GitHub Collega BitBucket repository di codici come e.
-
Monitora ed esegui il debug dei processi utilizzando Spark History Server, l'interfaccia utente Tez o il server della cronologia YARN.
EMR Studio è idoneo all'HIPAA ed è certificato secondo HITRUST CSF e SOC 2. Per ulteriori informazioni sulla conformità HIPAA per i servizi, vedere. AWS https://aws.amazon.com/compliance/hipaa-compliance/
Anche FedRamp EMR Studio è conforme. Per ulteriori informazioni sui programmi di conformità a cui è conforme Amazon EMR, consulta Convalida della conformità per Amazon EMR. Per ulteriori informazioni sui programmi di conformità aggiuntivi per i AWS servizi, consulta AWS Services in Scope
Cronologia delle funzionalità di Amazon EMR Studio
Questa tabella elenca gli aggiornamenti della funzionalità di dimensionamento gestito da Amazon EMR.
Data di rilascio | Funzionalità |
---|---|
5 gennaio 2024 |
È stato aggiunto il supporto per EMR Studio in AWS GovCloud (Stati Uniti orientali) e AWS GovCloud (Stati Uniti occidentali). |
26 novembre 2023 |
È stato aggiunto il supporto per la propagazione delle identità attendibili per EMR Studio con autenticazione IAM Identity Center. |
26 ottobre 2023 |
Aggiunta la possibilità di creare un'applicazione EMR Serverless con funzionalità interattive. |
28 febbraio 2023 |
È stato aggiunto il supporto chiave AWS KMS gestito dal cliente per l'archiviazione dei registri delle applicazioni per le applicazioni EMR Serverless. |
23 febbraio 2023 |
Aggiunta creazione di ruoli IAM con un solo clic per l'invio di processi EMR serverless. Aggiunta ricerca ECR per quando si seleziona un'immagine personalizzata per le applicazioni EMR serverless. |
27 gennaio 2023 |
I notebook di esecuzione headless possono tracciare l'avanzamento dell'esecuzione di ogni cella con |
23 gennaio 2023 |
Le applicazioni persistenti sono state ottimizzate per consentire tempi di avvio più rapidi. |