Amazon EMR Studio - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Amazon EMR Studio

O Amazon EMR Studio é um ambiente de desenvolvimento integrado (IDE) baseado na Web para cadernos Jupyter totalmente gerenciados que são executados em clusters do Amazon EMR. Você pode configurar um EMR Studio para que sua equipe desenvolva, visualize e depure aplicativos escritos em R, Python, Scala e. PySpark O EMR Studio é integrado ao AWS Identity and Access Management (IAM) e ao IAM Identity Center para que os usuários possam fazer login usando suas credenciais corporativas.

É possível criar um EMR Studio gratuitamente. As cobranças aplicáveis ​​para o armazenamento do Amazon S3 e para os clusters do Amazon EMR se aplicam quando você usa o EMR Studio. Para obter detalhes e destaques do produto, consulte a página de serviços do Amazon EMR Studio.

Principais recursos do EMR Studio

O Amazon EMR Studio oferece os seguintes recursos:

  • Autentique usuários com AWS Identity and Access Management (IAM), AWS IAM Identity Center com ou sem propagação de identidade confiável e seu provedor de identidade empresarial.

  • Acesse e execute clusters do Amazon EMR sob demanda para executar trabalhos do caderno Jupyter.

  • Conexão aos clusters do Amazon EMR no EKS para enviar trabalhos à medida que o trabalho é executado.

  • Navegação e salvamento de cadernos de exemplo. Para obter mais informações sobre exemplos de notebooks, consulte o repositório de exemplos de notebooks GitHub do EMR Studio.

  • Analise dados usando Python, Spark Scala PySpark, Spark R ou SparkSQL e instale kernels e bibliotecas personalizados.

  • Colaboração em tempo real com outros usuários no mesmo Workspace. Para obter mais informações, consulte Configuração da colaboração no Workspace no EMR Studio.

  • Uso do SQL Explorer do EMR Studio para navegar em seu catálogo de dados, executar consultas SQL e fazer download de resultados antes do trabalho com os dados em um caderno.

  • Execução de cadernos parametrizados como parte dos fluxos de trabalho programados com uma ferramenta de orquestração, como o Apache Airflow ou o Amazon Managed Workflows for Apache Airflow. Para obter mais informações, consulte Orquestrando trabalhos de análise em notebooks EMR usando o MWAA no Big Data Blog. AWS

  • Vincule repositórios de código, como GitHub e. BitBucket

  • Rastreamento e depuração de trabalhos usando o servidor de histórico do Spark, a interface do usuário do Tez ou o servidor de linha do tempo do YARN.

O EMR Studio é elegível para a HIPAA e certificado pela HITRUST CSF e pelo SOC 2. Para obter mais informações sobre a conformidade com a HIPAA para AWS serviços, consulte. https://aws.amazon.com/compliance/hipaa-compliance/ Para saber mais sobre a conformidade com o HITRUST CSF para AWS serviços, consulte. https://aws.amazon.com/compliance/hitrust/

O EMR Studio também FedRamp é compatível. Para obter mais informações sobre os programas de conformidade com os quais o Amazon EMR está de acordo, consulte Compliance validation for Amazon EMR. Para obter mais informações sobre programas de conformidade adicionais para AWS serviços, consulte AWS Serviços no escopo por programa de conformidade.

Histórico de recursos do Amazon EMR Studio

Esta tabela lista as atualizações na funcionalidade de ajuste de escala gerenciado do Amazon EMR.

Data de lançamento Recurso
5 de janeiro de 2024

Foi adicionado suporte para o EMR Studio em AWS GovCloud (Leste dos EUA) e AWS GovCloud (Oeste dos EUA).

26 de novembro de 2023

Foi adicionado suporte à propagação de identidade confiável para o EMR Studio com a autenticação do Centro de Identidade do IAM.

26 de outubro de 2023

Capacidade adicional de criar uma aplicação do EMR Serverless com capacidade interativa.

28 de fevereiro de 2023

Foi adicionado suporte de chave AWS KMS gerenciado pelo cliente para armazenamento de registros de aplicativos para aplicativos EMR Serverless.

23 de fevereiro de 2023

Adição da criação de perfil do IAM com um clique para envio de trabalhos do EMR Sem Servidor. Adição de pesquisa do ECR para quando você seleciona uma imagem personalizada para aplicações do EMR Sem Servidor.

27 de janeiro de 2023

Os cadernos de execução descentralizados podem rastrear o progresso da execução de cada célula com a mágica %execute_notebook.

23 de janeiro de 2023

As aplicações persistentes foram otimizadas para a obtenção de tempos de inicialização mais rápidos.