EMREstúdio Amazon - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

EMREstúdio Amazon

O Amazon EMR Studio é um ambiente de desenvolvimento integrado baseado na web (IDE) para notebooks Jupyter totalmente gerenciados que são executados em clusters da Amazon. EMR Você pode configurar um EMR Studio para sua equipe desenvolver, visualizar e depurar aplicativos escritos em R, Python, Scala e. PySpark EMRO Studio está integrado com AWS Identity and Access Management (IAM) e o IAM Identity Center para que os usuários possam fazer login usando suas credenciais corporativas.

Você pode criar um EMR estúdio sem nenhum custo. As cobranças aplicáveis para o armazenamento do Amazon S3 e para os EMR clusters da Amazon se aplicam quando você usa o EMR Studio. Para obter detalhes e destaques do produto, consulte a página de serviços do Amazon EMR Studio.

Principais características do EMR Studio

O Amazon EMR Studio fornece os seguintes recursos:

  • Autentique usuários com AWS Identity and Access Management (IAM), ou com AWS IAM Identity Center com ou sem propagação de identidade confiável e seu provedor de identidade corporativa.

  • Acesse e lance EMR clusters da Amazon sob demanda para executar trabalhos do Jupyter Notebook.

  • Conecte-se à Amazon EMR em EKS clusters para enviar trabalhos à medida que o trabalho é executado.

  • Navegação e salvamento de cadernos de exemplo. Para obter mais informações sobre exemplos de notebooks, consulte o GitHub repositório de exemplos do EMR Studio Notebook.

  • Analise dados usando Python, Spark Scala PySpark, Spark R ou Spark e instale kernels e bibliotecas SQL personalizados.

  • Colaboração em tempo real com outros usuários no mesmo Workspace. Para obter mais informações, consulte Configurar a colaboração do Workspace no Studio EMR.

  • Use o EMR Studio SQL Explorer para navegar em seu catálogo de dados, executar SQL consultas e baixar resultados antes de trabalhar com os dados em um notebook.

  • Execução de cadernos parametrizados como parte dos fluxos de trabalho programados com uma ferramenta de orquestração, como o Apache Airflow ou o Amazon Managed Workflows for Apache Airflow. Para obter mais informações, consulte Orquestrando trabalhos de análise em EMR notebooks usando no MWAA AWS Blog de Big Data.

  • Vincule repositórios de código, como GitHub e. BitBucket

  • Rastreie e depure trabalhos usando o Spark History Server, a interface do usuário do Tez ou YARN o servidor de linha do tempo.

EMRO estúdio é HIPAA elegível e é certificado sob HITRUST CSF e SOC 2. Para obter mais informações sobre HIPAA conformidade para AWS serviços, vejahttps://aws.amazon.com/compliance/hipaa-compliance/. Para saber mais sobre HITRUST CSF conformidade para AWS serviços, vejahttps://aws.amazon.com/compliance/hitrust/.

EMRO Studio também é FedRamp compatível. Para obter mais informações sobre os programas de conformidade com os quais a Amazon EMR está em conformidade, consulte Validação de conformidade para a Amazon EMR. Para obter mais informações sobre programas adicionais de conformidade para AWS serviços, consulte AWS Serviços no escopo do Programa de Conformidade.

Histórico de recursos do Amazon EMR Studio

Esta tabela lista as atualizações da capacidade de escalabilidade EMR gerenciada da Amazon.

Data de lançamento Recurso
5 de janeiro de 2024

Foi adicionado suporte para o EMR Studio em AWS GovCloud (Leste dos EUA) e AWS GovCloud (Oeste dos EUA).

26 de novembro de 2023

Foi adicionado suporte para propagação confiável de identidade para o EMR Studio com autenticação do IAM Identity Center.

26 de outubro de 2023

Foi adicionada a capacidade de criar um aplicativo EMR sem servidor com capacidade interativa.

28 de fevereiro de 2023

Adicionado AWS KMS suporte de chaves gerenciado pelo cliente para armazenamento de registros de aplicativos para aplicativos sem EMR servidor.

23 de fevereiro de 2023

Foi adicionada a criação de IAM função com um clique para envio de trabalhos EMR sem servidor. ECRPesquisa adicionada para quando você seleciona uma imagem personalizada para EMR aplicativos sem servidor.

27 de janeiro de 2023

Os cadernos de execução descentralizados podem rastrear o progresso da execução de cada célula com a mágica %execute_notebook.

23 de janeiro de 2023

As aplicações persistentes foram otimizadas para a obtenção de tempos de inicialização mais rápidos.