Preparação de dados usando a Amazon EMR - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Preparação de dados usando a Amazon EMR

Importante

O Amazon SageMaker Studio e o Amazon SageMaker Studio Classic são dois dos ambientes de aprendizado de máquina com os quais você pode interagir SageMaker.

Se seu domínio foi criado depois de 30 de novembro de 2023, o Studio é sua experiência padrão.

Se seu domínio foi criado antes de 30 de novembro de 2023, o Amazon SageMaker Studio Classic é sua experiência padrão. Para usar o Studio se o Amazon SageMaker Studio Classic for sua experiência padrão, consulteMigração do Amazon SageMaker Studio Classic.

Quando você migra do Amazon SageMaker Studio Classic para o Amazon SageMaker Studio, não há perda na disponibilidade dos recursos. O Studio Classic também existe como um aplicativo no Amazon SageMaker Studio para ajudá-lo a executar seus fluxos de trabalho legados de aprendizado de máquina.

O Amazon SageMaker Studio e o Studio Classic vêm com integração integrada com a Amazon EMR. Nos notebooks JupyterLab e no Studio Classic, cientistas e engenheiros de dados podem descobrir e se conectar aos EMR clusters existentes da Amazon e, em seguida, explorar, visualizar e preparar dados em grande escala de forma interativa para aprendizado de máquina usando Apache Spark, Apache Hive ou Presto. Com um único clique, eles podem acessar a interface do usuário do Spark para monitorar o status e as métricas de seus trabalhos do Spark sem sair do notebook.

Os administradores podem criar AWS CloudFormation modelos que definam os EMR clusters da Amazon. Eles podem então disponibilizar esses modelos de cluster no AWS Service Catalogpara os usuários do Studio e do Studio Classic iniciarem. Os cientistas de dados podem então escolher um modelo predefinido para autoprovisionar um EMR cluster da Amazon diretamente de seu ambiente Studio. Os administradores podem parametrizar ainda mais os modelos para permitir que os usuários escolham aspectos do cluster dentro de valores predefinidos. Por exemplo, os usuários podem querer especificar o número de nós principais ou selecionar o tipo de instância de um nó em um menu suspenso.

Usando AWS CloudFormation, os administradores podem controlar a configuração organizacional, de segurança e de rede dos EMR clusters da Amazon. Os cientistas e engenheiros de dados podem então personalizar esses modelos para suas cargas de trabalho para criar EMR clusters Amazon sob demanda diretamente do Studio e do Studio Classic sem definir configurações complexas. Os usuários podem encerrar os EMR clusters da Amazon após o uso.