Visão geral do Permissões Limitações Exemplos

Exemplos de comandos programáticos para cadernos do EMR

Visão geral do

Você pode executar Cadernos do EMR com APIs de execução usando um script ou a linha de comando. Quando você inicia, interrompe, lista e descreve as execuções do notebook EMR fora do AWS console, você pode controlar programaticamente um notebook EMR. É possível transferir valores de parâmetros diferentes para um caderno com uma célula de caderno parametrizada. Isto elimina a necessidade de criar uma cópia do caderno para cada novo conjunto de valores de parâmetros. Para obter mais informações, consulte Amazon EMR API actions.

Você pode agendar ou agrupar execuções de notebooks EMR com eventos da Amazon e. CloudWatch AWS Lambda Para obter mais informações, consulte Usando AWS Lambda com Amazon CloudWatch Events.

nota

Os cadernos do EMR estão disponíveis como Workspaces do EMR Studio no console. O botão Criar Workspace no console permite criar cadernos. Para acessar ou criar Workspaces, os usuários dos Cadernos do EMR precisam de permissões adicionais de perfil do IAM. Para obter mais informações, consulte Amazon EMR Notebooks are Amazon EMR Studio Workspaces in the console e console do Amazon EMR.

Permissões de perfil para a execução programática

Para usar a execução programática com os Cadernos do EMR, você deve configurar as permissões de usuário com as seguintes políticas:

Ao executar Cadernos do EMR programaticamente em um cluster de Cadernos do EMR, você deve adicionar estas permissões adicionais:

Limitações da execução programática

Há suporte para um máximo de 100 execuções simultâneas Região da AWS por conta.
Uma execução será encerrada se for executada por mais de 30 dias.
A execução programática de cadernos não é compatível com as aplicações interativas do Amazon EMR Serverless.

Exemplos de execução programática para Cadernos do EMR

As seções a seguir fornecem vários exemplos de execução programática de notebooks EMR com AWS CLI o Boto3 SDK (Python) e Ruby:

Você também pode executar cadernos parametrizados como parte dos fluxos de trabalho programados com uma ferramenta de orquestração, como o Apache Airflow ou o Amazon Managed Workflows for Apache Airflow (MWAA). Para obter mais informações, consulte Orchestrating analytics jobs on EMR Notebooks using MWAA no blog de Big Data da AWS.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Como trabalhar com Cadernos do EMR

Exemplos de comandos da CLI do caderno