Esempi di comandi programmatici per notebook EMR - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Esempi di comandi programmatici per notebook EMR

Panoramica

È possibile eseguire i EMR notebook eseguendoli da uno script o APIs dalla riga di comando. Quando si avvia, si interrompe, si elencano e si descrivono le esecuzioni dei EMR notebook all'esterno della AWS console, è possibile controllare un notebook a livello di programmazione. EMR Puoi trasmettere diversi valori di parametro a un notebook con una cella di notebook parametrizzata. Questa opzione elimina la necessità di creare una copia del notebook per ogni nuovo set di valori di parametro. Per ulteriori informazioni, consulta Amazon EMR API actions.

Puoi pianificare o organizzare in batch le esecuzioni di EMR notebook con Amazon CloudWatch Events e AWS Lambda. Per ulteriori informazioni, consulta Using AWS Lambda with Amazon CloudWatch Events.

Nota

EMRI notebook sono disponibili come spazi di lavoro EMR Studio nella console. Il pulsante Crea area di lavoro nella console consente di creare nuovi taccuini. Per accedere o creare aree di lavoro, gli utenti di EMR Notebooks necessitano di autorizzazioni di ruolo aggiuntive. IAM Per ulteriori informazioni, consulta Amazon EMR Notebooks are Amazon EMR Studio Workspace nella console e nella console Amazon. EMR

Autorizzazioni di ruolo per l'esecuzione a livello di programmazione

Per utilizzare l'esecuzione programmatica con EMR Notebooks, devi configurare le autorizzazioni utente con le seguenti politiche:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "AllowExecutionActions", "Effect": "Allow", "Action": [ "elasticmapreduce:StartNotebookExecution", "elasticmapreduce:DescribeNotebookExecution", "elasticmapreduce:ListNotebookExecutions" ], "Resource": "*" }, { "Sid": "AllowPassingServiceRole", "Effect": "Allow", "Action": [ "iam:PassRole" ], "Resource": "arn:aws:iam::account-id:role/EMR_Notebooks_DefaultRole" } ] }

Quando si eseguono Notebooks in modo programmatico su un EMR cluster EMR Notebooks, è necessario aggiungere le seguenti autorizzazioni aggiuntive:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "AllowRetrievingManagedEndpointCredentials", "Effect": "Allow", "Action": [ "emr-containers:GetManagedEndpointSessionCredentials" ], "Resource": [ "arn:aws:emr-containers:region:account-id:/virtualclusters/virtual-cluster-id/endpoints/managed-endpoint-id" ], "Condition": { "StringEquals": { "emr-containers:ExecutionRoleArn": [ "arn:aws:iam::account-id:role/emr-on-eks-execution-role" ] } } }, { "Sid": "AllowDescribingManagedEndpoint", "Effect": "Allow", "Action": [ "emr-containers:DescribeManagedEndpoint" ], "Resource": [ "arn:aws:emr-containers:region:account-id:/virtualclusters/virtual-cluster-id/endpoints/managed-endpoint-id" ] } ] }

Limitazioni relative all'esecuzione a livello di programmazione

  • Sono supportate un massimo di 100 esecuzioni simultanee per account. Regione AWS

  • Un'esecuzione viene terminata se dura più di 30 giorni.

  • L'esecuzione programmatica dei notebook non è supportata con le applicazioni interattive Amazon EMR Serverless.

Esempi di esecuzione programmatica dei notebook EMR

Le seguenti sezioni forniscono diversi esempi di esecuzione programmatica dei EMR notebook con AWS CLI Boto3 (SDKPython) e Ruby:

Puoi anche eseguire notebook con parametri come parte di flussi di lavoro pianificati con uno strumento di orchestrazione come Apache Airflow o Amazon Managed Workflows for Apache Airflow (). MWAA Per ulteriori informazioni, consulta Orchestrare i lavori di analisi sui notebook utilizzando nel blog Big Data. EMR MWAA AWS