Comportamento predefinito dell'applicazione Capacità massima Configurazioni dei lavoratori

Comprensione del comportamento delle applicazioni in EMR Serverless

Questa sezione descrive il comportamento di invio dei lavori, la configurazione della capacità per la scalabilità e le impostazioni di configurazione del worker per EMR Serverless.

Comportamento predefinito dell'applicazione

Auto-start— Per impostazione predefinita, un'applicazione è configurata per l'avvio automatico all'invio del lavoro. È possibile disattivare questa funzionalità.

Auto-stop— Per impostazione predefinita, un'applicazione è configurata per l'arresto automatico quando è inattiva per 15 minuti. Quando un'applicazione passa allo STOPPED stato, rilascia qualsiasi capacità preinizializzata configurata. È possibile modificare la quantità di tempo di inattività prima dell'arresto automatico di un'applicazione oppure disattivare questa funzionalità.

Capacità massima

È possibile configurare la capacità massima fino alla quale un'applicazione può scalare. È possibile specificare la capacità massima in termini di CPU, memoria (GB) e disco (GB).

Nota

È consigliabile configurare la capacità massima in modo che sia proporzionale alle dimensioni dei lavoratori supportate moltiplicando il numero di lavoratori per le loro dimensioni. Ad esempio, se desideri limitare l'applicazione a 50 worker con 2 vCPU, 16 GB di memoria e 20 GB per disco, imposta la capacità massima su 100 vCPU, 800 GB per memoria e 1000 GB per disco.

Configurazioni dei worker supportate

La tabella seguente elenca le configurazioni e le dimensioni dei lavoratori supportate che possono essere specificate per EMR Serverless. Configura diverse dimensioni per driver ed esecutori in base alle esigenze del carico di lavoro.

Configurazioni e dimensioni dei lavoratori
CPU	Memoria	Archiviazione temporanea predefinita
1 vCPU	Minimo 2 GB, massimo 8 GB, con incrementi di 1 GB	20 GB - 200 GB
2 vCPU	Minimo 4 GB, massimo 16 GB, con incrementi di 1 GB	20 GB - 200 GB
4 vCPU	Minimo 8 GB, massimo 30 GB, con incrementi di 1 GB	20 GB - 200 GB
8 vCPU	Minimo 16 GB, massimo 60 GB, con incrementi di 4 GB	20 GB - 200 GB
16 vCPU	Minimo 32 GB, massimo 120 GB, con incrementi di 8 GB	20 GB - 200 GB
32 vCPU	Tre valori discreti: 60 GB, 120 GB o 244 GB	20 GB - 200 GB

CPU: ogni worker può avere 1, 2, 4, 8, 16 o 32 vCPU.

Memoria: ogni worker dispone di memoria, specificata in GB, entro i limiti elencati nella tabella precedente. I job Spark hanno un sovraccarico di memoria, il che significa che la memoria che usano è superiore alle dimensioni del contenitore specificate. Questo sovraccarico è specificato con le proprietà e. spark.driver.memoryOverhead spark.executor.memoryOverhead L'overhead ha un valore predefinito del 10% della memoria del contenitore, con un minimo di 384 MB. È necessario considerare questo sovraccarico quando si scelgono le dimensioni dei lavoratori.

Ad esempio, se scegli 4 vCPU per l'istanza di lavoro e una capacità di storage preinizializzata di 30 GB, imposta un valore di circa 27 GB come memoria esecutore per il tuo job Spark. Ciò massimizza l'utilizzo della capacità preinizializzata. La memoria utilizzabile è di 27 GB, più il 10% di 27 GB (2,7 GB), per un totale di 29,7 GB.

Per i lavoratori con 32 vCPU, la memoria di lavoro deve corrispondere a una delle tre configurazioni discrete: 60 GB, 120 GB o 244 GB. EMR Serverless convalida la richiesta di memoria totale (memoria configurata Spark più sovraccarico di memoria) e rifiuta i lavori il cui totale non corrisponde a una delle tre configurazioni. spark.executor.memoryoltre al sovraccarico di memoria (impostazione predefinita del 10%), deve rientrare entro 8 GB dalla configurazione di memoria di lavoro supportata. Ad esempio, un job Spark che richiede un worker con 32 vCPU spark.executor.memory impostato su 100 GB verrà rifiutato perché il totale di 110 GB (dopo aver aggiunto il sovraccarico predefinito del 10%) non rientra negli 8 GB della dimensione del worker da 120 GB supportata. In questo caso, verranno spark.executor.memory accettati valori compresi tra 102 GB e 109 GB.

Disco: è possibile configurare ogni lavoratore con dischi di archiviazione temporanei con una dimensione minima di 20 GB e un massimo di 200 GB. Paghi solo lo spazio di archiviazione aggiuntivo oltre i 20 GB configurato per lavoratore.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Configurazione di un'applicazione

Pre-initialized capacità di lavorare con un'applicazione in EMR Serverless