Creazione di un cluster con Hudi installato - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di un cluster con Hudi installato

Con la EMR versione 5.28.0 e successive di Amazon, Amazon EMR installa i componenti Hudi per impostazione predefinita quando sono installati Spark, Hive o Presto. Per utilizzare Hudi su AmazonEMR, crea un cluster con una o più delle seguenti applicazioni installate:

  • Hadoop

  • Hive

  • Spark

  • Presto

  • Flink

Puoi creare un cluster utilizzando Amazon AWS Management Console AWS CLI, the o Amazon EMRAPI.

  1. Passa alla nuova EMR console Amazon e seleziona Passa alla vecchia console dalla barra di navigazione laterale. Per ulteriori informazioni su cosa aspettarti quando passi alla vecchia console, consulta Utilizzo della vecchia console.

  2. Seleziona Create cluster (Crea cluster), Go to advanced options (Vai alle opzioni avanzate).

  3. In Configurazione software, scegli emr-5.28.0 o versioni successive per Release (Rilascio) e seleziona Hadoop, Hive, Spark, Presto e Tez insieme ad altre applicazioni richieste dal cluster.

  4. Configurare altre opzioni come richiesto per l'applicazione, quindi scegliere Avanti.

  5. Configurare le opzioni per Hardware e Impostazioni generali del cluster come desiderato.

  6. Per le opzioni di sicurezza, ti consigliamo di selezionare una coppia di EC2key pair che puoi usare per connetterti alla riga di comando del nodo master utilizzandoSSH. Ciò consente di eseguire i comandi della shell Spark, i comandi Hive e CLI i comandi Hudi CLI descritti in questa guida.

  7. Configurare altre opzioni di sicurezza come desiderato, quindi scegliere Crea cluster.