Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Apache Hudi
Hudi è integrato con Apache Spark
Con la versione 5.28.0 e successive di Amazon EMR, EMR installa i componenti Hudi per impostazione predefinita quando sono installati Spark, Hive, Presto o Flink. Puoi usare Spark o l' DeltaStreamer utilità Hudi per creare o aggiornare set di dati Hudi. È possibile utilizzare Hive, Spark, Presto o Flink per per eseguire una query a un set di dati Hudi in modo interattivo o creare pipeline di elaborazione dati utilizzando pull incrementali. Il pull incrementale si riferisce alla possibilità di estrarre solo i dati che sono cambiati tra due azioni.
Queste caratteristiche rendono Hudi adatto per i seguenti casi d'uso:
-
Utilizzo di dati in streaming da sensori e altri dispositivi IoT (Internet of Things) che richiedono specifici eventi di inserimento e aggiornamento dei dati.
-
Rispetto delle norme sulla privacy dei dati nelle applicazioni in cui gli utenti possono scegliere di essere dimenticati o modificare il loro consenso per l'utilizzo dei loro dati.
-
Implementazione di un sistema di acquisizione dati di modifica (CDC)
che consente di applicare modifiche a un set di dati nel tempo.
La seguente tabella indica la versione di Hudi inclusa nell'ultimo rilascio della serie Amazon EMR 7.x insieme ai componenti che Amazon EMR installa con Hudi.
Etichetta di rilascio di Amazon EMR | Versione di Hudi | Componenti installati con Hudi |
---|---|---|
emr-7.8.0 |
Hudi 0.15.0-amzn-5 |
Not available. |
La seguente tabella indica la versione di Hudi inclusa nell'ultimo rilascio della serie Amazon EMR 6.x insieme ai componenti che Amazon EMR installa con Hudi.
Per la versione dei componenti installati con Hudi in questo rilascio, consulta la sezione Versioni dei componenti del rilascio 6.15.0.
Etichetta di rilascio di Amazon EMR | Versione di Hudi | Componenti installati con Hudi |
---|---|---|
emr-6.15.0 |
Hudi 0.14.0-amzn-0 |
Not available. |
Nota
Il rilascio 6.8.0 di Amazon EMR include Apache Hudihudi-spark3.3-bundle_2.12
di Hudi 0.12.0.
La seguente tabella indica la versione di Hudi inclusa nell'ultimo rilascio della serie Amazon EMR 5.x insieme ai componenti che Amazon EMR installa con Hudi.
Etichetta di rilascio di Amazon EMR | Versione di Hudi | Componenti installati con Hudi |
---|---|---|
emr-5.36.2 |
Hudi 0.10.1-amzn-1 |
Not available. |