Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Hudi
Apache Hudi
Hudi está integrado con Apache Spark
Con la EMR versión 5.28.0 y posteriores de Amazon, EMR instala los componentes de Hudi de forma predeterminada cuando se instalan Spark, Hive, Presto o Flink. Puedes usar Spark o la utilidad Hudi para crear o actualizar conjuntos de datos de Hudi DeltaStreamer . Puede utilizar Hive, Spark, Presto o Flink para consultar un conjunto de datos de Hudi de forma interactiva o crear canalizaciones de procesamiento de datos mediante la extracción incremental. La extracción incremental se refiere a la capacidad de extraer únicamente los datos que han cambiado entre dos acciones.
Estas características hacen que Hudi sea adecuado para los siguientes casos de uso:
-
Trabajo con datos de transmisión desde sensores y otros dispositivos del Internet de las cosas (IoT) que requieren eventos específicos de inserción y actualización de datos.
-
Cumplimiento de la normativa de privacidad de datos en aplicaciones cuyos usuarios pueden ejercer su derecho al olvido o modificar su consentimiento para el uso de sus datos.
-
Implementar un sistema de captura de datos de cambios (CDC)
que te permita aplicar cambios a un conjunto de datos a lo largo del tiempo.
La siguiente tabla muestra la versión de Hudi incluida en la última versión de la serie Amazon EMR 7.x, junto con los componentes que Amazon EMR instala con Hudi.
Etiqueta de EMR lanzamiento de Amazon | Versión de Hudi | Componentes instalados con Hudi |
---|---|---|
emr-7.3.0 |
Hudi 0.15.0-amzn-0 |
Not available. |
La siguiente tabla muestra la versión de Hudi incluida en la última versión de la serie Amazon EMR 6.x, junto con los componentes que Amazon EMR instala con Hudi.
Para ver la versión de los componentes instalados con Hudi en esta versión, consulte Versiones de los componentes de la versión 6.15.0.
Etiqueta de EMR lanzamiento de Amazon | Versión de Hudi | Componentes instalados con Hudi |
---|---|---|
emr-6.15.0 |
Hudi 0.14.0-amzn-0 |
Not available. |
nota
La EMR versión 6.8.0 de Amazon incluye Apache Hudihudi-spark3.3-bundle_2.12
La siguiente tabla muestra la versión de Hudi incluida en la última versión de la serie Amazon EMR 5.x, junto con los componentes que Amazon EMR instala con Hudi.
Etiqueta de EMR lanzamiento de Amazon | Versión de Hudi | Componentes instalados con Hudi |
---|---|---|
emr-5.36.2 |
Hudi 0.10.1-amzn-1 |
Not available. |