Tutoriales para EMR sin servidor
Esta sección describe casos de uso comunes para cuando trabaje con las aplicaciones de EMR sin servidor. Se tratan distintas herramientas, incluidas Hudi e Iceberg, para trabajar con grandes conjuntos de datos, así como el uso de Python y bibliotecas de Python para enviar trabajos a Spark.
Temas
- Uso de Java 17 con Amazon EMR sin servidor
- Uso de Apache Hudi con EMR sin servidor
- Uso de Apache Iceberg con EMR sin servidor
- Uso de bibliotecas de Python con EMR sin servidor
- Uso de diferentes versiones de Python con EMR sin servidor
- Uso de OSS de Delta Lake con EMR sin servidor
- Envío de trabajos de EMR sin servidor desde Airflow
- Uso de funciones definidas por el usuario de Hive con EMR sin servidor
- Uso de imágenes personalizadas con EMR sin servidor
- Uso de la integración de Amazon Redshift para Apache Spark en Amazon EMR sin servidor
- Conexión a DynamoDB con Amazon EMR sin servidor