Diferentes formas de introducir datos en Amazon EMR - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Diferentes formas de introducir datos en Amazon EMR

Amazon EMR ofrece varias formas de introducir datos en un clúster. La forma más común consiste en cargar los datos en Amazon S3 y utilizar las funciones integradas de Amazon EMR para cargar los datos en el clúster. También puede utilizar el DistributedCache función de Hadoop para transferir archivos de un sistema de archivos distribuido al sistema de archivos local. La implementación de Hive proporcionada por Amazon EMR (Hive versión 0.7.1.1 y posteriores) incluye una funcionalidad que puede utilizar para importar y exportar datos entre DynamoDB y un clúster de Amazon. EMR Si tiene una gran cantidad de datos on-premises para procesar, puede encontrar útil el servicio AWS Direct Connect .