Différentes méthodes pour transférer des données vers Amazon EMR - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Différentes méthodes pour transférer des données vers Amazon EMR

Amazon EMR propose plusieurs méthodes pour transférer des données vers un cluster. La méthode la plus courante consiste à télécharger les données sur Amazon S3 et à utiliser les fonctionnalités intégrées d'Amazon EMR pour charger les données sur votre cluster. Vous pouvez également utiliser DistributedCache fonctionnalité de Hadoop pour transférer des fichiers d'un système de fichiers distribué vers le système de fichiers local. L'implémentation de Hive fournie par Amazon EMR (Hive version 0.7.1.1 et versions ultérieures) inclut des fonctionnalités que vous pouvez utiliser pour importer et exporter des données entre DynamoDB et un cluster Amazon. EMR Si vous avez de grandes quantités de données sur site à traiter, le service AWS Direct Connect s'avèrera vraisemblablement utile.