Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Différentes méthodes pour transférer des données vers Amazon EMR
Amazon EMR propose plusieurs méthodes pour transférer des données vers un cluster. La méthode la plus courante consiste à télécharger les données sur Amazon S3 et à utiliser les fonctionnalités intégrées d'Amazon EMR pour charger les données sur votre cluster. Vous pouvez également utiliser DistributedCache fonctionnalité de Hadoop pour transférer des fichiers d'un système de fichiers distribué vers le système de fichiers local. L'implémentation de Hive fournie par Amazon EMR (Hive version 0.7.1.1 et versions ultérieures) inclut des fonctionnalités que vous pouvez utiliser pour importer et exporter des données entre DynamoDB et un cluster Amazon. EMR Si vous avez de grandes quantités de données sur site à traiter, le service AWS Direct Connect s'avèrera vraisemblablement utile.
Rubriques
- Chargement de données vers Amazon S3
- Charger des données avec AWS DataSync
- Importer des fichiers avec un cache distribué avec Amazon EMR
- Détection et traitement de fichiers compressés avec Amazon EMR
- Importer des données DynamoDB dans Hive avec Amazon EMR
- Connectez-vous aux données AWS Direct Connect depuis Amazon EMR
- Importez de grandes quantités de données pour Amazon EMR avec AWS Snowball