Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Créez des fichiers binaires à l'aide d'Amazon EMR
Vous pouvez utiliser Amazon EMR comme environnement de génération pour compiler des programmes destinés à être utilisés dans votre cluster. Les programmes que vous utilisez avec Amazon EMR doivent être compilés sur un système exécutant la même version de Linux que celle utilisée par AmazonEMR. Pour une version 32 bits, les options de compilation sur un ordinateur 32 bits ou de compilation croisée 32 bits doivent être activées. Pour une version 64 bits, les options de compilation sur un ordinateur 64 bits ou de compilation croisée 64 bits doivent être activées. Pour plus d'informations sur les versions des EC2 instances, consultez la section Planifier et configurer les EC2 instances dans le Amazon EMR Management Guide. Les langages de programmation pris en charge incluent C++, Python et C#.
Le tableau suivant décrit les étapes nécessaires pour créer et tester votre application à l'aide d'AmazonEMR.
1 | Connectez-vous au nœud maître de votre cluster. |
2 | Copiez les fichiers source dans le nœud principal. |
3 | Créez des fichiers binaires avec les optimisations nécessaires. |
4 | Copiez des fichiers binaires à partir du nœud principal dans Amazon S3. |
Chacune de ces étapes est détaillée dans les sections suivantes.
Pour vous connecter au nœud principal du cluster
-
Suivez les instructions de la section Connect to the master node SSH à l'aide de l'Amazon EMR Management Guide.
Pour copier les fichiers source dans le nœud principal
-
Placez vos fichiers source dans un compartiment Amazon S3. Pour savoir comment créer des compartiments et comment transférer des données vers Amazon S3, consultez le Guide du l'utilisateur Amazon Simple Storage Service.
-
Créez un dossier sur votre cluster Hadoop pour vos fichiers source en entrant une commande similaire à celle qui suit :
mkdir
SourceFiles
-
Copiez vos fichiers source à partir d'Amazon S3 vers le nœud principal en tapant une commande similaire à celle qui suit :
hadoop fs -get
s3://amzn-s3-demo-bucket/SourceFiles
SourceFiles
Pour créer des fichiers binaires avec les optimisations nécessaires
La façon dont vous créez vos fichiers binaires dépend de plusieurs facteurs. Suivez les instructions correspondant aux outils d'installation que vous utilisez pour installer et configurer votre environnement. Vous pouvez utiliser les commandes de spécification du système Hadoop pour obtenir les informations relatives au cluster, afin de déterminer comment installer votre environnement.
Pour identifier les spécifications du système
-
Utilisez les commandes suivantes pour vérifier l'architecture que vous utilisez pour créer vos fichiers binaires.
-
Pour afficher la version de Debian, saisissez la commande suivante :
master$ cat /etc/issue
La sortie ressemble à ce qui suit.
Debian GNU/Linux 5.0
-
Pour afficher le DNS nom public et la taille du processeur, entrez la commande suivante :
master$ uname -a
La sortie ressemble à ce qui suit.
Linux domU-12-31-39-17-29-39.compute-1.internal 2.6.21.7-2.fc8xen #1 SMP Fri Feb 15 12:34:28 EST 2008 x86_64 GNU/Linux
-
Pour afficher la vitesse du processeur, saisissez la commande suivante :
master$ cat /proc/cpuinfo
La sortie ressemble à ce qui suit.
processor : 0 vendor_id : GenuineIntel model name : Intel(R) Xeon(R) CPU E5430 @ 2.66GHz flags : fpu tsc msr pae mce cx8 apic mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm syscall nx lm constant_tsc pni monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr cda lahf_lm ...
-
Une fois que vos fichiers binaires sont créés, vous pouvez copier les fichiers dans Amazon S3.
Pour copier des fichiers binaires à partir du nœud principal dans Amazon S3
-
Entrez la commande suivante pour copier les fichiers binaires dans votre compartiment Amazon S3 :
hadoop fs -put BinaryFiles
s3://amzn-s3-demo-bucket/BinaryDestination