Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Apache Pig

Mode de mise au point
Apache Pig - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Apache Pig est une bibliothèque Apache open source qui s'exécute au-dessus de Hadoop. Elle fournit un langage de script que vous pouvez utiliser pour transformer des ensembles de données volumineux, sans avoir à écrire de code complexe en langage informatique de niveau inférieur, comme Java. La bibliothèque prend des commandes de type SQL écrites dans un langage appelé Pig Latin et les convertit en tâches Tez basées sur des graphes acycliques dirigés (DAGs) ou des programmes. MapReduce Pig fonctionne avec des données structurées et non structurées dans différents formats. Pour plus d'informations sur Pig, consultez la page http://pig.apache.org/.

Vous pouvez exécuter les commandes Pig de façon interactive ou en mode de traitement par lots. Pour utiliser Pig de façon interactive, créez une connexion SSH vers le nœud maître et envoyez des commandes à l'aide du shell Grunt. Pour utiliser Pig en mode de traitement par lots, écrivez vos scripts Pig, chargez-les sur Amazon S3 et envoyez-les en tant qu'étapes du cluster. Pour plus d'informations sur la soumission d'un travail à un cluster, consultez Soumission de travail à un cluster dans le Guide de gestion d'Amazon EMR.

Lorsque vous utilisez Pig pour écrire une sortie dans une HCatalog table dans Amazon S3, désactivez l'écriture directe Amazon EMR en définissant les mapred.output.direct.EmrFileSystem propriétés mapred.output.direct.NativeS3FileSystem et sur. false Pour de plus amples informations, veuillez consulter En utilisant HCatalog. Dans un script Pig, vous pouvez utiliser les commandes SET mapred.output.direct.NativeS3FileSystem false et SET mapred.output.direct.EmrFileSystem false.

Le tableau suivant répertorie la version de Pig incluse dans la dernière version d’Amazon EMR série 7.x, ainsi que les composants qu’Amazon EMR installe avec Pig.

Pour la version des composants installés avec Pig dans cette version, voir Versions des composants de la version 7.8.0.

Informations sur la version de Pig pour emr-7.8.0
Étiquette de version Amazon EMR Version de Pig Composants installés avec Pig

emr-7,8.0

Pig 0.17.0

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, pig-client, tez-on-yarn, tez-on-worker

Le tableau suivant répertorie la version de Pig incluse dans la dernière version d'Amazon EMR série 6.x, ainsi que les composants qu'Amazon EMR installe avec Pig.

Pour connaître la version des composants installés avec Pig dans cette version, consultez les versions des composants de la version 6.15.0.

Informations sur la version de Pig pour emr-6.15.0
Étiquette de version Amazon EMR Version de Pig Composants installés avec Pig

emr-6.15.0

Pig 0.17.0

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, pig-client, tez-on-yarn, tez-on-worker

Le tableau suivant répertorie la version de Pig incluse dans la dernière version d'Amazon EMR série 5.x, ainsi que les composants qu'Amazon EMR installe avec Pig.

Pour la version des composants installés avec Pig dans cette version, voir la version 5.36.2 Versions des composants.

Informations sur la version de Pig pour emr-5.36.2
Étiquette de version Amazon EMR Version de Pig Composants installés avec Pig

emr-5.36.2

Pig 0.17.0

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, pig-client, tez-on-yarn

ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.