Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Considérations relatives à Sqoop sur Amazon EMR
Tenez compte des éléments suivants lorsque vous exécutez Sqoop sur Amazon. EMR
Utilisation de Sqoop avec intégration HCatalog
Sqoop sur Amazon EMR prend en charge l'intégration de Sqoopmapred.output.direct.EmrFileSystem
propriétés mapred.output.direct.NativeS3FileSystem
et sur. false
Pour de plus amples informations, veuillez consulter En utilisant HCatalog. Vous pouvez utiliser les commandes Hadoop -D mapred.output.direct.NativeS3FileSystem=false
et -D
mapred.output.direct.EmrFileSystem=false
. Si vous ne désactivez pas l'écriture directe, aucune erreur ne se produit, mais la table est créée dans Amazon S3 et aucune donnée n'est écrite.
Support de Sqoop JDBC et de base de données
Par défaut, Sqoop possède un pilote MariaDB et Postgre installé. SQL Le SQL pilote Postgre installé pour Sqoop ne fonctionne que pour Postgre 8.4. SQL Pour installer un autre ensemble de JDBC connecteurs pour Sqoop, connectez-vous au nœud principal du cluster et installez-les dedans. /usr/lib/sqoop/lib
Vous trouverez ci-dessous des liens vers différents JDBC connecteurs :
-
MariaDB : A propos de MariaDB Connector/J
. -
Postgre SQL : pilote Postgre SQL JDBC
. -
SQLServer: Téléchargez le JDBC pilote Microsoft pour SQL serveur
. -
Mon SQL : Download Connector/J
-
Oracle : obtenir des JDBC pilotes Oracle et UCP depuis le référentiel Oracle Maven
Les bases de données prises en charge pour Sqoop sont répertoriées à l'adresse suivante, http://sqoop.apache.org/docs/version
/SqoopUserGuide.html #_supported_databases, où version
est la version de Sqoop que vous utilisez, par exemple 1.4.6. Si la chaîne de JDBC connexion ne correspond pas à celles de cette liste, vous devez spécifier un pilote.
Par exemple, vous pouvez exporter vers une table de base de données Amazon Redshift à l'aide de la commande suivante (pour la JDBC version 4.1) :
sqoop export --connect jdbc:redshift://$
MYREDSHIFTHOST
:5439/mydb
--tablemysqoopexport
--export-dir s3://amzn-s3-demo-bucket/myinputfiles/
--driver com.amazon.redshift.jdbc41.Driver --usernamemaster
--passwordMymasterpass1
Vous pouvez utiliser à la fois les chaînes de connexion MariaDB et SQL My, mais si vous spécifiez la chaîne de connexion MariaDB, vous devez spécifier le pilote :
sqoop export --connect jdbc:mariadb://$
HOSTNAME
:3306/mydb
--tablemysqoopexport
--export-dir s3://amzn-s3-demo-bucket/myinputfiles/
--driver org.mariadb.jdbc.Driver --usernamemaster
--passwordMymasterpass1
Si vous utilisez le chiffrement Secure Socket Layer pour accéder à votre base de données, vous devez utiliser un code JDBC URI similaire dans l'exemple d'exportation Sqoop suivant :
sqoop export --connect jdbc:mariadb://$
HOSTNAME
:3306/mydb
?verifyServerCertificate=false&useSSL=true&requireSSL=true --tablemysqoopexport
--export-dir s3://amzn-s3-demo-bucket/myinputfiles/
--driver org.mariadb.jdbc.Driver --usernamemaster
--passwordMymasterpass1
Pour plus d'informations sur SSL le chiffrement dansRDS, consultez la section Utilisation SSL pour chiffrer une connexion à une instance de base de données dans le guide de l'RDSutilisateur Amazon.
Pour plus d'informations, consultez la documentation Apache Sqoop
Sécurisation de votre mot de passe
Différentes méthodes permettent de sécuriser votre mot de passe :