Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Connexion aux données
Une AWS Glue connexion est un objet de catalogue de données qui stocke les informations de connexion, les URI chaînes, les informations du cloud privé virtuel (VPC), etc. pour un magasin de données spécifique. AWS Glue les robots d'exploration, les jobs et les terminaux de développement utilisent des connexions pour accéder à certains types de magasins de données. Vous pouvez utiliser des connexions à la fois pour les sources et les cibles, et réutiliser la même connexion entre plusieurs robots d'exploration ou des tâches d'extraction, de transformation et de chargement (ETL).
Présentation de l'utilisation des connecteurs et des connexions
Une connexion contient les propriétés requises pour se connecter à un magasin de données particulier. Lorsque vous créez une connexion, elle est stockée dans AWS Glue Data Catalog. Vous sélectionnez un connecteur, puis créez une connexion basée sur celui-ci.
Vous pouvez vous abonner à des connecteurs pour les magasins de données non pris en charge de manière native AWS Marketplace, puis utiliser ces connecteurs lorsque vous créez des connexions. Les développeurs peuvent également créer leurs propres connecteurs et vous pouvez les utiliser lors de la création de connexions.
Note
Les connexions créées à l'aide de AWS Marketplace connecteurs personnalisés ou de connecteurs AWS Glue Studio apparaissent dans la AWS Glue console avec le type défini surUNKNOWN
.
Les étapes suivantes décrivent le processus global d'utilisation des connecteurs dans AWS Glue Studio :
-
Abonnez-vous à un connecteur dans AWS Marketplace, ou développez votre propre connecteur et téléchargez-le sur AWS Glue Studio. Pour de plus amples informations, veuillez consulter Ajouter des connecteurs àAWS Glue Studio.
-
Vérifiez les informations d'utilisation du connecteur. Vous pouvez trouver ces informations sous l'onglet Usage (Utilisation) de la page produit du connecteur. Par exemple, si vous cliquez sur l'onglet Utilisation de cette page produit, AWS Glue Connector for Google BigQuery
, vous pouvez voir dans la section Ressources supplémentaires un lien vers un blog sur l'utilisation de ce connecteur. D'autres connecteurs peuvent contenir des liens vers les instructions de la section Présentation, comme indiqué sur la page produit du connecteur Cloudwatch Logs pour AWS Glue . -
Créez une connexion. Vous choisissez le connecteur à utiliser et vous fournissez des informations supplémentaires pour la connexion, telles que les informations de connexion, URI les chaînes et les informations du cloud privé virtuel (VPC). Pour de plus amples informations, veuillez consulter Création de connexions pour les connecteurs.
-
Créez un IAM rôle pour votre poste. La tâche suppose les autorisations du IAM rôle que vous spécifiez lors de sa création. Ce IAM rôle doit disposer des autorisations nécessaires pour s'authentifier auprès de vos magasins de données, en extraire des données et y écrire des données.
-
Créez une ETL tâche et configurez les propriétés de la source de données pour votre ETL tâche. Fournissez les options de connexion et les informations d'authentification comme indiqué par le fournisseur de connecteur personnalisé. Pour de plus amples informations, veuillez consulter Création de tâches avec des connecteurs personnalisés.
-
Personnalisez votre ETL tâche en ajoutant des transformations ou des magasins de données supplémentaires, comme décrit dansDémarrage de ETL tâches visuelles dans AWS Glue Studio.
-
Si vous utilisez un connecteur pour la cible de données, configurez les propriétés de la cible de données pour votre ETL tâche. Fournissez les options de connexion et les informations d'authentification comme indiqué par le fournisseur de connecteur personnalisé. Pour de plus amples informations, veuillez consulter Création de tâches avec des connecteurs personnalisés.
-
Personnalisez l'environnement d'exécution de la tâche en configurant ses propriétés, comme décrit dans Modifier les propriétés de tâche.
-
Exécutez la tâche.