Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Une AWS Glue connexion est un objet de catalogue de données qui stocke les informations d'identification de connexion, les chaînes d'URI, les informations du cloud privé virtuel (VPC), etc. pour un magasin de données spécifique. AWS Glue les robots d'exploration, les jobs et les terminaux de développement utilisent des connexions pour accéder à certains types de magasins de données. Vous pouvez utiliser des connexions pour les sources et les cibles, mais aussi réutiliser la même connexion pour plusieurs tâches de crawler ou extraction, transformation et chargement (ETL).
La dernière version du schéma de AWS Glue connexions fournit un moyen unifié de gérer les connexions de données entre les AWS services et les applications, tels que AWS Glue Amazon Athena, et Amazon SageMaker AI Unified Studio.
Présentation de l'utilisation des connecteurs et des connexions
Une connexion contient les propriétés requises pour se connecter à un magasin de données particulier. Lorsque vous créez une connexion, elle est stockée dans AWS Glue Data Catalog. Vous sélectionnez un connecteur, puis créez une connexion basée sur celui-ci.
Vous pouvez vous abonner à des connecteurs pour les magasins de données non pris en charge de manière native AWS Marketplace, puis utiliser ces connecteurs lorsque vous créez des connexions. Les développeurs peuvent également créer leurs propres connecteurs et vous pouvez les utiliser lors de la création de connexions.
Note
Les connexions créées à l'aide de AWS Marketplace connecteurs personnalisés ou de connecteurs AWS Glue Studio apparaissent dans la AWS Glue console avec le type défini surUNKNOWN
.
Les étapes suivantes décrivent le processus global d'utilisation des connecteurs dans AWS Glue Studio :
-
Abonnez-vous à un connecteur dans AWS Marketplace, ou développez votre propre connecteur et téléchargez-le sur AWS Glue Studio. Pour de plus amples informations, veuillez consulter Ajouter des connecteurs à AWS Glue Studio.
-
Vérifiez les informations d'utilisation du connecteur. Vous pouvez trouver ces informations sous l'onglet Usage (Utilisation) de la page produit du connecteur. Par exemple, si vous cliquez sur l'onglet Utilisation de cette page produit, AWS Glue Connector for Google BigQuery
, vous pouvez voir dans la section Ressources supplémentaires un lien vers un blog sur l'utilisation de ce connecteur. -
Créez une connexion. Vous sélectionnez le connecteur à utiliser et fournissez des informations supplémentaires pour la connexion, telles que les informations d'identification de connexion, les chaînes d'URI et les informations de Virtual Private Cloud (VPC). Pour de plus amples informations, veuillez consulter Création de connexions pour les connecteurs.
-
Créez un rôle IAM pour votre tâche. La tâche dispose des autorisations du rôle IAM que vous spécifiez quand vous la créez. Ce rôle IAM doit disposer des autorisations nécessaires pour s'authentifier, extraire des données et écrire des données dans vos magasins de données.
-
Créez une tâche ETL et configurez les propriétés de la source de données pour cette tâche. Fournissez les options de connexion et les informations d'authentification comme indiqué par le fournisseur de connecteur personnalisé. Pour de plus amples informations, veuillez consulter Création de tâches avec des connecteurs personnalisés.
-
Personnalisez votre tâche ETL en ajoutant des transformations ou des magasins de données supplémentaires, comme décrit dans Démarrage de tâches Visual ETL dans AWS Glue Studio.
-
Si vous utilisez un connecteur pour la cible de données, configurez les propriétés de la cible de données pour votre tâche ETL. Fournissez les options de connexion et les informations d'authentification comme indiqué par le fournisseur de connecteur personnalisé. Pour de plus amples informations, veuillez consulter Création de tâches avec des connecteurs personnalisés.
-
Personnalisez l'environnement d'exécution de la tâche en configurant ses propriétés, comme décrit dans Modifier les propriétés de tâche.
-
Exécutez la tâche.