Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisation SQL pour personnaliser les données
Lorsque vous créez un ensemble de données ou préparez vos données pour une analyse, vous pouvez personnaliser les données dans l'éditeur de requête.
L'éditeur de requêtes est composé de plusieurs composants, comme suit :
-
Mode de requête — En haut à gauche, vous pouvez choisir entre une requête directe ou SPICE modes de requête :
-
Requête directe — Pour exécuter l'SELECTinstruction directement sur la base de données
-
SPICE— Pour exécuter l'SELECTinstruction sur des données précédemment stockées en mémoire
-
-
Champs – Utilisez cette section pour désactiver les champs que vous souhaitez supprimer de le jeu de données final. Vous pouvez ajouter des champs calculés dans cette section et compléter vos données avec SageMaker
-
Archive des requêtes : utilisez cette section pour retrouver la version précédente de vos SQL requêtes.
-
Filtres – Utilisez cette section pour ajouter, modifier ou supprimer des filtres.
-
Explorateur de schémas : cette section n'apparaît que lorsque vous modifiezSQL. Vous pouvez l'utiliser pour explorer vos schémas, tables, champs et types de données.
-
SQLéditeur — Utilisez-le pour modifier votreSQL. L'SQLéditeur, qui propose la mise en évidence de la syntaxe, la saisie semi-automatique de base, l'indentation automatique et la numérotation des lignes. Vous pouvez spécifier une SQL requête uniquement pour les ensembles de données provenant de sources de données compatibles avecSQL. Vous SQL devez vous conformer aux exigences de la base de données cible concernant la syntaxe, la capitalisation, l'arrêt des commandes, etc. Si vous préférez, vous pouvez plutôt le coller SQL depuis un autre éditeur.
-
Espace de travail de données — Lorsque l'SQLéditeur est fermé, l'espace de travail de données s'affiche en haut à droite avec un arrière-plan quadrillé. Vous pouvez voir ici une représentation graphique de vos objets de données, en particulier les requêtes, les tables, les fichiers et les jointures créés dans l'éditeur de jointures.
Pour afficher les détails de chaque table, utilisez le menu des options de source de données et choisissez Détails de la table ou Modifier la SQL requête. Les détails s'affichent pour le nom et l'alias de la table, le schéma, le nom de la source de données et le type de source de données. Pour les paramètres de chargement sur un fichier, choisissez Configurer les paramètres de chargement dans le menu des options de source de données pour afficher ou modifier les paramètres suivants :
-
Format — le format de fichier CSVCUSTOM,CLF,,, etc.
-
Ligne de début – la ligne à partir de laquelle commencer
-
Qualificateur de texte – double guillemet ou guillemet simple
-
En-tête – indique si le fichier comprend une ligne d'en-tête
-
-
Aperçu des lignes – Un aperçu des lignes échantillonnées apparaît en bas à droite lorsque l'éditeur de configuration de jointure n'est pas utilisé.
-
Éditeur de configuration de jointure – L'éditeur de jointure s'ouvre lorsque vous avez plusieurs objets de données dans l'espace de travail des données. Pour modifier une jointure, sélectionnez l'icône de jointure entre deux tables (ou fichiers). Choisissez un type de jointure et les champs à joindre, à l'aide du panneau de configuration de jointure situé en bas de l'écran. Choisissez ensuite Appliquer pour créer la jointure. Vous devez terminer toutes les jointures pour pouvoir enregistrer votre travail.
Pour ajouter d'autres requêtes, tables ou fichiers, utilisez l'option Ajouter des données au-dessus de l'espace de travail.
Création d'une SQL requête de base
Suivez la procédure ci-dessous pour vous connecter à une source de données à l'aide d'une SQL requête personnalisée.
Pour créer une SQL requête de base
-
Créez une nouvelle source de données et validez la connexion.
-
Renseignez les options nécessaires à la connexion. Par contre, vous n'avez pas besoin de sélectionner un schéma ou une table.
-
Choisissez Utiliser une option personnalisée SQL.
-
(Facultatif) Vous pouvez saisir votre requête dans l'SQLéditeur ou passer à l'étape suivante pour utiliser la version plein écran. Pour l'entrer immédiatement, créez un nom pour la requête. Tapez ou collez ensuite une SQL requête dans l'éditeur. L'SQLéditeur propose la mise en évidence de la syntaxe, la saisie semi-automatique de base, l'indentation automatique et la numérotation des lignes.
(Facultatif) Choisissez Confirmer la requête pour la valider et afficher les paramètres de la requête directe, SPICE mémoire et SageMaker paramètres.
-
Choisissez Modifier/Apercevoir des données. L'éditeur de requêtes complet apparaît avec l'SQLéditeur affiché. La requête est traitée et un exemple de ses résultats s'affiche dans le volet de visualisation des données. Vous pouvez apporter des modifications SQL et les confirmer en choisissant Appliquer. Lorsque vous avez terminé d'utiliser leSQL, choisissez Fermer pour continuer.
-
En haut, entrez un nom pour l'ensemble de données. Choisissez Enregistrer et visualiser.
Modification des requêtes existantes
Pour mettre à jour une SQL requête
-
Ouvrez l'jeu de données avec lequel vous souhaitez travailler.
-
Dans l'espace de travail avec la grille, localisez l'objet en forme de boîte qui représente la requête existante.
-
Ouvrez le menu des options de l'objet de requête et choisissez Modifier SQL la requête. Si cette option n'apparaît pas dans la liste, l'objet de requête n'est pas basé surSQL.
Pour afficher les versions précédentes des requêtes, ouvrez l'Archive de requête à gauche.