Enregistrer les résultats des requêtes SQL dans un pandas DataFrame - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Enregistrer les résultats des requêtes SQL dans un pandas DataFrame

Vous pouvez stocker les résultats de votre requête SQL dans un pandas DataFrame. Le moyen le plus simple de générer les résultats d'une requête dans un DataFrame est d'utiliser le menu déroulant des Fonctionnalités de l'extension JupyterLab SQL relatives à l'éditeur SQL résultats de requête et de choisir l'option de trame de données Pandas.

Vous pouvez également ajouter le paramètre --output '{"format": "DATAFRAME", "dataframe_name": "dataframe_name"}' à votre chaîne de connexion.

Par exemple, la requête suivante extrait les détails des clients ayant le solde le plus élevé de la Customer table de la TPCH_SF1 base de données de Snowflake, en utilisant les deux pandas et SQL :

  • Dans cet exemple, nous extrayons toutes les données de la table des clients et les enregistrons sous un DataFrame nomall_customer_data.

    %%sm_sql --output '{"format": "DATAFRAME", "dataframe_name": "all_customer_data"}' --metastore-id snowflake-connection-name --metastore-type GLUE_CONNECTION SELECT * FROM SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.CUSTOMER
    Saved results to all_customer_data
  • Ensuite, nous extrayons les détails du solde le plus élevé du compte à partir du DataFrame.

    all_customer_data.loc[all_customer_data['C_ACCTBAL'].idxmax()].values
    array([61453, 'Customer#000061453', 'RxNgWcyl5RZD4qOYnyT3', 15, '25-819-925-1077', Decimal('9999.99'), 'BUILDING','es. carefully regular requests among the blithely pending requests boost slyly alo'], dtype=object)