本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
儲存 SQL 查詢會導致 pandas DataFrame
您可以在 pandas DataFrame 中存放 SQL 查詢的結果。將查詢結果輸出到 DataFrame 的最簡單方法是使用 JupyterLab SQL 延伸模組的 SQL 編輯器功能 query-result 下拉式清單,然後選擇 Pandas Dataframe 選項。
或者,您可以將 參數新增至--output '{"format": "DATAFRAME", "dataframe_name": "
連線字串。dataframe_name
"}'
例如,下列查詢會使用 pandas和 SQL,從 Snowflake TPCH_SF1
資料庫中的 Customer
資料表擷取餘額最高的客戶詳細資訊:
-
在此範例中,我們從客戶資料表擷取所有資料,然後儲存在名為 的 DataFrame 中
all_customer_data
。%%sm_sql --output '{"format": "DATAFRAME", "dataframe_name": "all_customer_data"}' --metastore-id
snowflake-connection-name
--metastore-type GLUE_CONNECTION SELECT * FROM SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.CUSTOMERSaved results to all_customer_data
-
接下來,我們會從 DataFrame 擷取最高帳戶餘額的詳細資訊。
all_customer_data.loc[all_customer_data['C_ACCTBAL'].idxmax()].values
array([61453, 'Customer#000061453', 'RxNgWcyl5RZD4qOYnyT3', 15, '25-819-925-1077', Decimal('9999.99'), 'BUILDING','es. carefully regular requests among the blithely pending requests boost slyly alo'], dtype=object)