儲存 SQL 查詢會導致 pandas DataFrame - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

儲存 SQL 查詢會導致 pandas DataFrame

您可以在 pandas DataFrame 中存放 SQL 查詢的結果。將查詢結果輸出到 DataFrame 的最簡單方法是使用 JupyterLab SQL 延伸模組的 SQL 編輯器功能 query-result 下拉式清單,然後選擇 Pandas Dataframe 選項。

或者,您可以將 參數新增至--output '{"format": "DATAFRAME", "dataframe_name": "dataframe_name"}'連線字串。

例如,下列查詢會使用 pandas和 SQL,從 Snowflake TPCH_SF1 資料庫中的 Customer 資料表擷取餘額最高的客戶詳細資訊:

  • 在此範例中,我們從客戶資料表擷取所有資料,然後儲存在名為 的 DataFrame 中all_customer_data

    %%sm_sql --output '{"format": "DATAFRAME", "dataframe_name": "all_customer_data"}' --metastore-id snowflake-connection-name --metastore-type GLUE_CONNECTION SELECT * FROM SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.CUSTOMER
    Saved results to all_customer_data
  • 接下來,我們會從 DataFrame 擷取最高帳戶餘額的詳細資訊。

    all_customer_data.loc[all_customer_data['C_ACCTBAL'].idxmax()].values
    array([61453, 'Customer#000061453', 'RxNgWcyl5RZD4qOYnyT3', 15, '25-819-925-1077', Decimal('9999.99'), 'BUILDING','es. carefully regular requests among the blithely pending requests boost slyly alo'], dtype=object)