将 SQL 查询结果保存在熊猫中 DataFrame - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将 SQL 查询结果保存在熊猫中 DataFrame

您可以将 SQL 查询的结果存储在熊猫 DataFrame中。将查询结果输出到 a 的最简单方法 DataFrame 是使用SQL 扩展的 JupyterLab SQL 编辑器功能查询结果下拉列表并选择 Pandas d ataFrame 选项。

或者,也可以在连接字符串中添加参数 --output '{"format": "DATAFRAME", "dataframe_name": "dataframe_name"}'

例如,以下查询使用两者从 Snowflake TPCH_SF1 数据库的Customer表中提取余额最高的客户的详细信息 pandas 还有 SQL:

  • 在此示例中,我们从 customer 表中提取所有数据,然后将其保存在 DataFrame 名字中all_customer_data

    %%sm_sql --output '{"format": "DATAFRAME", "dataframe_name": "all_customer_data"}' --metastore-id snowflake-connection-name --metastore-type GLUE_CONNECTION SELECT * FROM SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.CUSTOMER
    Saved results to all_customer_data
  • 接下来,我们从中提取最高账户余额的详细信息 DataFrame。

    all_customer_data.loc[all_customer_data['C_ACCTBAL'].idxmax()].values
    array([61453, 'Customer#000061453', 'RxNgWcyl5RZD4qOYnyT3', 15, '25-819-925-1077', Decimal('9999.99'), 'BUILDING','es. carefully regular requests among the blithely pending requests boost slyly alo'], dtype=object)