Guarde los resultados SQL de la consulta en un pandas DataFrame - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Guarde los resultados SQL de la consulta en un pandas DataFrame

Puedes almacenar los resultados de tu SQL consulta en un DataFrame pandas. La forma más sencilla de enviar los resultados de una consulta a DataFrame es utilizar el menú desplegable de SQLfunciones de edición de la extensión JupyterLab SQL resultados de la consulta y elegir la opción de marco de datos de Pandas.

Como alternativa, puede añadir el parámetro a la cadena de conexión. --output '{"format": "DATAFRAME", "dataframe_name": "dataframe_name"}'

Por ejemplo, la siguiente consulta extrae los detalles de los clientes con el saldo más alto de la Customer tabla de la TPCH_SF1 base de datos de Snowflake, utilizando ambas opciones pandas y: SQL

  • En este ejemplo, extraemos todos los datos de la tabla de clientes y los guardamos en un DataFrame nombreall_customer_data.

    %%sm_sql --output '{"format": "DATAFRAME", "dataframe_name": "all_customer_data"}' --metastore-id snowflake-connection-name --metastore-type GLUE_CONNECTION SELECT * FROM SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.CUSTOMER
    Saved results to all_customer_data
  • A continuación, extraemos los detalles del saldo más alto de la cuenta DataFrame.

    all_customer_data.loc[all_customer_data['C_ACCTBAL'].idxmax()].values
    array([61453, 'Customer#000061453', 'RxNgWcyl5RZD4qOYnyT3', 15, '25-819-925-1077', Decimal('9999.99'), 'BUILDING','es. carefully regular requests among the blithely pending requests boost slyly alo'], dtype=object)