Salve os resultados da SQL consulta em um pandas DataFrame - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Salve os resultados da SQL consulta em um pandas DataFrame

Você pode armazenar os resultados da sua SQL consulta em um pandas DataFrame. A maneira mais fácil de enviar os resultados da consulta para a DataFrame é usar o menu suspenso SQLrecursos de edição da JupyterLab SQL extensão de resultados da consulta e escolher a opção Pandas dataframe.

Como alternativa, você pode adicionar o parâmetro --output '{"format": "DATAFRAME", "dataframe_name": "dataframe_name"}' à sua cadeia de conexão.

Por exemplo, a consulta a seguir extrai detalhes dos clientes com o saldo mais alto da Customer tabela no TPCH_SF1 banco de dados da Snowflake, usando ambos pandas eSQL:

  • Neste exemplo, extraímos todos os dados da tabela de clientes e os salvamos em um DataFrame nomeall_customer_data.

    %%sm_sql --output '{"format": "DATAFRAME", "dataframe_name": "all_customer_data"}' --metastore-id snowflake-connection-name --metastore-type GLUE_CONNECTION SELECT * FROM SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.CUSTOMER
    Saved results to all_customer_data
  • Em seguida, extraímos os detalhes do maior saldo da conta do DataFrame.

    all_customer_data.loc[all_customer_data['C_ACCTBAL'].idxmax()].values
    array([61453, 'Customer#000061453', 'RxNgWcyl5RZD4qOYnyT3', 15, '25-819-925-1077', Decimal('9999.99'), 'BUILDING','es. carefully regular requests among the blithely pending requests boost slyly alo'], dtype=object)