Conectarse a una fuente de datos de Databricks - Amazon Managed Grafana

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Conectarse a una fuente de datos de Databricks

La fuente de datos de Databricks le permite consultar y visualizar los datos de Databricks en Amazon Managed Grafana. Incluye un editor de SQL para formatear y codificar con colores sus consultas.

nota

Esta fuente de datos es solo para Grafana Enterprise. Para obtener más información, consulte Gestione el acceso a los complementos empresariales.

Además, en los espacios de trabajo compatibles con la versión 9 o posterior, es posible que esta fuente de datos requiera la instalación del complemento adecuado. Para obtener más información, consulte Amplía tu espacio de trabajo con complementos.

Añadir una fuente de datos de Databricks

Siga estos pasos para añadir una fuente de datos de Databricks en la consola de Grafana.

Para añadir una fuente de datos de Databricks
  1. Abre el menú lateral seleccionando el icono de Grafana en el encabezado superior.

  2. En el menú lateral, en el enlace Tableros, selecciona Fuentes de datos.

    nota

    Si no ves el enlace Fuentes de datos, significa que no tienes el Admin rol de Grafana.

  3. Selecciona el botón + Añadir fuente de datos en el encabezado superior.

  4. Seleccione Databricks en la lista desplegable Tipo.

    nota

    Si no ve la opción Databricks y la necesita, debe actualizarse a Grafana Enterprise.

  5. Elige las opciones para conectarte a tus datos y editarlos.

Notas sobre el uso de la fuente de datos de Databricks

Series temporales

Las visualizaciones de series temporales se pueden seleccionar al añadir un datetime campo a la consulta. Este campo se usará como marca de tiempo para la serie. Si el campo no incluye una zona horaria específica, Grafana asumirá que la hora es UTC.

Series temporales multilínea

Para crear una visualización de series temporales multilínea, la consulta debe incluir al menos tres campos en el orden siguiente.

  1. Un datetime campo con un alias detime.

  2. Un valor paraGROUP BY.

  3. Uno o más valores métricos para visualizar.

El siguiente es un ejemplo de una consulta que devolverá opciones de series temporales de varias líneas.

SELECT log_time AS time, machine_group, avg(disk_free) AS avg_disk_free FROM mgbench.logs1 GROUP BY machine_group, log_time ORDER BY log_time