Examinar los datos con SQL Explorer para EMR Studio - Amazon EMR

Examinar los datos con SQL Explorer para EMR Studio

nota

SQL Explorer para EMR Studio no es compatible con las aplicaciones interactivas de Amazon EMR sin servidor o en un Studio que tenga habilitada la propagación de identidades de confianza de IAM Identity Center.

En este tema, se proporciona información que lo ayudará a comenzar a trabajar con el Explorador de SQL de Amazon EMR Studio. El Explorador de SQL es una herramienta de una sola página en su espacio de trabajo que le ayuda a comprender los orígenes de datos del catálogo de datos del clúster de EMR. Puede usar el Explorador de SQL para examinar sus datos, ejecutar consultas SQL para recuperar datos y descargar los resultados de las consultas.

El Explorador de SQL es compatible con Presto. Antes de usar el Explorador de SQL, asegúrese de que su clúster use la versión 5.34.0 o posterior o la versión 6.4.0 o posterior de Amazon EMR y tenga instalado Presto. El Explorador de SQL de Amazon EMR Studio no admite los clústeres de Presto que haya configurado con cifrado en tránsito. Esto se debe a que Presto se ejecuta en modo TLS en estos clústeres.

Explorar el catálogo de datos del clúster

El Explorador de SQL proporciona una interfaz de explorador del catálogo que puede utilizar para explorar y comprender cómo se organizan los datos. Por ejemplo, puede usar el explorador del catálogo de datos para comprobar los nombres de las tablas y columnas antes de escribir una consulta SQL.

Para examinar el catálogo de datos
  1. Abra el Explorador de SQL en el espacio de trabajo.

  2. Asegúrese de que su espacio de trabajo esté asociado a un clúster de EMR que se ejecute en EC2 y que utilice la versión 6.4.0 o posterior de Amazon EMR con Presto instalado. Puede elegir un clúster existente o crear uno nuevo. Para obtener más información, consulte Asociar computación a un espacio de trabajo de EMR Studio.

  3. Seleccione una base de datos de la lista desplegable para explorarla.

  4. Expanda una tabla de la base de datos para ver los nombres de las columnas de la tabla. También puede introducir una palabra clave en la barra de búsqueda para filtrar los resultados de la tabla.

Ejecutar una consulta SQL para recuperar datos

Para recuperar datos con una consulta SQL y descargar los resultados
  1. Abra el Explorador de SQL en el espacio de trabajo.

  2. Asegúrese de que su espacio de trabajo esté asociado a un clúster de EMR que se ejecute en EC2 con Presto y Spark instalados. Puede elegir un clúster existente o crear uno nuevo. Para obtener más información, consulte Asociar computación a un espacio de trabajo de EMR Studio.

  3. Seleccione Abrir editor para abrir una nueva pestaña de editor en su espacio de trabajo.

  4. Redacte la consulta SQL en la pestaña del editor.

  5. Elija Ejecutar.

  6. Consulte los resultados de la consulta en la vista previa de los resultados. El Explorador de SQL muestra los primeros 100 resultados de forma predeterminada. Puede elegir un número diferente de resultados para mostrarlos (hasta 1000) mediante el menú desplegable Vista previa de los primeros 100 resultados de la consulta.

  7. Para descargar los resultados en formato CSV, seleccione Descargar resultados. Puede descargar hasta 1000 filas de resultados.