AWS Glue DataBrew - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

AWS Glue DataBrew

AWS Glue DataBrew es un servicio de preparación visual de datos totalmente gestionado para limpiar, normalizar y transformar datos. Se diferencia del AWS Glue ETL en que no es necesario escribir código para trabajar con él. DataBrew proporciona más de 250 transformaciones integradas, con una point-and-click interfaz visual para crear y gestionar tareas de transformación de datos.

DataBrew está disponible en una vista de consola independiente de AWS Glue. Está integrado de forma nativa con varios AWS servicios y admite muchos formatos de archivo diferentes. Para obtener más información, consulte Integraciones de productos y servicios.

DataBrew se basa en los seis conceptos básicos siguientes:

  • Proyecto: todo el espacio de trabajo de preparación de datos en DataBrew

  • Conjunto de datos: conjunto de datos estructurados o semiestructurados

  • Receta: un conjunto de pasos de transformación de datos; cada paso puede contener muchas acciones

  • Trabajo: conjunto de instrucciones para ejecutar una receta o un trabajo de perfil de datos 

  • Linaje de datos: el seguimiento de los datos en una interfaz visual para identificar su origen

  • Perfil de datos: una vista resumida de la forma de los datos

AWS Glue DataBrew está integrado AWS Glue Studio, por lo que puede organizar DataBrew recetas dentro de sus trabajos y flujos de trabajo de AWS Glue ETL. DataBrew Las recetas también pueden aprovechar AWS Glue funciones como los marcadores de tareas, los reintentos automáticos y el escalado automático. Para empezar DataBrew, usa el AWS Glue DataBrew ejemplo del tutorial del proyecto.