Conexión a datos - AWS Glue

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Conexión a datos

Una AWS Glue conexión es un objeto del catálogo de datos que almacena las credenciales de inicio de sesión, URI las cadenas, la información de la nube privada virtual (VPC) y mucho más para un almacén de datos concreto. AWS Glue los rastreadores, los trabajos y los puntos finales de desarrollo utilizan conexiones para acceder a determinados tipos de almacenes de datos. Puede usar conexiones tanto para fuentes como para destinos y reutilizar la misma conexión en varios trabajos de rastreo o extracción, transformación y carga ()ETL.

Información general del uso de conectores y conexiones

Una conexión contiene las propiedades necesarias para conectarse a un almacén de datos determinado. Cuando se crea una conexión, se almacena en el AWS Glue Data Catalog. Elija un conector y, a continuación, cree una conexión basada en ese conector.

Puede suscribirse a conectores para almacenes de datos no compatibles de forma nativa y AWS Marketplace, a continuación, utilizarlos al crear conexiones. Los desarrolladores también pueden crear sus propios conectores, que el usuario puede utilizar para crear conexiones.

nota

Las conexiones creadas mediante conectores personalizados o AWS Marketplace conectores AWS Glue Studio aparecen en la AWS Glue consola con el tipo establecido en. UNKNOWN

Los siguientes pasos describen el proceso general de uso de los conectores en AWS Glue Studio:

  1. Suscríbase a un conector o desarrolle su propio conector y cárguelo en AWS Glue Studio. AWS Marketplace Para obtener más información, consulte Agregar conectores a AWS Glue Studio.

  2. Revise la información de uso del conector. Puede encontrar esta información en la pestaña Usage (Uso) en la página de producto del conector. Por ejemplo, si haces clic en la pestaña Uso de la página de este producto, AWS Glue Connector para Google BigQuery, verás en la sección Recursos adicionales un enlace a un blog sobre el uso de este conector. Otros conectores pueden contener vínculos a las instrucciones de la sección Overview (Información general), como se muestra en la página de producto del conector para Conector Cloudwatch Logs para AWS Glue.

  3. Cree una conexión. Usted elige el conector que desea utilizar y proporciona información adicional para la conexión, como las credenciales de inicio de sesión, URI las cadenas y la información de la nube privada virtual (VPC). Para obtener más información, consulte Creación de conexiones para conectores.

  4. Cree un IAM rol para su trabajo. El trabajo asume los permisos del IAM rol que especificó al crearlo. Esta IAM función debe tener los permisos necesarios para autenticarse en sus almacenes de datos, extraerlos y escribirlos en ellos.

  5. Cree un ETL trabajo y configure las propiedades de la fuente de datos para su ETL trabajo. Proporcione las opciones de conexión y la información de autenticación según las instrucciones del proveedor del conector personalizado. Para obtener más información, consulte Creación de trabajos con conectores personalizados.

  6. Personalice su ETL trabajo agregando transformaciones o almacenes de datos adicionales, tal y como se describe enInicio de trabajos de ETL visuales en AWS Glue Studio.

  7. Si utiliza un conector para el destino de datos, configure las propiedades del destino de datos para su ETL trabajo. Proporcione las opciones de conexión y la información de autenticación según las instrucciones del proveedor del conector personalizado. Para obtener más información, consulte Creación de trabajos con conectores personalizados.

  8. Personalice el entorno de ejecución de trabajos mediante la configuración de las propiedades del trabajo, como se describe en Modificar las propiedades del trabajo.

  9. Ejecute el trabajo.