Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Uso de conectores y conexiones personalizados con AWS Glue Studio

Modo de enfoque
Uso de conectores y conexiones personalizados con AWS Glue Studio - AWS Glue

AWS Glue proporciona soporte integrado con los almacenes de datos más utilizados (como Amazon Redshift, Amazon Aurora, Microsoft SQL Server, MySQL, MongoDB y PostgreSQL) mediante conexiones JDBC. AWS Glue también permite usar controladores JDBC personalizados en sus trabajos de extracción, transformación y carga (ETL). Para los almacenes de datos no soportados de forma nativa, como las aplicaciones de software como servicio (SaaS), puede utilizar conectores.

Un conector es un paquete de códigos opcionales que ayuda a acceder a almacenes de datos en AWS Glue Studio. Puede suscribirse a varios conectores ofrecidos en AWS Marketplace.

Al crear trabajos de ETL, puede usar un almacén de datos soportado de forma nativa, un conector de AWS Marketplace, o sus propios conectores personalizados. Si utiliza un conector, primero debe crear una conexión para el conector. Una conexión contiene las propiedades necesarias para conectarse a un almacén de datos determinado. Utilice la conexión con los orígenes de datos y los destinos de datos en el trabajo de ETL. Los conectores y las conexiones funcionan en conjunto para facilitar el acceso a los almacenes de datos.

Las siguientes conexiones están disponibles al crear conexiones para conectores:

  • Amazon Aurora: un motor de base de datos relacional escalable y de alto rendimiento con seguridad, copia de seguridad y restauración integradas y aceleración en memoria.

  • Amazon DocumentDB: un servicio de base de datos de documentos escalable, de alta disponibilidad y totalmente gestionado que admite las API de MongoDB y SQL.

  • Amazon Redshift: un servicio de base de datos de documentos escalable, de alta disponibilidad y totalmente administrado que admite las API de MongoDB y SQL.

  • Azure SQL: un servicio de base de datos relacional basado en la nube de Microsoft Azure que proporciona capacidades de administración y almacenamiento de datos escalables, fiables y seguras.

  • Cosmos DB: un servicio de base de datos en la nube distribuido a nivel mundial de Microsoft Azure que proporciona capacidades de consulta y almacenamiento de datos escalables y de alto rendimiento.

  • Google BigQuery: almacenamiento de datos en la nube sin servidor para ejecutar consultas SQL rápidas en conjuntos de datos de gran tamaño.

  • JDBC: un sistema de administración de base de datos relacional (RDBMS) que utiliza una API de Java para conectarse e interactuar con las conexiones de datos.

  • Kafka: una plataforma de procesamiento de flujos de código abierto que se utiliza para el flujo de datos y la mensajería en tiempo real.

  • MariaDB: una bifurcación de MySQL desarrollada por la comunidad que ofrece rendimiento, escalabilidad y características mejorados.

  • MongoDB: una base de datos multiplataforma orientada a documentos que proporciona alta escalabilidad, flexibilidad y rendimiento.

  • MongoDB Atlas: una oferta de base de datos como servicio (DBaaS) basada en la nube de MongoDB que simplifica la administración y el escalado de las implementaciones de MongoDB.

  • Microsoft SQL Server: un sistema de administración de base de datos relacional (RDBMS) de Microsoft que proporciona sólidas capacidades de almacenamiento, análisis e informes de datos.

  • Mixpanel: una plataforma de análisis que ayuda a las empresas a analizar cómo los usuarios interactúan con los sitios web, aplicaciones móviles y otros productos digitales.

  • MySQL: un sistema de administración de bases de datos relacionales (RDBMS) de código abierto que se usa ampliamente en aplicaciones web y es conocido por su fiabilidad y escalabilidad.

  • Red: un origen de datos de red representa un recurso o servicio accesible desde la red al que se puede acceder mediante una plataforma de integración de datos.

  • OpenSearch: un origen de datos de OpenSearch es una aplicación a la que OpenSearch puede conectarse y desde la que puede ingerir datos.

  • Oracle: un sistema de administración de base de datos relacional (RDBMS) de Oracle Corporation que proporciona sólidas capacidades de almacenamiento, análisis e informes de datos.

  • PostgreSQL: un sistema de administración de base de datos relacional (RDBMS) de código abierto que proporciona sólidas capacidades de almacenamiento, análisis e informes de datos.

  • Salesforce: Salesforce proporciona un software de gestión de relaciones con los clientes (CRM) que lo ayuda con las ventas, el servicio al cliente, el comercio electrónico y más. Si es usuario de Salesforce, puede conectar AWS Glue a su cuenta de Salesforce. A continuación, puede utilizar Salesforce como origen o destino de datos en sus trabajos de ETL. Ejecute estos trabajos para transferir datos entre Salesforce y los servicios de AWS u otras aplicaciones compatibles.

  • SAP HANA: una plataforma de análisis y base de datos en memoria que proporciona un procesamiento rápido de datos, análisis avanzados e integración de datos en tiempo real.

  • Snowflake: un almacén de datos basado en la nube que proporciona servicios de análisis y almacenamiento de datos escalables y de alto rendimiento.

  • Teradata: un sistema de administración de base de datos relacional (RDBMS) que proporciona capacidades de almacenamiento, análisis e informes de datos de alto rendimiento.

  • Vertica: almacenamiento de datos analíticos orientado a columnas diseñado para el análisis de macrodatos que ofrece un rendimiento de consultas rápido, análisis avanzados y escalabilidad.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.