Sviluppo di connettori personalizzati - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Sviluppo di connettori personalizzati

Puoi scrivere il codice che legge o scrive dati nel tuo data store e formatta i dati per utilizzarli con AWS Glue Studio lavori. Puoi creare connettori per datastore Spark, Athena e JDBC. Il codice di esempio pubblicato su GitHub fornisce una panoramica delle interfacce di base da implementare.

Per creare il codice del connettore è necessario un ambiente di sviluppo locale. Puoi usare qualsiasi IDE o anche solo un editor della riga di comando per scrivere il connettore. Esempi di ambienti di sviluppo includono:

Sviluppo dei connettori Spark

Puoi creare un connettore Spark con Spark DataSource API V2 (Spark 2.4) per leggere i dati.

Per creare un connettore Spark personalizzato

Segui i passaggi indicati nel AWS Glue GitHub libreria di esempio per lo sviluppo di connettori Spark, che si trova in https://github.com/aws-samples/aws-glue-samples/tree/master/GlueCustomConnectors/development/Spark/README.md.

Sviluppo di connettori Athena

È possibile creare un connettore Athena da utilizzare da AWS Glue e AWS Glue Studio per interrogare un'origine dati personalizzata.

Per creare un connettore Athena personalizzato

Segui i passaggi indicati nel AWS Glue GitHub libreria di esempi per lo sviluppo di connettori Athena, che si trova in https://github.com/aws-samples/aws-glue-samples/. tree/master/GlueCustomConnectors/development/Athena

Sviluppo di connettori JDBC

Puoi creare un connettore che utilizza JDBC per accedere ai datastore.

Per creare un connettore JDBC personalizzato
  1. Installa il AWS Glue Le librerie di runtime Spark nel tuo ambiente di sviluppo locale. Fate riferimento alle istruzioni contenute nel AWS Glue GitHub libreria di esempio in https://github.com/aws-samples/aws-glue-samples/tree/master/GlueCustomConnectors/development/GlueSparkRuntime/README.md.

  2. Implementa il driver JDBC responsabile del recupero dei dati dall'origine dati. Fai riferimento alla documentazione Java per Java SE 8.

    Crea un punto di ingresso all'interno del tuo codice che AWS Glue Studio utilizza per localizzare il connettore. Il campo Class name (Nome classe) dovrebbe essere il percorso completo del driver JDBC.

  3. Usa l'API GlueContext per leggere i dati con il connettore. Gli utenti possono aggiungere altre opzioni di input nel AWS Glue Studio console per configurare la connessione alla sorgente dati, se necessario. Per un esempio di codice che mostra come leggere e scrivere su un database JDBC con un connettore JDBC personalizzato, vedete Valori Custom e ConnectionType. Marketplace AWS

Esempi di utilizzo di connettori personalizzati con AWS Glue Studio

Fai riferimento ai seguenti blog per esempi di utilizzo di connettori personalizzati:

Sviluppando AWS Glue connettori per Marketplace AWS

In qualità di AWS partner, puoi creare connettori personalizzati e Marketplace AWS caricarli su cui vendere AWS Glue clienti.

Il processo per lo sviluppo del codice del connettore è lo stesso dei connettori personalizzati, ma il processo di caricamento e verifica del codice del connettore è più dettagliato. Consulta le istruzioni contenute nella sezione Creazione di connettori Marketplace AWS disponibili sul GitHub sito Web.