Connessione ai dati - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Connessione ai dati

Una AWS Glue connessione è un oggetto Data Catalog che memorizza credenziali di accesso, URI stringhe, informazioni sul cloud privato virtuale (VPC) e altro ancora per un particolare data store. AWS Glue i crawler, i job e gli endpoint di sviluppo utilizzano le connessioni per accedere a determinati tipi di archivi dati. È possibile utilizzare le connessioni sia per le sorgenti che per le destinazioni e riutilizzare la stessa connessione in più crawler o job di estrazione, trasformazione e caricamento (). ETL

Panoramica sull'utilizzo di connettori e connessioni

Una connessione contiene le proprietà necessarie per connettersi a un particolare datastore. Quando crei una connessione, questa viene archiviata in AWS Glue Data Catalog. Scegli un connettore e quindi crea una connessione basata su di esso.

È possibile sottoscrivere connettori per archivi dati non supportati in modo nativo in Marketplace AWS e quindi utilizzarli durante la creazione di connessioni. Gli sviluppatori possono anche creare i propri connettori ed è possibile utilizzarli durante la creazione di connessioni.

Nota

Le connessioni create utilizzando Marketplace AWS connettori personalizzati o in AWS Glue Studio vengono visualizzate nella AWS Glue console con il tipo impostato su. UNKNOWN

I passaggi seguenti descrivono il processo generale di utilizzo dei connettori in AWS Glue Studio:

  1. Iscriviti a un connettore in Marketplace AWS oppure sviluppa il tuo connettore e caricalo su AWS Glue Studio. Per ulteriori informazioni, consulta Aggiunta di connettori a AWS Glue Studio.

  2. Esamina le informazioni sull'utilizzo del connettore. Puoi trovare queste informazioni nella scheda Usage (Utilizzo) nella pagina prodotto del connettore. Ad esempio, se fai clic sulla scheda Utilizzo in questa pagina di prodotto, AWS Glue Connector for Google BigQuery, puoi vedere nella sezione Risorse aggiuntive un link a un blog sull'utilizzo di questo connettore. Altri connettori potrebbero contenere collegamenti alle istruzioni contenute nella sezione Overview (Panoramica), come mostrato nella pagina prodotto per Cloudwatch Logs connector for AWS Glue (Connettore Cloudwatch Logs per AWS Glue).

  3. Crea una connessione. Scegli il connettore da utilizzare e fornisci informazioni aggiuntive per la connessione, come credenziali di accesso, URI stringhe e informazioni sul cloud privato virtuale (VPC). Per ulteriori informazioni, consulta Creazione di connessioni per i connettori.

  4. Crea un IAM ruolo per il tuo lavoro. Il lavoro presuppone le autorizzazioni del IAM ruolo specificato al momento della creazione. Questo IAM ruolo deve disporre delle autorizzazioni necessarie per autenticarsi, estrarre dati e scrivere dati negli archivi dati.

  5. Crea un ETL lavoro e configura le proprietà dell'origine dati per il tuo ETL lavoro. Fornire le opzioni di connessione e le informazioni di autenticazione secondo le istruzioni fornite dal provider di connettori personalizzati. Per ulteriori informazioni, consulta Creazione di processi con connettori personalizzati.

  6. Personalizza il tuo ETL lavoro aggiungendo trasformazioni o archivi dati aggiuntivi, come descritto inAvvio di ETL lavori visivi in AWS Glue Studio.

  7. Se utilizzi un connettore per la destinazione dati, configura le proprietà della destinazione dati per il tuo ETL lavoro. Fornire le opzioni di connessione e le informazioni di autenticazione secondo le istruzioni fornite dal provider di connettori personalizzati. Per ulteriori informazioni, consulta Creazione di processi con connettori personalizzati.

  8. Personalizza l'ambiente di esecuzione configurando le proprietà del processo, come descritto in Modificare le proprietà del processo.

  9. Esegui il processo.