Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Cronologia della documentazione per AWS Glue

Modalità Focus

In questa pagina

Cronologia della documentazione per AWS Glue - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

ModificaDescrizioneData

Support per altri 16 nuovi connettori nativi SaaS per AWS Glue

Sono stati aggiunti altri sedici connettori nativi SaaS. AWS Glue Per ulteriori informazioni, vedere Aggiungere una AWS Glue connessione.

17 dicembre 2024

Support per ETL integrazioni zero

Zero- ETL è un insieme di integrazioni completamente gestite AWS che riduce al minimo la necessità di creare ETL pipeline di dati. Per ulteriori informazioni, consulta Zero - integrazioni. ETL

3 dicembre 2024

Support per connessioni riutilizzabili

Un nuovo schema di AWS Glue connessioni offre un modo unificato per gestire le connessioni dati tra AWS servizi e applicazioni AWS Glue, come Amazon Athena e SageMaker Amazon Unified Studio. Per ulteriori informazioni, consulta Connessione ai dati.

3 dicembre 2024

Support per AWS Glue la versione 5.0.

Sono state aggiunte informazioni sul supporto per la AWS Glue versione 5.0. Le funzionalità includono un aggiornamento di Apache Spark alla versione 3.52, un aggiornamento di Java alla versione 17, aggiornamenti del formato open table, controllo degli accessi a grana fine nativo di Spark, integrazione con Sagemaker Lakehouse e l'astrazione del data warehouse, supporto in Sagemaker Unified Studio e altro ancora. Per ulteriori AWS Glue informazioni AWS Glue, AWS Glue consulta le Note di rilascio e la migrazione dei lavori alla versione 5.0.

3 dicembre 2024

Connessione all' AWS Glue Data Catalog utilizzo dell'endpoint AWS Glue Iceberg REST

AWS Glue l'RESTendpoint Iceberg supporta API le operazioni specificate nella specifica Apache Iceberg. REST Utilizzando un REST client Iceberg, è possibile collegare l'applicazione in esecuzione su un motore di analisi al REST catalogo ospitato nel Data Catalog. Per ulteriori informazioni, consulta Accesso al catalogo dati.

3 dicembre 2024

Generazione automatica di statistiche sulle colonne

Genera automaticamente statistiche sulle colonne per nuove tabelle in AWS Glue Data Catalog. Per ulteriori informazioni, vedere Generazione automatica di statistiche sulle colonne.

3 dicembre 2024

Support per gli aggiornamenti generativi dell'intelligenza artificiale per Apache Spark in AWS Glue

Spark Upgrades in AWS Glue consente ai data engineer e agli sviluppatori di aggiornare e migrare, aggiornare e migrare i job Spark esistenti alle ultime versioni di AWS Glue Spark utilizzando l'intelligenza artificiale generativa. Per ulteriori informazioni, consulta Upgrade analysis with AI.

22 novembre 2024

Support per la risoluzione dei problemi di intelligenza artificiale generativa per Apache Spark in AWS Glue

Generative AI Troubleshooting for Apache Spark jobs in AWS Glue aiuta i data engineer e gli scienziati a diagnosticare e risolvere i problemi nelle loro applicazioni Spark con facilità. Per ulteriori informazioni, consulta Risoluzione dei problemi relativi ai job Spark con AI.

22 novembre 2024

Support per gli ottimizzatori Iceberg per accedere ai bucket Amazon S3 in un VPC

AWS Glue Data Catalog supporta gli ottimizzatori di tabelle Iceberg per accedere ai bucket Amazon S3 da uno specifico Virtual Private Cloud VPC () utilizzando una connessione di rete. AWS Glue Per ulteriori informazioni, consulta Ottimizzazione delle tabelle Iceberg.

20 novembre 2024

Support per altri nove nuovi connettori nativi SaaS per AWS Glue

Sono stati aggiunti altri nove connettori nativi SaaS. AWS Glue Per ulteriori informazioni, vedere Aggiungere una AWS Glue connessione.

19 novembre 2024

Support per dieci nuovi connettori nativi SaaS per AWS Glue

Sono stati aggiunti dieci connettori nativi SaaS. AWS Glue Per ulteriori informazioni, vedere Aggiungere una AWS Glue connessione.

15 novembre 2024

Support per l'esecuzione dei job, l'accodamento dei job AWS Glue ETL

È possibile attivare l'accodamento dei processi per eseguire i lavori in un secondo momento, quando non possono essere eseguiti immediatamente a causa delle quote di servizio. Per maggiori informazioni, consulta Configurazione delle proprietà dei job per i job Spark in. AWS Glue

3 settembre 2024

Modifiche aggiornate alla politica

Modifiche documentate alle AwsGlueSessionUserRestrictedNotebookServiceRolepolitiche AwsGlueSessionUserRestrictedNotebookPolicye, necessarie per il supporto delle sessioni con tag-on-create la chiave del tag proprietario. Per ulteriori informazioni, consulta AWS Glue gli aggiornamenti alle politiche AWS gestite.

30 agosto 2024

Il rilevamento delle anomalie e le regole dinamiche sono ora disponibili a livello generale

AWS Glue Data Quality utilizza un algoritmo di apprendimento automatico per apprendere dalle tendenze passate e quindi prevedere i valori futuri per rilevare le anomalie. Dynamic Rules consente di fornire soglie dinamiche. Per ulteriori informazioni, vedere Ottimizzazione delle prestazioni delle query per le tabelle Iceberg.

7 agosto 2024

Modifiche aggiornate alle politiche

Modifiche documentate alle AwsGlueSessionUserRestrictedServiceRolepolitiche AwsGlueSessionUserRestrictedPolicye, necessarie per il supporto delle sessioni con tag-on-create la chiave del tag proprietario. Per ulteriori informazioni, consulta AWS Glue gli aggiornamenti alle politiche AWS gestite.

5 agosto 2024

La generazione di statistiche sulle colonne per le tabelle Iceberg è ora disponibile a tutti

AWS Glue supporta il calcolo e l'aggiornamento del numero di valori distinti (NDVs) per ogni colonna nelle tabelle Iceberg. Per ulteriori informazioni, consulta Rilevamento delle anomalie nelle regole dinamiche e di qualità AWS Glue dei dati.

9 luglio 2024

Support per i profili AWS Glue di utilizzo

Gli amministratori possono creare profili di AWS Glue utilizzo per varie classi di utenti all'interno dell'account, come sviluppatori, tester e team di prodotto. Questa flessibilità consente agli amministratori di applicare controlli di utilizzo e costi diversi per ogni classe di utenti. Per ulteriori informazioni, vedere Configurazione dei profili AWS Glue di utilizzo.

18 giugno 2024

Support per un connettore Salesforce per AWS Glue Spark

Sono state aggiunte informazioni su un nuovo AWS Glue connettore per Salesforce. Questa funzionalità consente di utilizzare Spark AWS Glue per leggere e scrivere su Salesforce nella AWS Glue versione 4.0 e successive. Per ulteriori informazioni, consulta Connessione a Salesforce.

22 maggio 2024

Integrazione dei dati di Amazon Q in AWS Glue (GA)

L'integrazione dei dati di Amazon Q AWS Glue è una nuova funzionalità di intelligenza artificiale generativa AWS Glue che consente ai data engineer e ETL agli sviluppatori di creare lavori di integrazione dei dati utilizzando il linguaggio naturale. Gli ingegneri e gli sviluppatori possono chiedere a Q di creare lavori, risolvere problemi e rispondere a domande sull' AWS Glue integrazione dei dati. Per ulteriori informazioni, consulta Integrazione dei dati di Amazon Q in AWS Glue. Questa funzionalità include un aggiornamento e una AwsGlueSessionUserRestrictedServiceRole AWS gestione delle AwsGlueSessionUserRestrictedPolicy politiche. AwsGlueSessionUserRestrictedNotebookServiceRole Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.

30 aprile 2024

Integrazione dei dati di Amazon Q in AWS Glue (anteprima)

L'integrazione dei dati di Amazon Q AWS Glue è una nuova funzionalità di intelligenza artificiale generativa AWS Glue che consente ai data engineer e ETL agli sviluppatori di creare lavori di integrazione dei dati utilizzando il linguaggio naturale. Gli ingegneri e gli sviluppatori possono chiedere a Q di creare lavori, risolvere problemi e rispondere a domande sull' AWS Glue integrazione dei dati. Per ulteriori informazioni, consulta Integrazione dei dati di Amazon Q in AWS Glue. Questa funzionalità include un aggiornamento della politica AwsGlueSessionUserRestrictedNotebookPolicy AWS gestita. Per ulteriori informazioni, consulta AWS Glue gli aggiornamenti delle politiche AWS gestite.

30 gennaio 2024

Aggiornamento della documentazione per AWS Glue lo streaming

Aggiunto un nuovo capitolo con contenuti nuovi e riorganizzati per AWS Glue lo streaming. Questo contenuto descrive come funziona lo streaming AWS Glue, le caratteristiche dell'elaborazione dei dati in tempo reale e come monitorare i processi di streaming. Per ulteriori informazioni, consulta la pagina AWS Glue Streaming.

27 dicembre 2023

Supporto per l'utilizzo del rilevamento dei dati sensibili granulari

La trasformazione relativa al rilevamento dei dati sensibili fornisce la possibilità di rilevare, mascherare o rimuovere le entità che hai definito o che sono predefinite da AWS Glue. Le azioni granulari consentono inoltre di applicare un'azione specifica per entità. Per ulteriori informazioni, consulta Utilizzo del rilevamento dei dati sensibili granulari.

26 novembre 2023

Support per il monitoraggio dei lavori con metriche AWS Glue di Observability

Usa le metriche AWS Glue di Observability per generare approfondimenti su ciò che accade all'interno dei tuoi lavori di Apache Spark AWS Glue per migliorare la classificazione e l'analisi dei problemi. Per ulteriori informazioni, consulta Monitoraggio con metriche di osservabilità. AWS Glue

26 novembre 2023

Support per il rilevamento delle anomalie in AWS Glue Data Quality

AWS Glue Il rilevamento delle anomalie relative alla qualità dei dati applica nel tempo algoritmi di machine learning (ML) alle statistiche dei dati per rilevare modelli anomali e problemi nascosti di qualità dei dati che sono difficili da rilevare attraverso le regole. Per ulteriori informazioni, consulta Rilevamento delle anomalie nella qualità dei dati. AWS Glue

26 novembre 2023

Aggiornamento al comportamento di registrazione predefinito dell'interfaccia utente di Spark

I job Spark che generano i log dell'interfaccia utente Spark ora verranno scritti con un modello di nome file diverso per supportare l'interfaccia utente Spark nella console. AWS Glue Ciò non modifica il comportamento dei log. CloudWatch È possibile ripristinare il comportamento legacy aggiornando la configurazione del processo. Per ulteriori informazioni, consulta Monitoraggio dei processi tramite l'interfaccia utente Web di Apache Spark.

17 novembre 2023

Support per nuove fonti di dati in AWS Glue for Spark

Le connessioni ad Amazon OpenSearch Service, AzureSQL, Azure Cosmos for NoSQL, SAP HANA Teradata Vantage e Vertica sono ora supportate nativamente all'interno. AWS Glue Inoltre, le connessioni a queste fonti di dati, oltre a MongoDB, sono ora disponibili per l'uso nell' AWS Glue editor visivo di Studio. Per ulteriori informazioni, consulta Tipi di connessione e opzioni per ETL in AWS Glue for Spark AWS Glue per informazioni sul supporto di Spark e Aggiungere una AWS Glue connessione per informazioni sull'uso nell' AWS Glue editor visivo di Studio.

17 novembre 2023

Supporto per generare le statistiche delle colonne

Puoi calcolare statistiche a livello di colonna per AWS Glue Data Catalog tabelle in formati di dati come Parquet,,, ORC JSON IONCSV, e XML senza configurare pipeline di dati aggiuntive. Per ulteriori informazioni, consulta Utilizzo delle statistiche delle colonne.

16 novembre 2023

Supporto per la compattazione dei dati per le tabelle Iceberg

Per migliorare le prestazioni di lettura da parte di servizi di AWS analisi come Amazon Athena e Amazon e AWS Glue ETL jobEMR, Data Catalog offre la compattazione gestita (un processo che compatta piccoli oggetti Amazon S3 in oggetti più grandi) per le tabelle Iceberg in Data Catalog. Per ulteriori informazioni, consulta Ottimizzazione delle tabelle Iceberg.

13 novembre 2023

Aggiornamento al comportamento di attesa dell'esecuzione del processo

Le esecuzioni del processo standard di shell (interprete di comandi) Spark e Python ora passeranno a WAITING in determinate situazioni, anziché passare immediatamente a FAILED. Per ulteriori informazioni, consulta Stati di esecuzione dei processi AWS Glue.

8 novembre 2023

AWS Glue Studio guida per l'utente consolidata nella guida per sviluppatori AWS Glue

La guida per AWS Glue Studio l'utente è stata spostata nella guida per sviluppatori per creare un'unica guida utente unificata per AWS Glue Studio la AWS Glue console e l'accesso AWS Glue Studio programmatico.

25 ottobre 2023

Aggiornamento della policy gestita AWSGlueServiceNotebookRole AWS

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueServiceNotebookRole AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.

9 ottobre 2023

AWS Glue Studio supporta cinque nuove trasformazioni integrate

AWS Glue Studio supporta le seguenti cinque nuove trasformazioni integrate: Record matching, Remove null rows, Parse JSON column, Extract JSON path e Regex extractor. Per ulteriori informazioni, consulta Modifica AWS Glue dei nodi di trasformazione dei dati gestiti.

11 agosto 2023

Aggiornamento della politica AWSGlueServiceRole AWS gestita

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueServiceRole AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.

4 agosto 2023

Supporto per il crawling delle tabelle Apache Hudi

Sono state aggiunte informazioni sull'utilizzo AWS Glue per eseguire la scansione delle tabelle Hudi nei bucket Amazon S3 e sulla registrazione delle tabelle Hudi in. AWS Glue Data Catalog Per ulteriori informazioni, consulta le pagine Which data stores can I crawl? e Crawler properties.

21 luglio 2023

Aggiornamento della politica gestita AWSGlueConsoleFullAccess AWS

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.

14 luglio 2023

Supporto per il crawling delle tabelle Apache Iceberg

Sono state aggiunte informazioni sull'utilizzo AWS Glue per eseguire la scansione delle tabelle Iceberg nei bucket Amazon S3 e sulla registrazione delle tabelle Iceberg in. AWS Glue Data Catalog Per ulteriori informazioni, consulta le pagine Which data stores can I crawl? e Crawler properties.

7 luglio 2023

Support per AWS Glue with Ray

Sono state aggiunte informazioni su AWS Glue with Ray, un nuovo motore in grado di supportare i AWS Glue lavori. Riorganizzato il contenuto esistente AWS Glue con Spark per chiarire le ambiguità.

30 maggio 2023

Support per la qualità AWS Glue dei dati (GA)

AWS Glue La qualità dei dati è ora disponibile a livello generale. AWS Glue Data Quality ti aiuta a valutare e monitorare la qualità dei tuoi dati. Per informazioni su come utilizzare AWS Glue Data Quality con Data Catalog, consulta AWS Glue Data Quality. Per ulteriori informazioni sulla qualità AWS Glue dei dati per AWS Glue Studio, consulta Valutazione della qualità dei dati con AWS Glue Studio.

24 maggio 2023

Supporto per tipi di worker di grandi dimensioni per i processi Apache Spark

È ora disponibile il supporto per l'uso dei tipi di worker G.4X e G.8X per i processi Apache Spark. Questi tipi di worker sono adatti per i processi i cui carichi di lavoro contengono trasformazioni, aggregazioni, join e query con i maggiori requisiti. Per ulteriori informazioni, consulta Aggiungere lavori in AWS Glue.

8 maggio 2023

Supporto per la creazione di indici di partizione durante il crawling delle tabelle

Sono state aggiunte informazioni sul modo in cui i crawler supportano la creazione di indici di partizione per le tabelle rilevate dal crawler. Per ulteriori informazioni, consulta la pagina Setting the partition index crawler configuration option.

24 aprile 2023

Supporto per i parametri di utilizzo delle risorse

Sono state aggiunte informazioni sulla visualizzazione dell'utilizzo delle risorse del servizio e sulla configurazione degli allarmi in Amazon. CloudWatch Per ulteriori informazioni, consulta la pagina AWS Glue resource monitoring.

7 aprile 2023

Aggiornamento della politica gestita AWSGlueConsoleFullAccess AWS

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.

28 marzo 2023

Sono state aggiunte linee guida per l'utilizzo AWS Glue con e AWS SDK con esempi

La Guida per gli AWS Glue sviluppatori contiene due nuove sezioni che forniscono informazioni utili per l'utilizzo AWS Glue con un AWS SDK. Per ulteriori informazioni, consulta AWS Glue Using with an AWS SDK e Code examples for AWS Glue using AWS SDKs.

23 febbraio 2023

Aggiornamento della documentazione per IAM with AWS Glue

Informazioni riorganizzate e aggiunte sull'utilizzo IAM con AWS Glue. Per ulteriori informazioni, consulta Identity and Access Management per AWS Glue.

15 febbraio 2023

Support per l'esecuzione ETL di processi di streaming nella AWS Glue versione 4.0

Sono state aggiunte informazioni sul supporto per l'esecuzione di ETL lavori di streaming nella versione 4.0 di Glue e nuove opzioni per la connessione a un cluster Kafka o a un cluster Amazon Managed Streaming for Apache Kafka e Amazon Kinesis Data Streams. Per ulteriori informazioni, consulta Aggiungere ETL lavori di streaming in e Tipi AWS Glue e opzioni di connessione per in. ETL AWS Glue

8 febbraio 2023

Supporto per il crawling delle origini dati MongoDB Atlas

Sono state aggiunte informazioni sull'utilizzo AWS Glue per la scansione delle fonti di dati MongoDB Atlas. Per ulteriori informazioni, consulta Quali archivi di dati posso scansionare? , proprietà di connessione MongoDB e MongoDB Atlas e Utilizzo di una connessione MongoDB o MongoDB Atlas.

6 febbraio 2023

Supporto per il crawling delle tabelle Delta Lake con un connettore Delta Lake nativo

Sono state aggiunte informazioni sull'utilizzo AWS Glue per la scansione delle tabelle Delta Lake utilizzando un connettore Delta Lake nativo. Questa funzionalità ti consente di utilizzare i motori di AWS query per interrogare direttamente il registro delle transazioni Delta e utilizzare funzionalità come viaggi nel tempo e ACID garanzie, e di sincronizzare i metadati Delta Lake dai file di transazione di Amazon S3 nel Data Catalog per abilitare le autorizzazioni alle colonne sulle tue query in Lake Formation. Per ulteriori informazioni, consulta Come specificare le opzioni di configurazione per un archivio di dati Delta Lake e Interrogazione delle tabelle Delta Lake.

15 dicembre 2022

Support for AWS Glue Data Quality (anteprima)

Il supporto è ora disponibile per AWS Glue Data Quality (anteprima). AWS Glue Data Quality consente di valutare e monitorare la qualità dei dati quando si utilizza la AWS Glue versione 3.0. Per informazioni su come utilizzare AWS Glue Data Quality con Data Catalog, vedi AWS Glue Data Quality (anteprima). Per ulteriori informazioni sulla qualità AWS Glue dei dati per AWS Glue Studio, consulta Valutazione della qualità dei dati con AWS Glue Studio.

30 novembre 2022

Supporto per un nuovo connettore Amazon Redshift Spark con nuove funzionalità e miglioramenti delle prestazioni

È ora disponibile il supporto per un nuovo connettore Amazon Redshift Spark con un nuovo JDBC driver da utilizzare con i AWS Glue ETL processi di creazione di applicazioni Apache Spark che leggono e scrivono su dati in Amazon Redshift come parte delle pipeline di acquisizione e trasformazione dei dati. Per ulteriori informazioni, consulta Spostamento di dati da e verso Amazon Redshift.

29 novembre 2022

Support per AWS Glue la versione 4.0.

Sono state aggiunte informazioni sul supporto per la AWS Glue versione 4.0. Le funzionalità includono il supporto nativo per i framework data lake aperti con Apache Hudi, Delta Lake e Apache Iceberg e il supporto nativo per il plug-in di archiviazione cloud shuffle basato su Amazon S3 (un plug-in Apache Spark) per utilizzare Amazon S3 per la capacità di archiviazione shuffle ed elastica. Per ulteriori informazioni, consulta le note di AWS Glue rilascio e la migrazione dei AWS Glue lavori alla AWS Glue versione 4.0.

28 novembre 2022

AWS Glue Studio ora offre trasformazioni visive personalizzate

Le trasformazioni visive personalizzate consentono ai clienti di definire, riutilizzare e condividere la logica specifica dell'azienda tra ETL i propri team. Per ulteriori informazioni, consulta Trasformazioni visive personalizzate.

28 novembre 2022

Support per l'utilizzo del AWS Glue crawler per pubblicare metadati per gli archivi dati JDBC

È ora disponibile il supporto per l'utilizzo del AWS Glue crawler per pubblicare metadati come commenti e tipi grezzi nel Data Catalog per gli archivi di dati. JDBC Per ulteriori informazioni, consulta Parametri impostati nelle tabelle del Catalogo dati dal crawler, Proprietà del crawler e struttura. JdbcTarget

18 novembre 2022

Supporto per il crawling di datastore Snowflake

È ora disponibile il supporto per AWS Glue eseguire la scansione delle tabelle e delle viste Snowflake e per pubblicare i metadati nel Data Catalog come voce di tabella. Per le tabelle esterne Snowflake in Amazon S3, il crawler esegue il crawling anche della posizione Amazon S3 e del tipo di formato di file della tabella esterna e lo compila come parametri della tabella. Per ulteriori informazioni, consulta Quali datastore posso sottoporre a crawling?, Proprietà della connessione a AWS Glue e Parametri impostati nelle tabelle del catalogo di dati dal crawler.

18 novembre 2022

Supporto per una migliore gestione dello shuffle delle applicazioni Spark

È ora disponibile il supporto per un nuovo plug-in di archiviazione cloud shuffle per Apache Spark. Per ulteriori informazioni, consulta Plug-in shuffle di AWS Glue Spark con Amazon S3 e Plug-in di archiviazione cloud shuffle per Apache Spark.

15 novembre 2022

È stato aggiunto il supporto per gli obiettivi di Data Catalog durante l'accelerazione delle scansioni e le notifiche degli eventi di Amazon S3

Oltre al supporto esistente per i target Amazon S3, è ora disponibile il supporto per accelerare le scansioni per le destinazioni Data Catalog utilizzando le notifiche di eventi di Amazon S3. Per ulteriori informazioni, consulta Accelerazione della ricerca per indicizzazione usando le notifiche eventi Amazon S3.

13 ottobre 2022

Supporto per specificare il numero massimo di tabelle che un crawler può creare

È ora disponibile il supporto per specificare il numero massimo di tabelle che il crawler può creare. Per ulteriori informazioni, consulta la pagina Come specificare il numero massimo di tabelle che il crawler può creare.

6 settembre 2022

Supporto per Python 3.9 nei job della shell Python in AWS Glue

Il supporto è ora disponibile per l'esecuzione di script compatibili con Python 3.9 nei AWS Glue job della shell Python in e per la scelta di utilizzare set di librerie preconfezionate. Per ulteriori informazioni, consulta Processi della shell Python in AWS Glue.

11 agosto 2022

Support per l'esecuzione di AWS Glue lavori non urgenti o non urgenti utilizzando capacità inutilizzata

È ora disponibile il supporto per la configurazione di esecuzioni flessibili per processi non urgenti come processi di pre-produzione, test e caricamenti di dati una tantum. Per ulteriori informazioni, consulta Aggiungere lavori in. AWS Glue

9 agosto 2022

Il supporto per un nuovo tipo di worker per i processi di streaming

Il supporto di questo servizio di Support per l'uso del tipo di worker G.025X per processi di streaming a basso volume. Per ulteriori informazioni, consulta Aggiungere lavori in AWS Glue.

14 luglio 2022

Support per l'uso di Kafka SASL nelle connessioni AWS Glue

Il supporto è ora disponibile per l'uso di Kafka SASL nelle AWS Glue connessioni. Per ulteriori informazioni, consulta AWS Glue Proprietà di connessione Kafka per l'autenticazione client.

5 luglio 2022

Supporto per il connettore Apache Kafka per gli schemi protobuf

Il supporto di Apache Kafka Connector è attualmente disponibile per gli schemi Protobuf. Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.

9 giugno 2022

Support per Auto Scaling for AWS Glue jobs (GA)

Sono state aggiunte informazioni sull'utilizzo di Auto Scaling for jobs nella AWS Glue versione 3.0 per scalare dinamicamente le risorse di elaborazione. Per ulteriori informazioni, consulta Utilizzo di Auto Scaling per AWS Glue.

14 aprile 2022

Aggiornamento della documentazione per lo AWS Glue sviluppo e il test degli script di lavoro AWS Glue

Informazioni riorganizzate e aggiunte sui metodi di sviluppo e test disponibili per AWS Glue, comprese le istruzioni per lo sviluppo con Docker. Per ulteriori informazioni, consulta Sviluppo e test di script di AWS Glue lavoro.

14 marzo 2022

Aggiunta di buffer di protocollo (protobuf) come formato di dati supportato per il registro degli schemi AWS Glue

Sono state aggiunte informazioni su Protobuf come formato di dati supportato (oltre a e). AVRO JSON Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.

25 febbraio 2022

Supporto per il crawling delle tabelle Delta Lake

Sono state aggiunte informazioni sull'utilizzo AWS Glue per la scansione delle tabelle Delta Lake. Per ulteriori informazioni, consulta Come specificare le opzioni di configurazione per un archivio dati Delta Lake.

24 febbraio 2022

Support per approfondimenti sul AWS Glue lavoro

Sono state aggiunte informazioni sull'utilizzo di AWS Glue Job Insights per semplificare il debug e l'ottimizzazione dei job. AWS Glue Per ulteriori informazioni, consulta Monitoraggio con AWS Glue Job Insights.

8 febbraio 2022

Supporto per la scansione di tabelle Data Catalog basate su Amazon S3 utilizzando un endpoint VPC

Oltre agli archivi dati di Amazon S3, puoi configurare le tabelle del catalogo dati basate su Amazon S3 in modo che siano accessibili solo da un ambiente Amazon Virtual Private Cloud (VPCAmazon), per scopi di sicurezza, audit o controllo. Per ulteriori informazioni, consulta Scansione di tabelle del catalogo dati basate su Amazon S3 o Amazon S3 Data Store utilizzando un endpoint. VPC

3 febbraio 2022

Supporto per le tavole governate dalla Lake Formation

Sono state aggiunte informazioni sul AWS Glue supporto per le tabelle governate da Lake Formation, che supportano ACID transazioni, compattazione automatica dei dati e query sui viaggi nel tempo. Per ulteriori informazioni, consulta la guida per AWS Glue APIgli AWS Lake Formation sviluppatori.

30 novembre 2021

Nuove politiche AWS gestite aggiunte per sessioni e notebook interattivi

Nuove politiche gestite per IAM fornire una maggiore sicurezza per l'utilizzo AWS Glue con sessioni e notebook interattivi. Per ulteriori informazioni, consulta la sezione Policy gestite da AWS per AWS Glue.

30 novembre 2021

Il registro dello schema Glue ora supportato con i processi di streaming

È possibile creare processi di streaming che accedono alle tabelle che fanno parte di Glue Schema Registry. Per ulteriori informazioni, consulta AWS Glue Schema Registry e Adding Streaming Jobs in ETL. AWS Glue

15 novembre 2021

Supporto per nuove caratteristiche di machine learning

Aggiunte informazioni sulle nuove funzionalità per la trasformazione di machine learning Ricerca corrispondenze, tra cui la corrispondenza incrementale e il punteggio di corrispondenza. Per ulteriori informazioni, consulta Ricerca di corrispondenze incrementali e Stima della qualità delle corrispondenze utilizzando i punteggi di confidenza delle corrispondenze.

31 ottobre 2021

(Anteprima privata) Support per AWS Glue lavori flessibili

Sono state aggiunte informazioni sulla configurazione dei job AWS Glue Spark con una classe di esecuzione flessibile, adatta per lavori che non richiedono tempo e i cui tempi di inizio e completamento possono variare. Per ulteriori informazioni, consulta Adding Jobs in. AWS Glue

29 ottobre 2021

Supporto per accelerare la ricerca per indicizzazione usando le notifiche eventi Amazon S3

Sono state aggiunte informazioni sull'accelerazione della ricerca per indicizzazione utilizzando le notifiche degli eventi Amazon S3. Per ulteriori informazioni, consulta Accelerazione della ricerca per indicizzazione usando le notifiche eventi Amazon S3.

15 ottobre 2021

Opzioni di configurazione di sicurezza aggiuntive relative al controllo degli accessi e VPCs

Sono state aggiunte informazioni su come configurare nuove autorizzazioni di controllo degli accessi AWS Glue e sulla configurazione di. VPCs Per ulteriori informazioni, consulta AWS Tags in AWS Glue, Politiche basate sull'identità (IAMpolitiche) che controllano le impostazioni utilizzando chiavi di condizione o chiavi contestuali e Configurazione di tutte le AWS chiamate da effettuare. VPC

13 ottobre 2021

Support per le policy VPC degli endpoint

Sono state aggiunte informazioni sul supporto per le policy degli endpoint Virtual Private Cloud (VPC) in. AWS Glue Per ulteriori informazioni, vedere AWS Glue and interface VPC endpoints ()AWS PrivateLink.

11 ottobre 2021

Glue Studio è ora disponibile in Cina

AWS Glue Studio è ora disponibile nelle regioni Cina, Pechino e Ningxia.

11 ottobre 2021

AWS Glue Studio offre la creazione di notebook, per la modifica interattiva dei lavori

I notebook consentono di scrivere ed eseguire codice, visualizzare i risultati e condividere informazioni. In genere, i data scientist utilizzano i notebook per esperimenti e attività di esplorazione dei dati. Per ulteriori informazioni, consulta Utilizzo di notebook.

1° ottobre 2021

L'accesso diretto alle fonti di streaming ora disponibile

Quando aggiungi fonti di dati al tuo ETL lavoro nell'editor visivo, puoi fornire informazioni per accedere al flusso di dati invece di dover utilizzare un database e una tabella del Data Catalog.

30 settembre 2021

È stata documentata la politica di supporto delle AWS Glue versioni

Sono state aggiunte informazioni sulla politica di supporto delle AWS Glue versioni e sulle fasi di fine vita per alcune AWS Glue versioni. Per ulteriori informazioni, consulta Policy di supporto versione AWS Glue.

24 settembre 2021

I connettori personalizzati possono ora essere utilizzati con le anteprime dei dati

Quando modifichi il nodo dell'origine dati utilizzando un connettore personalizzato, puoi visualizzare in anteprima il set di dati scegliendo la scheda Anteprima dati. Per ulteriori informazioni, consulta Connettori personalizzati.

24 settembre 2021

Support per sessioni AWS Glue interattive (anteprima privata)

(Anteprima privata) Sono state aggiunte informazioni sull'utilizzo di sessioni AWS Glue interattive per eseguire carichi di lavoro Spark nel cloud da qualsiasi notebook Jupyter. Le sessioni interattive sono il metodo preferito per sviluppare il codice AWS Glue extract, transform e load (ETL) quando si utilizza la versione 2.0 o successiva. AWS Glue Per ulteriori informazioni, vedete Configurazione ed esecuzione di sessioni AWS Glue interattive per Jupyter Notebook.

24 agosto 2021

Supporto per la creazione di flussi di lavoro dai progetti (GA)

Sono state aggiunte informazioni sulla codifica dei casi d'uso comuni di estrazione, trasformazione e load (ETL) nei blueprint e sulla successiva creazione di flussi di lavoro a partire dai blueprint. Consente agli analisti di dati di creare ed eseguire facilmente processi complessi. ETL Per ulteriori informazioni, consulta Esecuzione di ETL attività complesse utilizzando blueprint e flussi di lavoro in. AWS Glue

23 agosto 2021

Support per AWS Glue la versione 3.0.

Sono state aggiunte informazioni sul supporto per la AWS Glue versione 3.0 che supporta l'aggiornamento del motore Apache Spark 3.0 per l'esecuzione dei ETL job Apache Spark e altre ottimizzazioni e aggiornamenti. Per ulteriori informazioni, consulta le note di AWS Glue rilascio e la migrazione dei lavori alla versione 3.0. AWS GlueAWS Glue Altre funzionalità di questa versione includono lo AWS Glue shuffle manager, un CSV lettore SIMD vettoriale e i predicati delle partizioni del catalogo. Per ulteriori informazioni, consulta AWS Glue Spark shuffle manager con Amazon S3, Opzioni di formato per ETL ingressi e uscite e Filtraggio lato server utilizzando i predicati delle partizioni del AWS Glue catalogo.

18 agosto 2021

AWS GovCloud (US) Region

AWS Glue Studio è ora disponibile in AWS GovCloud (US) Region

18 agosto 2021

Creazione di shell Python disponibile in AWS Glue Studio

Quando si crea un nuovo processo, è ora possibile scegliere di creare un processo di shell Python. Per ulteriori informazioni, consulta Avvio della creazione del processo e Modifica di processi shell Python in AWS Glue Studio.

13 agosto 2021

Support per l'avvio di un flusso di lavoro con un EventBridge evento Amazon

Sono state aggiunte informazioni su come AWS Glue può essere un consumatore di eventi in un'architettura basata sugli eventi. Per ulteriori informazioni, consulta Avvio di un AWS Glue flusso di lavoro con un EventBridge evento Amazon e Visualizzazione degli EventBridge eventi che hanno avviato un flusso di lavoro.

14 luglio 2021

Aggiunta JSON come formato di dati supportato per il registro degli AWS Glue schemi

Sono state aggiunte informazioni su JSON come formato di dati supportato (oltre aAVRO). Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.

30 giugno 2021

Crea lavori di AWS Glue streaming senza una tabella Data Catalog

La funzione create_data_frame_from_optionsPython o gli script getSourceper Scala supportano la creazione di ETL lavori di streaming che fanno riferimento direttamente ai flussi di dati invece di richiedere una tabella Data Catalog.

15 giugno 2021

AWS Glue le trasformazioni di apprendimento automatico ora supportano le chiavi AWS Key Management Service

È possibile specificare una configurazione o una AWS KMS chiave di sicurezza quando si configurano le trasformazioni di AWS Glue Machine Learning con la consoleCLI, il o. AWS Glue APIs Per ulteriori informazioni, vedere Utilizzo della crittografia dei dati con Machine Learning Transforms e AWS Glue Machine Learning API.

15 giugno 2021

Aggiornamento della politica AWSGlueConsoleFullAccess AWS gestita

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.

10 giugno 2021

Visualizzare il set di dati del processo durante la creazione e la modifica dei processi

È possibile utilizzare la nuova scheda di anteprima dati per un nodo nel diagramma del processo per visualizzare un esempio dei dati elaborati da tale nodo. Per ulteriori informazioni, consulta Utilizzo delle anteprime dei dati nell'editor visivo dei processi.

7 giugno 2021

Supporto per specificare un valore che indica la posizione della tabella per l'output del crawler.

Sono state aggiunte informazioni su come specificare un valore che indica la posizione della tabella durante la configurazione dell'output del crawler. Per ulteriori informazioni, consulta Come specificare la posizione della tabella.

4 giugno 2021

Supporto per il crawling di un campione di file in un set di dati durante il crawling di un archivio dati Amazon S3

Sono state aggiunte informazioni su come eseguire il crawling di un campione di file durante il crawling di Amazon S3. Per ulteriori informazioni, consulta Proprietà del crawler.

10 maggio 2021

Support per la scrittura AWS Glue ottimizzata del parquet

Sono state aggiunte informazioni sull'utilizzo del parquet writer AWS Glue ottimizzato DynamicFrames per creare o aggiornare tabelle con la parquet classificazione. Per ulteriori informazioni, consultate Creazione di tabelle, aggiornamento dello schema e aggiunta di nuove partizioni nel catalogo dati da AWS Glue ETL Jobs e Opzioni di formato per ETL input e output in. AWS Glue

4 maggio 2021

Supporto per le password di autenticazione client Kafka

Sono state aggiunte informazioni su come i ETL job di streaming AWS Glue supportano l'autenticazione dei certificati SSL client con i produttori di stream Apache Kafka. Ora puoi fornire un certificato personalizzato durante la definizione di una AWS Glue connessione a un cluster Apache Kafka, che AWS Glue verrà utilizzato per l'autenticazione con esso. Per ulteriori informazioni, vedere AWS Glue Connection Properties and Connection. API

28 Aprile 2021

Supporto per il consumo di dati da Amazon Kinesis Data Streams in un altro account nei lavori di streaming ETL

Sono state aggiunte informazioni sulla creazione di un ETL processo di streaming per utilizzare i dati di Amazon Kinesis Data Streams in un altro account. Per ulteriori informazioni, consulta Aggiungere ETL lavori di streaming in. AWS Glue

30 marzo 2021

SQLtrasformazione disponibile

È possibile utilizzare un nodo di SQLtrasformazione per scrivere la propria trasformazione sotto forma di SQL query. Per ulteriori informazioni, vedere Utilizzo di una SQL query per trasformare i dati.

23 marzo 2021

Supporto per la creazione di flussi di lavoro dagli schemi (anteprima pubblica)

(Anteprima pubblica) Sono state aggiunte informazioni sulla codifica dei casi d'uso comuni di estrazione, trasformazione e caricamento (ETL) nei blueprint e sulla successiva creazione di flussi di lavoro a partire dai blueprint. Consente agli analisti di dati di creare ed eseguire facilmente processi complessi. ETL Per ulteriori informazioni, consulta Esecuzione di ETL attività complesse utilizzando blueprint e flussi di lavoro in. AWS Glue

22 marzo 2021

I connettori possono essere utilizzati per le destinazioni dati

Ora è supportato l'utilizzo di un Marketplace AWS connettore o di un connettore personalizzato per la destinazione dei dati. Per ulteriori informazioni, consulta Creazione di processi con connettori personalizzati.

15 marzo 2021

Support per le metriche di importanza delle colonne per le trasformazioni dell'apprendimento AWS Glue automatico

Sono state aggiunte informazioni sulla visualizzazione delle metriche di importanza delle colonne quando si lavora con le trasformazioni di apprendimento AWS Glue automatico. Per ulteriori informazioni, consulta Working with Machine Learning Transforms sulla AWS Glue console.

5 febbraio 2021

Job scheduling ora disponibile in AWS Glue Studio

È possibile definire una pianificazione basata sul tempo per le esecuzioni del processo in AWS Glue Studio. È possibile utilizzare la console per creare una pianificazione di base o definire una pianificazione più complessa utilizzando la sintassi cron di tipo Unix. Per ulteriori informazioni, consulta Pianificazione delle esecuzioni.

21 dicembre 2020

AWS Glue Sono stati rilasciati connettori personalizzati

AWS Glue I connettori personalizzati consentono di scoprire e abbonarsi ai connettori in Marketplace AWS. Abbiamo anche rilasciato le interfacce di runtime AWS Glue Spark per collegare connettori creati per Apache Spark Datasource, Athena federated query e. JDBC APIs Per ulteriori informazioni, consulta Utilizzo di connettori e connessioni con. AWS Glue Studio

21 dicembre 2020

Support per l'esecuzione ETL di processi di streaming nella AWS Glue versione 2.0

Sono state aggiunte informazioni sul supporto per l'esecuzione di ETL lavori di streaming nella versione 2.0 di Glue. Per ulteriori informazioni, consulta Aggiungere ETL lavori di streaming in AWS Glue.

18 dicembre 2020

Supporto per il partizionamento del carico di lavoro con esecuzione limitata

Sono state aggiunte informazioni sull'abilitazione del partizionamento del carico di lavoro per configurare i limiti superiori della dimensione del set di dati o il numero di file elaborati durante le esecuzioni dei job. ETL Per ulteriori informazioni, consulta Partizionamento del carico di lavoro con esecuzione limitata.

23 novembre 2020

Supporto per una gestione avanzata delle partizioni

Sono state aggiunte informazioni su come utilizzare new per aggiungere o eliminare un indice APIs di partizione da/a una tabella esistente. Per ulteriori informazioni, consulta Utilizzo degli indici delle partizioni.

23 novembre 2020

Support per il registro AWS Glue degli schemi

Sono state aggiunte informazioni sull'utilizzo del registro degli AWS Glue schemi per individuare, controllare ed evolvere centralmente gli schemi. Per ulteriori informazioni, vedere AWS Glue Schema Registry.

19 novembre 2020

Support per il formato di input grok nei lavori di streaming ETL

Aggiunte informazioni sull'applicazione dei pattern Grok alle origini di streaming, ad esempio i file di log. Per ulteriori informazioni, consulta Applicazione di pattern Grok alle sorgenti di streaming.

17 novembre 2020

Support per l'aggiunta di tag ai flussi di lavoro sulla console AWS Glue

Sono state aggiunte informazioni sull'aggiunta di tag durante la creazione di un flusso di lavoro utilizzando la console AWS Glue . Per ulteriori informazioni, consulta Creazione e creazione di un flusso di lavoro utilizzando la AWS Glue console.

27 ottobre 2020

Supporto per le esecuzione incrementale del crawler

Aggiunte informazioni sul supporto per le esecuzioni di crawler incrementali, che eseguono il crawling solo delle cartelle Amazon S3 aggiunte dall'ultima esecuzione. Per ulteriori informazioni, consulta Crawling incrementale.

21 ottobre 2020

Supporto per il rilevamento dello schema per le sorgenti di ETL dati in streaming. supporto per sorgenti di dati in streaming Avro e kafka ETL autogestito

I job di estrazione, trasformazione e caricamento (ETL) in streaming ora AWS Glue possono rilevare automaticamente lo schema dei record in entrata e gestire le modifiche allo schema per record. Sono ora supportate le origini di dati Kafka autogestite. I ETL job di streaming ora supportano il formato Avro nelle fonti di dati. Per ulteriori informazioni, consulta Streaming ETL in AWS Glue, Definizione delle proprietà del lavoro per un ETL lavoro di streaming e Note e restrizioni per le sorgenti di streaming Avro.

7 ottobre 2020

Supporto per il crawling delle origini dei dati MongoDB e DocumentDB

Aggiunte informazioni sul supporto per il crawling delle origini dati MongoDB e Amazon DocumentDB (con compatibilità MongoDB). Per ulteriori informazioni, consulta Definizione di crawler.

5 ottobre 2020

Support per la FIPS conformità

Sono state aggiunte informazioni sugli FIPS endpoint per i clienti che richiedono FIPS 140-2 moduli crittografici convalidati per accedere ai dati utilizzando. AWS GluePer ulteriori informazioni, consulta Conformità. FIPS

23 settembre 2020

AWS Glue Studio fornisce un'interfaccia visiva facile da usare per la creazione e il monitoraggio dei lavori

Ora è possibile utilizzare una semplice interfaccia grafica per comporre lavori che spostano e trasformano i dati ed eseguirli su AWS Glue. È quindi possibile utilizzare la dashboard Job Run AWS Glue Studio per monitorare ETL l'esecuzione e assicurarsi che i job funzionino come previsto. Per ulteriori informazioni, consulta AWS Glue Studio Guida per l'utente.

23 settembre 2020

Supporto per la creazione di indici di tabella per migliorare le prestazioni delle query

Aggiunte informazioni sulla creazione di indici di tabella per consentire il recupero di un sottoinsieme di partizioni da una tabella. Per ulteriori informazioni, consulta Utilizzo degli indici delle partizioni.

9 settembre 2020

Support per tempi di avvio ridotti durante l'esecuzione di ETL job Apache Spark nella AWS Glue versione 2.0.

Sono state aggiunte informazioni sul supporto per la AWS Glue versione 2.0 che fornisce un'infrastruttura aggiornata per l'esecuzione dei ETL job di Apache Spark con tempi di avvio ridotti, modifiche nella registrazione e supporto per specificare moduli Python aggiuntivi a livello di job. Per ulteriori informazioni, consulta Note di AWS Glue rilascio e Running Spark Jobs with Reduced Startup Times ETL.

10 agosto 2020

Supporto per limitare il numero di esecuzioni simultanee del flusso di lavoro.

Aggiunte informazioni su come limitare il numero di esecuzioni simultanee per un determinato flusso di lavoro. Per ulteriori informazioni, consulta Creazione e creazione di un flusso di lavoro utilizzando la AWS Glue console.

10 agosto 2020

Supporto per la scansione di un data store Amazon S3 utilizzando un endpoint VPC

Sono state aggiunte informazioni sulla configurazione del tuo data store Amazon S3 a cui accedere solo da un ambiente Amazon Virtual Private Cloud (VPCAmazon), per scopi di sicurezza, audit o controllo. Per ulteriori informazioni, consulta Scansione di un Amazon S3 Data Store utilizzando un endpoint. VPC

7 agosto 2020

Supporto per la ripresa delle esecuzioni del flusso di lavoro

Aggiunte informazioni su come riprendere le esecuzioni del flusso di lavoro completate solo parzialmente perché uno o più nodi (processi o crawler) non sono stati completati correttamente. Per ulteriori informazioni, consulta Ripresa e ripristino dell'esecuzione di un flusso di lavoro.

27 luglio 2020

Supporto per l'abilitazione di certificati emessi da CA privati nelle connessioni Kafka in AWS Glue.

Aggiunte informazioni sulle nuove opzioni di connessione che supportano l'abilitazione dei certificati emessi da una CA privati per le connessioni Kafka in AWS Glue. Per ulteriori informazioni, consulta Tipi e opzioni di connessione per ETL i parametri interni AWS Glue e speciali utilizzati da. AWS Glue

20 luglio 2020

Supporto per la lettura dei dati DynamoDB in un altro account

Sono state aggiunte informazioni sul AWS Glue supporto per la lettura dei dati dalla tabella DynamoDB di un altro AWS account Per ulteriori informazioni, vedere Lettura da dati DynamoDB in un altro account.

17 luglio 2020

Support per una connessione writer DynamoDB AWS Glue nella versione 1.0 o successiva

Aggiunte informazioni sul supporto per il writer DynamoDB e opzioni di connessione nuove o aggiornate per la lettura o la scrittura di DynamoDB. Per ulteriori informazioni, consulta Tipi e opzioni di connessione per ETL in. AWS Glue

17 luglio 2020

Supporto per i collegamenti alle risorse e per il controllo degli accessi tra account utilizzando sia AWS Glue che Lake Formation

Sono stati aggiunti contenuti sui nuovi oggetti del Data Catalog denominati link alle risorse e su come gestire la condivisione delle risorse del Data Catalog tra account con AWS Glue e AWS Lake Formation. Per ulteriori informazioni, consulta Concedere l'accesso multi-account e Link alle risorse della tabella.

7 luglio 2020

Supporto per il campionamento dei registri durante il crawling dei datastore DynamoDB

Sono state aggiunte informazioni sulle nuove proprietà che puoi configurare durante il crawling di un datastore DynamoDB. Per ulteriori informazioni, consulta Proprietà del crawler.

12 giugno 2020

Supporto per l'arresto di un'esecuzione del flusso di lavoro.

Sono state aggiunte informazioni su come interrompere l'esecuzione di un flusso di lavoro per un determinato flusso di lavoro. Per ulteriori informazioni, vedere Arresto di un'esecuzione del flusso di lavoro.

14 maggio 2020

Support per i lavori di streaming ETL Spark

Sono state aggiunte informazioni sulla creazione di lavori di estrazione, trasformazione e caricamento (ETL) con sorgenti di dati in streaming. Per ulteriori informazioni, vedete Aggiungere ETL lavori di streaming in AWS Glue.

27 aprile 2020

Support per la creazione di tabelle, l'aggiornamento dello schema e l'aggiunta di nuove partizioni nel Data Catalog dopo l'esecuzione di un job ETL

Sono state aggiunte informazioni su come abilitare la creazione di tabelle, l'aggiornamento dello schema e l'aggiunta di nuove partizioni per visualizzare i risultati del ETL lavoro nel Data Catalog. Per ulteriori informazioni, vedere Creazione di tabelle, aggiornamento dello schema e aggiunta di nuove partizioni nel catalogo dati da AWS Glue ETL Jobs.

2 aprile 2020

Support per specificare una versione per il formato di dati Apache Avro come ETL input e output in AWS Glue

Sono state aggiunte informazioni sulla specificazione di una versione per il formato di dati Apache Avro come input e output in. ETL AWS Glue La versione predefinita 1.7. Puoi utilizzare l'opzione del formato version per specificare Avro versione 1.8 per abilitare la lettura/scrittura logica. Per ulteriori informazioni, consulta Opzioni di formato per ingressi e ETL uscite in. AWS Glue

31 marzo 2020

Support per il committer EMRFS ottimizzato per S3 per la scrittura di dati Parquet in Amazon S3

Sono state aggiunte informazioni su come impostare un nuovo flag per abilitare il committer EMRFR ottimizzato per S3 per scrivere dati Parquet in Amazon S3 durante la creazione o l'aggiornamento di un lavoro. AWS Glue Per ulteriori informazioni, consulta Parametri speciali utilizzati da. AWS Glue

30 marzo 2020

Il supporto per l'apprendimento automatico si trasforma in una risorsa gestita da tag di AWS risorse

Sono state aggiunte informazioni sull'utilizzo dei tag AWS delle risorse per gestire e controllare l'accesso alle trasformazioni del machine learning. AWS Glue Puoi assegnare tag di AWS risorsa a job, trigger, endpoint, crawler e trasformarsi in machine learning. AWS GluePer ulteriori informazioni, consulta Tag in.AWSAWS Glue

2 marzo 2020

Supporto per argomenti di lavoro non sovrascrivibili

Aggiunte informazioni sul supporto per parametri di lavoro speciali che non possono essere sovrascritti nei trigger o quando si esegue il processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

12 febbraio 2020

Supporto per nuove trasformazioni per l'utilizzo con set di dati in Amazon S3

Sono state aggiunte informazioni sulle nuove trasformazioni (Merge, Purge e Transition) ed esclusioni delle classi di storage Amazon S3 per applicazioni Apache Spark per l'utilizzo con set di dati in Amazon S3. Per ulteriori informazioni sul supporto per queste trasformazioni per Python, mergeDynamicFrameconsulta Working with Datasets in Amazon S3. Per Scala, vedi e Scala. mergeDynamicFramesAWS Glue GlueContext APIs

16 gennaio 2020

Support per l'aggiornamento del Data Catalog con nuove informazioni sulle partizioni da un lavoro ETL

Sono state aggiunte informazioni su come codificare uno script di estrazione, trasformazione e caricamento (ETL) per aggiornarlo AWS Glue Data Catalog con nuove informazioni sulla partizione. Con questa caratteristica, non è più necessario eseguire nuovamente il crawler al termine del processo per visualizzare le nuove partizioni. Per ulteriori informazioni, consulta Aggiornamento del catalogo dati con nuove partizioni.

15 gennaio 2020

Nuovo tutorial: utilizzo di un notebook SageMaker AI

È stato aggiunto un tutorial che dimostra come usare un SageMaker notebook Amazon per aiutarti a sviluppare i tuoi script ETL e quelli di machine learning. Vedi il tutorial: Usa un Amazon SageMaker Notebook con il tuo endpoint di sviluppo.

3 gennaio 2020

Supporto per la lettura da MongoDB e Amazon DocumentDB (compatibile con MongoDB)

Aggiunte informazioni sui nuovi tipi di connessione e opzioni di connessione per leggere e scrivere su MongoDB e Amazon DocumentDB (con compatibilità MongoDB). Per ulteriori informazioni, consulta Tipi e opzioni di connessione per ETL in AWS Glue.

17 dicembre 2019

Varie correzioni e chiarimenti

Sono state aggiunte diverse correzioni e chiarimenti. Sono state rimosse delle voci dal capitolo Problemi noti. Sono stati aggiunti avvisi che AWS Glue supportano solo le chiavi master simmetriche del cliente (CMKs) quando si specificano le impostazioni di crittografia del Data Catalog e si creano configurazioni di sicurezza. È stata aggiunta una nota che AWS Glue non supporta la scrittura su Amazon DynamoDB.

9 dicembre 2019

Support per JDBC driver personalizzati

Sono state aggiunte informazioni sulla connessione a sorgenti e destinazioni di dati con JDBC driver che AWS Glue non supportano in modo nativo, come My SQL version 8 e Oracle Database versione 18. Per ulteriori informazioni, vedere JDBC connectionType Valori.

25 novembre 2019

Support per il collegamento di notebook SageMaker AI a diversi endpoint di sviluppo

Sono state aggiunte informazioni su come collegare un notebook SageMaker AI a diversi endpoint di sviluppo. Aggiornamenti per descrivere la nuova azione della console per il passaggio a un nuovo endpoint di sviluppo e la nuova politica di SageMaker intelligenza artificialeIAM. Per ulteriori informazioni, consulta Working with Notebooks on the AWS Glue Console e Creazione di una policy IAM per Amazon SageMaker AI Notebooks.

21 novembre 2019

Support per la AWS Glue versione nelle trasformazioni di apprendimento automatico

Sono state aggiunte informazioni sulla definizione della AWS Glue versione in una trasformazione di apprendimento automatico per indicare con quale versione di AWS Glue una trasformazione di apprendimento automatico è compatibile. Per ulteriori informazioni, consulta Working with Machine Learning Transforms sulla AWS Glue console.

21 novembre 2019

Supporto per il riavvolgimento dei segnalibri di processo

Sono state aggiunte informazioni sul riavvolgimento dei segnalibri di processo per qualsiasi esecuzione precedente, con conseguente rielaborazione dei dati dell'esecuzione del processo successivo solo dall'esecuzione del processo con il segnalibro. Sono descritte due nuove opzioni secondarie per l'opzione job-bookmark-pause che consentono di eseguire un processo tra due segnalibri. Per ulteriori informazioni, vedere Tracciamento dei dati elaborati utilizzando i segnalibri di lavoro e i parametri speciali utilizzati da AWS Glue.

22 ottobre 2019

Support per JDBC certificati personalizzati per la connessione a un archivio dati

Sono state aggiunte informazioni sul AWS Glue supporto dei JDBC certificati personalizzati per SSL le connessioni a sorgenti o destinazioni di AWS Glue dati. Per ulteriori informazioni, consulta Uso di connessioni nella console AWS Glue.

10 ottobre 2019

Supporto per Python wheel

Sono state aggiunte informazioni sul AWS Glue supporto dei file wheel (insieme ai file egg) come dipendenze per i lavori della shell Python. Per ulteriori informazioni, consulta Fornire la propria libreria Python.

26 settembre 2019

Support per il controllo delle versioni degli endpoint di sviluppo in AWS Glue

Sono state aggiunte informazioni sulla definizione degli endpoint Glue version in fase di sviluppo. Glue versiondetermina le versioni di Apache Spark e Python supportate. AWS Glue Per ulteriori informazioni, consulta Aggiunta di un endpoint di sviluppo.

19 settembre 2019

Support per il monitoraggio AWS Glue tramite Spark UI

Sono state aggiunte informazioni sull'utilizzo dell'interfaccia utente di Apache Spark per monitorare ed eseguire il debug dei AWS Glue ETL job in esecuzione sul sistema dei AWS Glue job e delle applicazioni Spark sugli endpoint di sviluppo. AWS Glue Per ulteriori informazioni, consulta Monitoraggio tramite l'interfaccia utente di Spark. AWS Glue

19 settembre 2019

Miglioramento del supporto per lo sviluppo di ETL script locali utilizzando la libreria pubblica AWS Glue ETL

È stato aggiornato il contenuto della AWS Glue ETL libreria per riflettere il fatto che la AWS Glue versione 1.0 è ora supportata. Per ulteriori informazioni, consultate Sviluppo e test di ETL script a livello locale utilizzando la AWS Glue ETL libreria.

18 settembre 2019

Supporto per l'esclusione delle classi di archiviazione Amazon S3 durante l'esecuzione di processi

Sono state aggiunte informazioni sull'esclusione delle classi di storage Amazon S3 durante l'esecuzione di AWS Glue ETL processi che leggono file o partizioni da Amazon S3. Per ulteriori informazioni, consulta Esclusione delle classi di storage Amazon S3.

29 agosto 2019

Support per lo sviluppo di ETL script locali utilizzando la AWS Glue ETL libreria pubblica

Sono state aggiunte informazioni su come sviluppare e testare ETL gli script Python e Scala localmente senza la necessità di una connessione di rete. Per ulteriori informazioni, consulta Sviluppo e test di ETL script a livello locale utilizzando la libreria. AWS Glue ETL

28 agosto 2019

Problemi noti

Sono state aggiunte informazioni sui problemi noti in AWS Glue. Per ulteriori informazioni, consulta Problemi noti per AWS Glue.

28 agosto 2019

Il supporto per l'apprendimento automatico si trasforma in AWS Glue

Sono state aggiunte informazioni sulle funzionalità di apprendimento automatico fornite da AWS Glue per creare trasformazioni personalizzate. È possibile creare queste trasformazioni al momento della creazione di un processo. Per ulteriori informazioni, consulta Machine Learning Transforms in AWS Glue.

8 agosto 2019

Supporto per Amazon Virtual Private Cloud condiviso

Sono state aggiunte informazioni sul AWS Glue supporto per Amazon Virtual Private Cloud condiviso. Per ulteriori informazioni, consulta Shared Amazon VPCs.

6 agosto 2019

Support per il controllo delle versioni in AWS Glue

Sono state aggiunte informazioni sulla definizione delle Glue version proprietà del lavoro. AWS Glue version determina le versioni di Apache Spark e Python supportate. AWS Glue Per ulteriori informazioni, consulta Aggiungere lavori in. AWS Glue

24 luglio 2019

Supporto per le opzioni di configurazione aggiuntive per gli endpoint di sviluppo

Sono state aggiunte informazioni sulle opzioni di configurazione per gli endpoint di sviluppo con carichi di lavoro intensi in termini di memoria. È possibile scegliere tra due nuove configurazioni che offrono maggiore quantità di memoria per esecutore. Per ulteriori informazioni, consulta Lavorare con gli endpoint di sviluppo sulla AWS Glue console.

24 luglio 2019

Support per l'esecuzione di attività di estrazione, trasferimento e caricamento (ETL) utilizzando i flussi di lavoro

Sono state aggiunte informazioni sull'utilizzo di un nuovo costrutto chiamato workflow per progettare un'attività complessa di estrazione, trasformazione e caricamento (ETL) che AWS Glue può essere eseguita e monitorata come un'unica entità. Per ulteriori informazioni, vedere Esecuzione di ETL attività complesse utilizzando flussi di lavoro in. AWS Glue

20 giugno 2019

Supporto per Python 3.6 in processi shell di Python

Sono state aggiunte informazioni sul supporto di Python 3.6 in processi shell di Python. Puoi specificare Python 2.7 o Python 3.6 come proprietà di un processo. Per ulteriori informazioni, consulta Aggiunta di processi shell di Python in AWS Glue.

5 giugno 2019

Support per endpoint di cloud privato virtuale (VPC)

Sono state aggiunte informazioni sulla connessione diretta AWS Glue tramite un endpoint di interfaccia nel tuo. VPC Quando si utilizza un endpoint di VPC interfaccia, la comunicazione tra l'utente VPC e l'utente AWS Glue viene condotta in modo completo e sicuro all'interno della rete. AWS Per ulteriori informazioni, consulta Utilizzo AWS Glue con VPC gli endpoint.

4 giugno 2019

Support per la registrazione continua e in tempo reale dei AWS Glue lavori.

Sono state aggiunte informazioni sull'attivazione e la visualizzazione dei log dei job di Apache Spark in tempo reale, CloudWatch inclusi i registri dei driver, i log di ciascun executor e una barra di avanzamento dei job Spark. Per ulteriori informazioni, consulta l'articolo relativo alla registrazione continua dei processi AWS Glue.

28 maggio 2019

Supporto per le tabelle del Catalogo Dati esistenti come origini crawler

Sono state aggiunte informazioni su come specificare un elenco di tabelle del catalogo dati esistenti come origini crawler. I crawler possono quindi rilevare le modifiche agli schemi di tabella, aggiornare le definizioni di tabella e registrare nuove partizioni quando i nuovi dati diventano disponibili. Per ulteriori informazioni, consulta Proprietà dei crawler.

10 maggio 2019

Supporto per le opzioni di configurazione aggiuntive per i processi con elevati requisiti di memoria

Sono state aggiunte informazioni sulle opzioni di configurazione per i processi Apache Spark con carichi di lavoro con elevati requisiti di memoria. È possibile scegliere tra due nuove configurazioni che offrono maggiore quantità di memoria per esecutore. Per ulteriori informazioni, consulta Adding Jobs in. AWS Glue

5 aprile 2019

Support per CSV classificatori personalizzati

Sono state aggiunte informazioni sull'utilizzo di un CSV classificatore personalizzato per dedurre lo schema di vari tipi di dati. CSV Per ulteriori informazioni, consulta Scrittura di classificatori personalizzati.

26 marzo 2019

Support per i tag AWS delle risorse

Sono state aggiunte informazioni sull'utilizzo dei tag AWS delle risorse per aiutarti a gestire e controllare l'accesso alle tue AWS Glue risorse. Puoi assegnare tag di AWS risorsa a job, trigger, endpoint e crawler in. AWS GluePer ulteriori informazioni, consulta Tag in.AWSAWS Glue

20 marzo 2019

Support di Data Catalog per i lavori Spark SQL

Sono state aggiunte informazioni sulla configurazione dei AWS Glue job e degli endpoint di sviluppo per utilizzarli AWS Glue Data Catalog come Apache Hive Metastore esterno. Ciò consente ai job e agli endpoint di sviluppo di eseguire direttamente le query Apache SQL Spark sulle tabelle memorizzate in. AWS Glue Data Catalog Per ulteriori informazioni, consulta AWS Glue Data Catalog Support for Spark SQL Jobs.

14 marzo 2019

Supporto per processi shell di Python

Aggiunte informazioni sui processi shell di Python e il nuovo campo Maximum capacity (Capacità massima). Per ulteriori informazioni, consulta l'argomento relativo all'aggiunta di processi shell di Python in AWS Glue.

18 gennaio 2019

Supporto per le notifiche quando sono presenti modifiche di database e di tabelle

Sono state aggiunte informazioni sugli eventi generati per le modifiche alle chiamate di database, tabelle e partizioniAPI. È possibile configurare le azioni in CloudWatch Eventi per rispondere a questi eventi. Per ulteriori informazioni, consulta Automazione AWS Glue con CloudWatch eventi.

16 gennaio 2019

Supporto per la crittografia delle password di connessione

Aggiunte informazioni sulla crittografia di password utilizzate in oggetti di connessione. Per ulteriori informazioni, consulta Crittografia delle password di connessione.

11 dicembre 2018

Supporto per le autorizzazioni a livello della risorsa e per le policy basate sulla risorsa

Sono state aggiunte informazioni sull'utilizzo delle autorizzazioni a livello di risorsa e delle politiche basate sulle risorse con. AWS Glue Per ulteriori informazioni, consulta gli argomenti indicati in Sicurezza in AWS Glue.

15 ottobre 2018

Support per notebook SageMaker AI

Sono state aggiunte informazioni sull'utilizzo dei notebook SageMaker AI con endpoint di sviluppo. AWS Glue Per ulteriori informazioni, consulta Gestione di notebook.

5 ottobre 2018

Supporto per la crittografia

Sono state aggiunte informazioni sull'utilizzo della crittografia con. AWS Glue Per ulteriori informazioni, consulta Crittografia dei dati inattivi, Crittografia dei dati in transito e Configurazione della crittografia in AWS Glue.

24 agosto 2018

Supporto per i parametri di processo Apache Spark

Sono state aggiunte informazioni sull'uso delle metriche di Apache Spark per migliorare il debug e la profilazione dei lavori. ETL Puoi monitorare facilmente le metriche di runtime, come i byte letti e scritti, l'utilizzo della memoria e il CPU carico del driver e degli esecutori e lo spostamento dei dati tra gli esecutori dalla console. AWS Glue Per ulteriori informazioni, consulta Monitoring AWS Glue Using CloudWatch Metrics, Job Monitoring and Debugging e Working with Jobs on the Console. AWS Glue

13 luglio 2018

Supporto di DynamoDB come origine dati

Sono state aggiunte informazioni sulla scansione di DynamoDB e sul suo utilizzo come fonte di dati per i lavori. ETL Per ulteriori informazioni, consulta Catalogazione di tabelle con un crawler e Parametri di connessione.

10 luglio 2018

Aggiornamenti alla procedura di creazione di un server notebook

Informazioni aggiornate su come creare un server notebook su un'EC2istanza Amazon associata a un endpoint di sviluppo. Per ulteriori informazioni, consulta Creazione di un server notebook associato a un endpoint di sviluppo.

9 luglio 2018

Gli aggiornamenti sono ora disponibili su RSS

Ora puoi iscriverti a un RSS feed per ricevere notifiche sugli aggiornamenti della AWS Glue Developer Guide.

25 giugno 2018

Supporto delle notifiche di ritardo per i processi

Aggiunte informazioni sulla configurazione di una soglia di ritardo durante l'esecuzione di un processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

25 maggio 2018

Configurazione di un crawler per aggiungere nuove colonne

Sono state aggiunte informazioni sulla nuova opzione di configurazione per i crawler,. MergeNewColumns Per maggiori informazioni, consulta Configurazione di un crawler.

7 maggio 2018

Supporto del timeout dei processi

Aggiunte informazioni sull'impostazione di una soglia di timeout durante l'esecuzione di un processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

10 aprile 2018

Supporta ETL lo script Scala e attiva i lavori in base a stati di esecuzione aggiuntivi

Sono state aggiunte informazioni sull'uso di Scala come linguaggio ETL di programmazione. Inoltre, il grilletto API ora supporta l'attivazione quando vengono soddisfatte tutte le condizioni (oltre a tutte le condizioni). Inoltre, i processi possono essere attivati sulla base di un'esecuzione processo "non riuscita" o "arrestata" (in aggiunta a un'esecuzione processo "riuscita").

12 gennaio 2018

Aggiornamenti precedenti

La tabella seguente descrive le modifiche importanti apportate in ogni versione della Guida per sviluppatori AWS Glue prima di gennaio 2018.

Modifica Descrizione Data
Supporta fonti di XML dati e nuova opzione di configurazione del crawler Sono state aggiunte informazioni sulla classificazione delle fonti di XML dati e nuova opzione crawler per le modifiche alle partizioni. 16 novembre 2017
Nuove trasformazioni, supporto per motori di RDS database Amazon aggiuntivi e miglioramenti degli endpoint di sviluppo Sono state aggiunte informazioni sulle trasformazioni di mappe e filtri, supporto per Amazon RDS Microsoft SQL Server e Amazon RDS Oracle e nuove funzionalità per gli endpoint di sviluppo. 29 settembre 2017
AWS Glue versione iniziale Questa è la versione iniziale della Guida per gli sviluppatori di AWS Glue . 14 agosto 2017

Argomento successivo:

AWS Glossario

Argomento precedente:

Problemi noti
PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.