Cronologia della documentazione per AWS Glue

Modalità Focus

Cronologia della documentazione per AWS Glue - AWS Glue

Modifica	Descrizione	Data
Support per altri 14 nuovi connettori nativi SaaS per AWS Glue	Sono stati aggiunti altri quattordici connettori nativi SaaS. AWS Glue Per ulteriori informazioni, vedere Aggiungere una AWS Glue connessione.	30 gennaio 2025
Support per altri 16 nuovi connettori nativi SaaS per AWS Glue	Sono stati aggiunti altri sedici connettori nativi SaaS. AWS Glue Per ulteriori informazioni, vedere Aggiungere una AWS Glue connessione.	17 dicembre 2024
Generazione automatica di statistiche sulle colonne	AWS Glue Data Quality ora supporta Amazon SageMaker AI LakeHouse tabelle e tabelle Iceberg, Delta e HUDI AWS Lake Formation gestite in Data Catalog ed ETL. Per ulteriori informazioni, consulta AWS Glue Data Quality.	6 dicembre 2024
Support per integrazioni zero-ETL	Zero-ETL è un insieme di integrazioni completamente gestite AWS che riduce al minimo la necessità di creare pipeline di dati ETL. Per ulteriori informazioni, consulta Integrazioni zero-ETL.	3 dicembre 2024
Support per connessioni riutilizzabili	Un nuovo schema di AWS Glue connessioni offre un modo unificato per gestire le connessioni dati tra AWS servizi e applicazioni AWS Glue, come Amazon Athena e SageMaker Amazon Unified Studio. Per ulteriori informazioni, consulta Connessione ai dati.	3 dicembre 2024
Support per AWS Glue la versione 5.0.	Sono state aggiunte informazioni sul supporto per la AWS Glue versione 5.0. Le funzionalità includono un aggiornamento di Apache Spark alla versione 3.52, un aggiornamento di Java alla versione 17, aggiornamenti del formato open table, controllo degli accessi a grana fine nativo di Spark, integrazione con Sagemaker Lakehouse e l'astrazione del data warehouse, supporto in Sagemaker Unified Studio e altro ancora. Per ulteriori AWS Glue informazioni AWS Glue , AWS Glue consulta le Note di rilascio e la migrazione dei lavori alla versione 5.0.	3 dicembre 2024
Connessione all' AWS Glue Data Catalog utilizzo dell'endpoint AWS Glue REST Iceberg	AWS Glue l'endpoint REST di Iceberg supporta le operazioni API specificate nella specifica REST di Apache Iceberg. Utilizzando un client Iceberg REST, puoi connettere l'applicazione in esecuzione su un motore di analisi al catalogo REST ospitato nel Data Catalog. Per ulteriori informazioni, consulta Accesso al catalogo dati.	3 dicembre 2024
Generazione automatica di statistiche sulle colonne	Genera automaticamente statistiche sulle colonne per nuove tabelle in AWS Glue Data Catalog. Per ulteriori informazioni, vedere Generazione automatica di statistiche sulle colonne.	3 dicembre 2024
Support per gli aggiornamenti generativi dell'intelligenza artificiale per Apache Spark in AWS Glue	Spark Upgrades in AWS Glue consente ai data engineer e agli sviluppatori di aggiornare e migrare, aggiornare e migrare i job Spark esistenti alle ultime versioni di AWS Glue Spark utilizzando l'intelligenza artificiale generativa. Per ulteriori informazioni, consulta Upgrade analysis with AI.	22 novembre 2024
Support per la risoluzione dei problemi di intelligenza artificiale generativa per Apache Spark in AWS Glue	Generative AI Troubleshooting for Apache Spark jobs in AWS Glue aiuta i data engineer e gli scienziati a diagnosticare e risolvere i problemi nelle loro applicazioni Spark con facilità. Per ulteriori informazioni, consulta Risoluzione dei problemi relativi ai job Spark con AI.	22 novembre 2024
Support per gli ottimizzatori Iceberg per accedere ai bucket Amazon S3 in un VPC	AWS Glue Data Catalog supporta gli ottimizzatori di tabelle Iceberg per accedere ai bucket Amazon S3 da uno specifico Virtual Private Cloud (VPC) utilizzando una connessione di rete. AWS Glue Per ulteriori informazioni, consulta Ottimizzazione delle tabelle Iceberg.	20 novembre 2024
Support per altri nove nuovi connettori nativi SaaS per AWS Glue	Sono stati aggiunti altri nove connettori nativi SaaS. AWS Glue Per ulteriori informazioni, vedere Aggiungere una AWS Glue connessione.	19 novembre 2024
Support per dieci nuovi connettori nativi SaaS per AWS Glue	Sono stati aggiunti dieci connettori nativi SaaS. AWS Glue Per ulteriori informazioni, vedere Aggiungere una AWS Glue connessione.	15 novembre 2024
Support per l'esecuzione dei job, l'accodamento per AWS Glue i job ETL	È possibile attivare l'accodamento dei job run per eseguire i job in un secondo momento, quando non possono essere eseguiti immediatamente a causa delle quote di servizio. Per maggiori informazioni, consulta Configurazione delle proprietà dei job per i job Spark in. AWS Glue	3 settembre 2024
Modifiche politiche aggiornate	Modifiche documentate alle AwsGlueSessionUserRestrictedNotebookServiceRolepolitiche AwsGlueSessionUserRestrictedNotebookPolicye, necessarie per il supporto delle sessioni con tag-on-create la chiave del tag proprietario. Per ulteriori informazioni, consulta AWS Glue gli aggiornamenti alle politiche AWS gestite.	30 agosto 2024
Il rilevamento delle anomalie e le regole dinamiche sono ora disponibili a livello generale	AWS Glue Data Quality utilizza un algoritmo di apprendimento automatico per apprendere dalle tendenze passate e quindi prevedere i valori futuri per rilevare le anomalie. Dynamic Rules consente di fornire soglie dinamiche. Per ulteriori informazioni, vedere Ottimizzazione delle prestazioni delle query per le tabelle Iceberg.	7 agosto 2024
Modifiche aggiornate alle politiche	Modifiche documentate alle AwsGlueSessionUserRestrictedServiceRolepolitiche AwsGlueSessionUserRestrictedPolicye, necessarie per il supporto delle sessioni con tag-on-create la chiave del tag proprietario. Per ulteriori informazioni, consulta AWS Glue gli aggiornamenti alle politiche AWS gestite.	5 agosto 2024
La generazione di statistiche sulle colonne per le tabelle Iceberg è ora disponibile a tutti	AWS Glue supporta il calcolo e l'aggiornamento del numero di valori distinti (NDVs) per ogni colonna nelle tabelle Iceberg. Per ulteriori informazioni, consulta Rilevamento delle anomalie nelle regole dinamiche e di qualità AWS Glue dei dati.	9 luglio 2024
Support per i profili AWS Glue di utilizzo	Gli amministratori possono creare profili di AWS Glue utilizzo per varie classi di utenti all'interno dell'account, come sviluppatori, tester e team di prodotto. Questa flessibilità consente agli amministratori di applicare controlli di utilizzo e costi diversi per ogni classe di utenti. Per ulteriori informazioni, vedere Configurazione dei profili AWS Glue di utilizzo.	18 giugno 2024
Support per un connettore Salesforce per AWS Glue Spark	Sono state aggiunte informazioni su un nuovo AWS Glue connettore per Salesforce. Questa funzionalità consente di utilizzare Spark AWS Glue per leggere e scrivere su Salesforce nella AWS Glue versione 4.0 e successive. Per ulteriori informazioni, consulta Connessione a Salesforce.	22 maggio 2024
Integrazione dei dati di Amazon Q in AWS Glue (GA)	L'integrazione dei dati di Amazon Q AWS Glue è una nuova funzionalità di intelligenza artificiale generativa AWS Glue che consente ai data engineer e agli sviluppatori ETL di creare lavori di integrazione dei dati utilizzando il linguaggio naturale. Gli ingegneri e gli sviluppatori possono chiedere a Q di creare lavori, risolvere problemi e rispondere a domande sull' AWS Glue integrazione dei dati. Per ulteriori informazioni, consulta Integrazione dei dati di Amazon Q in AWS Glue. Questa funzionalità include un aggiornamento e una `AwsGlueSessionUserRestrictedServiceRole` AWS gestione delle `AwsGlueSessionUserRestrictedPolicy` politiche. `AwsGlueSessionUserRestrictedNotebookServiceRole` Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.	30 aprile 2024
Integrazione dei dati di Amazon Q in AWS Glue (anteprima)	L'integrazione dei dati di Amazon Q AWS Glue è una nuova funzionalità di intelligenza artificiale generativa AWS Glue che consente ai data engineer e agli sviluppatori ETL di creare lavori di integrazione dei dati utilizzando il linguaggio naturale. Gli ingegneri e gli sviluppatori possono chiedere a Q di creare lavori, risolvere problemi e rispondere a domande sull' AWS Glue integrazione dei dati. Per ulteriori informazioni, consulta Integrazione dei dati di Amazon Q in AWS Glue. Questa funzionalità include un aggiornamento della politica `AwsGlueSessionUserRestrictedNotebookPolicy` AWS gestita. Per ulteriori informazioni, consulta AWS Glue gli aggiornamenti delle politiche AWS gestite.	30 gennaio 2024
Aggiornamento della documentazione per AWS Glue lo streaming	Aggiunto un nuovo capitolo con contenuti nuovi e riorganizzati per AWS Glue lo streaming. Questo contenuto descrive come funziona lo streaming AWS Glue, le caratteristiche dell'elaborazione dei dati in tempo reale e come monitorare i processi di streaming. Per ulteriori informazioni, consulta la pagina AWS Glue Streaming.	27 dicembre 2023
Supporto per l'utilizzo del rilevamento dei dati sensibili granulari	La trasformazione relativa al rilevamento dei dati sensibili fornisce la possibilità di rilevare, mascherare o rimuovere le entità che hai definito o che sono predefinite da AWS Glue. Le azioni granulari consentono inoltre di applicare un'azione specifica per entità. Per ulteriori informazioni, consulta Utilizzo del rilevamento dei dati sensibili granulari.	26 novembre 2023
Support per il monitoraggio dei lavori con metriche AWS Glue di Observability	Usa le metriche AWS Glue di Observability per generare approfondimenti su ciò che accade all'interno dei tuoi lavori di Apache Spark AWS Glue per migliorare la classificazione e l'analisi dei problemi. Per ulteriori informazioni, consulta Monitoraggio con metriche di osservabilità. AWS Glue	26 novembre 2023
Support per il rilevamento delle anomalie in AWS Glue Data Quality	AWS Glue Il rilevamento delle anomalie relative alla qualità dei dati applica nel tempo algoritmi di machine learning (ML) alle statistiche dei dati per rilevare modelli anomali e problemi nascosti di qualità dei dati che sono difficili da rilevare attraverso le regole. Per ulteriori informazioni, consulta Rilevamento delle anomalie nella qualità dei dati. AWS Glue	26 novembre 2023
Aggiornamento al comportamento di registrazione predefinito dell'interfaccia utente di Spark	I job Spark che generano i log dell'interfaccia utente Spark ora verranno scritti con un modello di nome file diverso per supportare l'interfaccia utente Spark nella console. AWS Glue Ciò non modifica il comportamento dei log. CloudWatch È possibile ripristinare il comportamento legacy aggiornando la configurazione del processo. Per ulteriori informazioni, consulta Monitoraggio dei processi tramite l'interfaccia utente Web di Apache Spark.	17 novembre 2023
Support per nuove fonti di dati in AWS Glue for Spark	Le connessioni ad Amazon OpenSearch Service, Azure SQL, Azure Cosmos for NoSQL, SAP HANA Teradata Vantage e Vertica sono ora supportate nativamente all'interno. AWS Glue Inoltre, le connessioni a queste fonti di dati, oltre a MongoDB, sono ora disponibili per l'uso nell' AWS Glue editor visivo di Studio. Per ulteriori informazioni, consulta Tipi di connessione e opzioni per ETL in AWS Glue for Spark AWS Glue per informazioni sul supporto di Spark e Aggiungere una AWS Glue connessione per informazioni sull'uso nell'editor visivo di Studio. AWS Glue	17 novembre 2023
Supporto per generare le statistiche delle colonne	Puoi calcolare statistiche a livello di colonna per AWS Glue Data Catalog tabelle in formati di dati come Parquet, ORC, JSON, ION, CSV e XML senza configurare pipeline di dati aggiuntive. Per ulteriori informazioni, consulta Utilizzo delle statistiche delle colonne.	16 novembre 2023
Supporto per la compattazione dei dati per le tabelle Iceberg	Per migliorare le prestazioni di lettura da parte di servizi di AWS analisi come Amazon Athena e Amazon EMR e i processi AWS Glue ETL, Data Catalog offre la compattazione gestita (un processo che compatta piccoli oggetti Amazon S3 in oggetti più grandi) per le tabelle Iceberg in Data Catalog. Per ulteriori informazioni, consulta Ottimizzazione delle tabelle Iceberg.	13 novembre 2023
Aggiornamento al comportamento di attesa dell'esecuzione del processo	Le esecuzioni del processo standard di shell (interprete di comandi) Spark e Python ora passeranno a `WAITING` in determinate situazioni, anziché passare immediatamente a `FAILED`. Per ulteriori informazioni, consulta Stati di esecuzione dei processi AWS Glue.	8 novembre 2023
AWS Glue StudioAWS Glue guida per l'utente consolidata nella guida per sviluppatori	La guida per AWS Glue Studio l'utente è stata spostata nella guida per sviluppatori per creare un'unica guida utente unificata per AWS Glue Studio la AWS Glue console e l'accesso AWS Glue Studio programmatico.	25 ottobre 2023
Aggiornamento della policy gestita AWSGlue ServiceNotebookRole AWS	Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlue ServiceNotebookRole AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.	9 ottobre 2023
AWS Glue Studio supporta cinque nuove trasformazioni integrate	AWS Glue Studio supporta le seguenti cinque nuove trasformazioni integrate: Record matching, Remove null rows, Parse JSON column, Extract JSON path e Regex extractor. Per ulteriori informazioni, consulta Modifica dei nodi di trasformazione dei dati gestiti. AWS Glue	11 agosto 2023
Aggiornamento della politica AWSGlue ServiceRole AWS gestita	Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlue ServiceRole AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.	4 agosto 2023
Supporto per il crawling delle tabelle Apache Hudi	Sono state aggiunte informazioni sull'utilizzo AWS Glue per eseguire la scansione delle tabelle Hudi nei bucket Amazon S3 e sulla registrazione delle tabelle Hudi in. AWS Glue Data Catalog Per ulteriori informazioni, consulta le pagine Which data stores can I crawl? e Crawler properties.	21 luglio 2023
Aggiornamento della politica gestita AWSGlue ConsoleFullAccess AWS	Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlue ConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.	14 luglio 2023
Supporto per il crawling delle tabelle Apache Iceberg	Sono state aggiunte informazioni sull'utilizzo AWS Glue per eseguire la scansione delle tabelle Iceberg nei bucket Amazon S3 e sulla registrazione delle tabelle Iceberg in. AWS Glue Data Catalog Per ulteriori informazioni, consulta le pagine Which data stores can I crawl? e Crawler properties.	7 luglio 2023
Support per AWS Glue with Ray	Sono state aggiunte informazioni su AWS Glue with Ray, un nuovo motore in grado di supportare i AWS Glue lavori. Riorganizzato il contenuto esistente AWS Glue con Spark per chiarire le ambiguità.	30 maggio 2023
Support per la qualità AWS Glue dei dati (GA)	AWS Glue La qualità dei dati è ora disponibile a livello generale. AWS Glue Data Quality ti aiuta a valutare e monitorare la qualità dei tuoi dati. Per informazioni su come utilizzare AWS Glue Data Quality con Data Catalog, consulta AWS Glue Data Quality. Per ulteriori informazioni sulla qualità AWS Glue dei dati per AWS Glue Studio, consulta Valutazione della qualità dei dati con AWS Glue Studio.	24 maggio 2023
Supporto per tipi di worker di grandi dimensioni per i processi Apache Spark	È ora disponibile il supporto per l'uso dei tipi di worker `G.4X` e `G.8X` per i processi Apache Spark. Questi tipi di worker sono adatti per i processi i cui carichi di lavoro contengono trasformazioni, aggregazioni, join e query con i maggiori requisiti. Per ulteriori informazioni, consulta Aggiungere lavori in AWS Glue.	8 maggio 2023
Supporto per la creazione di indici di partizione durante il crawling delle tabelle	Sono state aggiunte informazioni sul modo in cui i crawler supportano la creazione di indici di partizione per le tabelle rilevate dal crawler. Per ulteriori informazioni, consulta la pagina Setting the partition index crawler configuration option.	24 aprile 2023
Supporto per i parametri di utilizzo delle risorse	Sono state aggiunte informazioni sulla visualizzazione dell'utilizzo delle risorse del servizio e sulla configurazione degli allarmi in Amazon. CloudWatch Per ulteriori informazioni, consulta la pagina AWS Glue resource monitoring.	7 aprile 2023
Aggiornamento della politica gestita AWSGlue ConsoleFullAccess AWS	Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlue ConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.	28 marzo 2023
Sono state aggiunte linee guida per l'utilizzo AWS Glue con un AWS SDK con esempi	La Guida per gli AWS Glue sviluppatori contiene due nuove sezioni che forniscono informazioni utili per l'utilizzo AWS Glue con un AWS SDK. Per ulteriori informazioni, consulta Utilizzo AWS Glue con un AWS SDK e Esempi di codice per l' AWS Glueutilizzo. AWS SDKs	23 febbraio 2023
Aggiornamento della documentazione per IAM con AWS Glue	Informazioni riorganizzate e aggiunte sull'utilizzo di IAM con AWS Glue. Per ulteriori informazioni, consulta Identity and Access Management per AWS Glue.	15 febbraio 2023
Support per l'esecuzione di job ETL in streaming nella AWS Glue versione 4.0	Sono state aggiunte informazioni sul supporto per l'esecuzione di processi ETL di streaming in Glue versione 4.0 e nuove opzioni per la connessione a un cluster Kafka o a un cluster Amazon Managed Streaming per Apache Kafka e flussi di dati Amazon Kinesis. Per ulteriori informazioni, consulta Aggiunta di processi ETL di streaming in AWS Glue e Tipi di connessione e opzioni per ETL in AWS Glue.	8 febbraio 2023
Supporto per il crawling delle origini dati MongoDB Atlas	Sono state aggiunte informazioni sull'utilizzo AWS Glue per la scansione delle fonti di dati MongoDB Atlas. Per ulteriori informazioni, consulta Quali archivi di dati posso scansionare? , proprietà di connessione MongoDB e MongoDB Atlas e Utilizzo di una connessione MongoDB o MongoDB Atlas.	6 febbraio 2023
Supporto per il crawling delle tabelle Delta Lake con un connettore Delta Lake nativo	Sono state aggiunte informazioni sull'utilizzo AWS Glue per la scansione delle tabelle Delta Lake utilizzando un connettore Delta Lake nativo. Questa funzionalità ti consente di utilizzare i motori di AWS query per interrogare direttamente il registro delle transazioni Delta e utilizzare funzionalità come i viaggi nel tempo e le garanzie ACID, e di sincronizzare i metadati Delta Lake dai file di transazione di Amazon S3 nel Data Catalog per abilitare le autorizzazioni alle colonne sulle tue query in Lake Formation. Per ulteriori informazioni, consulta Come specificare le opzioni di configurazione per un archivio di dati Delta Lake e Interrogazione delle tabelle Delta Lake.	15 dicembre 2022
Support for AWS Glue Data Quality (anteprima)	Il supporto è ora disponibile per AWS Glue Data Quality (anteprima). AWS Glue Data Quality consente di valutare e monitorare la qualità dei dati quando si utilizza la AWS Glue versione 3.0. Per informazioni su come utilizzare AWS Glue Data Quality con Data Catalog, vedi AWS Glue Data Quality (anteprima). Per ulteriori informazioni sulla qualità AWS Glue dei dati per AWS Glue Studio, consulta Valutazione della qualità dei dati con AWS Glue Studio.	30 novembre 2022
Supporto per un nuovo connettore Amazon Redshift Spark con nuove funzionalità e miglioramenti delle prestazioni	È ora disponibile il supporto per un nuovo connettore Amazon Redshift Spark con un nuovo driver JDBC da utilizzare con i processi AWS Glue ETL per creare applicazioni Apache Spark in grado di leggere e scrivere dati in Amazon Redshift come parte delle pipeline di acquisizione e trasformazione dei dati. Per ulteriori informazioni, consulta Spostamento di dati da e verso Amazon Redshift.	29 novembre 2022
Support per AWS Glue la versione 4.0.	Sono state aggiunte informazioni sul supporto per la AWS Glue versione 4.0. Le funzionalità includono il supporto nativo per i framework data lake aperti con Apache Hudi, Delta Lake e Apache Iceberg e il supporto nativo per il plug-in di archiviazione cloud shuffle basato su Amazon S3 (un plug-in Apache Spark) per utilizzare Amazon S3 per la capacità di archiviazione shuffle ed elastica. Per ulteriori informazioni, vedere Note di AWS Glue rilascio e Migrazione dei AWS Glue lavori alla AWS Glue versione 4.0.	28 novembre 2022
AWS Glue Studio ora offre trasformazioni visive personalizzate	Le trasformazioni visive personalizzate consentono ai clienti di definire, riutilizzare e condividere la logica ETL specifica dell'azienda tra i propri team. Per ulteriori informazioni, consulta Trasformazioni visive personalizzate.	28 novembre 2022
Support per l'utilizzo del AWS Glue crawler per pubblicare metadati per archivi dati JDBC	È ora disponibile il supporto per l'utilizzo del AWS Glue crawler per pubblicare metadati come commenti e tipi rawtype nel Data Catalog for JDBC data store. Per ulteriori informazioni, consulta Parametri impostati nelle tabelle del catalogo dati per crawler, proprietà del crawler e struttura. JdbcTarget	18 novembre 2022
Supporto per il crawling di datastore Snowflake	È ora disponibile il supporto per AWS Glue eseguire la scansione delle tabelle e delle viste Snowflake e per pubblicare i metadati nel Data Catalog come voce di tabella. Per le tabelle esterne Snowflake in Amazon S3, il crawler esegue il crawling anche della posizione Amazon S3 e del tipo di formato di file della tabella esterna e lo compila come parametri della tabella. Per ulteriori informazioni, consulta Quali datastore posso sottoporre a crawling?, Proprietà della connessione a AWS Glue e Parametri impostati nelle tabelle del catalogo di dati dal crawler.	18 novembre 2022
Supporto per una migliore gestione dello shuffle delle applicazioni Spark	È ora disponibile il supporto per un nuovo plug-in di archiviazione cloud shuffle per Apache Spark. Per ulteriori informazioni, consulta Plug-in shuffle di AWS Glue Spark con Amazon S3 e Plug-in di archiviazione cloud shuffle per Apache Spark.	15 novembre 2022
È stato aggiunto il supporto per gli obiettivi di Data Catalog durante l'accelerazione delle scansioni e le notifiche degli eventi di Amazon S3	Oltre al supporto esistente per i target Amazon S3, è ora disponibile il supporto per accelerare le scansioni per le destinazioni Data Catalog utilizzando le notifiche di eventi di Amazon S3. Per ulteriori informazioni, consulta Accelerazione della ricerca per indicizzazione usando le notifiche eventi Amazon S3.	13 ottobre 2022
Supporto per specificare il numero massimo di tabelle che un crawler può creare	È ora disponibile il supporto per specificare il numero massimo di tabelle che il crawler può creare. Per ulteriori informazioni, consulta la pagina Come specificare il numero massimo di tabelle che il crawler può creare.	6 settembre 2022
Supporto per Python 3.9 nei job della shell Python in AWS Glue	Il supporto è ora disponibile per l'esecuzione di script compatibili con Python 3.9 nei AWS Glue job della shell Python in e per la scelta di utilizzare set di librerie preconfezionate. Per ulteriori informazioni, consulta Processi della shell Python in AWS Glue.	11 agosto 2022
Support per l'esecuzione di AWS Glue lavori non urgenti o non urgenti utilizzando capacità inutilizzata	È ora disponibile il supporto per la configurazione di esecuzioni flessibili per processi non urgenti come processi di pre-produzione, test e caricamenti di dati una tantum. Per ulteriori informazioni, consulta Aggiungere lavori in. AWS Glue	9 agosto 2022
Il supporto per un nuovo tipo di worker per i processi di streaming	Il supporto di questo servizio di Support per l'uso del tipo di worker `G.025X` per processi di streaming a basso volume. Per ulteriori informazioni, consulta Aggiungere lavori in AWS Glue.	14 luglio 2022
Support per l'uso di Kafka SASL nelle connessioni AWS Glue	Il supporto è ora disponibile per l'uso di Kafka SASL nelle connessioni. AWS Glue Per ulteriori informazioni, consulta AWS Glue Proprietà di connessione Kafka per l'autenticazione client.	5 luglio 2022
Supporto per il connettore Apache Kafka per gli schemi protobuf	Il supporto di Apache Kafka Connector è attualmente disponibile per gli schemi Protobuf. Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.	9 giugno 2022
Support per Auto Scaling for AWS Glue jobs (GA)	Sono state aggiunte informazioni sull'utilizzo di Auto Scaling for jobs nella AWS Glue versione 3.0 per scalare dinamicamente le risorse di elaborazione. Per ulteriori informazioni, consulta Utilizzo di Auto Scaling per AWS Glue.	14 aprile 2022
Aggiornamento della documentazione per lo AWS Glue sviluppo e il test degli script di lavoro AWS Glue	Informazioni riorganizzate e aggiunte sui metodi di sviluppo e test disponibili per AWS Glue, comprese le istruzioni per lo sviluppo con Docker. Per ulteriori informazioni, consulta Sviluppo e test di script di AWS Glue lavoro.	14 marzo 2022
Aggiunta di buffer di protocollo (protobuf) come formato di dati supportato per il registro degli schemi AWS Glue	Aggiunte informazioni su Protobuf come formato dati supportato (oltre ad AVRO e JSON). Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.	25 febbraio 2022
Supporto per il crawling delle tabelle Delta Lake	Sono state aggiunte informazioni sull'utilizzo AWS Glue per la scansione delle tabelle Delta Lake. Per ulteriori informazioni, consulta Come specificare le opzioni di configurazione per un archivio dati Delta Lake.	24 febbraio 2022
Support per approfondimenti sul AWS Glue lavoro	Sono state aggiunte informazioni sull'utilizzo di AWS Glue Job Insights per semplificare il debug e l'ottimizzazione dei job. AWS Glue Per ulteriori informazioni, consulta Monitoraggio con AWS Glue Job Insights.	8 febbraio 2022
Supporto per il crawling di tabelle Catalogo dati supportate da Amazon S3 utilizzando un endpoint VPC	Oltre all'archivio dati di Amazon S3, si possono configurare le tabelle Catalogo dati supportate da Amazon S3 per consentire l'accesso solo a un ambiente Amazon Virtual Private Cloud (Amazon VPC) per motivi di sicurezza, audit o controllo. Per ulteriori informazioni, consulta Crawling di un datastore Amazon S3 o di tabelle Catalogo dati supportate da Amazon S3 utilizzando un endpoint VPC.	3 febbraio 2022
Supporto per le tavole governate dalla Lake Formation	Sono state aggiunte informazioni sul AWS Glue supporto per le tabelle governate da Lake Formation, che supportano le transazioni ACID, la compattazione automatica dei dati e le query sui viaggi nel tempo. Per ulteriori informazioni, consulta API AWS Glue, e Guida per gli sviluppatori di AWS Lake Formation.	30 novembre 2021
Nuove politiche AWS gestite aggiunte per sessioni e notebook interattivi	Le nuove policy gestite per IAM hanno fornito una maggiore sicurezza per l'utilizzo AWS Glue con sessioni e notebook interattivi. Per ulteriori informazioni, consulta la sezione Policy gestite da AWS per AWS Glue.	30 novembre 2021
Il registro dello schema Glue ora supportato con i processi di streaming	È possibile creare processi di streaming che accedono alle tabelle che fanno parte di Glue Schema Registry. Per ulteriori informazioni, consulta AWS Glue Schema Registry e Aggiunta di processi di streaming ETL in AWS Glue.	15 novembre 2021
Supporto per nuove caratteristiche di machine learning	Aggiunte informazioni sulle nuove funzionalità per la trasformazione di machine learning Ricerca corrispondenze, tra cui la corrispondenza incrementale e il punteggio di corrispondenza. Per ulteriori informazioni, consulta Ricerca di corrispondenze incrementali e Stima della qualità delle corrispondenze utilizzando i punteggi di confidenza delle corrispondenze.	31 ottobre 2021
(Anteprima privata) Support per AWS Glue lavori flessibili	Sono state aggiunte informazioni sulla configurazione dei job AWS Glue Spark con una classe di esecuzione flessibile, adatta per lavori che non richiedono tempo e i cui tempi di inizio e completamento possono variare. Per ulteriori informazioni, consulta Aggiungere lavori in. AWS Glue	29 ottobre 2021
Supporto per accelerare la ricerca per indicizzazione usando le notifiche eventi Amazon S3	Sono state aggiunte informazioni sull'accelerazione della ricerca per indicizzazione utilizzando le notifiche degli eventi Amazon S3. Per ulteriori informazioni, consulta Accelerazione della ricerca per indicizzazione usando le notifiche eventi Amazon S3.	15 ottobre 2021
Opzioni di configurazione di sicurezza aggiuntive relative al controllo degli accessi e VPCs	Sono state aggiunte informazioni su come configurare nuove autorizzazioni di controllo degli accessi AWS Glue e sulla configurazione di. VPCs Per ulteriori informazioni, consulta AWS Tags in AWS Glue, Identity-Based Policies (IAM Policies) che controllano le impostazioni utilizzando chiavi di condizione o chiavi contestuali e Configurazione di tutte le AWS chiamate in modo che passino attraverso il tuo VPC.	13 ottobre 2021
Supporto per le policy di endpoint VPC	Aggiunte informazioni sul supporto per policy endpoint Virtual Private Cloud (VPC) in AWS Glue. Per ulteriori informazioni consulta AWS Glue ed endpoint VPC di interfaccia (AWS PrivateLink).	11 ottobre 2021
Glue Studio è ora disponibile in Cina	AWS Glue Studio è ora disponibile nelle regioni Cina, Pechino e Ningxia.	11 ottobre 2021
AWS Glue Studio offre la creazione di notebook, per la modifica interattiva dei lavori	I notebook consentono di scrivere ed eseguire codice, visualizzare i risultati e condividere informazioni. In genere, i data scientist utilizzano i notebook per esperimenti e attività di esplorazione dei dati. Per ulteriori informazioni, consulta Utilizzo di notebook.	1° ottobre 2021
L'accesso diretto alle fonti di streaming ora disponibile	Quando si aggiungono origini dati al processo ETL nell'editor visivo, è possibile fornire informazioni per accedere al flusso di dati, anziché utilizzare un database e una tabella di Data Catalog.	30 settembre 2021
Ha documentato la politica di supporto delle AWS Glue versioni	Sono state aggiunte informazioni sulla politica di supporto delle AWS Glue versioni e sulle fasi di fine vita per alcune AWS Glue versioni. Per ulteriori informazioni, consulta Policy di supporto versione AWS Glue.	24 settembre 2021
I connettori personalizzati possono ora essere utilizzati con le anteprime dei dati	Quando modifichi il nodo dell'origine dati utilizzando un connettore personalizzato, puoi visualizzare in anteprima il set di dati scegliendo la scheda Anteprima dati. Per ulteriori informazioni, consulta Connettori personalizzati.	24 settembre 2021
Support per sessioni AWS Glue interattive (anteprima privata)	(Anteprima privata) Sono state aggiunte informazioni sull'utilizzo di sessioni AWS Glue interattive per eseguire carichi di lavoro Spark nel cloud da qualsiasi notebook Jupyter. Le sessioni interattive sono il metodo preferito per sviluppare il codice ETL ( AWS Glue Extract, Transform, Load) quando si utilizza la versione 2.0 o successiva. AWS Glue Per ulteriori informazioni, vedere Configurazione ed esecuzione di sessioni AWS Glue interattive per Jupyter Notebook.	24 agosto 2021
Supporto per la creazione di flussi di lavoro dai progetti (GA)	(Anteprima pubblica) Sono state aggiunte informazioni sulla codifica dei casi d'uso comuni di estrazione, trasformazione e caricamento (ETL) nei piani e sulla creazione di flussi di lavoro dai piani. Consente agli analisti di dati di creare ed eseguire facilmente processi ETL complessi. Per ulteriori informazioni, consulta Esecuzione di attività ETL complesse utilizzando gli schemi e i flussi di lavoro in AWS Glue.	23 agosto 2021
Support per AWS Glue la versione 3.0.	Sono state aggiunte informazioni sul supporto per la AWS Glue versione 3.0 che supporta l'aggiornamento del motore Apache Spark 3.0 per l'esecuzione dei job ETL di Apache Spark e altre ottimizzazioni e aggiornamenti. Per ulteriori informazioni, consulta le note di AWS Glue rilascio e la migrazione dei lavori alla versione 3.0. AWS GlueAWS Glue Altre funzionalità di questa versione includono lo AWS Glue shuffle manager, un lettore CSV vettorializzato SIMD e i predicati delle partizioni del catalogo. Per ulteriori informazioni, consulta AWS Glue Spark shuffle manager con Amazon S3, Opzioni di formato per ingressi e uscite ETL e Filtraggio lato server utilizzando i predicati delle partizioni del catalogo AWS Glue.	18 agosto 2021
AWS GovCloud (US) Region	AWS Glue Studio è ora disponibile in AWS GovCloud (US) Region	18 agosto 2021
Creazione di shell Python disponibile in AWS Glue Studio	Quando si crea un nuovo processo, è ora possibile scegliere di creare un processo di shell Python. Per ulteriori informazioni, consulta Avvio della creazione del processo e Modifica di processi shell Python in AWS Glue Studio.	13 agosto 2021
Support per l'avvio di un flusso di lavoro con un EventBridge evento Amazon	Sono state aggiunte informazioni su come AWS Glue può essere un consumatore di eventi in un'architettura basata sugli eventi. Per ulteriori informazioni, consulta Avvio di un AWS Glue flusso di lavoro con un EventBridge evento Amazon e Visualizzazione degli EventBridge eventi che hanno avviato un flusso di lavoro.	14 luglio 2021
Aggiunta di JSON come formato di dati supportato per il registro degli AWS Glue schemi	Aggiunte informazioni su JSON come formato dati supportato (oltre ad AVRO). Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.	30 giugno 2021
Crea lavori di AWS Glue streaming senza una tabella Data Catalog	La funzione Python `create_data_frame_from_options` o `getSource` per gli script Scala supportano la creazione di processi ETL di streaming che fanno riferimento direttamente ai flussi di dati anziché richiedere una tabella del catalogo dati.	15 giugno 2021
AWS Glue le trasformazioni di apprendimento automatico ora supportano AWS Key Management Service le chiavi	È possibile specificare una configurazione o una AWS KMS chiave di sicurezza quando si configurano le trasformazioni di AWS Glue Machine Learning con la console, la CLI o il. AWS Glue APIs Per ulteriori informazioni, consulta Utilizzo della crittografia dati con le trasformazioni basate su machine learning e API di Machine Learning AWS Glue.	15 giugno 2021
Aggiornamento alla politica gestita AWSGlue ConsoleFullAccess AWS	Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlue ConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.	10 giugno 2021
Visualizzare il set di dati del processo durante la creazione e la modifica dei processi	È possibile utilizzare la nuova scheda di anteprima dati per un nodo nel diagramma del processo per visualizzare un esempio dei dati elaborati da tale nodo. Per ulteriori informazioni, consulta Utilizzo delle anteprime dei dati nell'editor visivo dei processi.	7 giugno 2021
Supporto per specificare un valore che indica la posizione della tabella per l'output del crawler.	Sono state aggiunte informazioni su come specificare un valore che indica la posizione della tabella durante la configurazione dell'output del crawler. Per ulteriori informazioni, consulta Come specificare la posizione della tabella.	4 giugno 2021
Supporto per il crawling di un campione di file in un set di dati durante il crawling di un archivio dati Amazon S3	Sono state aggiunte informazioni su come eseguire il crawling di un campione di file durante il crawling di Amazon S3. Per ulteriori informazioni, consulta Proprietà del crawler.	10 maggio 2021
Support per la scrittura AWS Glue ottimizzata del parquet	Sono state aggiunte informazioni sull'utilizzo del parquet writer AWS Glue ottimizzato DynamicFrames per creare o aggiornare tabelle con la `parquet` classificazione. Per ulteriori informazioni, consultate Creazione di tabelle, aggiornamento dello schema e aggiunta di nuove partizioni nel catalogo dati da processi AWS Glue ETL e Opzioni di formato per ingressi e uscite ETL in. AWS Glue	4 maggio 2021
Supporto per le password di autenticazione client Kafka	Sono state aggiunte informazioni su come i job ETL in streaming AWS Glue supportano l'autenticazione dei certificati client SSL con i produttori di stream Apache Kafka. Ora puoi fornire un certificato personalizzato durante la definizione di una AWS Glue connessione a un cluster Apache Kafka, che verrà utilizzato per l'autenticazione con esso. AWS Glue Per ulteriori informazioni, consulta Proprietà della connessione AWS Glue e API di connessione.	28 Aprile 2021
Supporto per l'utilizzo di dati da Amazon Kinesis Data Streams in un altro account nei processi ETL di streaming	Sono state aggiunte informazioni su come creare un processo ETL di streaming per utilizzare i dati da Amazon Kinesis Data Streams in un altro account. Per ulteriori informazioni, consulta Aggiungere lavori ETL in streaming in. AWS Glue	30 marzo 2021
Trasformazione SQL disponibile	Puoi utilizzare un nodo di trasformazione SQL per scrivere la tua trasformazione sotto forma di query SQL. Per ulteriori informazioni, consulta Utilizzo di una query SQL per trasformare i dati.	23 marzo 2021
Supporto per la creazione di flussi di lavoro dagli schemi (anteprima pubblica)	(Anteprima pubblica) Sono state aggiunte informazioni sulla codifica dei casi d'uso comuni di estrazione, trasformazione e caricamento (ETL) nei piani e sulla creazione di flussi di lavoro dai piani. Consente agli analisti di dati di creare ed eseguire facilmente processi ETL complessi. Per ulteriori informazioni, consulta Esecuzione di attività ETL complesse utilizzando gli schemi e i flussi di lavoro in AWS Glue.	22 marzo 2021
I connettori possono essere utilizzati per le destinazioni dati	L'utilizzo di un Marketplace AWS connettore o personalizzato per la destinazione dei dati è ora supportato. Per ulteriori informazioni, consulta Creazione di processi con connettori personalizzati.	15 marzo 2021
Support per le metriche di importanza delle colonne per le trasformazioni dell'apprendimento AWS Glue automatico	Sono state aggiunte informazioni sulla visualizzazione delle metriche di importanza delle colonne quando si lavora con le trasformazioni di apprendimento AWS Glue automatico. Per ulteriori informazioni, consulta Working with Machine Learning Transforms sulla console AWS Glue	5 febbraio 2021
Job scheduling ora disponibile in AWS Glue Studio	È possibile definire una pianificazione basata sul tempo per le esecuzioni del processo in AWS Glue Studio. È possibile utilizzare la console per creare una pianificazione di base o definire una pianificazione più complessa utilizzando la sintassi cron di tipo Unix. Per ulteriori informazioni, consulta Pianificazione delle esecuzioni.	21 dicembre 2020
AWS Glue Sono stati rilasciati connettori personalizzati	AWS Glue I connettori personalizzati consentono di scoprire e abbonarsi ai connettori in Marketplace AWS. Abbiamo anche rilasciato le interfacce di runtime AWS Glue Spark per collegare connettori creati per Apache Spark Datasource, Athena federated query e JDBC. APIs Per ulteriori informazioni, consulta Utilizzo di connettori e connessioni con. AWS Glue Studio	21 dicembre 2020
Support per l'esecuzione di job ETL in streaming nella AWS Glue versione 2.0	Aggiunte informazioni sull'esecuzione di processi ETL di streaming in Glue versione 2.0. Per ulteriori informazioni, consulta Aggiungere lavori ETL in streaming in. AWS Glue	18 dicembre 2020
Supporto per il partizionamento del carico di lavoro con esecuzione limitata	Aggiunte informazioni sull'abilitazione del partizionamento del carico di lavoro per configurare i limiti superiori della dimensione del set di dati o il numero di file elaborati nelle esecuzioni dei processi ETL. Per ulteriori informazioni, consulta Partizionamento del carico di lavoro con esecuzione limitata.	23 novembre 2020
Supporto per una gestione avanzata delle partizioni	Sono state aggiunte informazioni su come utilizzare new APIs per aggiungere o eliminare un indice di partizione da/a una tabella esistente. Per ulteriori informazioni, consulta Utilizzo degli indici delle partizioni.	23 novembre 2020
Support per il registro AWS Glue degli schemi	Sono state aggiunte informazioni sull'utilizzo dello AWS Glue Schema Registry per individuare, controllare ed evolvere centralmente gli schemi. Per ulteriori informazioni, vedere AWS Glue Schema Registry.	19 novembre 2020
Supporto per il formato di input Grok nei processi ETL di streaming	Aggiunte informazioni sull'applicazione dei pattern Grok alle origini di streaming, ad esempio i file di log. Per ulteriori informazioni, consulta Applicazione di pattern Grok alle sorgenti di streaming.	17 novembre 2020
Support per l'aggiunta di tag ai flussi di lavoro sulla console AWS Glue	Sono state aggiunte informazioni sull'aggiunta di tag durante la creazione di un flusso di lavoro utilizzando la console AWS Glue . Per ulteriori informazioni, consulta Creazione e creazione di un flusso di lavoro utilizzando la AWS Glue console.	27 ottobre 2020
Supporto per le esecuzione incrementale del crawler	Aggiunte informazioni sul supporto per le esecuzioni di crawler incrementali, che eseguono il crawling solo delle cartelle Amazon S3 aggiunte dall'ultima esecuzione. Per ulteriori informazioni, consulta Crawling incrementale.	21 ottobre 2020
Supporto per il rilevamento dello schema per le origini dati ETL di streaming. supporto per le origini dei dati ETL di streaming Avro e Kafka autogestito	I job di estrazione, trasformazione e caricamento (ETL) in streaming AWS Glue possono ora rilevare automaticamente lo schema dei record in entrata e gestire le modifiche allo schema per record. Sono ora supportate le origini di dati Kafka autogestite. I processi ETL di streaming ora supportano il formato Avro nelle origini dati. Per ulteriori informazioni, vedere Streaming ETL in AWS Glue, Definizione delle proprietà del lavoro per un lavoro ETL di streaming e Note e restrizioni per le sorgenti di streaming Avro.	7 ottobre 2020
Supporto per il crawling delle origini dei dati MongoDB e DocumentDB	Aggiunte informazioni sul supporto per il crawling delle origini dati MongoDB e Amazon DocumentDB (con compatibilità MongoDB). Per ulteriori informazioni, consulta Definizione di crawler.	5 ottobre 2020
Supporto per la conformità a FIPS	Aggiunte informazioni sugli endpoint FIPS per i clienti che necessitano di moduli crittografici convalidati FIPS 140-2 quando accedono ai dati con AWS Glue. Per ulteriori informazioni, consulta la pagina Conformità FIPS.	23 settembre 2020
AWS Glue Studio fornisce un'interfaccia visiva facile da usare per la creazione e il monitoraggio dei lavori	Ora è possibile utilizzare una semplice interfaccia grafica per comporre lavori che spostano e trasformano i dati ed eseguirli su AWS Glue. È quindi possibile utilizzare il pannello di controllo di esecuzione dei processi in AWS Glue Studio per monitorare l'esecuzione di ETL e garantire che i processi funzionino come previsto. Per ulteriori informazioni, consulta AWS Glue Studio Guida per l'utente.	23 settembre 2020
Supporto per la creazione di indici di tabella per migliorare le prestazioni delle query	Aggiunte informazioni sulla creazione di indici di tabella per consentire il recupero di un sottoinsieme di partizioni da una tabella. Per ulteriori informazioni, consulta Utilizzo degli indici delle partizioni.	9 settembre 2020
Supporto per tempi di startup ridotti durante l'esecuzione di processi ETL di Apache Spark in AWS Glue versione 2.0.	Sono state aggiunte informazioni sul supporto per la AWS Glue versione 2.0 che fornisce un'infrastruttura aggiornata per l'esecuzione dei job ETL di Apache Spark con tempi di avvio ridotti, modifiche nella registrazione e supporto per specificare moduli Python aggiuntivi a livello di job. Per ulteriori informazioni, consulta Note di rilascio di AWS Glue ed Esecuzione di processi ETL Spark con tempi di avvio ridotti.	10 agosto 2020
Supporto per limitare il numero di esecuzioni simultanee del flusso di lavoro.	Aggiunte informazioni su come limitare il numero di esecuzioni simultanee per un determinato flusso di lavoro. Per ulteriori informazioni, consulta Creazione e creazione di un flusso di lavoro utilizzando la console. AWS Glue	10 agosto 2020
Supporto per il crawling di un datastore Amazon S3 utilizzando un endpoint VPC	Aggiunte informazioni sulla configurazione dell'archivio dati Amazon S3 per consentire l'accesso solo a un ambiente Amazon Virtual Private Cloud (Amazon VPC) per motivi di sicurezza, audit o controllo. Per ulteriori informazioni, consulta Crawling di un datastore Amazon S3 utilizzando un endpoint VPC.	7 agosto 2020
Supporto per la ripresa delle esecuzioni del flusso di lavoro	Aggiunte informazioni su come riprendere le esecuzioni del flusso di lavoro completate solo parzialmente perché uno o più nodi (processi o crawler) non sono stati completati correttamente. Per ulteriori informazioni, consulta Ripresa e ripristino dell'esecuzione di un flusso di lavoro.	27 luglio 2020
Supporto per l'abilitazione di certificati emessi da CA privati nelle connessioni Kafka in AWS Glue.	Aggiunte informazioni sulle nuove opzioni di connessione che supportano l'abilitazione dei certificati emessi da una CA privati per le connessioni Kafka in AWS Glue. Per ulteriori informazioni, consulta Tipi e opzioni di connessione per ETL in AWS Glue e Parametri speciali utilizzati da AWS Glue.	20 luglio 2020
Supporto per la lettura dei dati DynamoDB in un altro account	Sono state aggiunte informazioni sul AWS Glue supporto per la lettura dei dati dalla tabella DynamoDB di un altro AWS account Per ulteriori informazioni, vedere Lettura da dati DynamoDB in un altro account.	17 luglio 2020
Support per una connessione writer DynamoDB AWS Glue nella versione 1.0 o successiva	Aggiunte informazioni sul supporto per il writer DynamoDB e opzioni di connessione nuove o aggiornate per la lettura o la scrittura di DynamoDB. Per ulteriori informazioni, consulta Tipi di connessione e opzioni per ETL in AWS Glue.	17 luglio 2020
Supporto per i collegamenti alle risorse e per il controllo degli accessi tra account utilizzando sia AWS Glue che Lake Formation	Sono stati aggiunti contenuti sui nuovi oggetti Data Catalog denominati link alle risorse e su come gestire la condivisione delle risorse di Data Catalog tra account con e AWS Glue . AWS Lake Formation Per ulteriori informazioni, consulta Concedere l'accesso multi-account e Link alle risorse della tabella.	7 luglio 2020
Supporto per il campionamento dei registri durante il crawling dei datastore DynamoDB	Sono state aggiunte informazioni sulle nuove proprietà che puoi configurare durante il crawling di un datastore DynamoDB. Per ulteriori informazioni, consulta Proprietà del crawler.	12 giugno 2020
Supporto per l'arresto di un'esecuzione del flusso di lavoro.	Sono state aggiunte informazioni su come interrompere l'esecuzione di un flusso di lavoro per un determinato flusso di lavoro. Per ulteriori informazioni, vedere Arresto di un'esecuzione del flusso di lavoro.	14 maggio 2020
Supporto per i processi ETL di streaming Spark	Sono state aggiunte informazioni sulla creazione di processi ETL (Extract, Transform and Load) con origini dati in streaming. Per ulteriori informazioni, consulta Aggiunta di processi di streaming ETL in AWS Glue.	27 aprile 2020
Supporto per la creazione di tabelle, l'aggiornamento dello schema e l'aggiunta di nuove partizioni nel catalogo dati dopo l'esecuzione di un processo ETL	Sono state aggiunte informazioni su come abilitare la creazione di tabelle, l'aggiornamento dello schema e l'aggiunta di nuove partizioni per visualizzare i risultati del processo ETL nel catalogo dati. Per ulteriori informazioni, consulta Creazione di tabelle, aggiornamento dello schema e aggiunta di nuove partizioni nel catalogo dati da AWS Glue ETL Jobs.	2 aprile 2020
Support per specificare una versione per il formato di dati Apache Avro come input e output ETL in AWS Glue	Aggiunte informazioni su come specificare una versione per il formato dati Apache Avro come input e output ETL in AWS Glue. La versione predefinita 1.7. Puoi utilizzare l'opzione del formato `version` per specificare Avro versione 1.8 per abilitare la lettura/scrittura logica. Per ulteriori informazioni, consulta Opzioni di formato per ingressi e uscite ETL in. AWS Glue	31 marzo 2020
Supporto per il committer ottimizzato EMRFS S3 per la scrittura di dati Parquet in Amazon S3	Sono state aggiunte informazioni su come impostare un nuovo flag per abilitare il committer ottimizzato EMRFR S3 per la scrittura dei dati Parquet in Amazon S3 durante la creazione o l'aggiornamento di un processo AWS Glue . Per ulteriori informazioni, vedete Parametri speciali utilizzati da. AWS Glue	30 marzo 2020
Il supporto per l'apprendimento automatico si trasforma in una risorsa gestita da tag di AWS risorse	Sono state aggiunte informazioni sull'utilizzo dei tag AWS delle risorse per gestire e controllare l'accesso alle trasformazioni del machine learning. AWS Glue Puoi assegnare tag di AWS risorsa a job, trigger, endpoint, crawler e trasformarsi in machine learning. AWS GluePer ulteriori informazioni, consulta Tag in.AWSAWS Glue	2 marzo 2020
Supporto per argomenti di lavoro non sovrascrivibili	Aggiunte informazioni sul supporto per parametri di lavoro speciali che non possono essere sovrascritti nei trigger o quando si esegue il processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.	12 febbraio 2020
Supporto per nuove trasformazioni per l'utilizzo con set di dati in Amazon S3	Sono state aggiunte informazioni sulle nuove trasformazioni (Merge, Purge e Transition) ed esclusioni delle classi di storage Amazon S3 per applicazioni Apache Spark per l'utilizzo con set di dati in Amazon S3. Per ulteriori informazioni sul supporto per queste trasformazioni per Python, mergeDynamicFrameconsulta Working with Datasets in Amazon S3. Per Scala, vedi e Scala. mergeDynamicFramesAWS Glue GlueContext APIs	16 gennaio 2020
Supporto per l'aggiornamento del Catalogo Dati con nuove informazioni di partizione da un processo ETL	Sono state aggiunte informazioni su come codificare uno script di estrazione, trasformazione e caricamento (ETL) per aggiornarlo AWS Glue Data Catalog con nuove informazioni sulla partizione. Con questa caratteristica, non è più necessario eseguire nuovamente il crawler al termine del processo per visualizzare le nuove partizioni. Per ulteriori informazioni, consulta Aggiornamento del catalogo dati con nuove partizioni.	15 gennaio 2020
Nuovo tutorial: utilizzo di un SageMaker notebook AI	È stato aggiunto un tutorial che dimostra come usare un SageMaker notebook Amazon per aiutarti a sviluppare i tuoi script ETL e di machine learning. Vedi il tutorial: Usa un Amazon SageMaker Notebook con il tuo endpoint di sviluppo.	3 gennaio 2020
Supporto per la lettura da MongoDB e Amazon DocumentDB (compatibile con MongoDB)	Aggiunte informazioni sui nuovi tipi di connessione e opzioni di connessione per leggere e scrivere su MongoDB e Amazon DocumentDB (con compatibilità MongoDB). Per ulteriori informazioni, consulta Tipi di connessione e opzioni per ETL in AWS Glue.	17 dicembre 2019
Varie correzioni e chiarimenti	Sono state aggiunte diverse correzioni e chiarimenti. Sono state rimosse delle voci dal capitolo Problemi noti. Sono stati aggiunti avvisi che AWS Glue supportano solo le chiavi master simmetriche del cliente (CMKs) quando si specificano le impostazioni di crittografia del Data Catalog e si creano configurazioni di sicurezza. È stata aggiunta una nota che AWS Glue non supporta la scrittura su Amazon DynamoDB.	9 dicembre 2019
Supporto per driver JDBC personalizzati	Sono state aggiunte informazioni sulla connessione a sorgenti e destinazioni di dati con driver JDBC che AWS Glue non supportano nativamente, come MySQL versione 8 e Oracle Database versione 18. Per ulteriori informazioni, vedere Valori JDBC ConnectionType.	25 novembre 2019
Support per il collegamento di notebook SageMaker AI a diversi endpoint di sviluppo	Sono state aggiunte informazioni su come collegare un notebook SageMaker AI a diversi endpoint di sviluppo. Aggiornamenti per descrivere la nuova azione della console per il passaggio a un nuovo endpoint di sviluppo e la nuova policy SageMaker AI IAM. Per ulteriori informazioni, consulta Working with Notebooks on the AWS Glue Console e Creazione di una policy IAM per Amazon SageMaker AI Notebooks.	21 novembre 2019
Support per la AWS Glue versione nelle trasformazioni di apprendimento automatico	Sono state aggiunte informazioni sulla definizione della AWS Glue versione in una trasformazione di apprendimento automatico per indicare con quale versione di AWS Glue una trasformazione di apprendimento automatico è compatibile. Per ulteriori informazioni, consulta Working with Machine Learning Transforms sulla AWS Glue console.	21 novembre 2019
Supporto per il riavvolgimento dei segnalibri di processo	Sono state aggiunte informazioni sul riavvolgimento dei segnalibri di processo per qualsiasi esecuzione precedente, con conseguente rielaborazione dei dati dell'esecuzione del processo successivo solo dall'esecuzione del processo con il segnalibro. Sono descritte due nuove opzioni secondarie per l'opzione `job-bookmark-pause` che consentono di eseguire un processo tra due segnalibri. Per ulteriori informazioni, vedere Tracciamento dei dati elaborati utilizzando i segnalibri di lavoro e i parametri speciali utilizzati da AWS Glue.	22 ottobre 2019
Supporto per certificati JDBC personalizzati per la connessione a un archivio dati	Sono state aggiunte informazioni sul AWS Glue supporto dei certificati JDBC personalizzati per le connessioni SSL a sorgenti o destinazioni di AWS Glue dati. Per ulteriori informazioni, consulta Uso di connessioni nella console AWS Glue.	10 ottobre 2019
Supporto per Python wheel	Sono state aggiunte informazioni sul AWS Glue supporto dei file wheel (insieme ai file egg) come dipendenze per i lavori della shell Python. Per ulteriori informazioni, consulta Fornire la propria libreria Python.	26 settembre 2019
Support per il controllo delle versioni degli endpoint di sviluppo in AWS Glue	Sono state aggiunte informazioni sulla definizione degli endpoint `Glue version` in fase di sviluppo. `Glue version`determina le versioni di Apache Spark e Python supportate. AWS Glue Per ulteriori informazioni, consulta Aggiunta di un endpoint di sviluppo.	19 settembre 2019
Support per il monitoraggio AWS Glue tramite Spark UI	Sono state aggiunte informazioni sull'utilizzo dell'interfaccia utente di Apache Spark per monitorare ed eseguire il debug dei job AWS Glue ETL in esecuzione sul sistema dei AWS Glue job e delle applicazioni Spark sugli endpoint di sviluppo. AWS Glue Per ulteriori informazioni, consulta Monitoraggio tramite l'interfaccia utente di Spark. AWS Glue	19 settembre 2019
Miglioramento del supporto per lo sviluppo di script ETL locali tramite la libreria ETL AWS Glue pubblica	È stato aggiornato il contenuto della libreria AWS Glue ETL per indicare che la AWS Glue versione 1.0 è ora supportata. Per ulteriori informazioni, vedete Sviluppo e test di script ETL a livello locale utilizzando la AWS Glue libreria ETL.	18 settembre 2019
Supporto per l'esclusione delle classi di archiviazione Amazon S3 durante l'esecuzione di processi	Sono state aggiunte informazioni sull'esclusione delle classi di storage Amazon S3 durante l'esecuzione di processi AWS Glue ETL che leggono file o partizioni da Amazon S3. Per ulteriori informazioni, consulta Esclusione delle classi di storage Amazon S3.	29 agosto 2019
Support per lo sviluppo di script ETL locali utilizzando la libreria AWS Glue ETL pubblica	Aggiunte informazioni su come sviluppare e testare script ETL Python e Scala in locale senza la necessità di una connessione di rete. Per ulteriori informazioni, vedete Sviluppo e test di script ETL a livello locale utilizzando la libreria ETL. AWS Glue	28 agosto 2019
Problemi noti	Sono state aggiunte informazioni sui problemi noti in AWS Glue. Per ulteriori informazioni, consulta Problemi noti per AWS Glue.	28 agosto 2019
Il supporto per l'apprendimento automatico si trasforma in AWS Glue	Sono state aggiunte informazioni sulle funzionalità di apprendimento automatico fornite da AWS Glue per creare trasformazioni personalizzate. È possibile creare queste trasformazioni al momento della creazione di un processo. Per ulteriori informazioni, consulta Machine Learning Transforms in AWS Glue.	8 agosto 2019
Supporto per Amazon Virtual Private Cloud condiviso	Sono state aggiunte informazioni sul AWS Glue supporto per Amazon Virtual Private Cloud condiviso. Per ulteriori informazioni, consulta Shared Amazon VPCs.	6 agosto 2019
Support per il controllo delle versioni in AWS Glue	Sono state aggiunte informazioni sulla definizione delle `Glue version` proprietà del lavoro. AWS Glue version determina le versioni di Apache Spark e Python supportate. AWS Glue Per ulteriori informazioni, consulta Aggiungere lavori in. AWS Glue	24 luglio 2019
Supporto per le opzioni di configurazione aggiuntive per gli endpoint di sviluppo	Sono state aggiunte informazioni sulle opzioni di configurazione per gli endpoint di sviluppo con carichi di lavoro intensi in termini di memoria. È possibile scegliere tra due nuove configurazioni che offrono maggiore quantità di memoria per esecutore. Per ulteriori informazioni, consulta Lavorare con gli endpoint di sviluppo sulla AWS Glue console.	24 luglio 2019
Supporto per l'esecuzione di attività di estrazione, trasformazione e caricamento (ETL) utilizzando i flussi di lavoro	Sono state aggiunte informazioni sull'utilizzo di un nuovo costrutto chiamato workflow per progettare un'attività ETL (Extract, Transform and Load) complessa che AWS Glue può essere eseguita e monitorata come un'unica entità. Per ulteriori informazioni, vedere Esecuzione di attività ETL complesse utilizzando flussi di lavoro in. AWS Glue	20 giugno 2019
Supporto per Python 3.6 in processi shell di Python	Sono state aggiunte informazioni sul supporto di Python 3.6 in processi shell di Python. Puoi specificare Python 2.7 o Python 3.6 come proprietà di un processo. Per ulteriori informazioni, consulta Aggiunta di processi shell di Python in AWS Glue.	5 giugno 2019
Supporto di endpoint di cloud privato virtuale (VPC, Virtual Private Cloud)	Sono state aggiunte informazioni sulla connessione diretta AWS Glue tramite un endpoint di interfaccia nel tuo VPC. Quando utilizzi un endpoint di interfaccia VPC, la comunicazione tra il tuo VPC e il tuo VPC AWS Glue viene condotta in modo completo e sicuro all'interno della rete. AWS Per ulteriori informazioni, consulta Utilizzo AWS Glue con endpoint VPC.	4 giugno 2019
Support per la registrazione continua e in tempo reale dei AWS Glue lavori.	Sono state aggiunte informazioni sull'attivazione e la visualizzazione dei log dei job di Apache Spark in tempo reale, CloudWatch inclusi i registri dei driver, i log di ciascun executor e una barra di avanzamento dei job Spark. Per ulteriori informazioni, consulta l'articolo relativo alla registrazione continua dei processi AWS Glue.	28 maggio 2019
Supporto per le tabelle del Catalogo Dati esistenti come origini crawler	Sono state aggiunte informazioni su come specificare un elenco di tabelle del catalogo dati esistenti come origini crawler. I crawler possono quindi rilevare le modifiche agli schemi di tabella, aggiornare le definizioni di tabella e registrare nuove partizioni quando i nuovi dati diventano disponibili. Per ulteriori informazioni, consulta Proprietà dei crawler.	10 maggio 2019
Supporto per le opzioni di configurazione aggiuntive per i processi con elevati requisiti di memoria	Sono state aggiunte informazioni sulle opzioni di configurazione per i processi Apache Spark con carichi di lavoro con elevati requisiti di memoria. È possibile scegliere tra due nuove configurazioni che offrono maggiore quantità di memoria per esecutore. Per ulteriori informazioni, consulta Aggiungere lavori in. AWS Glue	5 aprile 2019
Supporto per classificatori CSV personalizzati	Sono state aggiunte informazioni sull'utilizzo di un classificatore CSV personalizzato per dedurre lo schema di vari tipi di dati CSV. Per ulteriori informazioni, consulta Scrittura di classificatori personalizzati.	26 marzo 2019
Support per i tag AWS delle risorse	Sono state aggiunte informazioni sull'utilizzo dei tag AWS delle risorse per aiutarti a gestire e controllare l'accesso alle tue AWS Glue risorse. Puoi assegnare tag di AWS risorsa a job, trigger, endpoint e crawler in. AWS GluePer ulteriori informazioni, consulta Tag in.AWSAWS Glue	20 marzo 2019
Supporto del Catalogo Dati per i processi Spark SQL	Sono state aggiunte informazioni sulla configurazione dei AWS Glue job e degli endpoint di sviluppo da utilizzare AWS Glue Data Catalog come Apache Hive Metastore esterno. In questo modo i processi e gli endpoint di sviluppo eseguono le query Apache Spark SQL direttamente sulle tabelle archiviate in AWS Glue Data Catalog. Per ulteriori informazioni, consulta l'argomento relativo al AWS Glue Data Catalog supporto di per i processi Spark SQL.	14 marzo 2019
Supporto per processi shell di Python	Aggiunte informazioni sui processi shell di Python e il nuovo campo Maximum capacity (Capacità massima). Per ulteriori informazioni, consulta l'argomento relativo all'aggiunta di processi shell di Python in AWS Glue.	18 gennaio 2019
Supporto per le notifiche quando sono presenti modifiche di database e di tabelle	Aggiunte informazioni sugli eventi generati a causa di modifiche al database, alla tabella e alle chiamate all'API della partizione. È possibile configurare le azioni in CloudWatch Events per rispondere a questi eventi. Per ulteriori informazioni, consulta Automazione AWS Glue con CloudWatch eventi.	16 gennaio 2019
Supporto per la crittografia delle password di connessione	Aggiunte informazioni sulla crittografia di password utilizzate in oggetti di connessione. Per ulteriori informazioni, consulta Crittografia delle password di connessione.	11 dicembre 2018
Supporto per le autorizzazioni a livello della risorsa e per le policy basate sulla risorsa	Sono state aggiunte informazioni sull'utilizzo delle autorizzazioni a livello di risorsa e delle politiche basate sulle risorse con. AWS Glue Per ulteriori informazioni, consulta gli argomenti indicati in Sicurezza in AWS Glue.	15 ottobre 2018
Support per notebook SageMaker AI	Sono state aggiunte informazioni sull'utilizzo dei notebook SageMaker AI con endpoint di sviluppo. AWS Glue Per ulteriori informazioni, consulta Gestione di notebook.	5 ottobre 2018
Supporto per la crittografia	Sono state aggiunte informazioni sull'utilizzo della crittografia con. AWS Glue Per ulteriori informazioni, consulta Crittografia dei dati inattivi, Crittografia dei dati in transito e Configurazione della crittografia in AWS Glue.	24 agosto 2018
Supporto per i parametri di processo Apache Spark	Aggiunta di informazioni sull'uso dei parametri Apache Spark per migliorare il debug e la profilatura dei processi ETL. È possibile tenere facilmente traccia delle metriche di runtime, ad esempio i byte letti e scritti, l'utilizzo della memoria e il carico sulla CPU del driver e degli esecutori e lo spostamento dei dati tra gli esecutori dalla console. AWS Glue Per ulteriori informazioni, consulta Monitoring AWS Glue Using CloudWatch Metrics, Job Monitoring and Debugging e Working with Jobs on the Console. AWS Glue	13 luglio 2018
Supporto di DynamoDB come origine dati	Aggiunta di informazioni sul crawling di DynamoDB e su come usarlo come origine dati dei processi ETL. Per ulteriori informazioni, consulta Catalogazione di tabelle con un crawler e Parametri di connessione.	10 luglio 2018
Aggiornamenti alla procedura di creazione di un server notebook	Informazioni aggiornate su come creare un server notebook su un' EC2 istanza Amazon associata a un endpoint di sviluppo. Per ulteriori informazioni, consulta Creazione di un server notebook associato a un endpoint di sviluppo.	9 luglio 2018
Aggiornamenti ora disponibili tramite RSS	È ora possibile abbonarsi a un feed RSS per ricevere notifiche sugli aggiornamenti alla Guida per gli sviluppatori di AWS Glue .	25 giugno 2018
Supporto delle notifiche di ritardo per i processi	Aggiunte informazioni sulla configurazione di una soglia di ritardo durante l'esecuzione di un processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.	25 maggio 2018
Configurazione di un crawler per aggiungere nuove colonne	Sono state aggiunte informazioni sulla nuova opzione di configurazione per i crawler,. MergeNewColumns Per maggiori informazioni, consulta Configurazione di un crawler.	7 maggio 2018
Supporto del timeout dei processi	Aggiunte informazioni sull'impostazione di una soglia di timeout durante l'esecuzione di un processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.	10 aprile 2018
Supporto script Scala ETL e processi trigger basati su stati di esecuzione aggiuntivi	Informazioni aggiunte sull'utilizzo di Scala come linguaggio di programmazione ETL. Ora l'API trigger supporta anche l'attivazione se viene soddisfatta una qualsiasi delle condizioni (in aggiunta a tutte le condizioni). Inoltre, i processi possono essere attivati sulla base di un'esecuzione processo "non riuscita" o "arrestata" (in aggiunta a un'esecuzione processo "riuscita").	12 gennaio 2018

Aggiornamenti precedenti

La tabella seguente descrive le modifiche importanti apportate in ogni versione della Guida per sviluppatori AWS Glue prima di gennaio 2018.

Modifica	Descrizione	Data
Supporto origini dati XML e nuova opzione di configurazione crawler	Informazioni aggiunte sulla classificazione di origini dati XML e nuova opzione crawler per modifiche della partizione.	16 novembre 2017
Nuove trasformazioni, supporto per motori di database Amazon RDS aggiuntivi e miglioramenti degli endpoint di sviluppo	Informazioni aggiunte sulle trasformazioni di filtraggio e mappatura, supporto per Amazon RDS Microsoft SQL Server e Amazon RDS Oracle e nuove caratteristiche per gli endpoint di sviluppo.	29 settembre 2017
AWS Glue versione iniziale	Questa è la versione iniziale della Guida per gli sviluppatori di AWS Glue .	14 agosto 2017

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Problemi noti

AWS Glossario

Argomento successivo:

AWS Glossario

Argomento precedente:

Problemi noti

Hai bisogno di aiuto?

In questa pagina

Seleziona le tue preferenze relative ai cookie

Personalizza le tue preferenze relative ai cookie

Essenziali

Prestazione

Funzionali

Pubblicitari

Impossibile salvare le preferenze dei cookie