Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Modifica | Descrizione | Data |
---|---|---|
Support per altri 14 nuovi connettori nativi SaaS per AWS Glue | Sono stati aggiunti altri quattordici connettori nativi SaaS. AWS Glue Per ulteriori informazioni, vedere Aggiungere una AWS Glue connessione. | 30 gennaio 2025 |
Support per altri 16 nuovi connettori nativi SaaS per AWS Glue | Sono stati aggiunti altri sedici connettori nativi SaaS. AWS Glue Per ulteriori informazioni, vedere Aggiungere una AWS Glue connessione. | 17 dicembre 2024 |
Generazione automatica di statistiche sulle colonne | AWS Glue Data Quality ora supporta Amazon SageMaker AI LakeHouse tabelle e tabelle Iceberg, Delta e HUDI AWS Lake Formation gestite in Data Catalog ed ETL. Per ulteriori informazioni, consulta AWS Glue Data Quality. | 6 dicembre 2024 |
Support per integrazioni zero-ETL | Zero-ETL è un insieme di integrazioni completamente gestite AWS che riduce al minimo la necessità di creare pipeline di dati ETL. Per ulteriori informazioni, consulta Integrazioni zero-ETL. | 3 dicembre 2024 |
Support per connessioni riutilizzabili | Un nuovo schema di AWS Glue connessioni offre un modo unificato per gestire le connessioni dati tra AWS servizi e applicazioni AWS Glue, come Amazon Athena e SageMaker Amazon Unified Studio. Per ulteriori informazioni, consulta Connessione ai dati. | 3 dicembre 2024 |
Support per AWS Glue la versione 5.0. | Sono state aggiunte informazioni sul supporto per la AWS Glue versione 5.0. Le funzionalità includono un aggiornamento di Apache Spark alla versione 3.52, un aggiornamento di Java alla versione 17, aggiornamenti del formato open table, controllo degli accessi a grana fine nativo di Spark, integrazione con Sagemaker Lakehouse e l'astrazione del data warehouse, supporto in Sagemaker Unified Studio e altro ancora. Per ulteriori AWS Glue informazioni AWS Glue, AWS Glue consulta le Note di rilascio e la migrazione dei lavori alla versione 5.0. | 3 dicembre 2024 |
Connessione all' AWS Glue Data Catalog utilizzo dell'endpoint AWS Glue REST Iceberg | AWS Glue l'endpoint REST di Iceberg supporta le operazioni API specificate nella specifica REST di Apache Iceberg. Utilizzando un client Iceberg REST, puoi connettere l'applicazione in esecuzione su un motore di analisi al catalogo REST ospitato nel Data Catalog. Per ulteriori informazioni, consulta Accesso al catalogo dati. | 3 dicembre 2024 |
Generazione automatica di statistiche sulle colonne | Genera automaticamente statistiche sulle colonne per nuove tabelle in AWS Glue Data Catalog. Per ulteriori informazioni, vedere Generazione automatica di statistiche sulle colonne. | 3 dicembre 2024 |
Support per gli aggiornamenti generativi dell'intelligenza artificiale per Apache Spark in AWS Glue | Spark Upgrades in AWS Glue consente ai data engineer e agli sviluppatori di aggiornare e migrare, aggiornare e migrare i job Spark esistenti alle ultime versioni di AWS Glue Spark utilizzando l'intelligenza artificiale generativa. Per ulteriori informazioni, consulta Upgrade analysis with AI. | 22 novembre 2024 |
Support per la risoluzione dei problemi di intelligenza artificiale generativa per Apache Spark in AWS Glue | Generative AI Troubleshooting for Apache Spark jobs in AWS Glue aiuta i data engineer e gli scienziati a diagnosticare e risolvere i problemi nelle loro applicazioni Spark con facilità. Per ulteriori informazioni, consulta Risoluzione dei problemi relativi ai job Spark con AI. | 22 novembre 2024 |
Support per gli ottimizzatori Iceberg per accedere ai bucket Amazon S3 in un VPC | AWS Glue Data Catalog supporta gli ottimizzatori di tabelle Iceberg per accedere ai bucket Amazon S3 da uno specifico Virtual Private Cloud (VPC) utilizzando una connessione di rete. AWS Glue Per ulteriori informazioni, consulta Ottimizzazione delle tabelle Iceberg. | 20 novembre 2024 |
Support per altri nove nuovi connettori nativi SaaS per AWS Glue | Sono stati aggiunti altri nove connettori nativi SaaS. AWS Glue Per ulteriori informazioni, vedere Aggiungere una AWS Glue connessione. | 19 novembre 2024 |
Support per dieci nuovi connettori nativi SaaS per AWS Glue | Sono stati aggiunti dieci connettori nativi SaaS. AWS Glue Per ulteriori informazioni, vedere Aggiungere una AWS Glue connessione. | 15 novembre 2024 |
Support per l'esecuzione dei job, l'accodamento per AWS Glue i job ETL | È possibile attivare l'accodamento dei job run per eseguire i job in un secondo momento, quando non possono essere eseguiti immediatamente a causa delle quote di servizio. Per maggiori informazioni, consulta Configurazione delle proprietà dei job per i job Spark in. AWS Glue | 3 settembre 2024 |
Modifiche politiche aggiornate | Modifiche documentate alle AwsGlueSessionUserRestrictedNotebookServiceRolepolitiche AwsGlueSessionUserRestrictedNotebookPolicye, necessarie per il supporto delle sessioni con tag-on-create la chiave del tag proprietario. Per ulteriori informazioni, consulta AWS Glue gli aggiornamenti alle politiche AWS gestite. | 30 agosto 2024 |
Il rilevamento delle anomalie e le regole dinamiche sono ora disponibili a livello generale | AWS Glue Data Quality utilizza un algoritmo di apprendimento automatico per apprendere dalle tendenze passate e quindi prevedere i valori futuri per rilevare le anomalie. Dynamic Rules consente di fornire soglie dinamiche. Per ulteriori informazioni, vedere Ottimizzazione delle prestazioni delle query per le tabelle Iceberg. | 7 agosto 2024 |
Modifiche aggiornate alle politiche | Modifiche documentate alle AwsGlueSessionUserRestrictedServiceRolepolitiche AwsGlueSessionUserRestrictedPolicye, necessarie per il supporto delle sessioni con tag-on-create la chiave del tag proprietario. Per ulteriori informazioni, consulta AWS Glue gli aggiornamenti alle politiche AWS gestite. | 5 agosto 2024 |
La generazione di statistiche sulle colonne per le tabelle Iceberg è ora disponibile a tutti | AWS Glue supporta il calcolo e l'aggiornamento del numero di valori distinti (NDVs) per ogni colonna nelle tabelle Iceberg. Per ulteriori informazioni, consulta Rilevamento delle anomalie nelle regole dinamiche e di qualità AWS Glue dei dati. | 9 luglio 2024 |
Support per i profili AWS Glue di utilizzo | Gli amministratori possono creare profili di AWS Glue utilizzo per varie classi di utenti all'interno dell'account, come sviluppatori, tester e team di prodotto. Questa flessibilità consente agli amministratori di applicare controlli di utilizzo e costi diversi per ogni classe di utenti. Per ulteriori informazioni, vedere Configurazione dei profili AWS Glue di utilizzo. | 18 giugno 2024 |
Support per un connettore Salesforce per AWS Glue Spark | Sono state aggiunte informazioni su un nuovo AWS Glue connettore per Salesforce. Questa funzionalità consente di utilizzare Spark AWS Glue per leggere e scrivere su Salesforce nella AWS Glue versione 4.0 e successive. Per ulteriori informazioni, consulta Connessione a Salesforce. | 22 maggio 2024 |
Integrazione dei dati di Amazon Q in AWS Glue (GA) | L'integrazione dei dati di Amazon Q AWS Glue è una nuova funzionalità di intelligenza artificiale generativa AWS Glue che consente ai data engineer e agli sviluppatori ETL di creare lavori di integrazione dei dati utilizzando il linguaggio naturale. Gli ingegneri e gli sviluppatori possono chiedere a Q di creare lavori, risolvere problemi e rispondere a domande sull' AWS Glue integrazione dei dati. Per ulteriori informazioni, consulta Integrazione dei dati di Amazon Q in AWS Glue. Questa funzionalità include un aggiornamento e una | 30 aprile 2024 |
Integrazione dei dati di Amazon Q in AWS Glue (anteprima) | L'integrazione dei dati di Amazon Q AWS Glue è una nuova funzionalità di intelligenza artificiale generativa AWS Glue che consente ai data engineer e agli sviluppatori ETL di creare lavori di integrazione dei dati utilizzando il linguaggio naturale. Gli ingegneri e gli sviluppatori possono chiedere a Q di creare lavori, risolvere problemi e rispondere a domande sull' AWS Glue integrazione dei dati. Per ulteriori informazioni, consulta Integrazione dei dati di Amazon Q in AWS Glue. Questa funzionalità include un aggiornamento della politica | 30 gennaio 2024 |
Aggiornamento della documentazione per AWS Glue lo streaming | Aggiunto un nuovo capitolo con contenuti nuovi e riorganizzati per AWS Glue lo streaming. Questo contenuto descrive come funziona lo streaming AWS Glue, le caratteristiche dell'elaborazione dei dati in tempo reale e come monitorare i processi di streaming. Per ulteriori informazioni, consulta la pagina AWS Glue Streaming. | 27 dicembre 2023 |
Supporto per l'utilizzo del rilevamento dei dati sensibili granulari | La trasformazione relativa al rilevamento dei dati sensibili fornisce la possibilità di rilevare, mascherare o rimuovere le entità che hai definito o che sono predefinite da AWS Glue. Le azioni granulari consentono inoltre di applicare un'azione specifica per entità. Per ulteriori informazioni, consulta Utilizzo del rilevamento dei dati sensibili granulari. | 26 novembre 2023 |
Support per il monitoraggio dei lavori con metriche AWS Glue di Observability | Usa le metriche AWS Glue di Observability per generare approfondimenti su ciò che accade all'interno dei tuoi lavori di Apache Spark AWS Glue per migliorare la classificazione e l'analisi dei problemi. Per ulteriori informazioni, consulta Monitoraggio con metriche di osservabilità. AWS Glue | 26 novembre 2023 |
Support per il rilevamento delle anomalie in AWS Glue Data Quality | AWS Glue Il rilevamento delle anomalie relative alla qualità dei dati applica nel tempo algoritmi di machine learning (ML) alle statistiche dei dati per rilevare modelli anomali e problemi nascosti di qualità dei dati che sono difficili da rilevare attraverso le regole. Per ulteriori informazioni, consulta Rilevamento delle anomalie nella qualità dei dati. AWS Glue | 26 novembre 2023 |
Aggiornamento al comportamento di registrazione predefinito dell'interfaccia utente di Spark | I job Spark che generano i log dell'interfaccia utente Spark ora verranno scritti con un modello di nome file diverso per supportare l'interfaccia utente Spark nella console. AWS Glue Ciò non modifica il comportamento dei log. CloudWatch È possibile ripristinare il comportamento legacy aggiornando la configurazione del processo. Per ulteriori informazioni, consulta Monitoraggio dei processi tramite l'interfaccia utente Web di Apache Spark. | 17 novembre 2023 |
Support per nuove fonti di dati in AWS Glue for Spark | Le connessioni ad Amazon OpenSearch Service, Azure SQL, Azure Cosmos for NoSQL, SAP HANA Teradata Vantage e Vertica sono ora supportate nativamente all'interno. AWS Glue Inoltre, le connessioni a queste fonti di dati, oltre a MongoDB, sono ora disponibili per l'uso nell' AWS Glue editor visivo di Studio. Per ulteriori informazioni, consulta Tipi di connessione e opzioni per ETL in AWS Glue for Spark AWS Glue per informazioni sul supporto di Spark e Aggiungere una AWS Glue connessione per informazioni sull'uso nell'editor visivo di Studio. AWS Glue | 17 novembre 2023 |
Supporto per generare le statistiche delle colonne | Puoi calcolare statistiche a livello di colonna per AWS Glue Data Catalog tabelle in formati di dati come Parquet, ORC, JSON, ION, CSV e XML senza configurare pipeline di dati aggiuntive. Per ulteriori informazioni, consulta Utilizzo delle statistiche delle colonne. | 16 novembre 2023 |
Supporto per la compattazione dei dati per le tabelle Iceberg | Per migliorare le prestazioni di lettura da parte di servizi di AWS analisi come Amazon Athena e Amazon EMR e i processi AWS Glue ETL, Data Catalog offre la compattazione gestita (un processo che compatta piccoli oggetti Amazon S3 in oggetti più grandi) per le tabelle Iceberg in Data Catalog. Per ulteriori informazioni, consulta Ottimizzazione delle tabelle Iceberg. | 13 novembre 2023 |
Aggiornamento al comportamento di attesa dell'esecuzione del processo | Le esecuzioni del processo standard di shell (interprete di comandi) Spark e Python ora passeranno a | 8 novembre 2023 |
AWS Glue StudioAWS Glue guida per l'utente consolidata nella guida per sviluppatori | La guida per AWS Glue Studio l'utente è stata spostata nella guida per sviluppatori per creare un'unica guida utente unificata per AWS Glue Studio la AWS Glue console e l'accesso AWS Glue Studio programmatico. | 25 ottobre 2023 |
Aggiornamento della policy gestita AWSGlue ServiceNotebookRole AWS | Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlue ServiceNotebookRole AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite. | 9 ottobre 2023 |
AWS Glue Studio supporta cinque nuove trasformazioni integrate | AWS Glue Studio supporta le seguenti cinque nuove trasformazioni integrate: Record matching, Remove null rows, Parse JSON column, Extract JSON path e Regex extractor. Per ulteriori informazioni, consulta Modifica dei nodi di trasformazione dei dati gestiti. AWS Glue | 11 agosto 2023 |
Aggiornamento della politica AWSGlue ServiceRole AWS gestita | Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlue ServiceRole AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite. | 4 agosto 2023 |
Supporto per il crawling delle tabelle Apache Hudi | Sono state aggiunte informazioni sull'utilizzo AWS Glue per eseguire la scansione delle tabelle Hudi nei bucket Amazon S3 e sulla registrazione delle tabelle Hudi in. AWS Glue Data Catalog Per ulteriori informazioni, consulta le pagine Which data stores can I crawl? e Crawler properties. | 21 luglio 2023 |
Aggiornamento della politica gestita AWSGlue ConsoleFullAccess AWS | Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlue ConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite. | 14 luglio 2023 |
Supporto per il crawling delle tabelle Apache Iceberg | Sono state aggiunte informazioni sull'utilizzo AWS Glue per eseguire la scansione delle tabelle Iceberg nei bucket Amazon S3 e sulla registrazione delle tabelle Iceberg in. AWS Glue Data Catalog Per ulteriori informazioni, consulta le pagine Which data stores can I crawl? e Crawler properties. | 7 luglio 2023 |
Support per AWS Glue with Ray | Sono state aggiunte informazioni su AWS Glue with Ray, un nuovo motore in grado di supportare i AWS Glue lavori. Riorganizzato il contenuto esistente AWS Glue con Spark per chiarire le ambiguità. | 30 maggio 2023 |
Support per la qualità AWS Glue dei dati (GA) | AWS Glue La qualità dei dati è ora disponibile a livello generale. AWS Glue Data Quality ti aiuta a valutare e monitorare la qualità dei tuoi dati. Per informazioni su come utilizzare AWS Glue Data Quality con Data Catalog, consulta AWS Glue Data Quality. Per ulteriori informazioni sulla qualità AWS Glue dei dati per AWS Glue Studio, consulta Valutazione della qualità dei dati con AWS Glue Studio. | 24 maggio 2023 |
Supporto per tipi di worker di grandi dimensioni per i processi Apache Spark | È ora disponibile il supporto per l'uso dei tipi di worker | 8 maggio 2023 |
Supporto per la creazione di indici di partizione durante il crawling delle tabelle | Sono state aggiunte informazioni sul modo in cui i crawler supportano la creazione di indici di partizione per le tabelle rilevate dal crawler. Per ulteriori informazioni, consulta la pagina Setting the partition index crawler configuration option. | 24 aprile 2023 |
Supporto per i parametri di utilizzo delle risorse | Sono state aggiunte informazioni sulla visualizzazione dell'utilizzo delle risorse del servizio e sulla configurazione degli allarmi in Amazon. CloudWatch Per ulteriori informazioni, consulta la pagina AWS Glue resource monitoring. | 7 aprile 2023 |
Aggiornamento della politica gestita AWSGlue ConsoleFullAccess AWS | Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlue ConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite. | 28 marzo 2023 |
Sono state aggiunte linee guida per l'utilizzo AWS Glue con un AWS SDK con esempi | La Guida per gli AWS Glue sviluppatori contiene due nuove sezioni che forniscono informazioni utili per l'utilizzo AWS Glue con un AWS SDK. Per ulteriori informazioni, consulta Utilizzo AWS Glue con un AWS SDK e Esempi di codice per l' AWS Glueutilizzo. AWS SDKs | 23 febbraio 2023 |
Aggiornamento della documentazione per IAM con AWS Glue | Informazioni riorganizzate e aggiunte sull'utilizzo di IAM con AWS Glue. Per ulteriori informazioni, consulta Identity and Access Management per AWS Glue. | 15 febbraio 2023 |
Support per l'esecuzione di job ETL in streaming nella AWS Glue versione 4.0 | Sono state aggiunte informazioni sul supporto per l'esecuzione di processi ETL di streaming in Glue versione 4.0 e nuove opzioni per la connessione a un cluster Kafka o a un cluster Amazon Managed Streaming per Apache Kafka e flussi di dati Amazon Kinesis. Per ulteriori informazioni, consulta Aggiunta di processi ETL di streaming in AWS Glue e Tipi di connessione e opzioni per ETL in AWS Glue. | 8 febbraio 2023 |
Supporto per il crawling delle origini dati MongoDB Atlas | Sono state aggiunte informazioni sull'utilizzo AWS Glue per la scansione delle fonti di dati MongoDB Atlas. Per ulteriori informazioni, consulta Quali archivi di dati posso scansionare? , proprietà di connessione MongoDB e MongoDB Atlas e Utilizzo di una connessione MongoDB o MongoDB Atlas. | 6 febbraio 2023 |
Supporto per il crawling delle tabelle Delta Lake con un connettore Delta Lake nativo | Sono state aggiunte informazioni sull'utilizzo AWS Glue per la scansione delle tabelle Delta Lake utilizzando un connettore Delta Lake nativo. Questa funzionalità ti consente di utilizzare i motori di AWS query per interrogare direttamente il registro delle transazioni Delta e utilizzare funzionalità come i viaggi nel tempo e le garanzie ACID, e di sincronizzare i metadati Delta Lake dai file di transazione di Amazon S3 nel Data Catalog per abilitare le autorizzazioni alle colonne sulle tue query in Lake Formation. Per ulteriori informazioni, consulta Come specificare le opzioni di configurazione per un archivio di dati Delta Lake e Interrogazione delle tabelle Delta Lake. | 15 dicembre 2022 |
Support for AWS Glue Data Quality (anteprima) | Il supporto è ora disponibile per AWS Glue Data Quality (anteprima). AWS Glue Data Quality consente di valutare e monitorare la qualità dei dati quando si utilizza la AWS Glue versione 3.0. Per informazioni su come utilizzare AWS Glue Data Quality con Data Catalog, vedi AWS Glue Data Quality (anteprima). Per ulteriori informazioni sulla qualità AWS Glue dei dati per AWS Glue Studio, consulta Valutazione della qualità dei dati con AWS Glue Studio. | 30 novembre 2022 |
Supporto per un nuovo connettore Amazon Redshift Spark con nuove funzionalità e miglioramenti delle prestazioni | È ora disponibile il supporto per un nuovo connettore Amazon Redshift Spark con un nuovo driver JDBC da utilizzare con i processi AWS Glue ETL per creare applicazioni Apache Spark in grado di leggere e scrivere dati in Amazon Redshift come parte delle pipeline di acquisizione e trasformazione dei dati. Per ulteriori informazioni, consulta Spostamento di dati da e verso Amazon Redshift. | 29 novembre 2022 |
Support per AWS Glue la versione 4.0. | Sono state aggiunte informazioni sul supporto per la AWS Glue versione 4.0. Le funzionalità includono il supporto nativo per i framework data lake aperti con Apache Hudi, Delta Lake e Apache Iceberg e il supporto nativo per il plug-in di archiviazione cloud shuffle basato su Amazon S3 (un plug-in Apache Spark) per utilizzare Amazon S3 per la capacità di archiviazione shuffle ed elastica. Per ulteriori informazioni, vedere Note di AWS Glue rilascio e Migrazione dei AWS Glue lavori alla AWS Glue versione 4.0. | 28 novembre 2022 |
AWS Glue Studio ora offre trasformazioni visive personalizzate | Le trasformazioni visive personalizzate consentono ai clienti di definire, riutilizzare e condividere la logica ETL specifica dell'azienda tra i propri team. Per ulteriori informazioni, consulta Trasformazioni visive personalizzate. | 28 novembre 2022 |
Support per l'utilizzo del AWS Glue crawler per pubblicare metadati per archivi dati JDBC | È ora disponibile il supporto per l'utilizzo del AWS Glue crawler per pubblicare metadati come commenti e tipi rawtype nel Data Catalog for JDBC data store. Per ulteriori informazioni, consulta Parametri impostati nelle tabelle del catalogo dati per crawler, proprietà del crawler e struttura. JdbcTarget | 18 novembre 2022 |
Supporto per il crawling di datastore Snowflake | È ora disponibile il supporto per AWS Glue eseguire la scansione delle tabelle e delle viste Snowflake e per pubblicare i metadati nel Data Catalog come voce di tabella. Per le tabelle esterne Snowflake in Amazon S3, il crawler esegue il crawling anche della posizione Amazon S3 e del tipo di formato di file della tabella esterna e lo compila come parametri della tabella. Per ulteriori informazioni, consulta Quali datastore posso sottoporre a crawling?, Proprietà della connessione a AWS Glue e Parametri impostati nelle tabelle del catalogo di dati dal crawler. | 18 novembre 2022 |
Supporto per una migliore gestione dello shuffle delle applicazioni Spark | È ora disponibile il supporto per un nuovo plug-in di archiviazione cloud shuffle per Apache Spark. Per ulteriori informazioni, consulta Plug-in shuffle di AWS Glue Spark con Amazon S3 e Plug-in di archiviazione cloud shuffle per Apache Spark. | 15 novembre 2022 |
È stato aggiunto il supporto per gli obiettivi di Data Catalog durante l'accelerazione delle scansioni e le notifiche degli eventi di Amazon S3 | Oltre al supporto esistente per i target Amazon S3, è ora disponibile il supporto per accelerare le scansioni per le destinazioni Data Catalog utilizzando le notifiche di eventi di Amazon S3. Per ulteriori informazioni, consulta Accelerazione della ricerca per indicizzazione usando le notifiche eventi Amazon S3. | 13 ottobre 2022 |
Supporto per specificare il numero massimo di tabelle che un crawler può creare | È ora disponibile il supporto per specificare il numero massimo di tabelle che il crawler può creare. Per ulteriori informazioni, consulta la pagina Come specificare il numero massimo di tabelle che il crawler può creare. | 6 settembre 2022 |
Supporto per Python 3.9 nei job della shell Python in AWS Glue | Il supporto è ora disponibile per l'esecuzione di script compatibili con Python 3.9 nei AWS Glue job della shell Python in e per la scelta di utilizzare set di librerie preconfezionate. Per ulteriori informazioni, consulta Processi della shell Python in AWS Glue. | 11 agosto 2022 |
Support per l'esecuzione di AWS Glue lavori non urgenti o non urgenti utilizzando capacità inutilizzata | È ora disponibile il supporto per la configurazione di esecuzioni flessibili per processi non urgenti come processi di pre-produzione, test e caricamenti di dati una tantum. Per ulteriori informazioni, consulta Aggiungere lavori in. AWS Glue | 9 agosto 2022 |
Il supporto per un nuovo tipo di worker per i processi di streaming | Il supporto di questo servizio di Support per l'uso del tipo di worker | 14 luglio 2022 |
Support per l'uso di Kafka SASL nelle connessioni AWS Glue | Il supporto è ora disponibile per l'uso di Kafka SASL nelle connessioni. AWS Glue Per ulteriori informazioni, consulta AWS Glue Proprietà di connessione Kafka per l'autenticazione client. | 5 luglio 2022 |
Supporto per il connettore Apache Kafka per gli schemi protobuf | Il supporto di Apache Kafka Connector è attualmente disponibile per gli schemi Protobuf. Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue. | 9 giugno 2022 |
Support per Auto Scaling for AWS Glue jobs (GA) | Sono state aggiunte informazioni sull'utilizzo di Auto Scaling for jobs nella AWS Glue versione 3.0 per scalare dinamicamente le risorse di elaborazione. Per ulteriori informazioni, consulta Utilizzo di Auto Scaling per AWS Glue. | 14 aprile 2022 |
Aggiornamento della documentazione per lo AWS Glue sviluppo e il test degli script di lavoro AWS Glue | Informazioni riorganizzate e aggiunte sui metodi di sviluppo e test disponibili per AWS Glue, comprese le istruzioni per lo sviluppo con Docker. Per ulteriori informazioni, consulta Sviluppo e test di script di AWS Glue lavoro. | 14 marzo 2022 |
Aggiunta di buffer di protocollo (protobuf) come formato di dati supportato per il registro degli schemi AWS Glue | Aggiunte informazioni su Protobuf come formato dati supportato (oltre ad AVRO e JSON). Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue. | 25 febbraio 2022 |
Supporto per il crawling delle tabelle Delta Lake | Sono state aggiunte informazioni sull'utilizzo AWS Glue per la scansione delle tabelle Delta Lake. Per ulteriori informazioni, consulta Come specificare le opzioni di configurazione per un archivio dati Delta Lake. | 24 febbraio 2022 |
Support per approfondimenti sul AWS Glue lavoro | Sono state aggiunte informazioni sull'utilizzo di AWS Glue Job Insights per semplificare il debug e l'ottimizzazione dei job. AWS Glue Per ulteriori informazioni, consulta Monitoraggio con AWS Glue Job Insights. | 8 febbraio 2022 |
Supporto per il crawling di tabelle Catalogo dati supportate da Amazon S3 utilizzando un endpoint VPC | Oltre all'archivio dati di Amazon S3, si possono configurare le tabelle Catalogo dati supportate da Amazon S3 per consentire l'accesso solo a un ambiente Amazon Virtual Private Cloud (Amazon VPC) per motivi di sicurezza, audit o controllo. Per ulteriori informazioni, consulta Crawling di un datastore Amazon S3 o di tabelle Catalogo dati supportate da Amazon S3 utilizzando un endpoint VPC. | 3 febbraio 2022 |
Supporto per le tavole governate dalla Lake Formation | Sono state aggiunte informazioni sul AWS Glue supporto per le tabelle governate da Lake Formation, che supportano le transazioni ACID, la compattazione automatica dei dati e le query sui viaggi nel tempo. Per ulteriori informazioni, consulta API AWS Glue, e Guida per gli sviluppatori di AWS Lake Formation. | 30 novembre 2021 |
Nuove politiche AWS gestite aggiunte per sessioni e notebook interattivi | Le nuove policy gestite per IAM hanno fornito una maggiore sicurezza per l'utilizzo AWS Glue con sessioni e notebook interattivi. Per ulteriori informazioni, consulta la sezione Policy gestite da AWS per AWS Glue. | 30 novembre 2021 |
Il registro dello schema Glue ora supportato con i processi di streaming | È possibile creare processi di streaming che accedono alle tabelle che fanno parte di Glue Schema Registry. Per ulteriori informazioni, consulta AWS Glue Schema Registry e Aggiunta di processi di streaming ETL in AWS Glue. | 15 novembre 2021 |
Supporto per nuove caratteristiche di machine learning | Aggiunte informazioni sulle nuove funzionalità per la trasformazione di machine learning Ricerca corrispondenze, tra cui la corrispondenza incrementale e il punteggio di corrispondenza. Per ulteriori informazioni, consulta Ricerca di corrispondenze incrementali e Stima della qualità delle corrispondenze utilizzando i punteggi di confidenza delle corrispondenze. | 31 ottobre 2021 |
(Anteprima privata) Support per AWS Glue lavori flessibili | Sono state aggiunte informazioni sulla configurazione dei job AWS Glue Spark con una classe di esecuzione flessibile, adatta per lavori che non richiedono tempo e i cui tempi di inizio e completamento possono variare. Per ulteriori informazioni, consulta Aggiungere lavori in. AWS Glue | 29 ottobre 2021 |
Supporto per accelerare la ricerca per indicizzazione usando le notifiche eventi Amazon S3 | Sono state aggiunte informazioni sull'accelerazione della ricerca per indicizzazione utilizzando le notifiche degli eventi Amazon S3. Per ulteriori informazioni, consulta Accelerazione della ricerca per indicizzazione usando le notifiche eventi Amazon S3. | 15 ottobre 2021 |
Opzioni di configurazione di sicurezza aggiuntive relative al controllo degli accessi e VPCs | Sono state aggiunte informazioni su come configurare nuove autorizzazioni di controllo degli accessi AWS Glue e sulla configurazione di. VPCs Per ulteriori informazioni, consulta AWS Tags in AWS Glue, Identity-Based Policies (IAM Policies) che controllano le impostazioni utilizzando chiavi di condizione o chiavi contestuali e Configurazione di tutte le AWS chiamate in modo che passino attraverso il tuo VPC. | 13 ottobre 2021 |
Supporto per le policy di endpoint VPC | Aggiunte informazioni sul supporto per policy endpoint Virtual Private Cloud (VPC) in AWS Glue. Per ulteriori informazioni consulta AWS Glue ed endpoint VPC di interfaccia (AWS PrivateLink). | 11 ottobre 2021 |
Glue Studio è ora disponibile in Cina | AWS Glue Studio è ora disponibile nelle regioni Cina, Pechino e Ningxia. | 11 ottobre 2021 |
AWS Glue Studio offre la creazione di notebook, per la modifica interattiva dei lavori | I notebook consentono di scrivere ed eseguire codice, visualizzare i risultati e condividere informazioni. In genere, i data scientist utilizzano i notebook per esperimenti e attività di esplorazione dei dati. Per ulteriori informazioni, consulta Utilizzo di notebook. | 1° ottobre 2021 |
L'accesso diretto alle fonti di streaming ora disponibile | Quando si aggiungono origini dati al processo ETL nell'editor visivo, è possibile fornire informazioni per accedere al flusso di dati, anziché utilizzare un database e una tabella di Data Catalog. | 30 settembre 2021 |
Ha documentato la politica di supporto delle AWS Glue versioni | Sono state aggiunte informazioni sulla politica di supporto delle AWS Glue versioni e sulle fasi di fine vita per alcune AWS Glue versioni. Per ulteriori informazioni, consulta Policy di supporto versione AWS Glue. | 24 settembre 2021 |
I connettori personalizzati possono ora essere utilizzati con le anteprime dei dati | Quando modifichi il nodo dell'origine dati utilizzando un connettore personalizzato, puoi visualizzare in anteprima il set di dati scegliendo la scheda Anteprima dati. Per ulteriori informazioni, consulta Connettori personalizzati. | 24 settembre 2021 |
Support per sessioni AWS Glue interattive (anteprima privata) | (Anteprima privata) Sono state aggiunte informazioni sull'utilizzo di sessioni AWS Glue interattive per eseguire carichi di lavoro Spark nel cloud da qualsiasi notebook Jupyter. Le sessioni interattive sono il metodo preferito per sviluppare il codice ETL ( AWS Glue Extract, Transform, Load) quando si utilizza la versione 2.0 o successiva. AWS Glue Per ulteriori informazioni, vedere Configurazione ed esecuzione di sessioni AWS Glue interattive per Jupyter Notebook. | 24 agosto 2021 |
Supporto per la creazione di flussi di lavoro dai progetti (GA) | (Anteprima pubblica) Sono state aggiunte informazioni sulla codifica dei casi d'uso comuni di estrazione, trasformazione e caricamento (ETL) nei piani e sulla creazione di flussi di lavoro dai piani. Consente agli analisti di dati di creare ed eseguire facilmente processi ETL complessi. Per ulteriori informazioni, consulta Esecuzione di attività ETL complesse utilizzando gli schemi e i flussi di lavoro in AWS Glue. | 23 agosto 2021 |
Support per AWS Glue la versione 3.0. | Sono state aggiunte informazioni sul supporto per la AWS Glue versione 3.0 che supporta l'aggiornamento del motore Apache Spark 3.0 per l'esecuzione dei job ETL di Apache Spark e altre ottimizzazioni e aggiornamenti. Per ulteriori informazioni, consulta le note di AWS Glue rilascio e la migrazione dei lavori alla versione 3.0. AWS GlueAWS Glue Altre funzionalità di questa versione includono lo AWS Glue shuffle manager, un lettore CSV vettorializzato SIMD e i predicati delle partizioni del catalogo. Per ulteriori informazioni, consulta AWS Glue Spark shuffle manager con Amazon S3, Opzioni di formato per ingressi e uscite ETL e Filtraggio lato server utilizzando i predicati delle partizioni del catalogo AWS Glue. | 18 agosto 2021 |
AWS GovCloud (US) Region | AWS Glue Studio è ora disponibile in AWS GovCloud (US) Region | 18 agosto 2021 |
Creazione di shell Python disponibile in AWS Glue Studio | Quando si crea un nuovo processo, è ora possibile scegliere di creare un processo di shell Python. Per ulteriori informazioni, consulta Avvio della creazione del processo e Modifica di processi shell Python in AWS Glue Studio. | 13 agosto 2021 |
Support per l'avvio di un flusso di lavoro con un EventBridge evento Amazon | Sono state aggiunte informazioni su come AWS Glue può essere un consumatore di eventi in un'architettura basata sugli eventi. Per ulteriori informazioni, consulta Avvio di un AWS Glue flusso di lavoro con un EventBridge evento Amazon e Visualizzazione degli EventBridge eventi che hanno avviato un flusso di lavoro. | 14 luglio 2021 |
Aggiunta di JSON come formato di dati supportato per il registro degli AWS Glue schemi | Aggiunte informazioni su JSON come formato dati supportato (oltre ad AVRO). Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue. | 30 giugno 2021 |
Crea lavori di AWS Glue streaming senza una tabella Data Catalog | La funzione Python | 15 giugno 2021 |
AWS Glue le trasformazioni di apprendimento automatico ora supportano AWS Key Management Service le chiavi | È possibile specificare una configurazione o una AWS KMS chiave di sicurezza quando si configurano le trasformazioni di AWS Glue Machine Learning con la console, la CLI o il. AWS Glue APIs Per ulteriori informazioni, consulta Utilizzo della crittografia dati con le trasformazioni basate su machine learning e API di Machine Learning AWS Glue. | 15 giugno 2021 |
Aggiornamento alla politica gestita AWSGlue ConsoleFullAccess AWS | Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlue ConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite. | 10 giugno 2021 |
Visualizzare il set di dati del processo durante la creazione e la modifica dei processi | È possibile utilizzare la nuova scheda di anteprima dati per un nodo nel diagramma del processo per visualizzare un esempio dei dati elaborati da tale nodo. Per ulteriori informazioni, consulta Utilizzo delle anteprime dei dati nell'editor visivo dei processi. | 7 giugno 2021 |
Supporto per specificare un valore che indica la posizione della tabella per l'output del crawler. | Sono state aggiunte informazioni su come specificare un valore che indica la posizione della tabella durante la configurazione dell'output del crawler. Per ulteriori informazioni, consulta Come specificare la posizione della tabella. | 4 giugno 2021 |
Supporto per il crawling di un campione di file in un set di dati durante il crawling di un archivio dati Amazon S3 | Sono state aggiunte informazioni su come eseguire il crawling di un campione di file durante il crawling di Amazon S3. Per ulteriori informazioni, consulta Proprietà del crawler. | 10 maggio 2021 |
Support per la scrittura AWS Glue ottimizzata del parquet | Sono state aggiunte informazioni sull'utilizzo del parquet writer AWS Glue ottimizzato DynamicFrames per creare o aggiornare tabelle con la | 4 maggio 2021 |
Supporto per le password di autenticazione client Kafka | Sono state aggiunte informazioni su come i job ETL in streaming AWS Glue supportano l'autenticazione dei certificati client SSL con i produttori di stream Apache Kafka. Ora puoi fornire un certificato personalizzato durante la definizione di una AWS Glue connessione a un cluster Apache Kafka, che verrà utilizzato per l'autenticazione con esso. AWS Glue Per ulteriori informazioni, consulta Proprietà della connessione AWS Glue e API di connessione. | 28 Aprile 2021 |
Supporto per l'utilizzo di dati da Amazon Kinesis Data Streams in un altro account nei processi ETL di streaming | Sono state aggiunte informazioni su come creare un processo ETL di streaming per utilizzare i dati da Amazon Kinesis Data Streams in un altro account. Per ulteriori informazioni, consulta Aggiungere lavori ETL in streaming in. AWS Glue | 30 marzo 2021 |
Trasformazione SQL disponibile | Puoi utilizzare un nodo di trasformazione SQL per scrivere la tua trasformazione sotto forma di query SQL. Per ulteriori informazioni, consulta Utilizzo di una query SQL per trasformare i dati. | 23 marzo 2021 |
Supporto per la creazione di flussi di lavoro dagli schemi (anteprima pubblica) | (Anteprima pubblica) Sono state aggiunte informazioni sulla codifica dei casi d'uso comuni di estrazione, trasformazione e caricamento (ETL) nei piani e sulla creazione di flussi di lavoro dai piani. Consente agli analisti di dati di creare ed eseguire facilmente processi ETL complessi. Per ulteriori informazioni, consulta Esecuzione di attività ETL complesse utilizzando gli schemi e i flussi di lavoro in AWS Glue. | 22 marzo 2021 |
I connettori possono essere utilizzati per le destinazioni dati | L'utilizzo di un Marketplace AWS connettore o personalizzato per la destinazione dei dati è ora supportato. Per ulteriori informazioni, consulta Creazione di processi con connettori personalizzati. | 15 marzo 2021 |
Support per le metriche di importanza delle colonne per le trasformazioni dell'apprendimento AWS Glue automatico | Sono state aggiunte informazioni sulla visualizzazione delle metriche di importanza delle colonne quando si lavora con le trasformazioni di apprendimento AWS Glue automatico. Per ulteriori informazioni, consulta Working with Machine Learning Transforms sulla console AWS Glue | 5 febbraio 2021 |
Job scheduling ora disponibile in AWS Glue Studio | È possibile definire una pianificazione basata sul tempo per le esecuzioni del processo in AWS Glue Studio. È possibile utilizzare la console per creare una pianificazione di base o definire una pianificazione più complessa utilizzando la sintassi cron | 21 dicembre 2020 |
AWS Glue Sono stati rilasciati connettori personalizzati | AWS Glue I connettori personalizzati consentono di scoprire e abbonarsi ai connettori in Marketplace AWS. Abbiamo anche rilasciato le interfacce di runtime AWS Glue Spark per collegare connettori creati per Apache Spark Datasource, Athena federated query e JDBC. APIs Per ulteriori informazioni, consulta Utilizzo di connettori e connessioni con. AWS Glue Studio | 21 dicembre 2020 |
Support per l'esecuzione di job ETL in streaming nella AWS Glue versione 2.0 | Aggiunte informazioni sull'esecuzione di processi ETL di streaming in Glue versione 2.0. Per ulteriori informazioni, consulta Aggiungere lavori ETL in streaming in. AWS Glue | 18 dicembre 2020 |
Supporto per il partizionamento del carico di lavoro con esecuzione limitata | Aggiunte informazioni sull'abilitazione del partizionamento del carico di lavoro per configurare i limiti superiori della dimensione del set di dati o il numero di file elaborati nelle esecuzioni dei processi ETL. Per ulteriori informazioni, consulta Partizionamento del carico di lavoro con esecuzione limitata. | 23 novembre 2020 |
Supporto per una gestione avanzata delle partizioni | Sono state aggiunte informazioni su come utilizzare new APIs per aggiungere o eliminare un indice di partizione da/a una tabella esistente. Per ulteriori informazioni, consulta Utilizzo degli indici delle partizioni. | 23 novembre 2020 |
Support per il registro AWS Glue degli schemi | Sono state aggiunte informazioni sull'utilizzo dello AWS Glue Schema Registry per individuare, controllare ed evolvere centralmente gli schemi. Per ulteriori informazioni, vedere AWS Glue Schema Registry. | 19 novembre 2020 |
Supporto per il formato di input Grok nei processi ETL di streaming | Aggiunte informazioni sull'applicazione dei pattern Grok alle origini di streaming, ad esempio i file di log. Per ulteriori informazioni, consulta Applicazione di pattern Grok alle sorgenti di streaming. | 17 novembre 2020 |
Support per l'aggiunta di tag ai flussi di lavoro sulla console AWS Glue | Sono state aggiunte informazioni sull'aggiunta di tag durante la creazione di un flusso di lavoro utilizzando la console AWS Glue . Per ulteriori informazioni, consulta Creazione e creazione di un flusso di lavoro utilizzando la AWS Glue console. | 27 ottobre 2020 |
Supporto per le esecuzione incrementale del crawler | Aggiunte informazioni sul supporto per le esecuzioni di crawler incrementali, che eseguono il crawling solo delle cartelle Amazon S3 aggiunte dall'ultima esecuzione. Per ulteriori informazioni, consulta Crawling incrementale. | 21 ottobre 2020 |
Supporto per il rilevamento dello schema per le origini dati ETL di streaming. supporto per le origini dei dati ETL di streaming Avro e Kafka autogestito | I job di estrazione, trasformazione e caricamento (ETL) in streaming AWS Glue possono ora rilevare automaticamente lo schema dei record in entrata e gestire le modifiche allo schema per record. Sono ora supportate le origini di dati Kafka autogestite. I processi ETL di streaming ora supportano il formato Avro nelle origini dati. Per ulteriori informazioni, vedere Streaming ETL in AWS Glue, Definizione delle proprietà del lavoro per un lavoro ETL di streaming e Note e restrizioni per le sorgenti di streaming Avro. | 7 ottobre 2020 |
Supporto per il crawling delle origini dei dati MongoDB e DocumentDB | Aggiunte informazioni sul supporto per il crawling delle origini dati MongoDB e Amazon DocumentDB (con compatibilità MongoDB). Per ulteriori informazioni, consulta Definizione di crawler. | 5 ottobre 2020 |
Supporto per la conformità a FIPS | Aggiunte informazioni sugli endpoint FIPS per i clienti che necessitano di moduli crittografici convalidati FIPS 140-2 quando accedono ai dati con AWS Glue. Per ulteriori informazioni, consulta la pagina Conformità FIPS. | 23 settembre 2020 |
AWS Glue Studio fornisce un'interfaccia visiva facile da usare per la creazione e il monitoraggio dei lavori | Ora è possibile utilizzare una semplice interfaccia grafica per comporre lavori che spostano e trasformano i dati ed eseguirli su AWS Glue. È quindi possibile utilizzare il pannello di controllo di esecuzione dei processi in AWS Glue Studio per monitorare l'esecuzione di ETL e garantire che i processi funzionino come previsto. Per ulteriori informazioni, consulta AWS Glue Studio Guida per l'utente. | 23 settembre 2020 |
Supporto per la creazione di indici di tabella per migliorare le prestazioni delle query | Aggiunte informazioni sulla creazione di indici di tabella per consentire il recupero di un sottoinsieme di partizioni da una tabella. Per ulteriori informazioni, consulta Utilizzo degli indici delle partizioni. | 9 settembre 2020 |
Supporto per tempi di startup ridotti durante l'esecuzione di processi ETL di Apache Spark in AWS Glue versione 2.0. | Sono state aggiunte informazioni sul supporto per la AWS Glue versione 2.0 che fornisce un'infrastruttura aggiornata per l'esecuzione dei job ETL di Apache Spark con tempi di avvio ridotti, modifiche nella registrazione e supporto per specificare moduli Python aggiuntivi a livello di job. Per ulteriori informazioni, consulta Note di rilascio di AWS Glue ed Esecuzione di processi ETL Spark con tempi di avvio ridotti. | 10 agosto 2020 |
Supporto per limitare il numero di esecuzioni simultanee del flusso di lavoro. | Aggiunte informazioni su come limitare il numero di esecuzioni simultanee per un determinato flusso di lavoro. Per ulteriori informazioni, consulta Creazione e creazione di un flusso di lavoro utilizzando la console. AWS Glue | 10 agosto 2020 |
Supporto per il crawling di un datastore Amazon S3 utilizzando un endpoint VPC | Aggiunte informazioni sulla configurazione dell'archivio dati Amazon S3 per consentire l'accesso solo a un ambiente Amazon Virtual Private Cloud (Amazon VPC) per motivi di sicurezza, audit o controllo. Per ulteriori informazioni, consulta Crawling di un datastore Amazon S3 utilizzando un endpoint VPC. | 7 agosto 2020 |
Supporto per la ripresa delle esecuzioni del flusso di lavoro | Aggiunte informazioni su come riprendere le esecuzioni del flusso di lavoro completate solo parzialmente perché uno o più nodi (processi o crawler) non sono stati completati correttamente. Per ulteriori informazioni, consulta Ripresa e ripristino dell'esecuzione di un flusso di lavoro. | 27 luglio 2020 |
Supporto per l'abilitazione di certificati emessi da CA privati nelle connessioni Kafka in AWS Glue. | Aggiunte informazioni sulle nuove opzioni di connessione che supportano l'abilitazione dei certificati emessi da una CA privati per le connessioni Kafka in AWS Glue. Per ulteriori informazioni, consulta Tipi e opzioni di connessione per ETL in AWS Glue e Parametri speciali utilizzati da AWS Glue. | 20 luglio 2020 |
Supporto per la lettura dei dati DynamoDB in un altro account | Sono state aggiunte informazioni sul AWS Glue supporto per la lettura dei dati dalla tabella DynamoDB di un altro AWS account Per ulteriori informazioni, vedere Lettura da dati DynamoDB in un altro account. | 17 luglio 2020 |
Support per una connessione writer DynamoDB AWS Glue nella versione 1.0 o successiva | Aggiunte informazioni sul supporto per il writer DynamoDB e opzioni di connessione nuove o aggiornate per la lettura o la scrittura di DynamoDB. Per ulteriori informazioni, consulta Tipi di connessione e opzioni per ETL in AWS Glue. | 17 luglio 2020 |
Supporto per i collegamenti alle risorse e per il controllo degli accessi tra account utilizzando sia AWS Glue che Lake Formation | Sono stati aggiunti contenuti sui nuovi oggetti Data Catalog denominati link alle risorse e su come gestire la condivisione delle risorse di Data Catalog tra account con e AWS Glue . AWS Lake Formation Per ulteriori informazioni, consulta Concedere l'accesso multi-account e Link alle risorse della tabella. | 7 luglio 2020 |
Supporto per il campionamento dei registri durante il crawling dei datastore DynamoDB | Sono state aggiunte informazioni sulle nuove proprietà che puoi configurare durante il crawling di un datastore DynamoDB. Per ulteriori informazioni, consulta Proprietà del crawler. | 12 giugno 2020 |
Supporto per l'arresto di un'esecuzione del flusso di lavoro. | Sono state aggiunte informazioni su come interrompere l'esecuzione di un flusso di lavoro per un determinato flusso di lavoro. Per ulteriori informazioni, vedere Arresto di un'esecuzione del flusso di lavoro. | 14 maggio 2020 |
Supporto per i processi ETL di streaming Spark | Sono state aggiunte informazioni sulla creazione di processi ETL (Extract, Transform and Load) con origini dati in streaming. Per ulteriori informazioni, consulta Aggiunta di processi di streaming ETL in AWS Glue. | 27 aprile 2020 |
Supporto per la creazione di tabelle, l'aggiornamento dello schema e l'aggiunta di nuove partizioni nel catalogo dati dopo l'esecuzione di un processo ETL | Sono state aggiunte informazioni su come abilitare la creazione di tabelle, l'aggiornamento dello schema e l'aggiunta di nuove partizioni per visualizzare i risultati del processo ETL nel catalogo dati. Per ulteriori informazioni, consulta Creazione di tabelle, aggiornamento dello schema e aggiunta di nuove partizioni nel catalogo dati da AWS Glue ETL Jobs. | 2 aprile 2020 |
Support per specificare una versione per il formato di dati Apache Avro come input e output ETL in AWS Glue | Aggiunte informazioni su come specificare una versione per il formato dati Apache Avro come input e output ETL in AWS Glue. La versione predefinita 1.7. Puoi utilizzare l'opzione del formato | 31 marzo 2020 |
Supporto per il committer ottimizzato EMRFS S3 per la scrittura di dati Parquet in Amazon S3 | Sono state aggiunte informazioni su come impostare un nuovo flag per abilitare il committer ottimizzato EMRFR S3 per la scrittura dei dati Parquet in Amazon S3 durante la creazione o l'aggiornamento di un processo AWS Glue . Per ulteriori informazioni, vedete Parametri speciali utilizzati da. AWS Glue | 30 marzo 2020 |
Il supporto per l'apprendimento automatico si trasforma in una risorsa gestita da tag di AWS risorse | Sono state aggiunte informazioni sull'utilizzo dei tag AWS delle risorse per gestire e controllare l'accesso alle trasformazioni del machine learning. AWS Glue Puoi assegnare tag di AWS risorsa a job, trigger, endpoint, crawler e trasformarsi in machine learning. AWS GluePer ulteriori informazioni, consulta Tag in.AWSAWS Glue | 2 marzo 2020 |
Supporto per argomenti di lavoro non sovrascrivibili | Aggiunte informazioni sul supporto per parametri di lavoro speciali che non possono essere sovrascritti nei trigger o quando si esegue il processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue. | 12 febbraio 2020 |
Supporto per nuove trasformazioni per l'utilizzo con set di dati in Amazon S3 | Sono state aggiunte informazioni sulle nuove trasformazioni (Merge, Purge e Transition) ed esclusioni delle classi di storage Amazon S3 per applicazioni Apache Spark per l'utilizzo con set di dati in Amazon S3. Per ulteriori informazioni sul supporto per queste trasformazioni per Python, mergeDynamicFrameconsulta Working with Datasets in Amazon S3. Per Scala, vedi e Scala. mergeDynamicFramesAWS Glue GlueContext APIs | 16 gennaio 2020 |
Supporto per l'aggiornamento del Catalogo Dati con nuove informazioni di partizione da un processo ETL | Sono state aggiunte informazioni su come codificare uno script di estrazione, trasformazione e caricamento (ETL) per aggiornarlo AWS Glue Data Catalog con nuove informazioni sulla partizione. Con questa caratteristica, non è più necessario eseguire nuovamente il crawler al termine del processo per visualizzare le nuove partizioni. Per ulteriori informazioni, consulta Aggiornamento del catalogo dati con nuove partizioni. | 15 gennaio 2020 |
Nuovo tutorial: utilizzo di un SageMaker notebook AI | È stato aggiunto un tutorial che dimostra come usare un SageMaker notebook Amazon per aiutarti a sviluppare i tuoi script ETL e di machine learning. Vedi il tutorial: Usa un Amazon SageMaker Notebook con il tuo endpoint di sviluppo. | 3 gennaio 2020 |
Supporto per la lettura da MongoDB e Amazon DocumentDB (compatibile con MongoDB) | Aggiunte informazioni sui nuovi tipi di connessione e opzioni di connessione per leggere e scrivere su MongoDB e Amazon DocumentDB (con compatibilità MongoDB). Per ulteriori informazioni, consulta Tipi di connessione e opzioni per ETL in AWS Glue. | 17 dicembre 2019 |
Varie correzioni e chiarimenti | Sono state aggiunte diverse correzioni e chiarimenti. Sono state rimosse delle voci dal capitolo Problemi noti. Sono stati aggiunti avvisi che AWS Glue supportano solo le chiavi master simmetriche del cliente (CMKs) quando si specificano le impostazioni di crittografia del Data Catalog e si creano configurazioni di sicurezza. È stata aggiunta una nota che AWS Glue non supporta la scrittura su Amazon DynamoDB. | 9 dicembre 2019 |
Supporto per driver JDBC personalizzati | Sono state aggiunte informazioni sulla connessione a sorgenti e destinazioni di dati con driver JDBC che AWS Glue non supportano nativamente, come MySQL versione 8 e Oracle Database versione 18. Per ulteriori informazioni, vedere Valori JDBC ConnectionType. | 25 novembre 2019 |
Support per il collegamento di notebook SageMaker AI a diversi endpoint di sviluppo | Sono state aggiunte informazioni su come collegare un notebook SageMaker AI a diversi endpoint di sviluppo. Aggiornamenti per descrivere la nuova azione della console per il passaggio a un nuovo endpoint di sviluppo e la nuova policy SageMaker AI IAM. Per ulteriori informazioni, consulta Working with Notebooks on the AWS Glue Console e Creazione di una policy IAM per Amazon SageMaker AI Notebooks. | 21 novembre 2019 |
Support per la AWS Glue versione nelle trasformazioni di apprendimento automatico | Sono state aggiunte informazioni sulla definizione della AWS Glue versione in una trasformazione di apprendimento automatico per indicare con quale versione di AWS Glue una trasformazione di apprendimento automatico è compatibile. Per ulteriori informazioni, consulta Working with Machine Learning Transforms sulla AWS Glue console. | 21 novembre 2019 |
Supporto per il riavvolgimento dei segnalibri di processo | Sono state aggiunte informazioni sul riavvolgimento dei segnalibri di processo per qualsiasi esecuzione precedente, con conseguente rielaborazione dei dati dell'esecuzione del processo successivo solo dall'esecuzione del processo con il segnalibro. Sono descritte due nuove opzioni secondarie per l'opzione | 22 ottobre 2019 |
Supporto per certificati JDBC personalizzati per la connessione a un archivio dati | Sono state aggiunte informazioni sul AWS Glue supporto dei certificati JDBC personalizzati per le connessioni SSL a sorgenti o destinazioni di AWS Glue dati. Per ulteriori informazioni, consulta Uso di connessioni nella console AWS Glue. | 10 ottobre 2019 |
Supporto per Python wheel | Sono state aggiunte informazioni sul AWS Glue supporto dei file wheel (insieme ai file egg) come dipendenze per i lavori della shell Python. Per ulteriori informazioni, consulta Fornire la propria libreria Python. | 26 settembre 2019 |
Support per il controllo delle versioni degli endpoint di sviluppo in AWS Glue | Sono state aggiunte informazioni sulla definizione degli endpoint | 19 settembre 2019 |
Support per il monitoraggio AWS Glue tramite Spark UI | Sono state aggiunte informazioni sull'utilizzo dell'interfaccia utente di Apache Spark per monitorare ed eseguire il debug dei job AWS Glue ETL in esecuzione sul sistema dei AWS Glue job e delle applicazioni Spark sugli endpoint di sviluppo. AWS Glue Per ulteriori informazioni, consulta Monitoraggio tramite l'interfaccia utente di Spark. AWS Glue | 19 settembre 2019 |
Miglioramento del supporto per lo sviluppo di script ETL locali tramite la libreria ETL AWS Glue pubblica | È stato aggiornato il contenuto della libreria AWS Glue ETL per indicare che la AWS Glue versione 1.0 è ora supportata. Per ulteriori informazioni, vedete Sviluppo e test di script ETL a livello locale utilizzando la AWS Glue libreria ETL. | 18 settembre 2019 |
Supporto per l'esclusione delle classi di archiviazione Amazon S3 durante l'esecuzione di processi | Sono state aggiunte informazioni sull'esclusione delle classi di storage Amazon S3 durante l'esecuzione di processi AWS Glue ETL che leggono file o partizioni da Amazon S3. Per ulteriori informazioni, consulta Esclusione delle classi di storage Amazon S3. | 29 agosto 2019 |
Support per lo sviluppo di script ETL locali utilizzando la libreria AWS Glue ETL pubblica | Aggiunte informazioni su come sviluppare e testare script ETL Python e Scala in locale senza la necessità di una connessione di rete. Per ulteriori informazioni, vedete Sviluppo e test di script ETL a livello locale utilizzando la libreria ETL. AWS Glue | 28 agosto 2019 |
Problemi noti | Sono state aggiunte informazioni sui problemi noti in AWS Glue. Per ulteriori informazioni, consulta Problemi noti per AWS Glue. | 28 agosto 2019 |
Il supporto per l'apprendimento automatico si trasforma in AWS Glue | Sono state aggiunte informazioni sulle funzionalità di apprendimento automatico fornite da AWS Glue per creare trasformazioni personalizzate. È possibile creare queste trasformazioni al momento della creazione di un processo. Per ulteriori informazioni, consulta Machine Learning Transforms in AWS Glue. | 8 agosto 2019 |
Supporto per Amazon Virtual Private Cloud condiviso | Sono state aggiunte informazioni sul AWS Glue supporto per Amazon Virtual Private Cloud condiviso. Per ulteriori informazioni, consulta Shared Amazon VPCs. | 6 agosto 2019 |
Support per il controllo delle versioni in AWS Glue | Sono state aggiunte informazioni sulla definizione delle | 24 luglio 2019 |
Supporto per le opzioni di configurazione aggiuntive per gli endpoint di sviluppo | Sono state aggiunte informazioni sulle opzioni di configurazione per gli endpoint di sviluppo con carichi di lavoro intensi in termini di memoria. È possibile scegliere tra due nuove configurazioni che offrono maggiore quantità di memoria per esecutore. Per ulteriori informazioni, consulta Lavorare con gli endpoint di sviluppo sulla AWS Glue console. | 24 luglio 2019 |
Supporto per l'esecuzione di attività di estrazione, trasformazione e caricamento (ETL) utilizzando i flussi di lavoro | Sono state aggiunte informazioni sull'utilizzo di un nuovo costrutto chiamato workflow per progettare un'attività ETL (Extract, Transform and Load) complessa che AWS Glue può essere eseguita e monitorata come un'unica entità. Per ulteriori informazioni, vedere Esecuzione di attività ETL complesse utilizzando flussi di lavoro in. AWS Glue | 20 giugno 2019 |
Supporto per Python 3.6 in processi shell di Python | Sono state aggiunte informazioni sul supporto di Python 3.6 in processi shell di Python. Puoi specificare Python 2.7 o Python 3.6 come proprietà di un processo. Per ulteriori informazioni, consulta Aggiunta di processi shell di Python in AWS Glue. | 5 giugno 2019 |
Supporto di endpoint di cloud privato virtuale (VPC, Virtual Private Cloud) | Sono state aggiunte informazioni sulla connessione diretta AWS Glue tramite un endpoint di interfaccia nel tuo VPC. Quando utilizzi un endpoint di interfaccia VPC, la comunicazione tra il tuo VPC e il tuo VPC AWS Glue viene condotta in modo completo e sicuro all'interno della rete. AWS Per ulteriori informazioni, consulta Utilizzo AWS Glue con endpoint VPC. | 4 giugno 2019 |
Support per la registrazione continua e in tempo reale dei AWS Glue lavori. | Sono state aggiunte informazioni sull'attivazione e la visualizzazione dei log dei job di Apache Spark in tempo reale, CloudWatch inclusi i registri dei driver, i log di ciascun executor e una barra di avanzamento dei job Spark. Per ulteriori informazioni, consulta l'articolo relativo alla registrazione continua dei processi AWS Glue. | 28 maggio 2019 |
Supporto per le tabelle del Catalogo Dati esistenti come origini crawler | Sono state aggiunte informazioni su come specificare un elenco di tabelle del catalogo dati esistenti come origini crawler. I crawler possono quindi rilevare le modifiche agli schemi di tabella, aggiornare le definizioni di tabella e registrare nuove partizioni quando i nuovi dati diventano disponibili. Per ulteriori informazioni, consulta Proprietà dei crawler. | 10 maggio 2019 |
Supporto per le opzioni di configurazione aggiuntive per i processi con elevati requisiti di memoria | Sono state aggiunte informazioni sulle opzioni di configurazione per i processi Apache Spark con carichi di lavoro con elevati requisiti di memoria. È possibile scegliere tra due nuove configurazioni che offrono maggiore quantità di memoria per esecutore. Per ulteriori informazioni, consulta Aggiungere lavori in. AWS Glue | 5 aprile 2019 |
Supporto per classificatori CSV personalizzati | Sono state aggiunte informazioni sull'utilizzo di un classificatore CSV personalizzato per dedurre lo schema di vari tipi di dati CSV. Per ulteriori informazioni, consulta Scrittura di classificatori personalizzati. | 26 marzo 2019 |
Support per i tag AWS delle risorse | Sono state aggiunte informazioni sull'utilizzo dei tag AWS delle risorse per aiutarti a gestire e controllare l'accesso alle tue AWS Glue risorse. Puoi assegnare tag di AWS risorsa a job, trigger, endpoint e crawler in. AWS GluePer ulteriori informazioni, consulta Tag in.AWSAWS Glue | 20 marzo 2019 |
Supporto del Catalogo Dati per i processi Spark SQL | Sono state aggiunte informazioni sulla configurazione dei AWS Glue job e degli endpoint di sviluppo da utilizzare AWS Glue Data Catalog come Apache Hive Metastore esterno. In questo modo i processi e gli endpoint di sviluppo eseguono le query Apache Spark SQL direttamente sulle tabelle archiviate in AWS Glue Data Catalog. Per ulteriori informazioni, consulta l'argomento relativo al AWS Glue Data Catalog supporto di per i processi Spark SQL. | 14 marzo 2019 |
Supporto per processi shell di Python | Aggiunte informazioni sui processi shell di Python e il nuovo campo Maximum capacity (Capacità massima). Per ulteriori informazioni, consulta l'argomento relativo all'aggiunta di processi shell di Python in AWS Glue. | 18 gennaio 2019 |
Supporto per le notifiche quando sono presenti modifiche di database e di tabelle | Aggiunte informazioni sugli eventi generati a causa di modifiche al database, alla tabella e alle chiamate all'API della partizione. È possibile configurare le azioni in CloudWatch Events per rispondere a questi eventi. Per ulteriori informazioni, consulta Automazione AWS Glue con CloudWatch eventi. | 16 gennaio 2019 |
Supporto per la crittografia delle password di connessione | Aggiunte informazioni sulla crittografia di password utilizzate in oggetti di connessione. Per ulteriori informazioni, consulta Crittografia delle password di connessione. | 11 dicembre 2018 |
Supporto per le autorizzazioni a livello della risorsa e per le policy basate sulla risorsa | Sono state aggiunte informazioni sull'utilizzo delle autorizzazioni a livello di risorsa e delle politiche basate sulle risorse con. AWS Glue Per ulteriori informazioni, consulta gli argomenti indicati in Sicurezza in AWS Glue. | 15 ottobre 2018 |
Support per notebook SageMaker AI | Sono state aggiunte informazioni sull'utilizzo dei notebook SageMaker AI con endpoint di sviluppo. AWS Glue Per ulteriori informazioni, consulta Gestione di notebook. | 5 ottobre 2018 |
Supporto per la crittografia | Sono state aggiunte informazioni sull'utilizzo della crittografia con. AWS Glue Per ulteriori informazioni, consulta Crittografia dei dati inattivi, Crittografia dei dati in transito e Configurazione della crittografia in AWS Glue. | 24 agosto 2018 |
Supporto per i parametri di processo Apache Spark | Aggiunta di informazioni sull'uso dei parametri Apache Spark per migliorare il debug e la profilatura dei processi ETL. È possibile tenere facilmente traccia delle metriche di runtime, ad esempio i byte letti e scritti, l'utilizzo della memoria e il carico sulla CPU del driver e degli esecutori e lo spostamento dei dati tra gli esecutori dalla console. AWS Glue Per ulteriori informazioni, consulta Monitoring AWS Glue Using CloudWatch Metrics, Job Monitoring and Debugging e Working with Jobs on the Console. AWS Glue | 13 luglio 2018 |
Supporto di DynamoDB come origine dati | Aggiunta di informazioni sul crawling di DynamoDB e su come usarlo come origine dati dei processi ETL. Per ulteriori informazioni, consulta Catalogazione di tabelle con un crawler e Parametri di connessione. | 10 luglio 2018 |
Aggiornamenti alla procedura di creazione di un server notebook | Informazioni aggiornate su come creare un server notebook su un' EC2 istanza Amazon associata a un endpoint di sviluppo. Per ulteriori informazioni, consulta Creazione di un server notebook associato a un endpoint di sviluppo. | 9 luglio 2018 |
Aggiornamenti ora disponibili tramite RSS | È ora possibile abbonarsi a un feed RSS per ricevere notifiche sugli aggiornamenti alla Guida per gli sviluppatori di AWS Glue . | 25 giugno 2018 |
Supporto delle notifiche di ritardo per i processi | Aggiunte informazioni sulla configurazione di una soglia di ritardo durante l'esecuzione di un processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue. | 25 maggio 2018 |
Configurazione di un crawler per aggiungere nuove colonne | Sono state aggiunte informazioni sulla nuova opzione di configurazione per i crawler,. MergeNewColumns Per maggiori informazioni, consulta Configurazione di un crawler. | 7 maggio 2018 |
Supporto del timeout dei processi | Aggiunte informazioni sull'impostazione di una soglia di timeout durante l'esecuzione di un processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue. | 10 aprile 2018 |
Supporto script Scala ETL e processi trigger basati su stati di esecuzione aggiuntivi | Informazioni aggiunte sull'utilizzo di Scala come linguaggio di programmazione ETL. Ora l'API trigger supporta anche l'attivazione se viene soddisfatta una qualsiasi delle condizioni (in aggiunta a tutte le condizioni). Inoltre, i processi possono essere attivati sulla base di un'esecuzione processo "non riuscita" o "arrestata" (in aggiunta a un'esecuzione processo "riuscita"). | 12 gennaio 2018 |
Aggiornamenti precedenti
La tabella seguente descrive le modifiche importanti apportate in ogni versione della Guida per sviluppatori AWS Glue prima di gennaio 2018.
Modifica | Descrizione | Data |
---|---|---|
Supporto origini dati XML e nuova opzione di configurazione crawler | Informazioni aggiunte sulla classificazione di origini dati XML e nuova opzione crawler per modifiche della partizione. | 16 novembre 2017 |
Nuove trasformazioni, supporto per motori di database Amazon RDS aggiuntivi e miglioramenti degli endpoint di sviluppo | Informazioni aggiunte sulle trasformazioni di filtraggio e mappatura, supporto per Amazon RDS Microsoft SQL Server e Amazon RDS Oracle e nuove caratteristiche per gli endpoint di sviluppo. | 29 settembre 2017 |
AWS Glue versione iniziale | Questa è la versione iniziale della Guida per gli sviluppatori di AWS Glue . | 14 agosto 2017 |