Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Preparazione dei dati con SQL in Studio

Modalità Focus
Preparazione dei dati con SQL in Studio - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Amazon SageMaker Studio fornisce un'estensione SQL integrata. Questa estensione consente ai data scientist di eseguire attività come campionamento, analisi esplorativa e progettazione delle funzionalità direttamente all'interno dei propri JupyterLab notebook. Sfrutta le AWS Glue connessioni per mantenere un catalogo centralizzato delle fonti di dati. Il catalogo memorizza i metadati relativi a varie fonti di dati. Attraverso questo ambiente SQL, i data scientist possono sfogliare i cataloghi di dati, esplorare i loro dati, creare query SQL complesse ed elaborare ulteriormente i risultati in Python.

Questa sezione illustra la configurazione dell'estensione SQL in Studio. Descrive le funzionalità abilitate da questa integrazione SQL e fornisce istruzioni per l'esecuzione di query SQL nei JupyterLab notebook.

Per abilitare l'analisi dei dati SQL, gli amministratori devono prima configurare AWS Glue le connessioni alle fonti di dati pertinenti. Queste connessioni consentono ai data scientist di accedere senza problemi ai set di dati autorizzati dall'interno. JupyterLab

Oltre alle AWS Glue connessioni configurate dall'amministratore, l'estensione SQL consente ai singoli data scientist di creare le proprie connessioni alle fonti di dati. Queste connessioni create dall'utente possono essere gestite in modo indipendente e adattate al profilo dell'utente tramite politiche di controllo degli accessi basate su tag. Questo modello di connessione a due livelli, con connessioni configurate dall'amministratore e create dall'utente, offre ai data scientist un accesso più ampio ai dati di cui hanno bisogno per le loro attività di analisi e modellazione. Gli utenti possono configurare le connessioni necessarie alle proprie fonti di dati all'interno dell'interfaccia utente (UI) dell' JupyterLab ambiente, senza fare affidamento esclusivamente sulle connessioni centralizzate stabilite dall'amministratore.

Importante

La funzionalità di creazione di connessioni definite dall'utente è disponibile come set di librerie autonome in PyPI. Per utilizzare questa funzionalità, è necessario installare le seguenti librerie nel proprio ambiente: JupyterLab

È possibile installare queste librerie eseguendo i seguenti comandi nel JupyterLab terminale:

pip install amazon-sagemaker-sql-editor>=0.1.13 pip install amazon-sagemaker-sql-execution>=0.1.6 pip install amazon-sagemaker-sql-magic>=0.1.3

Dopo aver installato le librerie, sarà necessario riavviare il JupyterLab server per rendere effettive le modifiche.

restart-jupyter-server

Con la configurazione dell'accesso, JupyterLab gli utenti possono:

  • Visualizza e sfoglia le fonti di dati preconfigurate.

  • Cerca, filtra e ispeziona gli elementi informativi del database come tabelle, schemi e colonne.

  • Genera automaticamente i parametri di connessione a una fonte di dati.

  • Crea query SQL complesse utilizzando le funzionalità di evidenziazione della sintassi, completamento automatico e formattazione SQL dell'editor SQL dell'estensione.

  • Esegui istruzioni SQL dalle celle del notebook. JupyterLab

  • Recupera i risultati delle query SQL come pandas DataFrames per ulteriori attività di elaborazione, visualizzazione e altre attività di apprendimento automatico.

È possibile accedere all'estensione scegliendo l'icona dell'estensione SQL ( Icon of the SQL extension feature in JupyterLab. ) nel riquadro di navigazione a sinistra dell' JupyterLab applicazione in Studio. Passando il mouse sull'icona viene visualizzato il relativo tooltip di Data Discovery.

Importante
PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.