Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
DataZone Terminologia e concetti di Amazon
Amazon DataZone è un servizio di gestione dei dati che semplifica e velocizza la catalogazione, la scoperta, la condivisione e la gestione dei dati archiviati su fonti AWS, locali e di terze parti. Con Amazon DataZone, gli amministratori e i data steward che supervisionano gli asset di dati di un'organizzazione possono gestire e governare l'accesso ai dati utilizzando controlli granulari. Questi controlli sono progettati per garantire l'accesso con il giusto livello di privilegi e contesto. Amazon DataZone semplifica l'accesso ai dati di tutta l'organizzazione per ingegneri, data scientist, product manager, analisti e utenti aziendali, in modo che possano scoprirli, utilizzarli e collaborare per ricavare informazioni basate sui dati.
Quando inizi a usare Amazon DataZone, è importante comprenderne i concetti chiave, la terminologia e i componenti.
Argomenti
- DataZone Componenti Amazon
- Cosa sono i DataZone domini Amazon?
- Cosa sono i DataZone progetti e gli ambienti Amazon?
- Cosa sono i DataZone progetti Amazon?
- Cosa sono i flussi di lavoro di DataZone inventario e pubblicazione di Amazon?
- Cosa sono i flussi di lavoro relativi agli DataZone abbonamenti e agli adempimenti di Amazon?
- I personaggi utente di Amazon DataZone
- DataZone Terminologia Amazon
DataZone Componenti Amazon
Amazon DataZone include i seguenti quattro componenti principali:
-
Catalogo dei dati aziendali: puoi utilizzare questo componente per catalogare i dati di tutta l'organizzazione in base al contesto aziendale e consentire così a tutti i membri dell'organizzazione di trovare e comprendere rapidamente i dati.
-
Flussi di lavoro di pubblicazione e sottoscrizione: puoi utilizzare questi flussi di lavoro automatizzati per proteggere i dati tra produttori e consumatori in modalità self-service e per garantire che tutti i membri dell'organizzazione abbiano accesso ai dati giusti per lo scopo giusto.
-
Progetti e ambienti
-
In Amazon DataZone i progetti sono raggruppamenti di persone, risorse (dati) e strumenti basati su casi d'uso aziendale utilizzati per semplificare l'accesso alle analisi. AWS I progetti forniscono aree in cui i membri del progetto possono collaborare, scambiare dati e condividere risorse. Per impostazione predefinita, i progetti sono configurati in modo che solo coloro che vengono aggiunti esplicitamente al progetto possano accedere ai dati e agli strumenti di analisi al loro interno. I progetti gestiscono la proprietà delle risorse prodotte in conformità alle politiche di progetto a cui possono accedere i consumatori di dati.
-
All'interno dei DataZone progetti Amazon, gli ambienti sono raccolte di zero o più risorse configurate (ad esempio, un bucket Amazon S3, un AWS Glue database o un gruppo di lavoro Amazon Athena) su cui può operare un determinato set di IAM principali (ad esempio, utenti con autorizzazioni di contributo).
-
-
Portale dati (esterno alla console di AWS gestione): si tratta di un'applicazione Web basata su browser in cui diversi utenti possono catalogare, scoprire, governare, condividere e analizzare i dati in modalità self-service. Il portale dati autentica gli utenti con IAM credenziali o credenziali esistenti fornite dal provider di identità tramite. AWS IAM Identity Center
Cosa sono i DataZone domini Amazon?
Puoi utilizzare i DataZone domini Amazon per organizzare le tue risorse, gli utenti e i loro progetti. Associando AWS account aggiuntivi ai tuoi DataZone domini Amazon, puoi riunire le tue fonti di dati. Puoi quindi pubblicare le risorse provenienti da queste fonti di dati nel catalogo del tuo dominio, con moduli di metadati e glossari che migliorano la completezza e la qualità dei metadati. Puoi anche cercare e sfogliare queste risorse per vedere quali dati sono pubblicati nel dominio. Inoltre, puoi partecipare a progetti per collaborare con altri utenti, sottoscrivere risorse e utilizzare ambienti di progetto per accedere a strumenti di analisi, tra cui Amazon Athena e Amazon Redshift. DataZone I domini Amazon ti offrono la flessibilità necessaria per riflettere le esigenze di dati e analisi della tua struttura organizzativa, sia che si tratti di creare un singolo DataZone dominio Amazon per la tua azienda o più DataZone domini Amazon per diverse unità aziendali.
Cosa sono i DataZone progetti e gli ambienti Amazon?
Amazon DataZone consente ai team e agli utenti di analisi di collaborare ai progetti creando raggruppamenti di team, strumenti e dati basati su casi d'uso.
-
In Amazon DataZone, i progetti consentono a un gruppo di utenti di collaborare su vari casi d'uso aziendali che coinvolgono la pubblicazione, la scoperta, la sottoscrizione e l'utilizzo dei dati nel catalogo Amazon DataZone . I membri del progetto utilizzano risorse dal DataZone catalogo Amazon e producono nuove risorse utilizzando uno o più flussi di lavoro analitici. I progetti supportano le seguenti attività all'interno del portale dati:
-
I proprietari dei progetti possono aggiungere membri con autorizzazioni di proprietario, collaboratore, consumatore, amministratore e spettatore
-
I membri del progetto possono essere SSO utenti, SSO gruppi e utenti IAM
-
I membri del progetto possono richiedere la sottoscrizione alle risorse nel catalogo dati
Le approvazioni degli abbonamenti vengono fornite ai progetti
Creare/eliminare progetti
Creare/eliminare profili di progetto Creare/eliminare profili di ambiente Creare/eliminare ambienti Aggiungi/elimina membri ai progetti Ricerca e scoperta Create/delete metadata forms/glossaries Crea sequenze di sorgenti di dati e acquisisci dati Pubblica dati Richiedi abbonamenti Approva/rifiuta le richieste di abbonamento Leggi i dati degli abbonati da Amazon Athena e Amazon Redshift Owner Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Sì Sì Sì Sì Sì Sì Sì Sì Collaboratore Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio No Sì Sì Sì Sì Sì Sì Sì Consumer Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio No
Sì
No
No
No
Sì
No
Sì
Visualizzatore Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio No
Sì
No
No
No
No
No
Sì
Steward Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio No
Sì
Sì
Sì
Sì
No
Sì
Sì
-
-
In un DataZone progetto Amazon, gli ambienti sono raccolte di zero o più risorse configurate (ad esempio, un Amazon S3, un AWS Glue database o un gruppo di lavoro Amazon Athena), con un determinato set IAM di principali che possono operare su tali risorse. Gli ambienti vengono creati utilizzando profili di ambiente, che sono set di risorse e progetti preconfigurati che forniscono modelli riutilizzabili per la creazione di ambienti. I profili di ambiente definiscono impostazioni come la regione Account AWS o la regione in cui vengono distribuiti gli ambienti.
Cosa sono i DataZone progetti Amazon?
Un blueprint con cui viene creato l'ambiente definisce quali AWS strumenti e servizi (ad esempio Amazon Redshift) i membri del progetto a cui appartiene l'ambiente possono utilizzare mentre lavorano con le risorse nel catalogo Amazon DataZone . AWS Glue
Nella versione corrente di Amazon DataZone, sono supportati i seguenti blueprint predefiniti:
Nome del progetto | Descrizione | Risorse create |
---|---|---|
Progetto Data Lake |
Consente ai membri DataZone del progetto Amazon di lanciare servizi Data Lake per produttori e consumatori all'interno dell'ambiente. In qualità di consumatore, consente ai membri DataZone del progetto Amazon di accedere a una copia «di sola lettura» degli asset gestiti da Lake Formation direttamente in Amazon Athena e in altri motori di query supportati da Lake Formation. In qualità di produttore, consente ai membri DataZone del progetto Amazon di creare nuove tabelle LakeFormation gestite utilizzando Amazon Athena e di pubblicarle nel catalogo Amazon DataZone. |
Fornisce agli utenti la possibilità di creare e interrogare tabelle Lake Formation utilizzando Amazon Athena. Gruppo di lavoro Amazon Athena, AWS Glue database con autorizzazioni «sola lettura» Lake Formation, autorizzazioni «sola letturaIAM» e accesso ad Amazon S3 gestito dal progetto. AWS Glue database con autorizzazioni di «creazione» e «concessione» di Lake Formation, autorizzazioni di «lettura» e «scrittura» IAM AWS Glue ETL (estrazione, trasformazione e caricamento) con tag. |
Progetto di Data Warehouse |
In qualità di consumatore, questo modello consente ai membri DataZone del progetto Amazon di connettersi ai propri cluster Amazon Redshift per interrogare archivi dati remoti e creare e archiviare nuovi set di dati. In qualità di produttore, questo modello consente ai membri DataZone del progetto Amazon di connettersi ai propri cluster Amazon Redshift per interrogare archivi di dati remoti, creare nuovi set di dati e pubblicarli nel catalogo Amazon. DataZone |
Accesso all'editor di query di Amazon Redshift, accesso in «lettura» alle fonti di dati sottoscritte dal DataZone catalogo Amazon, possibilità di creare risorse locali nel cluster Amazon Redshift configurato. Accesso all'editor di query di Amazon Redshift, accesso in «lettura» alle fonti di dati sottoscritte dal DataZone catalogo Amazon, possibilità di creare e pubblicare risorse dal cluster Amazon Redshift configurato. |
Progetto Amazon Sagemaker |
Questo modello aiuta i produttori di dati e i consumatori a passare senza problemi SageMaker ad Amazon per collaborare su progetti di machine learning (ML), rafforzando al contempo la governance dell'accesso ai dati e alle risorse ML. Con la nuova integrazione integrata tra Amazon DataZone e Amazon SageMaker, i consumatori e i produttori di dati possono semplificare la governance del machine learning in tutta la configurazione dell'infrastruttura, collaborare a iniziative aziendali e gestire facilmente dati e risorse ML. |
Puoi creare un SageMaker dominio Amazon in grado di cercare, sottoscrivere e pubblicare dati e risorse ML in Amazon DataZone. Inoltre, puoi iscriverti e pubblicare sui database AWS Glue e sulla formazione di laghi come configurato. |
Cosa sono i flussi di lavoro di DataZone inventario e pubblicazione di Amazon?
Creazione di risorse di inventario del progetto
Per utilizzare Amazon per DataZone catalogare i tuoi dati, devi prima importare i tuoi dati (asset) come inventario del tuo progetto in Amazon DataZone. La creazione di un inventario per un progetto rende le risorse individuabili solo dai membri di quel progetto. Le risorse dell'inventario del progetto non sono disponibili per tutti gli utenti del dominio in search/browse a meno che non vengano pubblicate esplicitamente. Nell'attuale versione di Amazon DataZone, puoi aggiungere risorse all'inventario del progetto nei seguenti modi:
-
Crea ed esegui fonti di dati tramite il portale dati o utilizzando Amazon DataZone APIs. Nell'attuale versione di Amazon DataZone, puoi creare ed eseguire fonti di dati per AWS Glue e Amazon Redshift. Creando ed eseguendo sorgenti dati AWS Glue o Amazon Redshift, crei risorse nell'inventario di un progetto scelto e ne importi i metadati tecnici dalle tabelle del database di origine o dai data warehouse come inventario in Amazon. DataZone
-
UtilizzandoAPIs, puoi creare risorse dai tipi di asset di sistema disponibili (AWS Glue, Amazon Redshift, oggetti Amazon S3) o dai tuoi tipi di asset personalizzati.
-
Crea tipi di risorse personalizzati nell'inventario di un progetto utilizzando Amazon DataZone APIs. I tipi di risorse personalizzati possono includere modelli ML, dashboard, tabelle locali, ecc.
-
Crea risorse da questi tipi di risorse personalizzate utilizzando Amazon DataZone APIs.
-
-
Crea manualmente risorse per oggetti S3 utilizzando il portale DataZone dati Amazon.
Gestione delle risorse di inventario del progetto: dopo aver creato un inventario del progetto, i proprietari dei dati possono curare le proprie risorse di inventario con i metadati aziendali richiesti aggiungendo o aggiornando nomi aziendali (asset e schema), descrizioni (asset e schema), readme, termini del glossario (asset e schema) e moduli di metadati. Puoi farlo tramite il portale dati o utilizzando Amazon DataZone APIs. Ogni modifica alla risorsa crea una nuova versione dell'inventario.
Pubblicazione delle risorse di inventario del progetto nel DataZone catalogo Amazon
Il passaggio successivo dell'utilizzo di Amazon DataZone per catalogare i dati consiste nel rendere le risorse di inventario del progetto individuabili dagli utenti del dominio. Puoi farlo pubblicando le risorse di inventario nel DataZone catalogo Amazon. Solo la versione più recente della risorsa di inventario può essere pubblicata nel catalogo e solo l'ultima versione pubblicata è attiva nel catalogo Discovery. Se una risorsa di inventario viene aggiornata dopo la sua pubblicazione nel DataZone catalogo Amazon, devi pubblicarla nuovamente in modo esplicito affinché la versione più recente sia presente nel catalogo Discovery. Nell'attuale versione di Amazon DataZone, puoi pubblicare le risorse di inventario dei tuoi progetti nel DataZone catalogo Amazon nei seguenti modi:
-
Pubblica manualmente le risorse dell'inventario del progetto nel DataZone catalogo Amazon tramite il portale dati o utilizzando Amazon DataZone APIs.
-
Come parte della creazione o della modifica delle fonti di dati, abilita le impostazioni opzionali Publish your AWS Glue sul catalogo o Pubblica le tue risorse Amazon Redshift nel catalogo da utilizzare durante le esecuzioni pianificate o automatizzate delle origini dati. Quando questa impostazione è abilitata, l'esecuzione di un'origine dati aggiunge risorse all'inventario del progetto e quindi pubblica anche le risorse di inventario nel DataZone catalogo Amazon. Tieni presente che se pubblichi direttamente, le risorse potrebbero non contenere metadati aziendali e saranno rese direttamente individuabili da tutti gli utenti del dominio. Puoi utilizzare questa impostazione sulle tue fonti di dati tramite il portale dati o utilizzando Amazon DataZone APIs.
Cosa sono i flussi di lavoro relativi agli DataZone abbonamenti e agli adempimenti di Amazon?
Una volta pubblicate le tue risorse nel DataZone catalogo Amazon, gli utenti del tuo dominio possono scoprirle, richiederle e accedervi e continuare a utilizzare Amazon DataZone per governare, condividere e analizzare queste risorse.
Gli utenti richiedono l'accesso a una risorsa sottoscrivendo tale risorsa per conto di un progetto. Una volta creata una richiesta di abbonamento, i proprietari della risorsa ricevono una notifica e possono esaminarla e decidere se approvarla o rifiutarla. Se la richiesta di sottoscrizione viene approvata dal proprietario dei dati, al progetto sottoscrittore viene concesso l'accesso a tale risorsa.
Una volta approvata una richiesta di abbonamento, Amazon DataZone avvia un flusso di lavoro di evasione dell'abbonamento che aggiunge automaticamente la risorsa a tutti gli ambienti applicabili all'interno del progetto creando le sovvenzioni necessarie in AWS Lake Formation o Amazon Redshift. Ciò consente ai membri del progetto abbonati di interrogare la risorsa utilizzando uno degli strumenti di query (Amazon Athena o Amazon Redshift query editor) nei propri ambienti.
Amazon DataZone può attivare questa logica di evasione automatica solo per le risorse gestite (incluse le tabelle AWS Glue e le tabelle e viste di Amazon Redshift). Per tutti gli altri tipi di risorse (risorse non gestite), Amazon non DataZone può attivare automaticamente l'adempimento, ma pubblica invece un evento in Amazon Eventbridge con tutti i dettagli necessari nel payload dell'evento in modo che tu possa creare le sovvenzioni necessarie al di fuori di Amazon. DataZone Amazon fornisce DataZone anche una funzionalità updateSubscriptionStatus
API che consente di aggiornare lo stato dell'abbonamento una volta completato al di fuori di Amazon, DataZone in modo che Amazon DataZone possa notificare ai membri del progetto che possono iniziare a utilizzare la risorsa.
I personaggi utente di Amazon DataZone
Di seguito sono riportati i principali DataZone utenti di Amazon:
-
Amministratori di dominio proprietari della configurazione di Amazon DataZone come piattaforma di analisi per la propria organizzazione.
Nel contesto di Amazon DataZone, gli amministratori di dominio installano Amazon DataZone negli AWS account, creano DataZone domini Amazon e configurano associazioni di AWS account e associazioni di provider di identità con i domini Amazon DataZone . Gli amministratori di dominio utilizzano anche altre console di AWS servizio come AWS Organization e Service Catalog per configurare Amazon. DataZone
-
Utenti di dati che sono i principali utenti di Amazon DataZone (editori di asset e abbonati) per le loro attività di analisi e apprendimento automatico.
Gli utenti dei dati includono addetti all'analisi dei dati, data scientist e utenti di sistema che producono e consumano risorse di dati. Nel contesto di Amazon DataZone, gli utenti di dati creano e partecipano a progetti e ambienti, sottoscrivono e utilizzano asset di dati con strumenti di analisi o machine learning preconfigurati e pubblicano gli asset di dati di output nel catalogo di DataZone domini Amazon per condividerli con altri.
-
Sviluppatori di sistema che creano modelli di infrastruttura personalizzati e integrano Amazon DataZone con cataloghi o sistemi di produzione interni.
Nel contesto di Amazon DataZone, gli sviluppatori di sistemi creano progetti di ambiente (modelli di infrastruttura) o pipeline Infrastructure-As-Code CI/CD come provider di ambiente, pipeline di dati per promuovere le risorse di dati tra gli ambienti, sincronizzazione del catalogo e adattatori per la concessione di abbonamenti da integrare con cataloghi interni o integrazioni tra Amazon DataZone APIs e interfacce utente o sistemi di produzione interni, se necessario.
-
Responsabili della governance dei dati che possiedono le definizioni e i rischi della sicurezza organizzativa, della privacy e di altre politiche di conformità e che si assicurano che l'utilizzo di Amazon DataZone nelle loro organizzazioni sia conforme a tali definizioni.
DataZone Terminologia Amazon
- Domain
-
Un DataZone dominio Amazon è l'entità organizzativa per connettere le tue risorse, gli utenti e i loro progetti. Con DataZone i domini Amazon, hai la flessibilità necessaria per riflettere le esigenze di dati e analisi della tua struttura organizzativa, che si tratti di creare un singolo DataZone dominio Amazon per la tua azienda o più zone dati; domini per diverse unità aziendali o team.
- Unità di dominio
-
Le unità di dominio consentono di organizzare facilmente le risorse e le altre entità di dominio in unità aziendali e team specifici. Per configurare una condivisione dei dati sicura ed efficiente all'interno e tra le unità aziendali della tua organizzazione, puoi creare unità di dominio all'interno di Amazon DataZone e consentire a utenti selezionati all'interno di ciascuna unità aziendale di accedere e condividere le proprie risorse nel catalogo. Le unità di dominio possono anche essere utilizzate per consentire ai proprietari di risorse, come i proprietari di AWS account, di configurare le autorizzazioni di DataZone autorizzazione Amazon sulle proprie risorse. Le unità di dominio forniscono un'autorità delegata dai proprietari degli account ai proprietari delle unità di dominio e possono impostare le autorizzazioni di autorizzazione sui profili di ambiente (creati utilizzando le configurazioni dei blueprint), per conto dei proprietari degli account. Per ulteriori informazioni, consulta Unità di dominio e politiche di autorizzazione in Amazon DataZone.
- Politica di autorizzazione
-
Le politiche di DataZone autorizzazione di Amazon sono un insieme di controlli all'interno di Amazon DataZone applicati a entità come progetti, blueprint, ambienti, glossari e moduli di metadati. Queste policy definiscono chi può creare queste entità e gestirne il ciclo di vita nel portale Amazon DataZone.
All'interno di un'unità di DataZone dominio Amazon, puoi assegnare le seguenti politiche di autorizzazione ai tuoi utenti e gruppi per concedere loro autorizzazioni specifiche:
-
Politica di creazione di unità di dominio
-
Politica di creazione del progetto
-
Politica di adesione al progetto
-
Politica di presupposizione della proprietà delle unità di dominio
-
Politica di assunzione della proprietà del progetto
Per ulteriori informazioni, consulta Assegna politiche di autorizzazione a utenti e gruppi all'interno di un'unità di DataZone dominio Amazon.
All'interno di un'unità di DataZone dominio Amazon, puoi assegnare le seguenti politiche di autorizzazione ai tuoi progetti per concedere loro autorizzazioni specifiche:
-
Politica di creazione del glossario
-
Politica di creazione dei moduli di metadati
-
Politica di creazione di tipi di asset personalizzati
Per ulteriori informazioni, consulta Assegna politiche di autorizzazione ai progetti all'interno di un'unità di DataZone dominio Amazon.
All'interno di una configurazione del blueprint specifica, è possibile assegnare le seguenti politiche di autorizzazione ai progetti e ai proprietari di unità di dominio:
-
Crea profili di ambiente utilizzando questo blueprint: questa policy può essere assegnata a DataZone progetti Amazon e li autorizza a creare profili di ambiente utilizzando questo blueprint.
-
Concedi le autorizzazioni per creare profili di ambiente utilizzando questo blueprint: questa policy può essere assegnata ai proprietari delle unità di dominio e li autorizza a concedere le autorizzazioni ai progetti per creare profili di ambiente utilizzando questo blueprint.
Per ulteriori informazioni, consulta Assegna politiche di autorizzazione all'interno delle configurazioni dei DataZone blueprint di Amazon.
-
- Account associato
-
L'associazione AWS dei tuoi account ai DataZone domini Amazon ti consente di pubblicare i dati di questi AWS account nel DataZone catalogo Amazon e di creare DataZone progetti Amazon per utilizzare i tuoi dati su più AWS account. Le richieste di associazione di account possono essere avviate solo in AWS account che possiedono un DataZone dominio Amazon. Le richieste di associazione di account possono essere accettate solo dagli utenti amministrativi degli AWS account invitati. Una volta associato un AWS account a un DataZone dominio Amazon, puoi registrare le tue fonti di dati come AWS Glue catalog e Amazon Redshift in questo account su questo dominio. L'associazione consente inoltre a un AWS account di creare DataZone progetti e ambienti Amazon.
An Account AWS può essere associato a uno o più DataZone domini Amazon.
- Origine dati
-
In Amazon DataZone, puoi utilizzare le fonti di dati per importare i metadati tecnici degli asset (dati) dai database di origine o dai data warehouse in Amazon. DataZone Nell'attuale versione di Amazon DataZone, puoi creare ed eseguire fonti di dati per AWS Glue e Amazon Redshift. Creando un'origine dati, stabilisci una connessione tra Amazon DataZone e la fonte (AWS Glue Data Catalog o Amazon Redshift Warehouse) che ti consente di leggere i metadati tecnici, inclusi nomi di tabelle, nomi di colonne e tipi di dati. Creando un'origine dati, dai anche il via all'esecuzione iniziale dell'origine dati che crea nuove risorse o aggiorna quelle esistenti in Amazon DataZone. Durante la creazione di un'origine dati o dopo che l'origine dati è stata creata correttamente, hai anche la possibilità di specificare una pianificazione per l'esecuzione dell'origine dati.
- Esecuzione dell'origine dati
-
In Amazon DataZone, l'esecuzione di un'origine dati è un'attività che Amazon DataZone esegue per creare risorse negli inventari dei progetti e, facoltativamente, anche per pubblicare risorse di inventario del progetto nel catalogo Amazon DataZone . Le esecuzioni delle fonti di dati possono essere automatizzate (avviate quando una fonte di dati viene inizialmente creata) o pianificata o manuale. I criteri di selezione dei dati consentono di ottimizzare i set di dati esistenti e futuri da inserire negli inventari dei progetti o nel catalogo DataZone Amazon e la frequenza degli aggiornamenti dei metadati di tali risorse di inventario o catalogo.
- Obiettivo dell'abbonamento
-
In Amazon DataZone, gli obiettivi di abbonamento ti consentono di accedere ai dati a cui ti sei iscritto nei tuoi progetti. Un obiettivo di sottoscrizione specifica la posizione (ad esempio, un database o uno schema) e le autorizzazioni richieste (ad esempio, un IAM ruolo) che Amazon DataZone può utilizzare per stabilire una connessione con i dati di origine e per creare le concessioni necessarie in modo che i membri del DataZone progetto Amazon possano iniziare a interrogare i dati a cui si sono abbonati.
- Richiesta di abbonamento
-
In Amazon DataZone, una richiesta di abbonamento è un processo che un DataZone progetto Amazon deve seguire per ottenere l'accesso a una risorsa specifica. Le richieste di abbonamento possono essere approvate, rifiutate, revocate o concesse.
- Asset
-
In Amazon DataZone, una risorsa è un'entità che presenta un singolo oggetto di dati fisico (ad esempio, una tabella, un dashboard, un file) o un oggetto di dati virtuale (ad esempio, una vista).
- Asset type (Tipo asset)
-
I tipi di asset definiscono il modo in cui gli asset vengono rappresentati nel DataZone catalogo Amazon. Un tipo di risorsa definisce lo schema per un tipo specifico di risorsa. Quando le risorse vengono create, vengono convalidate in base allo schema definito dal tipo di risorsa (per impostazione predefinita, la versione più recente). Quando si verifica un aggiornamento degli asset, Amazon DataZone crea una nuova versione dell'asset e consente DataZone agli utenti Amazon di operare su tutte le versioni degli asset.
- Glossario aziendale
-
In Amazon DataZone, un glossario aziendale è una raccolta di termini commerciali che possono essere associati agli asset. Un glossario aziendale aiuta a garantire che gli stessi termini e le stesse definizioni vengano utilizzati in un'organizzazione in tutte le sue varie attività di analisi dei dati.
I termini di un glossario aziendale possono essere aggiunti alle risorse e alle colonne per classificare o migliorare l'identificazione di tali attributi durante la ricerca. Il glossario può essere selezionato come tipo di valore per un campo in un modulo di metadati associato a una risorsa. Quando un termine particolare viene selezionato come valore per il campo del modulo di metadati di una risorsa, gli utenti possono cercare il termine del glossario aziendale e trovare le risorse associate.
- Tipo di modulo per metadati
-
Un tipo di modulo di metadati è un modello che definisce i metadati raccolti e salvati quando le risorse vengono create come inventario o pubblicate in un dominio Amazon DataZone . I tipi di modulo di metadati possono essere associati a una risorsa di dati. I tipi di modulo di metadati aiutano gli amministratori di dominio a definire i moduli di metadati necessari per quel dominio, ad esempio informazioni sulla conformità, informazioni sulle normative o classificazioni. Consente agli amministratori di dominio di personalizzare metadati aggiuntivi per le proprie risorse. Amazon DataZone dispone di tipi di moduli di metadati di sistema come asset-common-details-form -type, column-business-metadata-form -type,, glue-table-form-type, glue-view-form-type redshift-table-form-type, s3- redshift-view-form-typeobject-collection-form-type, e. subscription-terms-form-type suggestion-form-type
- Modulo per i metadati
-
In Amazon DataZone, i moduli di metadati definiscono i metadati che vengono raccolti e salvati quando le risorse vengono create come inventario o pubblicate in un dominio Amazon DataZone . Le definizioni dei moduli di metadati vengono create nel dominio del catalogo da un amministratore di dominio. La definizione di un modulo di metadati è composta da una o più definizioni di campo, con supporto per i tipi di dati booleani, date, decimali, numeri interi, stringhe e valori dei campi del glossario aziendale.
Un amministratore di dominio applica un modulo di metadati alle risorse del proprio dominio aggiungendo il modulo di metadati al proprio dominio. Gli editori di risorse forniscono quindi tutti i valori di campo facoltativi e obbligatori nel modulo di metadati.
- Progetto
-
In Amazon DataZone, i progetti consentono a un gruppo di utenti di collaborare su vari casi d'uso aziendali che prevedono la creazione di risorse negli inventari dei progetti e quindi la loro individuazione da parte di tutti i membri del progetto, quindi la pubblicazione, la scoperta, la sottoscrizione e il consumo di risorse nel catalogo Amazon. DataZone I membri del progetto utilizzano risorse dal DataZone catalogo Amazon e producono nuove risorse utilizzando uno o più flussi di lavoro analitici. I membri del progetto possono essere proprietari, collaboratori, consumatori, amministratori e spettatori.
Creare/eliminare progetti
Creare/eliminare profili di progetto Creare/eliminare profili di ambiente Creare/eliminare ambienti Aggiungi/elimina membri ai progetti Ricerca e scoperta Create/delete metadata forms/glossaries Crea sequenze di sorgenti di dati e acquisisci dati Pubblica dati Richiedi abbonamenti Approva/rifiuta le richieste di abbonamento Leggi i dati degli abbonati da Amazon Athena e Amazon Redshift Owner Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Sì Sì Sì Sì Sì Sì Sì Sì Collaboratore Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio No Sì Sì Sì Sì Sì Sì Sì Consumer Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio No
Sì
No
No
No
Sì
No
Sì
Visualizzatore Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio No
Sì
No
No
No
No
No
Sì
Steward Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio Da gestire dal membro dell'unità di dominio No
Sì
Sì
Sì
Sì
No
Sì
Sì
I proprietari dei progetti possono aggiungere o rimuovere altri utenti come proprietari o collaboratori e possono modificare o eliminare i progetti. Altre restrizioni relative ai contributori possono essere definite mediante politiche. Quando un utente crea un progetto, diventa il primo proprietario di quel progetto.
- Ambiente
-
Un ambiente è una raccolta di risorse configurate (ad esempio, un bucket Amazon S3, un AWS Glue database o un gruppo di lavoro Amazon Athena), con un determinato set di IAM principali (con autorizzazioni di collaboratore assegnate) che possono operare su tali risorse. Ogni ambiente può inoltre avere utenti principali autorizzati ad accedere alle risorse e ai dati tramite sottoscrizione e adempimento. Gli ambienti sono progettati per archiviare collegamenti utilizzabili verso AWS servizi, dispositivi esterni e console. IDEs I membri del progetto possono accedere a servizi come la console Amazon Athena e altro ancora tramite deep link configurati all'interno di un ambiente. SSOgli utenti e IAM gli utenti del progetto possono essere ulteriormente limitati per utilizzare/accedere ad ambienti specifici.
- Profilo ambientale
-
In Amazon DataZone, un profilo di ambiente è un modello che puoi utilizzare per creare ambienti. I profili ambientali vengono creati utilizzando i blueprint.
Con i profili di ambiente, gli amministratori di dominio possono creare blueprint con parametri preconfigurati, quindi i data worker possono creare rapidamente un numero qualsiasi di nuovi ambienti selezionando i profili di ambiente esistenti e specificando i nomi per i nuovi ambienti. Ciò consente ai data worker di gestire in modo efficiente i propri progetti e ambienti, garantendo al contempo che soddisfino le politiche di governance dei dati applicate dagli amministratori di dominio.
- Piano
-
Un blueprint con cui viene creato l'ambiente definisce quali AWS strumenti e servizi (ad esempio Amazon Redshift) i membri del progetto a cui appartiene l'ambiente possono utilizzare mentre lavorano con le risorse nel catalogo Amazon DataZone . AWS Glue
Nella versione corrente di Amazon sono supportati DataZone i seguenti blueprint predefiniti:
-
Blueprint Data Lake
-
Progetto di data warehouse
-
Progetto Amazon Sagemaker
-
- Profilo utente
-
Un profilo utente rappresenta DataZone gli utenti Amazon. Amazon DataZone supporta IAM ruoli e SSO identità per interagire con la Console di DataZone gestione Amazon e il portale dati per scopi diversi. Gli amministratori di dominio utilizzano IAM i ruoli per eseguire il lavoro amministrativo iniziale relativo al dominio nella Console di DataZone gestione Amazon, tra cui la creazione di nuovi DataZone domini Amazon, la configurazione dei tipi di modulo di metadati e l'implementazione delle politiche. I data worker utilizzano le proprie identità SSO aziendali tramite Identity Center per accedere ad Amazon DataZone Data Portal e accedere ai progetti a cui sono iscritti.
- Profilo del gruppo
-
I profili di gruppo rappresentano gruppi di DataZone utenti Amazon. I gruppi possono essere creati manualmente o mappati su gruppi di clienti aziendali di Active Directory. In Amazon DataZone, i gruppi hanno due scopi. Innanzitutto, un gruppo può associarsi a un team di utenti nell'organigramma e quindi ridurre il lavoro amministrativo del proprietario di un DataZone progetto Amazon quando ci sono nuovi dipendenti che entrano o escono da un team. In secondo luogo, gli amministratori aziendali utilizzano i gruppi di Active Directory per gestire e aggiornare gli stati degli utenti e quindi gli amministratori di DataZone dominio Amazon possono utilizzare queste appartenenze ai gruppi per implementare le politiche di dominio Amazon. DataZone
- Amministratore di dominio
-
In Amazon DataZone, il IAM principale che crea un DataZone dominio Amazon è l'amministratore di dominio predefinito di quel dominio. Gli amministratori di dominio in Amazon DataZone eseguono funzionalità chiave per il dominio, tra cui la creazione di domini, l'assegnazione di altri amministratori di dominio, l'aggiunta di fonti di dati e obiettivi di abbonamento, la creazione di progetti e ambienti e l'assegnazione dei proprietari dei progetti.
- Editore
-
In Amazon DataZone, gli editori pubblicano le risorse nel DataZone catalogo Amazon e possono modificare i metadati delle risorse che pubblicano. Se viene concessa questa autorità, gli editori possono approvare o rifiutare le richieste di abbonamento alle risorse che hanno pubblicato nel catalogo Amazon. DataZone
- Sottoscrittore
-
In Amazon DataZone, un abbonato è un DataZone progetto Amazon che desidera trovare, accedere e utilizzare risorse nel catalogo Amazon DataZone .
- Account AWS owner
-
In Amazon DataZone, Account AWS i proprietari creano ruoli, politiche e autorizzazioni Account AWS che consentono di associarli Account AWS ai DataZone domini Amazon.