Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Blueprint DataZone integrati di Amazon
Un modello con cui viene creato un ambiente definisce quali strumenti e servizi i membri del progetto a cui appartiene l'ambiente possono utilizzare mentre lavorano con le risorse nel DataZone catalogo Amazon. Nell'attuale versione di Amazon DataZone, sono presenti i seguenti progetti integrati:
-
Progetto Data Lake
-
Progetto di data warehouse
-
SageMaker Progetto Amazon
Puoi eseguire i passaggi delle seguenti procedure per abilitare i blueprint predefiniti in Amazon DataZone:
Abilita i blueprint integrati nell' AWS account che possiede il dominio Amazon DataZone
Un modello con cui viene creato un ambiente definisce quali strumenti e servizi i membri del progetto a cui appartiene l'ambiente possono utilizzare mentre lavorano con le risorse nel DataZone catalogo Amazon.
Nell'attuale versione di Amazon DataZone, ci sono diversi blueprint integrati: data lake blueprint, data warehouse blueprint e Amazon blueprint. SageMaker
-
Il modello Data Lake contiene la definizione per il lancio e la configurazione di un set di servizi (AWS Glue, AWS Lake Formation, Amazon Athena) per pubblicare e utilizzare le risorse del data lake nel catalogo Amazon. DataZone
-
Il modello di data warehouse contiene la definizione per il lancio e la configurazione di un set di servizi (Amazon Redshift) per pubblicare e utilizzare le risorse Amazon Redshift nel catalogo Amazon. DataZone
-
Amazon SageMaker Blueprint contiene la definizione per il lancio e la configurazione di un set di servizi (Amazon SageMaker Studio) per pubblicare e utilizzare le SageMaker risorse Amazon nel catalogo Amazon. DataZone
Per ulteriori informazioni, consulta DataZone Terminologia e concetti di Amazon.
Durante la creazione di un DataZone dominio Amazon, hai la possibilità di scegliere la configurazione rapida che abilita automaticamente il data lake predefinito e i blueprint predefiniti integrati nel data warehouse come parte del processo di creazione del dominio. La configurazione rapida crea anche profili di ambiente e ambienti predefiniti per te utilizzando questi blueprint integrati.
Se non scegli la configurazione rapida come parte della creazione del tuo DataZone dominio Amazon, puoi utilizzare la procedura seguente per abilitare i blueprint integrati disponibili nell' AWS account che ospita questo DataZone dominio Amazon. È necessario abilitare questi blueprint integrati prima di poterli utilizzare per creare profili e ambienti ambientali in questo dominio.
Per abilitare i blueprint integrati in un DataZone dominio Amazon tramite la console di DataZone gestione Amazon, devi assumere un ruolo IAM nell'account con autorizzazioni amministrative. Configura le autorizzazioni IAM necessarie per utilizzare la console di DataZone gestione Amazonper ottenere le autorizzazioni minime.
Abilita i blueprint integrati in un dominio Amazon DataZone
-
Accedi alla DataZone console Amazon all'indirizzo https://console.aws.amazon.com/datazone
e accedi con le credenziali del tuo account. -
Scegli Visualizza domini e scegli il dominio in cui desideri abilitare uno o più blueprint integrati.
-
Nella pagina dei dettagli del dominio, vai alla scheda Blueprints.
-
Dall'elenco Blueprints, scegli il DefaultDataLakeo il o DefaultDataWarehouseil SageMaker blueprint Amazon.
-
Nella pagina dei dettagli del progetto scelto, scegli Abilita in questo account.
-
Nella pagina Autorizzazioni e risorse, specifica quanto segue:
-
Se stai abilitando il DefaultDataLakeblueprint, per il ruolo Glue Manage Access, specifica un ruolo di servizio nuovo o esistente che conceda ad Amazon DataZone l'autorizzazione a importare e gestire l'accesso alle tabelle in AWS Glue and Lake Formation AWS .
-
Se stai abilitando il DefaultDataWarehouseblueprint, per il ruolo Redshift Manage Access, specifica un ruolo di servizio nuovo o esistente che conceda ad DataZone Amazon l'autorizzazione a importare e gestire l'accesso a condivisioni di dati, tabelle e viste in Amazon Redshift.
-
Se stai abilitando il SageMaker blueprint Amazon, per il ruolo SageMaker Manage Access, specifica un ruolo di servizio nuovo o esistente che conceda ad Amazon DataZone le autorizzazioni per pubblicare SageMaker i dati Amazon nel catalogo. Fornisce inoltre ad Amazon DataZone le autorizzazioni per concedere l'accesso o revocare l'accesso alle risorse SageMaker pubblicate da Amazon nel catalogo.
Importante
Quando abiliti il SageMaker blueprint Amazon, Amazon DataZone verifica se i seguenti ruoli IAM per Amazon DataZone esistono nell'account e nella regione correnti. Se questi ruoli non esistono, Amazon li crea DataZone automaticamente.
-
AmazonDataZoneGlueAccess- <region>- <domainId>
-
AmazonDataZoneRedshiftAccess- <region>- <domainId>
-
-
Per il ruolo Provisioning, specifica un ruolo di servizio nuovo o esistente che conceda ad Amazon DataZone l'autorizzazione a creare e configurare risorse ambientali utilizzando AWS CloudFormation l'account e la regione dell'ambiente.
-
Se stai abilitando il SageMaker blueprint Amazon, per il bucket Amazon S3 SageMaker per l'origine dati -Glue, specifica un bucket Amazon S3 che deve essere utilizzato da tutti gli ambienti dell'account. SageMaker AWS Il prefisso del bucket che specifichi deve essere uno dei seguenti:
-
amazon-datazone*
-
datazone-sagemaker*
-
sagemaker-datazone*
-
DataZone-Salviettore*
-
Salviettiere- * DataZone
-
DataZone-SageMaker*
-
SageMaker-DataZone*
-
-
-
Scegli Abilita blueprint.
Una volta abilitati i blueprint scelti, puoi controllare quali progetti possono utilizzare i blueprint del tuo account per creare profili ambientali. È possibile farlo assegnando la gestione dei progetti alla configurazione del blueprint.
Importante
Per impostazione predefinita, non viene specificato alcun progetto di gestione per i blueprint di ambiente, il che significa che qualsiasi DataZone utente Amazon può creare profili per un blueprint di ambiente. Pertanto, si consiglia vivamente di specificare sempre i progetti di gestione per i blueprint dell'ambiente per garantire una governance più solida.
Specificate la gestione dei progetti su blueprint abilitati
-
Accedi alla DataZone console Amazon all'indirizzo https://console.aws.amazon.com/datazone
e accedi con le credenziali del tuo account. -
Scegli Visualizza domini, quindi scegli il dominio in cui desideri aggiungere i progetti di gestione per i progetti scelti.
-
Scegli la scheda Blueprint, quindi scegli il blueprint con cui vuoi lavorare.
-
Per impostazione predefinita, tutti i progetti all'interno del DefaultDataLake dominio possono utilizzare SageMaker i blueprint or o Amazon nell'account per creare profili di ambiente. DefaultDataWareshouse Tuttavia, puoi limitare questo problema assegnando la gestione dei progetti ai blueprint. Per aggiungere progetti in gestione, scegli Seleziona progetto di gestione, quindi scegli i progetti che desideri aggiungere come progetti di gestione dal menu a discesa, quindi scegli Seleziona progetti di gestione.
Dopo aver abilitato il DefaultDataWarehouse blueprint nel tuo AWS account, puoi aggiungere set di parametri alla configurazione del blueprint. Un set di parametri è un gruppo di chiavi e valori, necessario DataZone ad Amazon per stabilire una connessione al cluster Amazon Redshift e viene utilizzato per creare ambienti di data warehouse. Questi parametri includono il nome del cluster Amazon Redshift, il database e il AWS segreto che contiene le credenziali del cluster.
Aggiungere set di parametri al blueprint DefaultDataWarehouse
-
Accedi alla DataZone console Amazon all'indirizzo https://console.aws.amazon.com/datazone
e accedi con le credenziali del tuo account. -
Scegli Visualizza domini, quindi scegli il dominio in cui desideri aggiungere il set di parametri.
-
Scegli la scheda Blueprint, quindi scegli il DefaultDataWareshouse blueprint per aprire la pagina dei dettagli del blueprint.
-
Nella scheda Set di parametri nella pagina dei dettagli del blueprint, scegli Crea set di parametri.
-
Fornisci un nome per il set di parametri.
-
Facoltativamente, fornite una descrizione per il set di parametri.
-
Seleziona una regione
-
Seleziona un cluster Amazon Redshift o Amazon Redshift Serverless.
-
Seleziona l'ARN AWS segreto che contiene le credenziali del cluster Amazon Redshift selezionato o del gruppo di lavoro Amazon Redshift Serverless. Il AWS segreto deve essere etichettato con il
AmazonDataZoneDomain : [Domain_ID]
tag per essere idoneo all'uso all'interno di un set di parametri.-
Se non disponi di un AWS segreto esistente, puoi anche crearne uno nuovo scegliendo Crea nuovo AWS segreto. Si apre una finestra di dialogo in cui è possibile fornire il nome del segreto, il nome utente e la password. Dopo aver scelto Create New AWS Secret, Amazon DataZone crea un nuovo segreto nel servizio AWS Secrets Manager e assicura che il segreto sia etichettato con il dominio in cui stai tentando di creare il set di parametri.
-
-
Se hai scelto il cluster Amazon Redshift nel passaggio precedente, ora scegli un cluster dal menu a discesa. Se hai scelto il gruppo di lavoro Amazon Redshift nel passaggio precedente, ora scegli un gruppo di lavoro dal menu a discesa.
-
Inserisci il nome del database all'interno del cluster Amazon Redshift o del gruppo di lavoro Amazon Redshift Serverless selezionato.
-
Scegli Crea set di parametri.
-
Nota
È possibile aggiungere solo fino a 10 set di parametri al DefaultDataWarehouse blueprint.
Dopo aver abilitato il SageMaker blueprint Amazon nel tuo AWS account, puoi aggiungere set di parametri alla configurazione del blueprint. Un set di parametri è un gruppo di chiavi e valori, necessario DataZone ad Amazon per stabilire una connessione con Amazon SageMaker e viene utilizzato per creare ambienti sagemaker.
Aggiungere set di parametri al SageMaker blueprint Amazon
-
Accedi alla DataZone console Amazon all'indirizzo https://console.aws.amazon.com/datazone
e accedi con le credenziali del tuo account. -
Scegli Visualizza domini, quindi scegli il dominio che contiene il blueprint abilitato a cui desideri aggiungere il set di parametri.
-
Scegli la scheda Blueprints, quindi scegli il SageMaker blueprint Amazon per aprire la pagina dei dettagli del progetto.
-
Nella scheda Set di parametri nella pagina dei dettagli del blueprint, scegli Crea set di parametri, quindi specifica quanto segue:
-
Fornisci un nome per il set di parametri.
-
Facoltativamente, fornite una descrizione per il set di parametri.
-
Specificare il tipo di autenticazione del SageMaker dominio Amazon. Puoi scegliere IAM o IAM Identity Center (SSO).
-
Specificare una AWS regione.
-
Specificare una chiave AWS KMS per la crittografia dei dati. Puoi scegliere una chiave esistente o crearne una nuova.
-
In Parametri di ambiente, specificate quanto segue:
-
ID VPC: l'ID che stai utilizzando per il VPC dell'ambiente Amazon. SageMaker Puoi specificare un VPC esistente o crearne uno nuovo.
-
Sottoreti: una o più IDs per un intervallo di indirizzi IP per risorse specifiche all'interno del tuo VPC.
-
Accesso alla rete: scegli solo VPC o Solo Internet pubblico.
-
Gruppo di sicurezza: il gruppo di sicurezza da utilizzare per la configurazione di VPC e sottoreti.
-
-
In Parametri dell'origine dati, scegli una delle seguenti opzioni:
-
AWS Solo colla
-
AWS Glue+ Amazon Redshift Serverless. Se scegli questa opzione, specifica quanto segue:
-
Specificare l'ARN AWS segreto che contiene le credenziali del cluster Amazon Redshift selezionato. Il AWS segreto deve essere etichettato con il
AmazonDataZoneDomain : [Domain_ID]
tag per essere idoneo all'uso all'interno di un set di parametri.Se non disponi di un AWS segreto esistente, puoi anche crearne uno nuovo scegliendo Crea nuovo AWS segreto. Si apre una finestra di dialogo in cui è possibile fornire il nome del segreto, il nome utente e la password. Dopo aver scelto Create New AWS Secret, Amazon DataZone crea un nuovo segreto nel servizio AWS Secrets Manager e assicura che il segreto sia etichettato con il dominio in cui stai tentando di creare il set di parametri.
-
Specificate il gruppo di lavoro Amazon Redshift che desiderate utilizzare per la creazione degli ambienti.
-
Specificate il nome del database (all'interno del gruppo di lavoro che avete scelto) che desiderate utilizzare durante la creazione degli ambienti.
-
-
AWS Solo Glue+ Amazon Redshift Cluster
-
Specificare l'ARN AWS segreto che contiene le credenziali del cluster Amazon Redshift selezionato. Il AWS segreto deve essere etichettato con il
AmazonDataZoneDomain : [Domain_ID]
tag per essere idoneo all'uso all'interno di un set di parametri.Se non disponi di un AWS segreto esistente, puoi anche crearne uno nuovo scegliendo Crea nuovo AWS segreto. Si apre una finestra di dialogo in cui è possibile fornire il nome del segreto, il nome utente e la password. Dopo aver scelto Create New AWS Secret, Amazon DataZone crea un nuovo segreto nel servizio AWS Secrets Manager e assicura che il segreto sia etichettato con il dominio in cui stai tentando di creare il set di parametri.
-
Specificate il cluster Amazon Redshift che desiderate utilizzare per la creazione degli ambienti.
-
Specificate il nome del database (all'interno del cluster che avete scelto) che desiderate utilizzare per creare ambienti.
-
-
-
-
Scegliete Crea set di parametri.
Aggiungi Amazon SageMaker come servizio affidabile nell' AWS account che possiede il DataZone dominio Amazon
Se hai abilitato il SageMaker blueprint Amazon, devi aggiungerlo anche SageMaker come uno dei servizi affidabili di Amazon DataZone. A tale scopo, completa la seguente procedura:
-
Accedi alla DataZone console Amazon all'indirizzo https://console.aws.amazon.com/datazone
e accedi con le credenziali del tuo account. -
Scegli Visualizza domini, quindi scegli il dominio che contiene il blueprint abilitato. SageMaker
-
Scegli i servizi affidabili, quindi scegli Amazon SageMaker e quindi scegli Abilita.