As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Plantas DataZone integradas da Amazon
Um plano com o qual um ambiente é criado define quais ferramentas e serviços os membros do projeto ao qual o ambiente pertence podem usar ao trabalhar com ativos no DataZone catálogo da Amazon. Na versão atual da Amazon DataZone, existem os seguintes esquemas integrados:
-
Esquema do data lake
-
Esquema do data warehouse
-
SageMaker Projeto da Amazon
Você pode executar as etapas dos procedimentos a seguir para habilitar os blueprints padrão na Amazon DataZone:
Habilite esquemas integrados na AWS conta que possui o domínio da Amazon DataZone
Um plano com o qual um ambiente é criado define quais ferramentas e serviços os membros do projeto ao qual o ambiente pertence podem usar ao trabalhar com ativos no DataZone catálogo da Amazon.
Na versão atual da Amazon DataZone, há vários modelos integrados: plano de lago de dados, plano de armazém de dados e modelo da Amazon. SageMaker
-
O Data Lake Blueprint contém a definição para lançar e configurar um conjunto de serviços (AWS Glue, AWS Lake Formation, Amazon Athena) para publicar e usar ativos de data lake no catálogo da Amazon. DataZone
-
O plano de data warehouse contém a definição para iniciar e configurar um conjunto de serviços (Amazon Redshift) para publicar e usar ativos do Amazon Redshift no catálogo da Amazon. DataZone
-
O Amazon SageMaker Blueprint contém a definição para iniciar e configurar um conjunto de serviços (Amazon SageMaker Studio) para publicar e usar SageMaker ativos da Amazon no catálogo da Amazon DataZone .
Para obter mais informações, consulte DataZone Terminologia e conceitos da Amazon.
Ao criar um DataZone domínio da Amazon, você tem a opção de escolher a configuração rápida, que ativa automaticamente o data lake padrão e os esquemas integrados do data warehouse padrão como parte do processo de criação do domínio. A configuração rápida também cria perfis de ambiente padrão e ambientes padrão para você usando esses esquemas integrados.
Se você não escolher a Configuração rápida como parte da criação do seu DataZone domínio da Amazon, você pode usar o procedimento abaixo para ativar os esquemas integrados disponíveis na AWS conta que abriga esse DataZone domínio da Amazon. Você deve habilitar esses esquemas integrados antes de poder usá-los para criar perfis de ambiente e ambientes nesse domínio.
Para habilitar esquemas integrados em um DataZone domínio da Amazon por meio do console DataZone de gerenciamento da Amazon, você deve assumir uma função do IAM na conta com permissões administrativas. Configure as permissões do IAM necessárias para usar o console DataZone de gerenciamento da Amazonpara obter as permissões mínimas.
Habilite esquemas integrados em um domínio da Amazon DataZone
-
Navegue até o DataZone console da Amazon em https://console.aws.amazon.com/datazone
e faça login com as credenciais da sua conta. -
Escolha Visualizar domínios e selecione o domínio no qual você deseja habilitar um ou mais esquemas integrados.
-
Na página de detalhes do domínio, navegue até a guia Esquemas.
-
Na lista de Blueprints, escolha o blueprint DefaultDataLakeou o DefaultDataWarehouse, ou o Amazon SageMaker blueprint.
-
Na página de detalhes do esquema escolhido, escolha Ativar nesta conta.
-
Na página Permissões e recursos, especifique o seguinte:
-
Se você estiver habilitando o DefaultDataLakeblueprint, para a função Glue Manage Access, especifique uma função de serviço nova ou existente que conceda à Amazon DataZone autorização para ingerir e gerenciar o acesso às tabelas no AWS Glue e no AWS Lake Formation.
-
Se você estiver habilitando o DefaultDataWarehouseblueprint, para a função Redshift Manage Access, especifique uma função de serviço nova ou existente que conceda à DataZone Amazon autorização para ingerir e gerenciar o acesso a compartilhamentos de dados, tabelas e visualizações no Amazon Redshift.
-
Se você estiver habilitando o Amazon SageMaker blueprint, para a função SageMaker Manage Access, especifique uma função de serviço nova ou existente que conceda à Amazon DataZone permissões para publicar SageMaker dados da Amazon no catálogo. Também concede à Amazon DataZone permissões para conceder acesso ou revogar o acesso aos ativos SageMaker publicados pela Amazon no catálogo.
Importante
Quando você está habilitando o Amazon SageMaker blueprint, a Amazon DataZone verifica se as seguintes funções do IAM para a Amazon DataZone existem na conta atual e na região. Se essas funções não existirem, a Amazon as DataZone criará automaticamente.
-
AmazonDataZoneGlueAccess- <region>- <domainId>
-
AmazonDataZoneRedshiftAccess- <region>- <domainId>
-
-
Para a função de provisionamento, especifique uma função de serviço nova ou existente que conceda à Amazon DataZone autorização para criar e configurar recursos ambientais usando AWS CloudFormation na conta do ambiente e na região.
-
Se você estiver habilitando o Amazon SageMaker blueprint, para o bucket Amazon S3 SageMaker para a fonte de dados -Glue, especifique um bucket do Amazon S3 que deve ser usado por SageMaker todos os ambientes na conta. AWS O prefixo do bucket especificado deve ser um dos seguintes:
-
amazon-datazone*
-
datazone-sagemaker*
-
sagemaker-datazone*
-
DataZone-Sagemaker*
-
Sábio- * DataZone
-
DataZone-SageMaker*
-
SageMaker-DataZone*
-
-
-
Escolha Habilitar esquema.
Depois de habilitar os esquemas escolhidos, você pode controlar quais projetos podem usar os esquemas em sua conta para criar perfis de ambiente. É possível fazer isso ao atribuir projetos de gerenciamento à configuração do esquema.
Importante
Por padrão, nenhum projeto de gerenciamento é especificado para os blueprints do ambiente, o que significa que qualquer DataZone usuário da Amazon pode criar perfis para um blueprint do ambiente. Portanto, é muito recomendado que você sempre especifique projetos de gerenciamento para seus esquemas de ambiente para garantir uma governança mais forte.
Especificar projetos de gerenciamento em esquemas habilitados
-
Navegue até o DataZone console da Amazon em https://console.aws.amazon.com/datazone
e faça login com as credenciais da sua conta. -
Escolha Visualizar domínios e, em seguida, escolha o domínio em que você deseja adicionar os projetos de gerenciamento para os esquemas escolhidos.
-
Escolha a guia Esquemas e, em seguida, escolha o esquema com o qual você deseja trabalhar.
-
Por padrão, todos os projetos dentro do domínio podem usar o DefaultDataLake ou DefaultDataWareshouse, ou os SageMaker blueprints da Amazon na conta para criar perfis de ambiente. No entanto, você pode restringir isso atribuindo projetos de gerenciamento aos esquemas. Para adicionar projetos de gerenciamento, escolha Selecionar projetos de gerenciamento e, em seguida, escolha os projetos que você deseja adicionar como projetos de gerenciamento no menu suspenso e escolha Selecionar projeto(s) de gerenciamento.
Depois de habilitar o DefaultDataWarehouse blueprint em sua AWS conta, você pode adicionar conjuntos de parâmetros à configuração do blueprint. Um conjunto de parâmetros é um grupo de chaves e valores necessários para que DataZone a Amazon estabeleça uma conexão com seu cluster do Amazon Redshift e é usado para criar ambientes de armazém de dados. Esses parâmetros incluem o nome do seu cluster Amazon Redshift, banco de dados e o AWS segredo que contém as credenciais do cluster.
Adicionar conjuntos de parâmetros ao DefaultDataWarehouse blueprint
-
Navegue até o DataZone console da Amazon em https://console.aws.amazon.com/datazone
e faça login com as credenciais da sua conta. -
Escolha Visualizar domínios e escolha o domínio no qual você deseja adicionar o conjunto de parâmetros.
-
Escolha a guia Blueprints e, em seguida, escolha o DefaultDataWareshouse blueprint para abrir a página de detalhes do blueprint.
-
Na guia Conjuntos de parâmetros na página de detalhes do esquema, escolha Criar conjunto de parâmetros.
-
Forneça um nome para o conjunto de parâmetros.
-
Opcionalmente, forneça uma descrição para o conjunto de parâmetros.
-
Selecione uma região
-
Selecione o cluster do Amazon Redshift ou do Amazon Redshift sem servidor.
-
Selecione o ARN AWS secreto que contém as credenciais do cluster selecionado do Amazon Redshift ou do grupo de trabalho Amazon Redshift Serverless. O segredo da AWS deve ser marcado com a tag
AmazonDataZoneDomain : [Domain_ID]
para ser elegível para uso em um conjunto de parâmetros.-
Se você não tiver um AWS segredo existente, também poderá criar um novo segredo escolhendo Criar novo AWS segredo. Será aberta uma caixa de diálogo na qual você pode fornecer o nome do segredo, nome de usuário e senha. Depois de escolher Create New AWS Secret, a Amazon DataZone cria um novo segredo no serviço AWS Secrets Manager e garante que o segredo seja marcado com o domínio no qual você está tentando criar o conjunto de parâmetros.
-
-
Se você escolheu o cluster do Amazon Redshift na etapa acima, agora escolha um cluster no menu suspenso. Se você escolheu o grupo de trabalho do Amazon Redshift na etapa acima, agora escolha um grupo de trabalho no menu suspenso.
-
Insira o nome do banco de dados no cluster do Amazon Redshift ou no grupo de trabalho do Amazon Redshift sem servidor.
-
Escolha Criar conjunto de parâmetros.
-
nota
Você só pode adicionar até 10 conjuntos de parâmetros ao DefaultDataWarehouse blueprint.
Depois de habilitar o Amazon SageMaker blueprint em sua AWS conta, você pode adicionar conjuntos de parâmetros à configuração do blueprint. Um conjunto de parâmetros é um grupo de chaves e valores necessários para que DataZone a Amazon estabeleça uma conexão com sua Amazon SageMaker e é usado para criar ambientes do Sagemaker.
Adicionar conjuntos de parâmetros ao SageMaker blueprint da Amazon
-
Navegue até o DataZone console da Amazon em https://console.aws.amazon.com/datazone
e faça login com as credenciais da sua conta. -
Escolha Visualizar domínios e, em seguida, escolha o domínio que contém o esquema ativado ao qual você deseja adicionar o conjunto de parâmetros.
-
Escolha a guia Blueprints e, em seguida, escolha o SageMaker blueprint da Amazon para abrir a página de detalhes do blueprint.
-
Na guia Conjuntos de parâmetros na página de detalhes do esquema, escolha Criar conjunto de parâmetros e, depois especifique o seguinte:
-
Forneça um Nome para o conjunto de parâmetros.
-
Opcionalmente, forneça uma Descrição para o conjunto de parâmetros.
-
Especifique o tipo de autenticação de SageMaker domínio da Amazon. É possível escolher o IAM ou o IAM Identity Center (SSO).
-
Especifique uma AWS região.
-
Especifique uma chave AWS KMS para criptografia de dados. É possível escolher uma chave existente ou criar uma.
-
Em Parâmetros de ambiente, especifique o seguinte:
-
VPC ID - a ID que você está usando para a VPC do ambiente Amazon. SageMaker É possível especificar uma VPC existente ou criar uma.
-
Sub-redes - uma ou mais IDs para uma variedade de endereços IP para recursos específicos em sua VPC.
-
Acesso à rede: escolha Somente VPC ou Somente internet pública.
-
Grupo de segurança: o grupo de segurança a ser usado ao configurar a VPC e as sub-redes.
-
-
Em Parâmetros da fonte de dados, escolha uma das seguintes opções:
-
AWS Glue somente
-
AWS Glue + Amazon Redshift sem servidor. Se você escolher essa opção, especifique o seguinte:
-
Especifique o ARN AWS secreto que contém as credenciais do cluster Amazon Redshift selecionado. O segredo da AWS deve ser marcado com a tag
AmazonDataZoneDomain : [Domain_ID]
para ser elegível para uso em um conjunto de parâmetros.Se você não tiver um AWS segredo existente, também poderá criar um novo segredo escolhendo Criar novo AWS segredo. Será aberta uma caixa de diálogo na qual você pode fornecer o nome do segredo, nome de usuário e senha. Depois de escolher Create New AWS Secret, a Amazon DataZone cria um novo segredo no serviço AWS Secrets Manager e garante que o segredo seja marcado com o domínio no qual você está tentando criar o conjunto de parâmetros.
-
Especifique o grupo de trabalho do Amazon Redshift que você deseja usar ao criar ambientes.
-
Especifique o nome do banco de dados (dentro do grupo de trabalho que você escolheu) que você deseja usar ao criar ambientes.
-
-
AWS Somente Glue + Amazon Redshift Cluster
-
Especifique o ARN AWS secreto que contém as credenciais do cluster Amazon Redshift selecionado. O segredo da AWS deve ser marcado com a tag
AmazonDataZoneDomain : [Domain_ID]
para ser elegível para uso em um conjunto de parâmetros.Se você não tiver um AWS segredo existente, também poderá criar um novo segredo escolhendo Criar novo AWS segredo. Será aberta uma caixa de diálogo na qual você pode fornecer o nome do segredo, nome de usuário e senha. Depois de escolher Create New AWS Secret, a Amazon DataZone cria um novo segredo no serviço AWS Secrets Manager e garante que o segredo seja marcado com o domínio no qual você está tentando criar o conjunto de parâmetros.
-
Especifique o cluster do Amazon Redshift que você deseja usar ao criar ambientes.
-
Especifique o nome do banco de dados (no cluster escolhido) que você deseja usar ao criar ambientes.
-
-
-
-
Escolha Criar conjunto de parâmetros.
Adicione a Amazon SageMaker como um serviço confiável na AWS conta que possui o DataZone domínio da Amazon
Se você habilitou o Amazon SageMaker blueprint, você também deve adicioná-lo SageMaker como um dos serviços confiáveis da Amazon DataZone. Para fazer isso, conclua o seguinte procedimento:
-
Navegue até o DataZone console da Amazon em https://console.aws.amazon.com/datazone
e faça login com as credenciais da sua conta. -
Escolha Exibir domínios e, em seguida, escolha o domínio que contém o SageMaker blueprint ativado.
-
Escolha os serviços confiáveis, depois escolha a Amazon e SageMaker, em seguida, escolha Ativar.