As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Terminologia e conceitos do Amazon DataZone
O Amazon DataZone é um serviço de gerenciamento de dados que torna mais rápido e fácil catalogar, descobrir, compartilhar e governar dados armazenados na AWS, on-premises e em fontes terceirizadas. Com o Amazon DataZone, administradores e gestores de dados que supervisionam os ativos de dados de uma organização podem gerenciar e governar o acesso aos dados usando controles refinados. Esses controles são projetados para garantir o acesso com o nível certo de privilégios e contexto. O Amazon DataZone facilita que engenheiros, cientistas de dados, gerentes de produto, analistas e usuários corporativos acessem dados em toda a organização para que possam descobrir, usar e colaborar para obter insights baseados em dados.
Ao começar a usar o Amazon DataZone, é importante que você entenda seus principais conceitos, terminologia e componentes.
Tópicos
- Componentes do Amazon DataZone
- O que são domínios do Amazon DataZone?
- Quais são os projetos e ambientes do Amazon DataZone?
- O que são os esquemas do Amazon DataZone?
- O que são fluxos de trabalho de inventário e publicação do Amazon DataZone?
- O que são fluxos de trabalho de assinatura e atendimento do Amazon DataZone?
- As personas do usuário do Amazon DataZone
- Terminologia do Amazon DataZone
Componentes do Amazon DataZone
O Amazon DataZone inclui os quatro componentes principais a seguir:
-
Catálogo de dados corporativos: você pode usar esse componente para catalogar dados em toda a sua organização com contexto comercial e, assim, permitir que todos em sua organização encontrem e entendam os dados rapidamente.
-
Publique e assine fluxos de trabalho: você pode usar esses fluxos de trabalho automatizados para proteger os dados entre produtores e consumidores de forma autônoma e para garantir que todos em sua organização tenham acesso aos dados certos para a finalidade certa.
-
Projetos e ambientes
-
No Amazon DataZone, os projetos são agrupamentos de pessoas, ativos (dados) e ferramentas baseados em casos de uso de negócios usados para simplificar o acesso a analytics da AWS. Os projetos fornecem áreas nas quais os membros do projeto podem colaborar, trocar dados e compartilhar ativos. Por padrão, os projetos são configurados para que somente aqueles que são explicitamente adicionados ao projeto possam acessar as ferramentas de dados e analytics contidas neles. Os projetos gerenciam a propriedade dos ativos produzidos de acordo com as políticas do projeto para os consumidores de dados acessarem.
-
Nos projetos do Amazon DataZone, os ambientes são coleções de zero ou mais recursos configurados (por exemplo, um bucket do Amazon S3, um banco de dados do AWS Glue ou um grupo de trabalho do Amazon Athena) nos quais um determinado conjunto de entidades principais do IAM (por exemplo, usuários com permissões de colaborador) pode operar.
-
-
Portal de dados (fora do AWS Management Console): é um aplicativo web baseado em navegador no qual diferentes usuários podem catalogar, descobrir, controlar, compartilhar e analisar dados de forma autônoma. O portal de dados autentica usuários com as credenciais do IAM ou credenciais existentes do seu provedor de identidade por meio do AWS IAM Identity Center.
O que são domínios do Amazon DataZone?
Você pode usar domínios do Amazon DataZone para organizar seus ativos, usuários e seus projetos. Ao associar contas da AWS adicionais aos seus domínios do Amazon DataZone, você pode reunir suas fontes de dados. Em seguida, você pode publicar ativos dessas fontes de dados no catálogo do seu domínio, com formulários de metadados e glossários que melhoram a integridade e a qualidade dos metadados. Você também pode pesquisar e navegar nesses ativos para ver quais dados são publicados no domínio. Além disso, você pode participar de projetos para colaborar com outros usuários, assinar ativos e usar ambientes de projeto para acessar ferramentas de analytics, incluindo Amazon Athena e Amazon Redshift. Os domínios do Amazon DataZone permitem que você tenha a flexibilidade de refletir as necessidades de dados e analytics de sua estrutura organizacional, seja criando um único domínio do Amazon DataZone para sua empresa ou vários domínios do Amazon DataZone para diferentes unidades de negócios.
Quais são os projetos e ambientes do Amazon DataZone?
O Amazon DataZone permite que equipes e usuários de analytics colaborem em projetos criando grupos de equipes, ferramentas e dados baseados em casos de uso.
-
No Amazon DataZone, os projetos permitem que um grupo de usuários colabore em vários casos de uso de negócios que envolvem publicação, descoberta, assinatura e consumo de dados no catálogo do Amazon DataZone. Os membros do projeto consomem ativos do catálogo do Amazon DataZone e produzem novos ativos usando um ou mais fluxos de trabalho analíticos. Os projetos apoiam as seguintes atividades no portal de dados:
-
Os proprietários do projeto podem adicionar membros com permissões de proprietário, colaborador, consumidor, administrador e leitor
-
Os membros do projeto podem ser usuários de SSO, grupos de SSO e usuários do IAM
-
Os membros do projeto podem solicitar a assinatura dos ativos no catálogo de dados
As aprovações de assinatura são fornecidas aos projetos
Criar/excluir projetos
Criar/excluir perfis de projeto Criar/excluir perfis de ambiente Criar/excluir ambientes Adicionar/excluir membros em projetos Pesquisa e descoberta Criar/excluir formulários/glossários de metadados Criar execuções de fontes de dados e ingerir dados Publicar dados Solicitações de assinatura Aprovar/rejeitar solicitações de assinatura Ler dados do Amazon Athena e do Amazon Redshift Proprietário A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Sim Sim Sim Sim Sim Sim Sim Sim Colaborador A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Não Sim Sim Sim Sim Sim Sim Sim Consumidor A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Não
Sim
Não
Não
Não
Sim
Não
Sim
Visualizador A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Não
Sim
Não
Não
Não
Não
Não
Sim
Administrador A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Não
Sim
Sim
Sim
Sim
Não
Sim
Sim
-
-
Em um projeto do Amazon DataZone, ambientes são coleções de zero ou mais recursos configurados (por exemplo, um bucket do Amazon S3, um banco de dados do AWS Glue ou um grupo de trabalho do Amazon Athena), com um determinado conjunto de entidades principais do IAM que podem operar nesses recursos. Os ambientes são criados usando perfis de ambiente que são conjuntos pré-configurados de recursos e esquemas que fornecem modelos reutilizáveis para a criação de ambientes. Os perfis de ambiente definem configurações como a região ou Conta da AWS na qual os ambientes são implantados.
O que são os esquemas do Amazon DataZone?
Um esquema com o qual o ambiente é criado define quais ferramentas e serviços da AWS (por exemplo, o AWS Glue ou o Amazon Redshift) podem ser usados pelos membros do projeto, ao qual o ambiente pertence, ao trabalhar com ativos no catálogo do Amazon DataZone.
Na versão atual do Amazon DataZone, os seguintes esquemas padrão são compatíveis:
Nome do esquema | Descrição | Recursos criados |
---|---|---|
Esquema do Data Lake |
Permite que os membros do projeto do Amazon DataZone iniciem serviços de produtor e consumidor do Data Lake dentro do ambiente. Como consumidor, ele permite que os membros do projeto Amazon DataZone acessem uma cópia “somente para leitura” dos ativos gerenciados pelo Lake Formation diretamente no Amazon Athena e em outros mecanismos de consulta compatíveis com o Lake Formation. Como produtor, ele permite que os membros do projeto do Amazon DataZone criem novas tabelas gerenciadas pelo LakeFormation usando o Amazon Athena e as publiquem no catálogo do Amazon DataZone. |
Oferece aos usuários a capacidade de criar e consultar tabelas do Lake Formation usando o Amazon Athena. Grupo de trabalho do Amazon Athena, banco de dados do AWS Glue com permissões ‘somente para leitura’ do Lake Formation, permissões ‘somente para leitura’ do IAM e acesso ao Amazon S3 que é gerenciado pelo projeto. O banco de dados do AWS Glue com permissões de 'criar' e 'conceder' do Lake Formation, permissões do IAM de 'leitura' e 'gravação', AWS Glue ETL (extrair, transformar e carregar) com marcação. |
Esquema do Data Warehouse |
Como consumidor, esse esquema permite que os membros do projeto do Amazon DataZone se conectem aos seus próprios clusters do Amazon Redshift para consultar armazenamentos de dados remotos e criar e armazenar novos conjuntos de dados. Como produtor, esse esquema permite que os membros do projeto do Amazon DataZone se conectem aos seus próprios clusters do Amazon Redshift para consultar armazenamentos de dados remotos, criar novos conjuntos de dados e publicá-los no catálogo do Amazon DataZone. |
Acesso ao Editor de Consultas do Amazon Redshift, acesso de ‘leitura’ às fontes de dados assinadas do catálogo do Amazon DataZone, capacidade de criar ativos locais no cluster configurado do Amazon Redshift. Acesso ao Editor de Consultas do Amazon Redshift, acesso de ‘leitura’ às fontes de dados assinadas do catálogo do Amazon DataZone, capacidade de criar e publicar ativos do cluster configurado do Amazon Redshift. |
Esquema do Amazon Sagemaker |
Esse esquema ajuda produtores e consumidores de dados a migrarem facilmente para o Amazon SageMaker para colaborar em projetos de machine learning (ML) e, ao mesmo tempo, impor a governança do acesso aos dados e aos ativos de ML. Com a nova integração incorporada entre o Amazon DataZone e o Amazon SageMaker, consumidores e produtores de dados podem simplificar a governança de ML em toda a configuração da infraestrutura, colaborar em iniciativas de negócios e governar facilmente dados e ativos de ML. |
Você pode criar um domínio do Amazon SageMaker que é capaz de pesquisar, assinar e publicar dados e ativos de ML no Amazon DataZone. Também pode se inscrever e publicar nos bancos de dados do AWS Glue e no Lake Formation, conforme configurado. |
O que são fluxos de trabalho de inventário e publicação do Amazon DataZone?
Criação de ativos de inventário do projeto
Para usar o Amazon DataZone para catalogar seus dados, você deve primeiro trazer seus dados (ativos) como inventário do seu projeto no Amazon DataZone. A criação de inventário para um projeto torna os ativos detectáveis somente para os membros desse projeto. Os ativos do inventário do projeto não estão disponíveis para todos os usuários do domínio na pesquisa/navegação, a menos que sejam publicados explicitamente. Na versão atual do Amazon DataZone, você pode adicionar ativos ao inventário do projeto das seguintes formas:
-
Crie e execute fontes de dados por meio do portal de dados ou usando as APIs do Amazon DataZone. Na versão atual do Amazon DataZone, você pode criar e executar fontes de dados para o AWS Glue e o Amazon Redshift. Ao criar e executar fontes de dados do AWS Glue ou do Amazon Redshift, você cria ativos em um inventário de projeto escolhido e importa seus metadados técnicos das tabelas do banco de dados de origem ou dos data warehouses como inventário para o Amazon DataZone.
-
Usando APIs, você pode criar ativos a partir dos tipos de ativos do sistema disponíveis (objetos do AWS Glue, Amazon Redshift, Amazon S3) ou de seus tipos de ativos personalizados.
-
Crie tipos de ativos personalizados em um inventário de projetos usando as APIs do Amazon DataZone. Os tipos de ativos personalizados podem incluir modelos de ML, painéis, tabelas on-premises etc.
-
Crie ativos usando esses tipos de ativos personalizados usando as APIs do Amazon DataZone.
-
-
Crie manualmente ativos para objetos do S3 usando o portal de dados do Amazon DataZone.
Curadoria dos ativos do inventário do projeto: depois de criar um inventário do projeto, os proprietários dos dados podem organizar seus ativos de inventário com os metadados comerciais necessários adicionando ou atualizando nomes comerciais (ativo e esquema), descrições (ativo e esquema), leia-me, termos do glossário (ativo e esquema) e formulários de metadados. É possível fazer isso por meio do portal de dados ou usando as APIs do Amazon DataZone. Cada edição em seu ativo cria uma nova versão do inventário.
Publicação de ativos de inventário do projeto no catálogo do Amazon DataZone
A próxima etapa de usar o Amazon DataZone para catalogar seus dados é fazer com que os ativos de inventário do seu projeto possam ser descobertos pelos usuários do domínio. Você pode fazer isso publicando os ativos de inventário no catálogo do Amazon DataZone. Somente a versão mais recente do ativo de inventário pode ser publicada no catálogo e somente a versão mais recente publicada está ativa no catálogo de descobertas. Se um ativo de inventário for atualizado após ser publicado no catálogo do Amazon DataZone, você deverá publicá-lo explicitamente novamente para que a versão mais recente esteja no catálogo de descoberta. Na versão atual do Amazon DataZone, você pode publicar seus ativos de inventário do projeto no catálogo do Amazon DataZone das seguintes formas:
-
Publique manualmente seus ativos de inventário do projeto no catálogo do Amazon DataZone por meio do portal de dados ou usando as APIs do Amazon DataZone.
-
Como parte da criação ou edição de fontes de dados, ative as configurações opcionais Publicar seus ativos do AWS Glue no catálogo ou Publish seus ativos do Amazon Redshift no catálogo para serem usadas durante as execuções programadas ou automatizadas da fonte de dados. Quando essa configuração é ativada, a execução de uma fonte de dados adiciona ativos ao inventário do seu projeto e, em seguida, também publica os ativos do inventário no catálogo do Amazon DataZone. Observe que, se você publicar diretamente, os ativos talvez não tenham metadados comerciais e poderão ser descobertos diretamente por todos os usuários do domínio. Você pode usar essa configuração em suas fontes de dados por meio do portal de dados ou usando as APIs do Amazon DataZone.
O que são fluxos de trabalho de assinatura e atendimento do Amazon DataZone?
Depois que seus ativos são publicados no catálogo do Amazon DataZone, os usuários do seu domínio podem descobrir esses ativos, solicitar e obter acesso a esses ativos e continuar a usar o Amazon DataZone para governar, compartilhar e analisar esses ativos.
Os usuários solicitam acesso a um ativo assinando esse ativo em nome de um projeto. Depois que uma solicitação de assinatura é criada, os proprietários do ativo recebem uma notificação e podem analisar a solicitação de assinatura e decidir se querem aprová-la ou rejeitá-la. Se a solicitação de assinatura for aprovada pelo proprietário dos dados, o projeto assinante terá acesso a esse ativo.
Depois que uma solicitação de assinatura é aprovada, o Amazon DataZone inicia um fluxo de trabalho de atendimento de assinaturas que adiciona automaticamente o ativo a todos os ambientes aplicáveis dentro do projeto, criando as concessões necessárias no AWS Lake Formation ou no Amazon Redshift. Isso permite que os membros assinantes do projeto consultem o ativo usando uma das ferramentas de consulta (Amazon Athena ou Editor de Consultas do Amazon Redshift) em seus ambientes.
O Amazon DataZone pode acionar essa lógica de atendimento automatizado somente para ativos gerenciados (isso inclui tabelas do AWS Glue e tabelas e visualizações do Amazon Redshift). Para todos os outros tipos de ativos (ativos não gerenciados), o Amazon DataZone não pode acionar automaticamente o atendimento, mas publica um evento no Amazon Eventbridge com todos os detalhes necessários na carga útil do evento, de forma que você possa criar as concessões necessárias fora do Amazon DataZone. O Amazon DataZone também fornece a API updateSubscriptionStatus
que permite que você atualize o status da assinatura depois que ela for cumprida fora do Amazon DataZone, para que o Amazon DataZone possa notificar os membros do projeto de que eles podem começar a consumir o ativo.
As personas do usuário do Amazon DataZone
A seguir estão as principais personas do usuário do Amazon DataZone:
-
Administradores de domínio responsáveis pela configuração do Amazon DataZone como plataforma de analytics para sua organização.
No contexto do Amazon DataZone, os administradores de domínio instalam o Amazon DataZone em contas da AWS, criam domínios do Amazon DataZone e configuram associações de contas da AWS e associações de provedores de identidade com domínios do Amazon DataZone. Os administradores de domínio também usam outros consoles de serviço da AWS, como AWS Organization e Service Catalog, para configurar o Amazon DataZone.
-
Usuários de dados que são os principais usuários do Amazon DataZone (publicadores e assinantes de ativo) para suas tarefas de analytics e machine learning.
Os usuários de dados incluem profissionais de data analytics, cientistas de dados e usuários do sistema que produzem e consomem ativos de dados. No contexto do Amazon DataZone, os usuários de dados criam e participam de projetos e ambientes, assinam e consomem ativos de dados com ferramentas de analytics ou machine learning pré-configuradas e publicam ativos de dados de saída no catálogo de domínios do Amazon DataZone para compartilhar com outras pessoas.
-
Desenvolvedores de sistemas que criam modelos de infraestrutura personalizados e integram o Amazon DataZone a catálogos internos ou a sistemas de produção.
No contexto do Amazon DataZone, os desenvolvedores de sistemas criam esquemas de ambiente (modelos de infraestrutura) ou pipeline de CI/CD de infraestrutura como código como um provedor de ambiente, pipelines de dados para promover ativos de dados em todos os ambientes, adaptadores de sincronização de catálogos e cumprimento de concessão de assinatura para integração a catálogos internos ou a integrações entre APIs do Amazon DataZone e interfaces de usuário internas ou sistemas de produção, se necessário.
-
Responsáveis por governança de dados que possuem as definições e os riscos de segurança organizacional, privacidade e outras políticas de conformidade e que garantem que o uso do Amazon DataZone em suas organizações esteja em conformidade com essas definições.
Terminologia do Amazon DataZone
- Domínio
-
Um domínio do Amazon DataZone é a entidade organizadora para conectar seus ativos, usuários e seus projetos. Com os domínios do Amazon DataZone, você tem a flexibilidade de refletir as necessidades de dados e analytics de sua estrutura organizacional, seja criando um único domínio do Amazon DataZone para sua empresa ou várias zonas de dados; domínios para diferentes unidades de negócios ou equipes.
- Unidade de domínio
-
As unidades de domínio permitem que você organize facilmente seus ativos e outras entidades de domínio em unidades de negócios e equipes específicas. A fim de configurar o compartilhamento seguro e eficiente de dados dentro e entre as unidades de negócios da sua organização, você pode criar unidades de domínio no Amazon DataZone e permitir que usuários selecionados em cada unidade de negócios façam login e compartilhem seus ativos no catálogo. As unidades de domínio também podem ser usadas para permitir que proprietários de recursos, como proprietários de contas da AWS, configurem permissões de autorização do Amazon DataZone em seus recursos. As unidades de domínio fornecem uma autoridade delegada dos proprietários da conta aos proprietários da unidade de domínio e podem configurar permissões de autorização em perfis de ambiente (criados usando configurações de esquema), em nome dos proprietários da conta. Para ter mais informações, consulte Unidades de domínio e políticas de autorização na Amazon DataZone.
- Políticas de autorização
-
As políticas de autorização do Amazon DataZone são um conjunto de controles dentro do Amazon DataZone aplicados a entidades como projetos, esquemas, ambientes, glossários e formulários de metadados. Essas políticas definem quem pode criar essas entidades e gerenciar seu ciclo de vida no portal do Amazon DataZone.
Dentro de uma unidade de domínio do Amazon DataZone, você pode atribuir as seguintes políticas de autorização aos seus usuários e grupos para conceder-lhes permissões específicas:
-
Política de criação de unidades de domínio
-
Política de criação de projetos
-
Política de associação a projetos
-
Política de suposição de propriedade da unidade de domínio
-
Política de suposição de propriedade do projeto
Para ter mais informações, consulte Atribua políticas de autorização a usuários e grupos dentro de uma unidade de DataZone domínio da Amazon.
Dentro de uma unidade de domínio do Amazon DataZone, você pode atribuir as seguintes políticas de autorização aos seus projetos para conceder permissões específicas:
-
Política de criação de glossário
-
Política de criação de formulários de metadados
-
Política de criação de tipo de ativo personalizado
Para ter mais informações, consulte Atribua políticas de autorização a projetos dentro de uma unidade de DataZone domínio da Amazon.
Em uma configuração específica do esquema, você pode atribuir as políticas de autorização a seguir aos projetos e proprietários de unidades de domínio:
-
Crie perfis de ambiente usando esse esquema, essa política pode ser atribuída aos projetos do Amazon DataZone e os autoriza a criar perfis de ambiente usando esse esquema.
-
Conceda permissões para criar perfis de ambiente usando esse esquema, essa política pode ser atribuída aos proprietários de unidades de domínio e os autoriza a conceder permissões aos projetos para criar perfis de ambiente usando esse esquema.
Para ter mais informações, consulte Atribua políticas de autorização nas configurações do Amazon DataZone Blueprint.
-
- Conta associada
-
Associar suas contas da AWS aos domínios do Amazon DataZone permite que você publique dados dessas contas da AWS no catálogo do Amazon DataZone e crie projetos do Amazon DataZone para trabalhar com seus dados em várias contas da AWS. Solicitações de associação de conta só podem ser iniciadas em contas da AWS que possuem um domínio do Amazon DataZone. As solicitações de associação de conta só podem ser aceitas pelos usuários administrativos das contas da AWS convidadas. Depois que uma conta da AWS é associada a um domínio do Amazon DataZone, você pode registrar suas fontes de dados, como o catálogo do AWS Glue e o Amazon Redshift, nessa conta para esse domínio. A associação também permite que uma conta da AWS crie projetos e ambientes do Amazon DataZone.
Uma Conta da AWS pode ser associada a um ou mais domínios do Amazon DataZone.
- Fonte de dados
-
No Amazon DataZone, você pode usar fontes de dados para importar metadados técnicos de ativos (dados) dos bancos de dados de origem ou data warehouses para o Amazon DataZone. Na versão atual do Amazon DataZone, você pode criar e executar fontes de dados para o AWS Glue e o Amazon Redshift. Ao criar uma fonte de dados, você estabelece uma conexão entre o Amazon DataZone e a fonte (AWS Glue Data Catalog ou Warehouse do Amazon Redshift), o que permite ler metadados técnicos, incluindo nomes de tabelas, nomes de colunas e tipos de dados. Ao criar uma fonte de dados, você também dá início a execução inicial da fonte de dados que cria novos ativos ou atualiza os existentes no Amazon DataZone. Ao criar uma fonte de dados ou após a criação bem-sucedida dela, você também pode definir uma programação para a execução da fonte de dados.
- Execução da fonte de dados
-
No Amazon DataZone, a execução de uma fonte de dados é uma tarefa que o Amazon DataZone executa para criar ativos nos inventários do projeto e, opcionalmente, publicar ativos do inventário do projeto no catálogo do Amazon DataZone. As execuções da fonte de dados podem ser automatizadas (iniciadas quando uma fonte de dados é criada inicialmente), ou programadas ou manuais. Os critérios de seleção de dados permitem que você ajuste os conjuntos de dados existentes e futuros a serem inseridos nos inventários do projeto ou no catálogo do Amazon DataZone e a frequência das atualizações de metadados desses ativos de inventário ou do catálogo.
- Meta de assinatura
-
No Amazon DataZone, as metas de assinatura permitem que você acesse os dados nos quais se inscreveu em seus projetos. Uma meta de assinatura especifica o local (por exemplo, um banco de dados ou um esquema) e as permissões necessárias (por exemplo, um perfil do IAM) que o Amazon DataZone pode usar para estabelecer uma conexão com os dados de origem e criar as concessões necessárias para que os membros do projeto do Amazon DataZone possam começar a consultar os dados nos quais se inscreveram.
- Solicitação de assinatura
-
No Amazon DataZone, uma solicitação de assinatura é um processo que um projeto do Amazon DataZone deve seguir para ter acesso a um ativo específico. As solicitações de assinatura podem ser aprovadas, rejeitadas, revogadas ou concedidas.
- Ativo
-
No Amazon DataZone, um ativo é uma entidade que apresenta um único objeto de dados físicos (por exemplo, uma tabela, um painel, um arquivo) ou um objeto de dados virtual (por exemplo, uma visualização).
- Asset type (Tipo de ativo)
-
Os tipos de ativos definem como os ativos são representados no catálogo do Amazon DataZone. Um tipo de ativo define o esquema para um tipo específico de ativo. Quando os ativos são criados, eles são validados em relação ao esquema definido pelo tipo de ativo (por padrão, a versão mais recente). Quando ocorre uma atualização de ativos, o Amazon DataZone cria uma nova versão do ativo e permite que os usuários do Amazon DataZone operem em todas as versões do ativo.
- Glossário de negócios
-
No Amazon DataZone, um glossário de negócios é uma coleção de termos de negócios que podem estar associados a ativos. Um glossário de negócios ajuda a garantir que os mesmos termos e definições sejam usados em toda a organização em suas várias tarefas de data analytics.
Os termos em um glossário de negócios podem ser adicionados aos ativos e colunas para classificar ou aprimorar a identificação desses atributos durante a pesquisa. O glossário pode ser selecionado como o tipo de valor de um campo em um formulário de metadados associado a um ativo. Quando um termo específico é selecionado como o valor do campo do formulário de metadados de um ativo, os usuários podem pesquisar o termo do glossário de negócios e encontrar os ativos associados.
- Tipo de formulário de metadados
-
Um tipo de formulário de metadados é um modelo que define os metadados que são coletados e salvos quando os ativos são criados como inventário ou publicados em um domínio do Amazon DataZone. Os tipos de formulários de metadados podem ser associados a um ativo de dados. Os tipos de formulários de metadados ajudam os administradores de domínio a definir os formulários de metadados necessários para esse domínio, como informações de conformidade, informações regulamentares ou classificações. Permitem que os administradores de domínio personalizem metadados adicionais para seus ativos. O Amazon DataZone tem tipos de formulários de metadados do sistema, como: asset-common-details-form-type, column-business-metadata-form-type, glue-table-form-type, glue-view-form-type, redshift-table-form-type, redshift-view-form-type, s3-object-collection-form-type, subscription-terms-form-type e suggestion-form-type.
- Formulário de metadados
-
No Amazon DataZone, os formulários de metadados definem os metadados que são coletados e salvos quando os ativos são criados como inventário ou publicados em um domínio do Amazon DataZone. As definições do formulário de metadados são criadas no domínio do catálogo por um administrador do domínio. Uma definição de formulário de metadados é composta por uma ou mais definições de campo, com suporte para tipos de dados de valor de campo booliano, de data, decimal, inteiro, sequência de caracteres e glossário de negócios.
Um administrador de domínio aplica um formulário de metadados aos ativos em seu domínio adicionando o formulário de metadados ao domínio. Em seguida, os publicadores de ativos fornecem todos os valores de campo opcionais e obrigatórios no formulário de metadados.
- Projeto
-
No Amazon DataZone, os projetos permitem que um grupo de usuários colabore em vários casos de uso de negócios que envolvem a criação de ativos em inventários do projeto e, assim, a possibilidade de serem descobertos por todos os membros do projeto e, em seguida, publicação, descoberta, assinatura e consumo de ativos no catálogo Amazon DataZone. Os membros do projeto consomem ativos do catálogo do Amazon DataZone e produzem novos ativos usando um ou mais fluxos de trabalho analíticos. Os membros do projeto podem ser proprietários, colaboradores, consumidores, administradores e visualizadores.
Criar/excluir projetos
Criar/excluir perfis de projeto Criar/excluir perfis de ambiente Criar/excluir ambientes Adicionar/excluir membros em projetos Pesquisa e descoberta Criar/excluir formulários/glossários de metadados Criar execuções de fontes de dados e ingerir dados Publicar dados Solicitações de assinatura Aprovar/rejeitar solicitações de assinatura Ler dados do Amazon Athena e do Amazon Redshift Proprietário A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Sim Sim Sim Sim Sim Sim Sim Sim Colaborador A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Não Sim Sim Sim Sim Sim Sim Sim Consumidor A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Não
Sim
Não
Não
Não
Sim
Não
Sim
Visualizador A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Não
Sim
Não
Não
Não
Não
Não
Sim
Administrador A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Não
Sim
Sim
Sim
Sim
Não
Sim
Sim
Os proprietários do projeto podem adicionar ou remover outros usuários como proprietários ou colaboradores e podem modificar ou excluir projetos. Outras restrições aos colaboradores podem ser definidas com políticas. Quando um usuário cria um projeto, ele se torna o primeiro proprietário desse projeto.
- Ambiente
-
Um ambiente é uma coleção de recursos configurados (por exemplo, um bucket do Amazon S3, um banco de dados do AWS Glue ou um grupo de trabalho do Amazon Athena), com um determinado conjunto de entidades principais do IAM (com permissões de colaborador atribuídas) que podem operar nesses recursos. Cada ambiente também pode ter entidades principais dos usuários autorizados a acessar os recursos e obter acesso aos dados por meio de assinatura e atendimento. Os ambientes são projetados para armazenar links acionáveis em serviços da AWS, IDEs e consoles externos. Os membros do projeto podem acessar serviços como o console do Amazon Athena e muito mais por meio de links diretos configurados em um ambiente. Os usuários do SSO e os usuários do IAM do projeto podem ser mais detalhados para usar/acessar ambientes específicos.
- Perfil do ambiente
-
No Amazon DataZone, um perfil de ambiente é um modelo que você pode usar para criar ambientes. Os perfis de ambiente são criados usando esquemas.
Com os perfis de ambiente, os administradores de domínio podem agrupar esquemas com parâmetros pré-configurados e, em seguida, os operadores de dados podem criar rapidamente qualquer número de novos ambientes selecionando perfis de ambiente existentes e especificando nomes para os novos ambientes. Isso permite que os profissionais de dados gerenciem com eficiência seus projetos e ambientes e, ao mesmo tempo, assegurem que satisfaçam as políticas de governança de dados impostas por seus administradores de domínio.
- Blueprint
-
Um esquema com o qual o ambiente é criado define quais ferramentas e serviços da AWS (por exemplo, o AWS Glue ou o Amazon Redshift) podem ser usados pelos membros do projeto, ao qual o ambiente pertence, ao trabalhar com ativos no catálogo do Amazon DataZone.
Na versão atual do Amazon DataZone, os seguintes esquemas padrão são compatíveis:
-
Esquema do data lake
-
Esquema do data warehouse
-
Esquema do Amazon Sagemaker
-
- Perfis de usuário
-
Um perfil de usuário representa os usuários do Amazon DataZone. O Amazon DataZone oferece suporte a perfis do IAM e identidades de SSO para interagir com o Console de Gerenciamento do Amazon DataZone e o portal de dados para diferentes propósitos. Os administradores de domínio usam perfis do IAM para realizar o trabalho administrativo inicial relacionado ao domínio no Console de Gerenciamento do Amazon DataZone, incluindo a criação de novos domínios do Amazon DataZone, a configuração de tipos de formulários de metadados e a implementação de políticas. Os profissionais de dados usam suas identidades corporativas de SSO por meio do Identity Center para fazer login no portal de dados do Amazon DataZone e acessar projetos nos quais têm associações.
- Perfil do grupo
-
Os perfis de grupo representam grupos de usuários do Amazon DataZone. Os grupos podem ser criados manualmente ou mapeados para grupos do Active Directory de clientes corporativos. No Amazon DataZone, os grupos têm dois propósitos. Primeiro, um grupo pode mapear uma equipe de usuários no organograma e, assim, reduzir o trabalho administrativo do proprietário de um projeto Amazon DataZone quando há novos funcionários entrando ou saindo de uma equipe. Em segundo lugar, os administradores corporativos usam grupos do Active Directory para gerenciar e atualizar os status dos usuários e, portanto, os administradores de domínio do Amazon DataZone podem usar essas associações de grupos para implementar políticas de domínio do Amazon DataZone.
- Administrador de domínio
-
No Amazon DataZone, uma entidade principal do IAM que cria um domínio do Amazon DataZone é o administrador padrão desse domínio. Os administradores de domínio no Amazon DataZone executam as principais funcionalidades do domínio, incluindo a criação de domínios, a atribuição de outros administradores de domínio, a adição de fontes de dados e metas de assinatura, a criação de projetos e ambientes e a atribuição de proprietários de projetos.
- Publicador
-
No Amazon DataZone, os publicadores publicam ativos no catálogo do Amazon DataZone e podem editar os metadados dos ativos que publicam. Se essa autoridade for concedida, os publicadores podem aprovar ou rejeitar solicitações de assinatura dos ativos que publicaram no catálogo do Amazon DataZone.
- Assinante
-
No Amazon DataZone, um assinante é um projeto do Amazon DataZone que quer encontrar, acessar e consumir ativos no catálogo do Amazon DataZone.
- Conta da AWS proprietária
-
No Amazon DataZone, Conta da AWS os proprietários criam perfis, políticas e permissões das Contas da AWS que permitem que essas Contas da AWS sejam associadas aos domínios do Amazon DataZone.