DataZone Terminologia e conceitos da Amazon - Amazon DataZone

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

DataZone Terminologia e conceitos da Amazon

DataZone A Amazon é um serviço de gerenciamento de dados que torna mais rápido e fácil catalogar, descobrir, compartilhar e controlar dados armazenados em AWS fontes locais e de terceiros. Com a Amazon DataZone, administradores e administradores de dados que supervisionam os ativos de dados de uma organização podem gerenciar e governar o acesso aos dados usando controles refinados. Esses controles são projetados para garantir o acesso com o nível certo de privilégios e contexto. A Amazon DataZone facilita que engenheiros, cientistas de dados, gerentes de produto, analistas e usuários corporativos acessem dados em toda a organização para que possam descobrir, usar e colaborar para obter insights baseados em dados.

Ao começar a usar a Amazon DataZone, é importante que você entenda seus principais conceitos, terminologia e componentes.

DataZone Componentes da Amazon

A Amazon DataZone inclui os quatro componentes principais a seguir:

  • Catálogo de dados corporativos - você pode usar esse componente para catalogar dados em toda a sua organização com contexto comercial e, assim, permitir que todos em sua organização encontrem e entendam os dados rapidamente.

  • Publique e assine fluxos de trabalho — você pode usar esses fluxos de trabalho automatizados para proteger os dados entre produtores e consumidores de forma autônoma e para garantir que todos em sua organização tenham acesso aos dados certos para a finalidade certa.

  • Projetos e ambientes

    • Nos DataZone projetos da Amazon, são agrupamentos de pessoas, ativos (dados) e ferramentas baseados em casos de uso comercial usados para simplificar o acesso às análises. AWS Os projetos fornecem áreas em que os membros do projeto podem colaborar, trocar dados e compartilhar ativos. Por padrão, os projetos são configurados para que somente aqueles que são explicitamente adicionados ao projeto possam acessar as ferramentas de dados e análises contidas neles. Os projetos gerenciam a propriedade dos ativos produzidos de acordo com as políticas do projeto para os consumidores de dados acessarem.

    • Nos DataZone projetos da Amazon, os ambientes são coleções de zero ou mais recursos configurados (por exemplo, um bucket do Amazon S3, um AWS Glue banco de dados ou um grupo de trabalho do Amazon Athena) nos quais um determinado conjunto IAM de diretores (por exemplo, usuários com permissões de colaborador) pode operar.

  • Portal de dados (fora do AWS Management Console) — é um aplicativo web baseado em navegador em que diferentes usuários podem catalogar, descobrir, controlar, compartilhar e analisar dados de forma autônoma. O portal de dados autentica usuários com IAM credenciais ou credenciais existentes do seu provedor de identidade por meio de. AWS IAM Identity Center

O que são DataZone domínios da Amazon?

Você pode usar os DataZone domínios da Amazon para organizar seus ativos, usuários e seus projetos. Ao associar AWS contas adicionais aos seus DataZone domínios da Amazon, você pode reunir suas fontes de dados. Em seguida, você pode publicar ativos dessas fontes de dados no catálogo do seu domínio, com formulários de metadados e glossários que melhoram a integridade e a qualidade dos metadados. Você também pode pesquisar e navegar nesses ativos para ver quais dados são publicados no domínio. Além disso, você pode participar de projetos para colaborar com outros usuários, assinar ativos e usar ambientes de projeto para acessar ferramentas de análise, incluindo Amazon Athena e Amazon Redshift. Os DataZone domínios da Amazon permitem que você tenha a flexibilidade de refletir as necessidades de dados e análises de sua estrutura organizacional, seja criando um único DataZone domínio da Amazon para sua empresa ou vários DataZone domínios da Amazon para diferentes unidades de negócios.

O que são DataZone projetos e ambientes da Amazon?

A Amazon DataZone permite que equipes e usuários de análises colaborem em projetos criando grupos de equipes, ferramentas e dados baseados em casos de uso.

  • Na Amazon DataZone, os projetos permitem que um grupo de usuários colabore em vários casos de uso comercial que envolvem publicação, descoberta, assinatura e consumo de dados no catálogo da Amazon. DataZone Os membros do projeto consomem ativos do DataZone catálogo da Amazon e produzem novos ativos usando um ou mais fluxos de trabalho analíticos. Os projetos apoiam as seguintes atividades no portal de dados:

    • Os proprietários do projeto podem adicionar membros com permissões de proprietário, colaborador, consumidor, administrador e espectador

    • Os membros do projeto podem ser SSO usuários, SSO grupos e IAM usuários

    • Os membros do projeto podem solicitar a assinatura dos ativos no catálogo de dados

      As aprovações de assinatura são fornecidas aos projetos

    Criar/excluir projetos

    Criar/excluir perfis de projeto Criar/excluir perfis de ambiente Criar/excluir ambientes Adicionar/excluir membros em projetos Pesquisa e descoberta Create/delete metadata forms/glossaries Crie execuções de fontes de dados e ingira dados Publicar dados Solicitar assinaturas Aprovar/rejeitar solicitações de assinatura Leia dados assinados do Amazon Athena e do Amazon Redshift
    Proprietário A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Sim Sim Sim Sim Sim Sim Sim Sim
    Colaborador A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Não Sim Sim Sim Sim Sim Sim Sim
    Consumidor A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio

    Não

    Sim

    Não

    Não

    Não

    Sim

    Não

    Sim

    Visualizador A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio

    Não

    Sim

    Não

    Não

    Não

    Não

    Não

    Sim

    Mordomo A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio

    Não

    Sim

    Sim

    Sim

    Sim

    Não

    Sim

    Sim

  • Em um DataZone projeto da Amazon, os ambientes são coleções de zero ou mais recursos configurados (por exemplo, um Amazon S3, um AWS Glue banco de dados ou um grupo de trabalho do Amazon Athena), com um determinado conjunto IAM de diretores que podem operar com esses recursos. Os ambientes são criados usando perfis de ambiente que são conjuntos pré-configurados de recursos e esquemas que fornecem modelos reutilizáveis para a criação de ambientes. Os perfis de ambiente definem configurações como a região Conta da AWS ou na qual os ambientes são implantados.

O que são DataZone plantas da Amazon?

Um plano com o qual o ambiente é criado define quais AWS ferramentas e serviços (por exemplo, AWS Glue ou o Amazon Redshift) os membros do projeto ao qual o ambiente pertence podem usar ao trabalhar com ativos no catálogo da Amazon DataZone .

Na versão atual da Amazon DataZone, os seguintes esquemas padrão são compatíveis:

Nome do blueprint Descrição Recursos criados
Projeto do Data Lake

Permite que os membros DataZone do projeto da Amazon lancem serviços para produtores e consumidores do Data Lake dentro do ambiente.

Como consumidor, ele permite que os membros do DataZone projeto da Amazon acessem uma cópia “somente para leitura” dos ativos gerenciados pelo Lake Formation diretamente no Amazon Athena e em outros mecanismos de consulta compatíveis com o Lake Formation.

Como produtor, ele permite que os membros DataZone do projeto da Amazon criem novas tabelas LakeFormation gerenciadas usando o Amazon Athena e as publiquem no catálogo da Amazon DataZone.

Oferece aos usuários a capacidade de criar e consultar tabelas do Lake Formation usando o Amazon Athena. Grupo de trabalho do Amazon Athena, AWS Glue banco de dados com permissões “somente de leitura” do Lake Formation, permissões de “IAMsomente leitura” e acesso ao Amazon S3 que é gerenciado pelo projeto. AWS Glue banco de dados com permissões de 'criar' e 'conceder' Lake Formation, permissões de 'leitura' e 'gravação' IAM AWS Glue ETL (extrair, transformar e carregar) com marcação.
Projeto do Data Warehouse

Como consumidor, esse plano permite que os membros DataZone do projeto da Amazon se conectem aos seus próprios clusters do Amazon Redshift para consultar datastores remotos e criar e armazenar novos conjuntos de dados.

Como produtor, esse plano permite que os membros DataZone do projeto da Amazon se conectem aos seus próprios clusters do Amazon Redshift para consultar datastores remotos, criar novos conjuntos de dados e publicá-los no catálogo da Amazon. DataZone

Acesso ao editor de consultas do Amazon Redshift, acesso de “leitura” às fontes de dados inscritas do DataZone catálogo da Amazon, capacidade de criar ativos locais no cluster configurado do Amazon Redshift. Acesso ao editor de consultas do Amazon Redshift, acesso de “leitura” às fontes de dados inscritas do DataZone catálogo da Amazon, capacidade de criar e publicar ativos do cluster configurado do Amazon Redshift.
Projeto do Amazon Sagemaker

Esse plano ajuda produtores e consumidores de dados a migrarem facilmente para a Amazon para SageMaker colaborar em projetos de aprendizado de máquina (ML) e, ao mesmo tempo, reforçar a governança do acesso a dados e ativos de ML. Com a nova integração integrada entre a Amazon DataZone e a Amazon SageMaker, consumidores e produtores de dados podem simplificar a governança de ML em toda a configuração da infraestrutura, colaborar em iniciativas de negócios e governar facilmente dados e ativos de ML.

Você pode criar um SageMaker domínio da Amazon que pode pesquisar, assinar e publicar dados e ativos de ML na Amazon DataZone. Também pode se inscrever e publicar nos bancos de dados AWS Glue e no Lake Formation conforme configurado.

O que são fluxos de trabalho DataZone de inventário e publicação da Amazon?

Criação de ativos de inventário do projeto

Para usar a Amazon DataZone para catalogar seus dados, você deve primeiro trazer seus dados (ativos) como inventário do seu projeto na Amazon DataZone. A criação de inventário para um projeto torna os ativos detectáveis somente para os membros desse projeto. Os ativos do inventário do projeto não estão disponíveis para todos os usuários do domínio na pesquisa/navegação, a menos que sejam publicados explicitamente. Na versão atual da Amazon DataZone, você pode adicionar ativos ao inventário do projeto das seguintes formas:

  • Crie e execute fontes de dados por meio do portal de dados ou usando a Amazon DataZone APIs. Na versão atual da Amazon DataZone, você pode criar e executar fontes de dados para o AWS Glue e o Amazon Redshift. Ao criar e executar fontes de dados do AWS Glue ou do Amazon Redshift, você cria ativos em um inventário de projeto escolhido e importa seus metadados técnicos das tabelas do banco de dados de origem ou dos armazéns de dados como inventário para a Amazon. DataZone

  • UsandoAPIs, você pode criar ativos a partir dos tipos de ativos do sistema disponíveis (objetos AWS Glue, Amazon Redshift, Amazon S3) ou de seus tipos de ativos personalizados.

    • Crie tipos de ativos personalizados em um inventário de projetos usando a Amazon DataZone APIs. Os tipos de ativos personalizados podem incluir modelos de ML, painéis, tabelas locais etc.

    • Crie ativos a partir desses tipos de ativos personalizados usando a Amazon DataZone APIs.

  • Crie manualmente ativos para objetos do S3 usando o portal de DataZone dados da Amazon.

Organização dos ativos do inventário do projeto — depois de criar um inventário do projeto, os proprietários dos dados podem organizar seus ativos de inventário com os metadados comerciais necessários adicionando ou atualizando nomes comerciais (ativo e esquema), descrições (ativo e esquema), leia-me, termos do glossário (ativo e esquema) e formulários de metadados. Você pode fazer isso por meio do portal de dados ou usando a Amazon DataZone APIs. Cada edição em seu ativo cria uma nova versão do inventário.

Publicação de ativos de inventário do projeto no DataZone catálogo da Amazon

A próxima etapa de usar DataZone a Amazon para catalogar seus dados é fazer com que os ativos de inventário do seu projeto possam ser descobertos pelos usuários do domínio. Você pode fazer isso publicando os ativos de inventário no DataZone catálogo da Amazon. Somente a versão mais recente do ativo de inventário pode ser publicada no catálogo e somente a versão mais recente publicada está ativa no catálogo de descobertas. Se um ativo de inventário for atualizado após ser publicado no DataZone catálogo da Amazon, você deverá publicá-lo explicitamente novamente para que a versão mais recente esteja no catálogo de descobertas. Na versão atual da Amazon DataZone, você pode publicar seus ativos de inventário do projeto no DataZone catálogo da Amazon das seguintes formas:

  • Publique manualmente os ativos do inventário do seu projeto no DataZone catálogo da Amazon por meio do portal de dados ou usando a Amazon DataZone APIs.

  • Como parte da criação ou edição de fontes de dados, ative as configurações opcionais Publish your AWS Glue no catálogo ou Publish seus ativos do Amazon Redshift nas configurações do catálogo para serem usadas durante as execuções programadas ou automatizadas da fonte de dados. Quando essa configuração está ativada, a execução de uma fonte de dados adiciona ativos ao inventário do seu projeto e, em seguida, também publica os ativos do inventário no DataZone catálogo da Amazon. Observe que, se você publicar diretamente, os ativos podem não ter metadados comerciais e poderão ser descobertos diretamente por todos os usuários do domínio. Você pode usar essa configuração em suas fontes de dados por meio do portal de dados ou usando a Amazon DataZone APIs.

O que são fluxos de trabalho de DataZone assinatura e atendimento da Amazon?

Depois que seus ativos são publicados no DataZone catálogo da Amazon, os usuários do seu domínio podem descobrir esses ativos, solicitar e obter acesso a esses ativos e continuar a usar DataZone a Amazon para governar, compartilhar e analisar esses ativos.

Os usuários solicitam acesso a um ativo assinando esse ativo em nome de um projeto. Depois que uma solicitação de assinatura é criada, os proprietários do ativo recebem uma notificação e podem analisar a solicitação de assinatura e decidir se querem aprová-la ou rejeitá-la. Se a solicitação de assinatura for aprovada pelo proprietário dos dados, o projeto assinante terá acesso a esse ativo.

Depois que uma solicitação de assinatura é aprovada, DataZone a Amazon inicia um fluxo de trabalho de atendimento de assinaturas que adiciona automaticamente o ativo a todos os ambientes aplicáveis dentro do projeto, criando as doações necessárias no AWS Lake Formation ou no Amazon Redshift. Isso permite que os membros assinantes do projeto consultem o ativo usando uma das ferramentas de consulta (Amazon Athena ou editor de consultas Amazon Redshift) em seus ambientes.

A Amazon DataZone pode acionar essa lógica de atendimento automatizado somente para ativos gerenciados (isso inclui tabelas AWS Glue e tabelas e visualizações do Amazon Redshift). Para todos os outros tipos de ativos (ativos não gerenciados), a Amazon não DataZone pode acionar automaticamente o atendimento, mas publica um evento no Amazon Eventbridge com todos os detalhes necessários na carga útil do evento para que você possa criar as doações necessárias fora da Amazon. DataZone A Amazon DataZone também fornece o updateSubscriptionStatus API que permite que você atualize o status da assinatura assim que ela for cumprida fora da Amazon, DataZone para que a Amazon DataZone possa notificar os membros do projeto de que eles podem começar a consumir o ativo.

As personas dos usuários da Amazon DataZone

A seguir estão as principais personas dos DataZone usuários da Amazon:

  • Administradores de domínio que possuem a configuração da Amazon DataZone como plataforma de análise para sua organização.

    No contexto da Amazon DataZone, os administradores de domínio instalam a Amazon DataZone em AWS contas, criam DataZone domínios da Amazon e configuram associações de AWS contas e associações de provedores de identidade com domínios da Amazon DataZone . Os administradores de domínio também usam outros consoles AWS de serviços, como AWS Organization e Service Catalog, para configurar a Amazon. DataZone

  • Usuários de dados que são os principais usuários da Amazon DataZone (editores de ativos e assinantes) para suas tarefas de análise e aprendizado de máquina.

    Os usuários de dados incluem profissionais de análise de dados, cientistas de dados e usuários do sistema que produzem e consomem ativos de dados. No contexto da Amazon DataZone, os usuários de dados criam e participam de projetos e ambientes, assinam e consomem ativos de dados com ferramentas de análise ou aprendizado de máquina pré-configuradas e publicam ativos de dados de saída no catálogo de DataZone domínios da Amazon para compartilhar com outras pessoas.

  • Desenvolvedores de sistemas que criam modelos de infraestrutura personalizados e integram a Amazon DataZone com catálogos internos ou sistemas de produção.

    No contexto da Amazon DataZone, os desenvolvedores de sistemas criam esquemas de ambiente (modelos de infraestrutura) ou pipeline de Infrastructure-As-Code CI/CD como provedor de ambiente, pipelines de dados para promover ativos de dados em todos os ambientes, adaptadores de sincronização de catálogos e distribuição de subsídios de assinatura para integração com catálogos internos ou integrações entre a DataZone APIs Amazon e interfaces de usuário internas ou sistemas de produção, se necessário.

  • Agentes de governança de dados que possuem as definições e os riscos de segurança organizacional, privacidade e outras políticas de conformidade e que garantem que o uso da Amazon DataZone em suas organizações esteja em conformidade com essas definições.

DataZone Terminologia da Amazon

Domínio

Um DataZone domínio da Amazon é a entidade organizadora para conectar seus ativos, usuários e seus projetos. Com os DataZone domínios da Amazon, você tem a flexibilidade de refletir as necessidades de dados e análises de sua estrutura organizacional, seja criando um único DataZone domínio da Amazon para sua empresa ou várias zonas de dados; domínios para diferentes unidades de negócios ou equipes.

Unidade de domínio

As unidades de domínio permitem que você organize facilmente seus ativos e outras entidades de domínio em unidades de negócios e equipes específicas. Para configurar o compartilhamento seguro e eficiente de dados dentro e entre as unidades de negócios da sua organização, você pode criar unidades de domínio na Amazon DataZone e permitir que usuários selecionados em cada unidade de negócios façam login e compartilhem seus ativos no catálogo. As unidades de domínio também podem ser usadas para permitir que proprietários de recursos, como proprietários de AWS contas, configurem permissões de DataZone autorização da Amazon em seus recursos. As unidades de domínio fornecem uma autoridade delegada dos proprietários da conta aos proprietários da unidade de domínio e podem configurar permissões de autorização em perfis de ambiente (criados usando configurações de blueprint), em nome dos proprietários da conta. Para obter mais informações, consulte Unidades de domínio e políticas de autorização na Amazon DataZone.

Política de autorização

As políticas de DataZone autorização da Amazon são um conjunto de controles dentro da Amazon DataZone aplicados a entidades como projetos, plantas, ambientes, glossários e formulários de metadados. Essas políticas definem quem pode criar essas entidades e gerenciar seu ciclo de vida no portal da Amazon DataZone.

Dentro de uma unidade de DataZone domínio da Amazon, você pode atribuir as seguintes políticas de autorização aos seus usuários e grupos para conceder-lhes permissões específicas:

  • Política de criação de unidades de domínio

  • Política de criação de projetos

  • Política de associação ao projeto

  • Política de suposição de propriedade da unidade de domínio

  • Política de suposição de propriedade do projeto

Para obter mais informações, consulte Atribua políticas de autorização a usuários e grupos dentro de uma unidade de DataZone domínio da Amazon.

Dentro de uma unidade de DataZone domínio da Amazon, você pode atribuir as seguintes políticas de autorização aos seus projetos para conceder permissões específicas:

  • Política de criação de glossário

  • Política de criação de formulários de metadados

  • Política de criação de tipo de ativo personalizado

Para obter mais informações, consulte Atribua políticas de autorização a projetos dentro de uma unidade de DataZone domínio da Amazon.

Em uma configuração específica do blueprint, você pode atribuir as seguintes políticas de autorização aos projetos e proprietários de unidades de domínio:

  • Crie perfis de ambiente usando esse blueprint — essa política pode ser atribuída a DataZone projetos da Amazon e autoriza que eles criem perfis de ambiente usando esse blueprint.

  • Conceda permissões para criar perfis de ambiente usando esse blueprint - essa política pode ser atribuída aos proprietários de unidades de domínio e os autoriza a conceder permissões aos projetos para criar perfis de ambiente usando esse blueprint.

Para obter mais informações, consulte Atribua políticas de autorização nas configurações do Amazon DataZone Blueprint.

Conta associada

Associar suas AWS contas aos DataZone domínios da Amazon permite que você publique dados dessas AWS contas no DataZone catálogo da Amazon e crie DataZone projetos da Amazon para trabalhar com seus dados em várias AWS contas. Solicitações de associação de conta só podem ser iniciadas em AWS contas que possuem um DataZone domínio da Amazon. As solicitações de associação de conta só podem ser aceitas pelos usuários administrativos das AWS contas convidadas. Depois que uma AWS conta é associada a um DataZone domínio da Amazon, você pode registrar suas fontes de dados, como o catálogo AWS Glue e o Amazon Redshift, nessa conta para esse domínio. Estar associado também permite que uma AWS conta crie DataZone projetos e ambientes da Amazon.

Um Conta da AWS pode ser associado a um ou mais DataZone domínios da Amazon.

Fonte de dados

Na Amazon DataZone, você pode usar fontes de dados para importar metadados técnicos de ativos (dados) dos bancos de dados de origem ou armazéns de dados para a Amazon. DataZone Na versão atual da Amazon DataZone, você pode criar e executar fontes de dados para o AWS Glue e o Amazon Redshift. Ao criar uma fonte de dados, você estabelece uma conexão entre a Amazon DataZone e a fonte (AWS Glue Data Catalog ou Amazon Redshift Warehouse) que permite ler metadados técnicos, incluindo nomes de tabelas, nomes de colunas e tipos de dados. Ao criar uma fonte de dados, você também inicia a execução inicial da fonte de dados que cria novos ou atualiza ativos existentes na Amazon DataZone. Ao criar uma fonte de dados ou após a criação bem-sucedida da fonte de dados, você também tem a opção de especificar um cronograma para a execução da fonte de dados.

Execução da fonte de dados

Na Amazon DataZone, a execução de uma fonte de dados é uma tarefa que DataZone a Amazon executa para criar ativos nos inventários do projeto e, opcionalmente, publicar ativos do inventário do projeto no catálogo da Amazon DataZone . As execuções da fonte de dados podem ser automatizadas (iniciadas quando uma fonte de dados é criada inicialmente) ou programadas ou manuais. Os critérios de seleção de dados permitem que você ajuste os conjuntos de dados existentes e futuros a serem inseridos nos inventários do projeto ou no DataZone catálogo da Amazon e a frequência das atualizações de metadados nesses ativos de inventário ou catálogo.

Meta da assinatura

Na Amazon DataZone, as metas de assinatura permitem que você acesse os dados nos quais você se inscreveu em seus projetos. Uma meta de assinatura especifica a localização (por exemplo, um banco de dados ou um esquema) e as permissões necessárias (por exemplo, uma IAM função) que a Amazon DataZone pode usar para estabelecer uma conexão com os dados de origem e criar as concessões necessárias para que os membros do DataZone projeto da Amazon possam começar a consultar os dados nos quais se inscreveram.

Solicitação de assinatura

Na Amazon DataZone, uma solicitação de assinatura é um processo que um DataZone projeto da Amazon deve seguir para ter acesso a um ativo específico. As solicitações de assinatura podem ser aprovadas, rejeitadas, revogadas ou concedidas.

Ativo

Na Amazon DataZone, um ativo é uma entidade que apresenta um único objeto de dados físicos (por exemplo, uma tabela, um painel, um arquivo) ou um objeto de dados virtual (por exemplo, uma visualização).

Asset type (Tipo de ativo)

Os tipos de ativos definem como os ativos são representados no DataZone catálogo da Amazon. Um tipo de ativo define o esquema para um tipo específico de ativo. Quando os ativos são criados, eles são validados em relação ao esquema definido pelo tipo de ativo (por padrão, a versão mais recente). Quando ocorre uma atualização de ativos, a Amazon DataZone cria uma nova versão do ativo e permite que DataZone os usuários da Amazon operem em todas as versões do ativo.

Glossário de negócios

Na Amazon DataZone, um glossário comercial é uma coleção de termos comerciais que podem estar associados a ativos. Um glossário de negócios ajuda a garantir que os mesmos termos e definições sejam usados em toda a organização em suas várias tarefas de análise de dados.

Os termos em um glossário comercial podem ser adicionados aos ativos e colunas para classificar ou aprimorar a identificação desses atributos durante a pesquisa. O glossário pode ser selecionado como o tipo de valor de um campo em um formulário de metadados associado a um ativo. Quando um termo específico é selecionado como o valor do campo do formulário de metadados de um ativo, os usuários podem pesquisar o termo do glossário comercial e encontrar os ativos associados.

Tipo de formulário de metadados

Um tipo de formulário de metadados é um modelo que define os metadados que são coletados e salvos quando os ativos são criados como inventário ou publicados em um domínio da Amazon DataZone . Os tipos de formulários de metadados podem ser associados a um ativo de dados. Os tipos de formulários de metadados ajudam os administradores de domínio a definir os formulários de metadados necessários para esse domínio, como informações de conformidade, informações regulamentares ou classificações. Ele permite que os administradores de domínio personalizem metadados adicionais para seus ativos. DataZone A Amazon tem tipos de formulários de metadados do sistema, como asset-common-details-form -type, column-business-metadata-form -type, glue-table-form-type,, glue-view-form-type, redshift-table-form-type redshift-view-form-type, s3-object-collection-form-type, e. subscription-terms-form-type suggestion-form-type

Formulário de metadados

Na Amazon DataZone, os formulários de metadados definem os metadados que são coletados e salvos quando os ativos são criados como inventário ou publicados em um domínio da Amazon DataZone . As definições do formulário de metadados são criadas no domínio do catálogo por um administrador do domínio. Uma definição de formulário de metadados é composta por uma ou mais definições de campo, com suporte para tipos de dados de valor de campo booleano, de data, decimal, inteiro, sequência de caracteres e glossário comercial.

Um administrador de domínio aplica um formulário de metadados aos ativos em seu domínio adicionando o formulário de metadados ao domínio. Em seguida, os editores de ativos fornecem todos os valores de campo opcionais e obrigatórios no formulário de metadados.

Projeto

Na Amazon DataZone, os projetos permitem que um grupo de usuários colabore em vários casos de uso comercial que envolvem a criação de ativos nos inventários do projeto e, assim, torná-los detectáveis por todos os membros do projeto e, em seguida, publicar, descobrir, assinar e consumir ativos no catálogo da Amazon. DataZone Os membros do projeto consomem ativos do DataZone catálogo da Amazon e produzem novos ativos usando um ou mais fluxos de trabalho analíticos. Os membros do projeto podem ser proprietários, colaboradores, consumidores, administradores e espectadores.

Criar/excluir projetos

Criar/excluir perfis de projeto Criar/excluir perfis de ambiente Criar/excluir ambientes Adicionar/excluir membros em projetos Pesquisa e descoberta Create/delete metadata forms/glossaries Crie execuções de fontes de dados e ingira dados Publicar dados Solicitar assinaturas Aprovar/rejeitar solicitações de assinatura Leia dados assinados do Amazon Athena e do Amazon Redshift
Proprietário A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Sim Sim Sim Sim Sim Sim Sim Sim
Colaborador A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio Não Sim Sim Sim Sim Sim Sim Sim
Consumidor A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio

Não

Sim

Não

Não

Não

Sim

Não

Sim

Visualizador A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio

Não

Sim

Não

Não

Não

Não

Não

Sim

Mordomo A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio A ser gerenciado pelo membro da unidade de domínio

Não

Sim

Sim

Sim

Sim

Não

Sim

Sim

Os proprietários do projeto podem adicionar ou remover outros usuários como proprietários ou colaboradores e podem modificar ou excluir projetos. Outras restrições aos colaboradores podem ser definidas com políticas. Quando um usuário cria um projeto, ele se torna o primeiro proprietário desse projeto.

Ambiente

Um ambiente é uma coleção de recursos configurados (por exemplo, um bucket do Amazon S3, um AWS Glue banco de dados ou um grupo de trabalho do Amazon Athena), com um determinado conjunto IAM de diretores (com permissões de colaborador atribuídas) que podem operar nesses recursos. Cada ambiente também pode ter usuários principais autorizados a acessar os recursos e obter acesso aos dados por meio de assinatura e atendimento. Os ambientes são projetados para armazenar links acionáveis em AWS serviços IDEs e consoles externos. Os membros do projeto podem acessar serviços como o console Amazon Athena e muito mais por meio de links diretos configurados em um ambiente. SSOusuários e IAM usuários do projeto podem ser mais detalhados para usar/acessar ambientes específicos.

Perfil do ambiente

Na Amazon DataZone, um perfil de ambiente é um modelo que você pode usar para criar ambientes. Os perfis de ambiente são criados usando blueprints.

Com os perfis de ambiente, os administradores de domínio podem agrupar esquemas com parâmetros pré-configurados e, em seguida, os operadores de dados podem criar rapidamente qualquer número de novos ambientes selecionando perfis de ambiente existentes e especificando nomes para os novos ambientes. Isso permite que os profissionais de dados gerenciem com eficiência seus projetos e ambientes e, ao mesmo tempo, assegurem que satisfaçam as políticas de governança de dados impostas por seus administradores de domínio.

Blueprint

Um plano com o qual o ambiente é criado define quais AWS ferramentas e serviços (por exemplo, AWS Glue ou o Amazon Redshift) os membros do projeto ao qual o ambiente pertence podem usar ao trabalhar com ativos no catálogo da Amazon DataZone .

Na versão atual da Amazon, DataZone os seguintes esquemas padrão são suportados:

  • Projeto do data lake

  • Plano de data warehouse

  • Projeto do Amazon Sagemaker

Perfis de usuário

Um perfil de usuário representa DataZone os usuários da Amazon. A Amazon DataZone oferece suporte a IAM funções e SSO identidades para interagir com o Amazon DataZone Management Console e o portal de dados para diferentes propósitos. Os administradores de domínio usam IAM funções para realizar o trabalho administrativo inicial relacionado ao domínio no Amazon DataZone Management Console, incluindo a criação de novos DataZone domínios da Amazon, a configuração de tipos de formulários de metadados e a implementação de políticas. Os profissionais de dados usam suas identidades SSO corporativas por meio do Identity Center para fazer login no Amazon DataZone Data Portal e acessar projetos nos quais têm associações.

Perfil do grupo

Os perfis de grupo representam grupos de DataZone usuários da Amazon. Os grupos podem ser criados manualmente ou mapeados para grupos do Active Directory de clientes corporativos. Na Amazon DataZone, os grupos têm dois propósitos. Primeiro, um grupo pode mapear uma equipe de usuários no organograma e, assim, reduzir o trabalho administrativo do proprietário de um DataZone projeto da Amazon quando há novos funcionários entrando ou saindo de uma equipe. Segundo, os administradores corporativos usam grupos do Active Directory para gerenciar e atualizar os status dos usuários e, portanto, os administradores de DataZone domínio da Amazon podem usar essas associações de grupos para implementar políticas de domínio da Amazon. DataZone

Administrador de domínio

Na Amazon DataZone, um IAM diretor que cria um DataZone domínio da Amazon é o administrador de domínio padrão desse domínio. Os administradores de domínio na Amazon DataZone executam as principais funcionalidades do domínio, incluindo a criação de domínios, a atribuição de outros administradores de domínio, a adição de fontes de dados e metas de assinatura, a criação de projetos e ambientes e a designação de proprietários de projetos.

Editora

Na Amazon DataZone, os editores publicam ativos no DataZone catálogo da Amazon e podem editar os metadados dos ativos que publicam. Se essa autoridade for concedida, os editores podem aprovar ou rejeitar solicitações de assinatura dos ativos que publicaram no catálogo da Amazon DataZone .

Assinante

Na Amazon DataZone, um assinante é um DataZone projeto da Amazon que deseja encontrar, acessar e consumir ativos no catálogo da Amazon DataZone .

Conta da AWS owner

Na Amazon DataZone, Conta da AWS os proprietários criam funções, políticas e permissões Contas da AWS que permitem que elas Contas da AWS sejam associadas aos DataZone domínios da Amazon.