As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
AWS arquitetura de dados moderna
Este guia não descreve como implementar uma estrutura de estratégia de dados no AWS. Esse é um tópico extenso que é abordado na AWS documentação, nas postagens do blog e em outros guias (consulte a seção Recursos). No entanto, o diagrama a seguir fornece uma visão geral de alto nível. Ele ilustra os principais componentes de uma arquitetura de dados moderna AWS e abrange a maioria dos serviços que podem estar em seu roteiro.
Os principais componentes dessa arquitetura dão suporte aos princípios técnicos de uma estratégia de dados moderna que foram discutidos anteriormente:
-
Use uma camada de armazenamento integrada, econômica e escalável, para que cada produtor e consumidor de dados tenha os recursos técnicos para interagir com os dados.
O Amazon Simple Storage Service (Amazon S3
) é um serviço de armazenamento de objetos que fornece integração, escalabilidade, disponibilidade de dados, segurança e desempenho a um baixo custo. -
A segurança é obrigatória. Aplique regras de privacidade de dados, forneça proteção de dados com criptografia, habilite a auditoria e forneça conformidade automatizada.
Para aplicar privacidade, proteção e conformidade de dados de forma automatizada e para permitir a auditoria, você pode usar AWS Key Management Service (AWS KMS), AWS Identity and Access Management (IAM)
,, e o Amazon Macie. AWS Secrets ManagerAWS Audit Manager -
Controle os dados para compartilhá-los em toda a empresa. Forneça um catálogo de dados exclusivo e um glossário de negócios para que os usuários possam encontrar e usar os dados de que precisam.
AWS Lake Formation
ajuda você a controlar os dados e compartilhá-los em toda a empresa. Além disso, você pode criar um catálogo de dados exclusivo AWS Glue e um glossário de negócios usando a Amazon DataZone (em versão prévia) para permitir que seus funcionários encontrem os dados de que precisam. -
Selecione o serviço certo para o trabalho certo. Considere a funcionalidade, a escalabilidade, a latência de dados, o esforço necessário para executar o serviço, a resiliência, a integração e a automação ao escolher um componente.
Você pode considerar o Amazon Athena
, o AmazonEMR, AWS Glue o Amazon OpenSearch Service, o Amazon Kinesis, o Amazon Redshift, o Amazon Managed Streaming for Apache Kafka MSK (Amazon) e a Amazon para gerenciar suas tarefas. QuickSight Por exemplo, você pode realizar streaming em tempo real com o Kinesis ou a AmazonMSK, processamento de dados com o Amazon EMR ou, pesquisar com o OpenSearch Service AWS Glue, consultas ad-hoc com o Athena e armazenamento de dados com o Amazon Redshift. -
Use inteligência artificial (IA) e aprendizado de máquina (ML).
Você pode habilitar o uso de inteligência artificial com serviços de AWS IA
e aprendizado de máquina com a Amazon SageMaker . -
Forneça alfabetização de dados e ferramentas com abstrações para pessoas de negócios.
Os processos para fornecer alfabetização, ferramentas e abstrações de dados não fazem parte da arquitetura, mas você pode usar a Amazon DataZone
(em versão prévia) e a Amazon QuickSight como ferramentas de abstração de dados. AWS Lake Formation -
Teste as hipóteses de suas iniciativas de dados e avalie seus resultados.
Você pode usar o painel do Amazon OpenSearch Service
ou QuickSight a Amazon para trabalhar com métricas de resultados comerciais e resultados de testes e validar suas hipóteses.
Para exemplos de arquiteturas de exemplo para diferentes casos de uso, consulte os diagramas de arquitetura de referência no AWS Architecture