As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
O que AWS Entity Resolutioné
AWS Entity Resolution é um serviço que ajuda você a combinar, vincular e aprimorar registros relacionados armazenados em vários aplicativos, canais e armazenamentos de dados. Você pode começar a usar fluxos de trabalho de resolução de entidades que são flexíveis, escaláveis e podem se conectar aos seus aplicativos e provedores de serviços de dados existentes.
AWS Entity Resolution oferece técnicas avançadas de correspondência, como correspondência baseada em regras, correspondência baseada em aprendizado de máquina (correspondência de ML) e correspondência liderada por provedores de serviços de dados. Essas técnicas podem ajudá-lo a vincular e aprimorar com mais precisão os registros relacionados de informações de clientes, códigos de produtos ou códigos de dados comerciais.
Você pode usar AWS Entity Resolution para criar uma visão unificada das interações com os clientes vinculando eventos recentes (como cliques em anúncios, abandono de carrinho e compras) a sinais pseudonimizados de seus provedores de serviços de dados em um ID de entidade exclusivo. Você também pode acompanhar melhor os produtos que usam códigos diferentes (por exemplo,SKU,UPC) em suas lojas. Você pode usar AWS Entity Resolution para controlar a precisão da correspondência e proteger melhor a segurança dos dados, minimizando a movimentação dos dados.
Tópicos
Você é um AWS Entity Resolution usuário iniciante?
Se você é usuário iniciante do AWS Entity Resolution, recomendamos que comece lendo as seguintes seções:
Características do AWS Entity Resolution
AWS Entity Resolution inclui os seguintes recursos:
-
Preparação de dados flexível e personalizável
AWS Entity Resolution lê seus dados AWS Glue para usar como entradas para processamento de partidas. Você pode especificar no máximo 20 entradas de dados. AWS Entity Resolution processa cada linha da tabela de entrada de dados como um registro, com uma entidade exclusiva servindo como chave primária. AWS Entity Resolution pode operar em conjuntos de dados criptografados. Primeiro, defina o mapeamento do esquema AWS Entity Resolution para entender quais campos de entrada você deseja usar no fluxo de trabalho correspondente. Você pode trazer seu próprio esquema de dados, ou blueprint, a partir de uma entrada de AWS Glue dados existente. Ou você pode criar seu esquema personalizado usando uma interface de usuário ou JSON editor interativo. Por padrão, AWS Entity Resolution também normaliza as entradas de dados antes da correspondência para melhorar o processamento da correspondência, como remover caracteres especiais e espaços extras e formatar texto em minúsculas. Se a entrada de dados já estiver normalizada, você poderá desativar a normalização. Também fornecemos uma GitHub biblioteca
, que você pode usar para personalizar ainda mais o processo de normalização de dados de acordo com suas necessidades. -
Fluxos de trabalho de correspondência de entidades configuráveis
Um fluxo de trabalho de correspondência de entidades é uma sequência de etapas que você configura para saber AWS Entity Resolution como combinar sua entrada de dados e onde gravar a saída de dados consolidada. Você pode configurar um ou mais fluxos de trabalho correspondentes para comparar diferentes entradas de dados e usar diferentes técnicas de correspondência, como correspondência baseada em regras, correspondência de aprendizado de máquina ou correspondência liderada por provedor de serviços de dados sem resolução de entidades ou experiência em ML. Você também pode visualizar o status do trabalho dos fluxos de trabalho e métricas correspondentes existentes, como número do recurso, número de registros processados e número de correspondências encontradas.
-
eady-to-use Correspondência baseada em regras R
Essa técnica de correspondência inclui um conjunto de ready-to-use regras no AWS Management Console ou AWS Command Line Interface (AWS CLI). Você pode usar essas regras para encontrar registros relacionados com base em seus campos de entrada. Você também pode personalizar as regras adicionando ou removendo campos de entrada para cada regra, excluindo regras, reorganizando a prioridade da regra e criando novas regras. Você também pode redefinir as regras para retorná-las às configurações originais. A saída de dados em seu bucket do Amazon Simple Storage Service (Amazon S3) tem grupos de correspondência AWS Entity Resolution que são gerados usando a técnica de correspondência baseada em regras. Cada grupo de correspondência tem o número da regra usado para gerar a correspondência associada a ele para ajudar você a entender a correspondência. Por exemplo, o número da regra pode demonstrar a precisão de cada grupo de correspondência, de forma que a regra um seja mais precisa do que a regra dois.
-
Correspondência pré-configurada baseada em aprendizado de máquina (correspondência de ML)
Essa técnica de correspondência inclui um modelo de ML pré-configurado para encontrar correspondências em todas as suas entradas de dados, especialmente nos registros baseados no consumidor. O modelo usa todos os campos de entrada associados aos tipos de dados de nome, endereço de e-mail, número de telefone, endereço e data de nascimento. O modelo gera grupos de correspondência de registros relacionados com uma pontuação de confiança em cada grupo, explicando a qualidade da correspondência em relação a outros grupos de correspondência. O modelo considera os campos de entrada ausentes e analisa todo o registro em conjunto para representar uma entidade. A saída de dados em seu bucket do Amazon S3 tem grupos de correspondência que são AWS Entity Resolution gerados usando a correspondência de ML. É aqui que cada grupo de correspondência tem uma pontuação de confiança associada de 0,0—1,0, o que indica a precisão da partida.
-
Combinando registros com provedores de serviços de dados
Com isso, AWS Entity Resolution você pode combinar, vincular e aprimorar seus registros com os principais fornecedores de serviços de dados e conjuntos de dados licenciados para expandir sua capacidade de entender, alcançar e atender seus clientes. Por exemplo, você pode acrescentar atributos aos seus dados para aprimorar seus registros ou pode melhorar a interoperabilidade dos sistemas e plataformas com os quais trabalha para atingir suas metas comerciais. Você pode usar esse fluxo de trabalho correspondente com alguns cliques, eliminando a necessidade de criar e manter integrações proprietárias complexas. Você deve ter um contrato de licença com esses provedores de serviços de dados para aproveitar essa técnica de correspondência.
-
-
Processamento manual em massa e processamento incremental automático
Você pode usar o processamento de dados para ajudar a converter suas entradas ou entradas de dados em uma tabela de saída de dados consolidada com registros semelhantes que tenham uma ID de correspondência comum gerada usando configurações de fluxo de trabalho de correspondência de entidades. Usando o API e AWS Management Console ou o AWS CLI, você pode executar o processamento manual em massa sob demanda, com base em seu pipeline de dados existente de extração, transformação e carregamento (ETL), que reprocessa todos os dados para quaisquer novas correspondências e atualiza as correspondências existentes. Além disso, para cenários de correspondência baseados em regras, você pode iniciar o processamento incremental automático para que, assim que novos dados estejam disponíveis em seu bucket do Amazon S3, o serviço leia esses novos registros e os compare com os registros existentes. Isso mantém suas correspondências atualizadas com quaisquer alterações nos dados do Amazon S3.
-
Pesquisa quase em tempo real
Pesquisar qualquer campo de entidade por meio da AWS Entity Resolution GetMatchId APIoperação ajuda você a recuperar de forma síncrona um ID de correspondência existente. Você pode ligar AWS Entity Resolution com atributos de informações de identificação pessoal (PII) adquiridos por meio de diferentes fontes e canais. AWS Entity Resolution faz o hash desses atributos para proteção de dados e recupera a ID de correspondência correspondente para vincular e combinar o cliente. Por exemplo, você pode obter uma inscrição na web com um nome, e-mail e endereço para correspondência associados. Use a AWS Entity Resolution GetMatchId API operação para descobrir se esse cliente ou entidade já existe nos resultados correspondentes armazenados no bucket do S3, junto com o ID de correspondência da entidade correspondente associado a ele. Depois de obter a ID de correspondência da entidade, você pode encontrar as informações transacionais associadas a ela em seus aplicativos de origem, como seus sistemas de gerenciamento de relacionamento com o cliente (CRM) ou plataforma de dados do cliente (CDP).
-
Proteção de dados e regionalização por design
AWS Entity Resolution oferece um recurso de criptografia padrão que pode ajudá-lo a proteger seus dados e fornece uma chave de criptografia para cada entrada de dados no serviço. Por exemplo, AWS Entity Resolution oferece a flexibilidade de trazer dados criptografados e com hash do lado do servidor para executar fluxos de trabalho de correspondência baseados em regras. AWS Entity Resolution oferece suporte à regionalização, o que significa que seus fluxos de trabalho correspondentes são executados para processar seus dados da mesma forma Região da AWS de onde você está usando o serviço. Você também pode criptografar e fazer o hash da saída de dados no Amazon S3 antes de usar seus dados resolvidos em outros aplicativos.
-
Transcodificação multipartidária
AWS Entity Resolution ajuda você a definir suas fontes de dados e as configurações correspondentes entre várias partes que desejam usar uma colaboração de dados, como em AWS Clean Rooms.
Serviços relacionados
Os itens a seguir Serviços da AWS estão relacionados a AWS Entity Resolution:
-
Amazon S3
Armazene os dados que você traz para AWS Entity Resolution o Amazon S3.
Para obter mais informações, consulte O que é o Amazon S3? no Guia do usuário do Amazon Simple Storage Service.
-
AWS Glue
Crie AWS Glue tabelas a partir de seus dados no Amazon S3 para uso em. AWS Entity Resolution
Para obter mais informações, consulte O que é AWS Glue? no Guia do AWS Glue desenvolvedor.
-
AWS CloudTrail
Use AWS Entity Resolution com CloudTrail registros para aprimorar sua análise da AWS service (Serviço da AWS) atividade.
Para obter mais informações, consulte Registrando chamadas de AWS Entity Resolution API usando AWS CloudTrail.
-
AWS CloudFormation
Crie os seguintes recursos em AWS CloudFormation: AWS::EntityResolution::MatchingWorkflow, AWS::EntityResolution::SchemaMapping, AWS::EntityResolution:IdMappingWorkflow, AWS::EntityResolution::IdNamespace e AWS::EntityResolution::PolicyStatement
Para obter mais informações, consulte Crie recursos de resolução de AWS entidades com AWS CloudFormation.
Acessando AWS Entity Resolution
Você pode acessar AWS Entity Resolution por meio das seguintes opções:
-
Diretamente pelo AWS Entity Resolution console em https://console.aws.amazon.com/entityresolution/
. -
Programaticamente por meio do. AWS Entity Resolution API Para obter mais informações, consulte a AWS Entity Resolution APIReferência.
-
Se você planeja chamar o AWS Entity Resolution API in AWS Lambda Runtime, crie seu próprio pacote de implantação e inclua a versão desejada da AWS SDK biblioteca. Para obter mais informações, consulte os exemplos a seguir no Guia do AWS Lambda desenvolvedor:
-
Preços para AWS Entity Resolution
Para obter informações sobre a definição de preço, consulte Definição de preço do AWS Entity Resolution