AWS Entity Resolution Glossar - AWS Entity Resolution

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

AWS Entity Resolution Glossar

Amazon-Ressourcenname (ARN)

Eine eindeutige Kennung für AWS Ressourcen. ARNssind erforderlich, wenn Sie eine Ressource in allen Bereichen eindeutig angeben müssen AWS Entity Resolution, z. B. in AWS Entity Resolution Richtlinien, Amazon Relational Database Service (AmazonRDS) -Tags und Aufrufen. API

Automatische Verarbeitung

Eine Option für den Verarbeitungsrhythmus für einen passenden Workflow-Job, mit der dieser automatisch ausgeführt werden kann, wenn sich Ihre Dateneingabe ändert.

Diese Option ist nur für den regelbasierten Abgleich verfügbar.

Standardmäßig ist der Verarbeitungsrhythmus für einen passenden Workflow-Auftrag auf Manuell festgelegt, sodass er bei Bedarf ausgeführt werden kann. Sie können die automatische Verarbeitung so einrichten, dass Ihr passender Workflow-Job automatisch ausgeführt wird, wenn sich Ihre Dateneingabe ändert. Dadurch bleibt Ihre passende Workflow-Ausgabe erhalten up-to-date.

AWS KMS key ARN

Dies ist Ihr AWS KMS Amazon-Ressourcenname (ARN) für die Verschlüsselung im Ruhezustand. Falls nicht angegeben, verwendet das System einen AWS Entity Resolution verwalteten KMS Schlüssel.

Klarer Text

Daten, die nicht kryptografisch geschützt sind.

Konfidenzniveau () ConfidenceLevel

Beim ML-Abgleich ist dies das Konfidenzniveau, das angewendet wird AWS Entity Resolution , wenn ML einen übereinstimmenden Datensatz identifiziert. Dies ist Teil der passenden Workflow-Metadaten, die in die Ausgabe aufgenommen werden.

Entschlüsselung

Der Prozess der Rücktransformation verschlüsselter Daten in ihre ursprüngliche Form. Die Entschlüsselung kann nur durchgeführt werden, wenn Sie Zugriff auf den geheimen Schlüssel haben.

Verschlüsselung

Der Vorgang, bei dem Daten mithilfe eines geheimen Werts, eines sogenannten Schlüssels, in eine Form kodiert werden, die zufällig erscheint. Ohne Zugriff auf den Schlüssel ist es unmöglich, den ursprünglichen Klartext zu ermitteln.

Group name (Gruppenname)

Der Gruppenname verweist auf die gesamte Gruppe von Eingabefeldern und kann Ihnen helfen, analysierte Daten zu Vergleichszwecken zu gruppieren.

Wenn es beispielsweise drei Eingabefelder gibt:first_name, undmiddle_name, können Sie sie gruppierenlast_name, indem Sie den Gruppennamen eingeben, wie full_name für den Abgleich und die Ausgabe.

Hash

Hashing bedeutet, einen kryptografischen Algorithmus anzuwenden, der eine unumkehrbare und eindeutige Zeichenfolge mit fester Größe erzeugt, die als Hash bezeichnet wird. AWS Entity Resolution verwendet das 256-Bit-Hash-Protokoll (SHA256) des Secure Hash Algorithm und gibt eine 32-Byte-Zeichenfolge aus. In können Sie wählen AWS Entity Resolution, ob Sie Datenwerte in Ihrer Ausgabe hashen möchten.

Hash-Protokoll (HashingProtocol)

AWS Entity Resolution verwendet das 256-Bit-Hash-Protokoll (SHA256) des Secure Hash Algorithm und gibt eine 32-Byte-Zeichenfolge aus. Dies ist Teil der passenden Workflow-Metadaten, die in die Ausgabe aufgenommen werden.

Methode zur ID-Zuordnung

Wie die ID-Zuordnung durchgeführt werden soll.

Es gibt zwei Methoden zur ID-Zuordnung:

  • Regelbasiert — Die Methode, mit der Sie Abgleichsregeln verwenden, um First-Party-Daten in einem ID-Mapping-Workflow von einer Quelle in ein Ziel zu übersetzen.

  • Anbieterdienste — Die Methode, mit der Sie einen Provider-Service verwenden, um in einem ID-Mapping-Workflow von Drittanbietern codierte Daten von einer Quelle in ein Ziel zu übersetzen.

    AWS Entity Resolution unterstützt derzeit die LiveRamp auf Providerdiensten basierende ID-Mapping-Methode. Sie müssen über ein Abonnement für LiveRamp Through verfügen, um diese AWS Data Exchange Methode verwenden zu können. Weitere Informationen finden Sie unter Schritt 1: Abonnieren Sie einen Anbieterdienst unter AWS Data Exchange.

Arbeitsablauf bei der ID-Zuordnung

Ein Datenverarbeitungsjob, der Daten aus einer Eingabedatenquelle einem Eingabedatenziel auf der Grundlage der angegebenen ID-Zuordnungsmethode zuordnet. Es erzeugt eine ID-Zuordnungstabelle. Für diesen Workflow müssen Sie die ID-Zuordnungsmethode und die Eingabedaten angeben, die Sie von einer Quelle in ein Ziel übersetzen möchten.

Sie können einen ID-Mapping-Workflow so einrichten, dass er entweder in Ihrem eigenen AWS-Konto oder in zwei Schritten ausgeführt wird AWS-Konten.

ID-Namespace

Eine Ressource AWS Entity Resolution , die Metadaten enthält, die mehrere Datensätze AWS-Konten und die Verwendung dieser Datensätze in einem ID-Mapping-Workflow erläutern.

Es gibt zwei Arten von ID-Namespaces: und. SOURCE TARGET Das SOURCE enthält Konfigurationen für die Quelldaten, die in einem ID-Mapping-Workflow verarbeitet werden. Das TARGET enthält eine Konfiguration der Zieldaten, in die alle Quellen aufgelöst werden. Um die Eingabedaten zu definieren, die Sie über zwei auflösen möchten AWS-Konten, erstellen Sie eine ID-Namespace-Quelle und ein ID-Namespace-Ziel, um Ihre Daten von einem Satz (SOURCE) in einen anderen () zu übersetzen. TARGET

Nachdem Sie und ein anderes Mitglied ID-Namespaces erstellt und einen ID-Zuordnungs-Workflow ausgeführt haben, können Sie einer Kollaboration beitreten, AWS Clean Rooms um eine Verknüpfung mehrerer Tabellen für die ID-Zuordnungstabelle auszuführen und die Daten zu analysieren.

Weitere Informationen finden Sie im AWS Clean Rooms -Benutzerhandbuch.

Eingabefeld

Ein Eingabefeld entspricht einem Spaltennamen aus Ihrer AWS Glue Eingabedatentabelle.

Eingabequelle ARN (InputSourceARN)

Der Amazon-Ressourcenname (ARN), der für eine AWS Glue Tabelleneingabe generiert wurde. Dies ist Teil der passenden Workflow-Metadaten, die in die Ausgabe aufgenommen werden.

Eingabetyp

Der Typ der Eingabedaten. Sie wählen es aus einer vorkonfigurierten Werteliste wie Name, Adresse, Telefonnummer oder E-Mail-Adresse aus. Der Eingabetyp gibt an, AWS Entity Resolution welche Art von Daten Sie präsentieren, sodass sie ordnungsgemäß klassifiziert und normalisiert werden können.

Auf maschinellem Lernen basierendes Matching

Der auf maschinellem Lernen basierende Matching (ML-Matching) findet Übereinstimmungen in Ihren Daten, die möglicherweise unvollständig sind oder nicht exakt gleich aussehen. Der ML-Abgleich ist ein voreingestellter Prozess, bei dem versucht wird, Datensätze aus allen von Ihnen eingegebenen Daten abzugleichen. Der ML-Abgleich gibt eine Match-ID und ein Konfidenzniveau für jeden übereinstimmenden Datensatz zurück.

Manuelle Verarbeitung

Eine Option für die Schrittfrequenz eines passenden Workflow-Auftrags, mit der dieser bei Bedarf ausgeführt werden kann.

Diese Option ist standardmäßig festgelegt und sowohl für den regelbasierten Abgleich als auch für den auf maschinellem Lernen basierenden Abgleich verfügbar.

Many-to-Many übereinstimmend

Many-to-many Beim Abgleich werden mehrere Instanzen ähnlicher Daten verglichen. Werte in Eingabefeldern, denen derselbe Zuordnungsschlüssel zugewiesen wurde, werden miteinander abgeglichen, unabhängig davon, ob sie sich im selben Eingabefeld oder in unterschiedlichen Eingabefeldern befinden.

Beispielsweise haben Sie möglicherweise mehrere Eingabefelder für Telefonnummern wie mobile_phone und home_phone die gleiche Abgleichstaste „Telefon“. Verwenden many-to-many Sie den Abgleich, um Daten im mobile_phone Eingabefeld mit Daten im mobile_phone Eingabefeld und Daten im home_phone Eingabefeld zu vergleichen.

Mit Abgleichsregeln werden Daten in mehreren Eingabefeldern mit demselben Abgleichsschlüssel mit einer (oder) -Operation ausgewertet, und beim one-to-many Abgleich werden Werte aus mehreren Eingabefeldern verglichen. Das heißt, wenn eine Kombination von mobile_phone oder zwischen zwei Datensätzen home_phone übereinstimmt, gibt die Vergleichstaste „Telefon“ eine Übereinstimmung zurück. Für die Suchtaste „Telefon“, um eine Übereinstimmung zu finden, Record One mobile_phone = Record Two mobile_phone ODER Record One mobile_phone = Record Two home_phone ODER Record One home_phone = Record Two home_phone ODERRecord One home_phone = Record Two mobile_phone.

Spiel-ID (MatchID)

Bei regelbasiertem Abgleich und ML-Matching ist dies die ID, die von jeder übereinstimmenden Datensatzgruppe generiert AWS Entity Resolution und auf diese angewendet wird. Dies ist Teil der passenden Workflow-Metadaten, die in die Ausgabe aufgenommen werden.

Schlüssel abgleichen (MatchKey)

Der Abgleichsschlüssel AWS Entity Resolution gibt an, welche Eingabefelder als ähnliche Daten und welche als unterschiedliche Daten betrachtet werden sollen. Auf diese Weise können regelbasierte Abgleichsregeln AWS Entity Resolution automatisch konfiguriert und ähnliche Daten, die in verschiedenen Eingabefeldern gespeichert sind, verglichen werden.

Wenn Ihre Daten mehrere Arten von Telefonnummerninformationen wie ein mobile_phone Eingabefeld und ein home_phone Eingabefeld enthalten, die Sie miteinander vergleichen möchten, können Sie beiden die Abgleichstaste „Telefon“ geben. Anschließend kann der regelbasierte Abgleich so konfiguriert werden, dass Daten mithilfe von „oder“ -Anweisungen in allen Eingabefeldern mit dem Abgleichsschlüssel „Telefon“ verglichen werden (siehe One-to-One Matching und Many-to-Many Matching Definitionen im Abschnitt Matching Workflow).

Wenn Sie möchten, dass beim regelbasierten Abgleich verschiedene Arten von Telefonnummerninformationen vollständig getrennt berücksichtigt werden, können Sie spezifischere Abgleichsschlüssel wie „Mobile_Phone“ und „Home_Phone“ erstellen. Anschließend können Sie beim Einrichten eines Workflows für den Abgleich angeben, wie die einzelnen Telefonzuordnungsschlüssel beim regelbasierten Abgleich verwendet werden sollen.

Wenn für ein bestimmtes Eingabefeld kein Wert angegeben MatchKey ist, kann es nicht für den Abgleich verwendet werden, sondern es kann den Abgleichs-Workflow-Prozess durchlaufen und bei Bedarf ausgegeben werden.

Schlüsselname abgleichen

Der Name, der einem Match Key zugewiesen wurde.

Zuordnungsregel (MatchRule)

Bei regelbasiertem Abgleich ist dies die angewendete Regelnummer, mit der ein übereinstimmender Datensatz generiert wurde. Dies ist Teil der passenden Workflow-Metadaten, die in die Ausgabe aufgenommen werden.

Übereinstimmung

Der Prozess, bei dem Daten aus verschiedenen Eingabefeldern, Tabellen oder Datenbanken kombiniert und verglichen werden und anhand der Erfüllung bestimmter Abgleichskriterien (z. B. entweder durch Abgleichsregeln oder Modelle) ermittelt wird, welche davon ähnlich sind — oder „übereinstimmen“.

Arbeitsablauf beim Abgleich

Der Prozess, den Sie eingerichtet haben, um anzugeben, welche Eingabedaten miteinander abgeglichen werden sollen und wie der Abgleich durchgeführt werden soll.

Beschreibung des passenden Workflows

Eine optionale Beschreibung des passenden Workflows, die Sie möglicherweise eingeben möchten. Beschreibungen helfen Ihnen dabei, zwischen passenden Workflows zu unterscheiden, wenn Sie mehr als einen erstellen.

Passender Workflow-Name

Der Name für den passenden Workflow, den Sie angeben.

Anmerkung

Übereinstimmende Workflow-Namen müssen eindeutig sein. Sie dürfen nicht denselben Namen haben, da sonst ein Fehler zurückgegeben wird.

Passende Workflow-Metadaten

Informationen, die AWS Entity Resolution während eines passenden Workflow-Jobs generiert und ausgegeben wurden. Diese Informationen sind bei der Ausgabe erforderlich.

Normalisierung () ApplyNormalization

Wählen Sie aus, ob die Eingabedaten wie im Schema definiert normalisiert werden sollen. Bei der Normalisierung werden Daten standardisiert, indem zusätzliche Leerzeichen und Sonderzeichen entfernt und das Format auf Kleinbuchstaben standardisiert wird.

Wenn ein Eingabefeld beispielsweise den Eingabetyp hat und die Werte in der PHONE_NUMBER Eingabetabelle als formatiert sind(123) 456-7890, AWS Entity Resolution werden die Werte auf normalisiert. 1234567890

In den folgenden Abschnitten werden unsere Standardnormalisierungsregeln beschrieben. Informationen speziell zum ML-basierten Abgleich finden Sie unter. Normalisierung () ApplyNormalization — Nur ML-basiert

Name

  • TRIM= Schneidet führende und nachfolgende Leerzeichen ab

  • LOWERCASE= Alle Alphazeichen werden in Kleinbuchstaben geschrieben

  • CONVERT_ ACCENT = Buchstaben mit verdecktem Akzent in einen normalen Buchstaben umwandeln

  • REMOVE_ _ ALL NON _ ALPHA = Entfernt alle Nicht-Alpha-Zeichen [a-zA-Z]

Email

  • TRIM= Schneidet führende und nachfolgende Leerzeichen ab

  • LOWERCASE= Alle Alphazeichen werden in Kleinbuchstaben geschrieben

  • CONVERT_ ACCENT = Buchstaben mit verdecktem Akzent in einen normalen Buchstaben umwandeln

  • EMAIL_ ADDRESS _ UTIL _ NORM = Entfernt alle Punkte (.) aus dem Benutzernamen, entfernt alles, was nach einem Pluszeichen (+) im Benutzernamen steht, und standardisiert gängige Domain-Variationen

  • REMOVE_ _ ALL _ NON EMAIL _ CHARS = Entfernt alle non-alpha-numeric Zeichen [a-zA-Z0-9] und [.@-]

Phone

  • TRIM= Schneidet führende und nachfolgende Leerzeichen ab

  • REMOVE_ _ ALL NON _ NUMERIC = Entfernt alle nicht numerischen Zeichen [0-9]

  • REMOVE_ _ ALL LEADING _ ZEROES = Entfernt alle führenden Nullen

  • ENSURE_ PREFIX _ WITH _MAP, "phonePrefixMap" = Untersucht jede Telefonnummer und versucht, sie mit den Mustern in der phonePrefixMap abzugleichen. Wenn eine Übereinstimmung gefunden wird, fügt die Regel das Präfix der Telefonnummer hinzu oder ändert es, um sicherzustellen, dass es dem in der Map angegebenen Standardformat entspricht.

Adresse

ADDRESS_RENAME_WORD_MAP

Dies sind die Wörter, die bei der Normalisierung der Adresszeichenfolge umbenannt werden.

"avenue": "ave", "bouled": "blvd", "circle": "cir", "circles": "cirs", "court": "ct", "centre": "ctr", "center": "ctr", "drive": "dr", "freeway": "fwy", "frwy": "fwy", "highway": "hwy", "lane": "ln", "parks": "park", "parkways": "pkwy", "pky": "pkwy", "pkway": "pkwy", "pkwys": "pkwy", "parkway": "pkwy", "parkwy": "pkwy", "place": "pl", "plaza": "plz", "plza": "plz", "road": "rd", "square": "sq", "squ": "sq", "sqr": "sq", "street": "st", "str": "st", "str.": "strasse"

ADDRESS_RENAME_DELIMITER_MAP

Dies sind die Trennzeichen, die bei der Normalisierung der Adresszeichenfolge umbenannt werden.

",": " ", ".": " ", "[": " ", "]": " ", "/": " ", "-": " ", "#": " number "

ADDRESS_RENAME_DIRECTION_MAP

Dies sind die Richtungskennungen, die bei der Normalisierung der Adresszeichenfolge umbenannt werden.

"east": "e", "north": "n", "south": "s", "west": "w", "northeast": "ne", "northwest": "nw", "southeast": "se", "southwest": "sw"

ADDRESS_RENAME_NUMBER_MAP

Dies sind die Zahlenfolgen, die bei der Normalisierung der Adresszeichenfolge umbenannt werden.

"número": "number", "numero": "number", "no": "number", "núm": "number", "num": "number"

ADDRESS_RENAME_SPECIAL_CHAR_MAP

Dies sind die Sonderzeichenfolgen, die bei der Normalisierung der Adresszeichenfolge umbenannt werden.

"ß": "ss", "ä": "ae", "ö": "oe", "ü": "ue", "ø": "o", "æ": "ae"

Gehasht

  • TRIM= Schneidet führende und nachfolgende Leerzeichen ab

Quell-ID

  • TRIM= Schneidet führende und nachfolgende Leerzeichen ab

Normalisierung () ApplyNormalization — Nur ML-basiert

Wählen Sie aus, ob die Eingabedaten wie im Schema definiert normalisiert werden sollen. Bei der Normalisierung werden Daten standardisiert, indem zusätzliche Leerzeichen und Sonderzeichen entfernt und das Format auf Kleinbuchstaben standardisiert wird.

Wenn ein Eingabefeld beispielsweise den Eingabetyp hat und die Werte in der NAME Eingabetabelle als formatiert sindJohns Smith, AWS Entity Resolution werden die Werte auf normalisiert. john smith

In den folgenden Abschnitten werden die Normalisierungsregeln für Matching-Workflows beschrieben, die auf maschinellem Lernen basieren.

Name

  • TRIM= Kürzt führende und nachfolgende Leerzeichen

  • LOWERCASE= Alle Alphazeichen werden in Kleinbuchstaben geschrieben

Email

  • LOWERCASE= Alle Alphazeichen in Kleinbuchstaben

  • Ersetzt nur (at) (Groß- und Kleinschreibung beachten) durch ein @-Symbol

  • Entfernt alle Leerzeichen an beliebiger Stelle im Wert

  • Entfernt alles, was außerhalb des ersten Bereichs liegt, "< >" falls es existiert

Phone

  • TRIM= Schneidet führende und nachfolgende Leerzeichen ab

  • REMOVE_ _ ALL NON _ NUMERIC = Entfernt alle nicht numerischen Zeichen [0-9]

  • REMOVE_ _ ALL LEADING _ ZEROES = Entfernt alle führenden Nullen

  • ENSURE_ PREFIX _ WITH _MAP, "phonePrefixMap" = Untersucht jede Telefonnummer und versucht, sie mit den Mustern in der phonePrefixMap abzugleichen. Wenn eine Übereinstimmung gefunden wird, fügt die Regel das Präfix der Telefonnummer hinzu oder ändert es, um sicherzustellen, dass es dem in der Map angegebenen Standardformat entspricht.

One-to-One übereinstimmend

One-to-one Beim Matching werden einzelne Instanzen ähnlicher Daten verglichen. Eingabefelder mit demselben Abgleichsschlüssel und Werten im selben Eingabefeld werden miteinander abgeglichen.

Beispielsweise haben Sie möglicherweise mehrere Eingabefelder für Telefonnummern wie mobile_phone undhome_phone, die denselben Abgleichsschlüssel „Telefon“ haben. Verwenden one-to-one Sie den Abgleich, um Daten im mobile_phone Eingabefeld mit Daten im mobile_phone Eingabefeld zu vergleichen und um Daten im home_phone Eingabefeld mit Daten im home_phone Eingabefeld zu vergleichen. Daten im mobile_phone Eingabefeld werden nicht mit Daten im home_phone Eingabefeld verglichen.

Mit Abgleichsregeln werden Daten in mehreren Eingabefeldern mit demselben Abgleichsschlüssel mit einer (oder) -Operation ausgewertet, und one-to-many beim Abgleich werden Werte innerhalb eines einzelnen Eingabefeldes verglichen. Das heißt, wenn zwei Datensätze home_phone mit mobile_phone oder übereinstimmen, gibt die Vergleichstaste „Telefon“ eine Übereinstimmung zurück. Für die Suchtaste „Telefon“, um eine Übereinstimmung zu finden, Record One mobile_phone = Record Two mobile_phone ODERRecord One home_phone = Record Two home_phone.

Abgleichsregeln werten Daten in Eingabefeldern mit unterschiedlichen Zuordnungsschlüsseln mit einer (und) -Operation aus. Wenn Sie möchten, dass beim regelbasierten Abgleich verschiedene Arten von Telefonnummerninformationen vollständig getrennt berücksichtigt werden, können Sie spezifischere Zuordnungsschlüssel wie „mobile_phone“ und „home_phone“ erstellen. Wenn Sie beide Vergleichstasten in einer Regel verwenden möchten, um Treffer zu finden,. Record One mobile_phone = Record Two mobile_phone AND Record One home_phone = Record Two home_phone

Output

Eine Liste von OutputAttributeObjekten, von denen jedes die Felder Name und Hashed hat. Jedes dieser Objekte steht für eine Spalte, die in die AWS Glue Ausgabetabelle aufgenommen werden soll, und gibt an, ob die Werte in der Spalte gehasht werden sollen.

gibt 3Path aus

Das S3-Ziel, in das die AWS Entity Resolution Ausgabetabelle geschrieben wird.

OutputSourceConfig

Eine Liste von OutputSource Objekten, von denen jedes die Felder Outputs3Path und Output hat. ApplyNormalization

Dienstbasiertes Matching auf Anbieterbasis

Beim Abgleich auf Anbieterdiensten handelt es sich um einen Prozess, bei dem Ihre Datensätze mit bevorzugten Datendienstanbietern und lizenzierten Datensätzen abgeglichen, verknüpft und erweitert werden. Sie müssen über ein Abonnement beim Anbieter AWS Data Exchange verfügen, um diese Abgleichstechnik verwenden zu können.

AWS Entity Resolution ist derzeit in die folgenden Datendienstanbieter integriert:

  • LiveRamp

  • TransUnion

  • UID2.0

Regelbasierter Abgleich

Beim regelbasierten Abgleich handelt es sich um einen Prozess, der darauf abzielt, exakte Übereinstimmungen zu finden. Beim regelbasierten Abgleich handelt es sich um einen hierarchischen Satz von Wasserfall-Abgleichsregeln, die von Ihnen vorgeschlagen, auf der Grundlage der von AWS Entity Resolution Ihnen eingegebenen Daten vorgeschlagen und vollständig von Ihnen konfiguriert werden können. Alle in den Regelkriterien angegebenen Vergleichsschlüssel müssen exakt übereinstimmen, damit die verglichenen Daten als Treffer deklariert und die zugehörigen Metadaten ausgegeben werden können. Beim regelbasierten Abgleich werden für jeden übereinstimmenden Datensatz eine Match-ID und eine Regelnummer zurückgegeben.

Wir empfehlen, Regeln zu definieren, mit denen eine Entität eindeutig identifiziert werden kann. Ordnen Sie Ihre Regeln so an, dass zuerst genauere Treffer gefunden werden.

Nehmen wir zum Beispiel an, Sie haben zwei Regeln, Regel 1 und Regel 2.

Diese Regeln haben die folgenden Zuweisungsschlüssel:

  • Regel 1 beinhaltet den vollständigen Namen und die Adresse

  • Regel 2 beinhaltet den vollständigen Namen, die Adresse und die Telefonnummer

Da Regel 1 zuerst ausgeführt wird, werden nach Regel 2 keine Treffer gefunden, da sie alle nach Regel 1 gefunden worden wären.

Um nach Übereinstimmungen zu suchen, die nach Telefonnummer unterschieden werden, ordnen Sie die Regeln wie folgt neu an:

  • Regel 2 umfasst den vollständigen Namen, die Adresse und die Telefonnummer

  • Regel 1 beinhaltet den vollständigen Namen und die Adresse

Schema

Der Begriff, der für eine Struktur oder ein Layout verwendet wird, das definiert, wie ein Datensatz organisiert und verknüpft ist.

Beschreibung des Schemas

Eine optionale Beschreibung des Schemas, die Sie eingeben können. Beschreibungen helfen Ihnen, zwischen Schemazuordnungen zu unterscheiden, wenn Sie mehr als eine erstellen.

Name des Schemas

Der Name des Schemas.

Anmerkung

Schemanamen müssen eindeutig sein. Sie dürfen nicht denselben Namen haben, da sonst ein Fehler zurückgegeben wird.

Schemazuordnung

Schema-Mapping AWS Entity Resolution ist der Prozess, mit dem Sie festlegen, AWS Entity Resolution wie Ihre Daten für den Abgleich interpretiert werden sollen. Sie definieren das Schema der Eingabedatentabelle, die Sie in einen Abgleichs-Workflow einlesen möchten AWS Entity Resolution .

Schemazuordnung ARN

Der Amazon-Ressourcenname (ARN), der für die Schemazuordnung generiert wurde.

Eindeutige ID

Eine eindeutige Kennung, die Sie angeben und die jeder Zeile mit Eingabedaten zugewiesen werden muss, die AWS Entity Resolution gelesen wird.

Beispiel: Primary_key, Row_ID oder Record_ID.

Die Spalte „Eindeutige ID“ ist erforderlich.

Die eindeutige ID muss ein eindeutiger Bezeichner innerhalb einer einzelnen Tabelle sein.

In verschiedenen Tabellen kann die Unique ID doppelte Werte haben.

Wenn der passende Workflow ausgeführt wird, wird der Datensatz zurückgewiesen, wenn die eindeutige ID:

  • ist nicht angegeben

  • ist innerhalb derselben Tabelle nicht eindeutig

  • überschneidet sich in Bezug auf den Attributnamen zwischen den Quellen.

  • mehr als 38 Zeichen (nur bei regelbasierten Matching-Workflows)