

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Eingabedatentabellen vorbereiten
<a name="prepare-data-tables"></a>

In AWS Entity Resolution enthält jede Ihrer *Eingabedatentabellen* Quelldatensätze. Diese Datensätze enthalten Verbraucher-Identifikatoren wie Vorname, Nachname, E-Mail-Adresse oder Telefonnummer. Diese Quelldatensätze können mit anderen Quelldatensätzen abgeglichen werden, die Sie in derselben oder anderen Eingabedatentabellen angeben. Jeder Datensatz muss eine eindeutige Datensatz-ID ([Eindeutige ID](glossary.md#unique-id-defn)) haben, und Sie müssen ihn als Primärschlüssel definieren, während Sie darin eine Schemazuordnung erstellen AWS Entity Resolution.

Jede Eingabedatentabelle ist als AWS Glue Tabelle verfügbar, die von Amazon S3 unterstützt wird. Sie können Ihre Erstanbieterdaten bereits in Amazon S3 verwenden oder Datentabellen von anderen SaaS-Drittanbietern in Amazon S3 importieren. Nachdem Sie die Daten auf Amazon S3 hochgeladen haben, können Sie einen AWS Glue Crawler verwenden, um eine Datentabelle in der AWS Glue Data Catalog zu erstellen. Anschließend können Sie die Datentabelle als Eingabe für verwenden. AWS Entity Resolution

In den folgenden Abschnitten wird beschrieben, wie Daten von Erstanbietern und Daten von Drittanbietern vorbereitet werden.

**Topics**
+ [Vorbereiten von Eingabedaten von Erstanbietern](prepare-input-data.md)
+ [Vorbereiten von Eingabedaten von Drittanbietern](prepare-third-party-input-data.md)

# Vorbereiten von Eingabedaten von Erstanbietern
<a name="prepare-input-data"></a>

[In den folgenden Schritten wird beschrieben, wie Sie Daten von Erstanbietern für die Verwendung in einem [regelbasierten Abgleichsworkflow, einem auf maschinellem Lernen basierenden Abgleichsworkflow](creating-matching-workflow-rule-based.md)[oder einem ID-Mapping-Workflow](create-matching-workflow-ml.md) vorbereiten.](create-id-mapping-workflow.md) 

## Schritt 1: Bereiten Sie Datentabellen von Erstanbietern vor
<a name="prepare-first-party-tables"></a>

Für jeden passenden Workflowtyp gibt es unterschiedliche Empfehlungen und Richtlinien, um den Erfolg sicherzustellen.

Informationen zur Erstellung von Datentabellen von Erstanbietern finden Sie in der folgenden Tabelle: 


**Richtlinien für Datentabellen von Erstanbietern**  

| Workflow-Typ | Erforderlich | 
| --- | --- | 
| Regelbasierter Abgleichs-Workflow mit erweitertem Regeltyp |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/entityresolution/latest/userguide/prepare-input-data.html)  | 
| regelbasierter Abgleichs-Workflow mit einfachem Regeltyp |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/entityresolution/latest/userguide/prepare-input-data.html)  | 
| Auf maschinellem Lernen basierender Matching-Workflow |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/entityresolution/latest/userguide/prepare-input-data.html)  | 
| Arbeitsablauf für die ID-Zuordnung  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/entityresolution/latest/userguide/prepare-input-data.html)  | 

## Schritt 2: Speichern Sie Ihre Eingabedatentabelle in einem unterstützten Datenformat
<a name="save-input-data"></a>

Wenn Sie Ihre Eingabedaten von Erstanbietern bereits in einem unterstützten Datenformat gespeichert haben, können Sie diesen Schritt überspringen. 

Um sie verwenden zu können AWS Entity Resolution, müssen die Eingabedaten in einem Format vorliegen, das AWS Entity Resolution unterstützt. 

AWS Entity Resolution unterstützt die folgenden Datenformate:
+ Kommagetrennter Wert (CSV)
+ Parquet

## Schritt 3: Laden Sie Ihre Eingabedatentabelle auf Amazon S3 hoch
<a name="upload-to-s3"></a>

Wenn Sie Ihre First-Party-Datentabelle bereits in Amazon S3 haben, können Sie diesen Schritt überspringen.

**Anmerkung**  
Sie können die Eingabedaten in Amazon S3Resources in jeder Region der AWS kommerziellen Partition speichern, in der S3 unterstützt wird. Auf diese Daten kann aus einer anderen Region oder AWS-Konto bei der Ausführung des passenden Workflows zugegriffen werden.

**So laden Sie Ihre Eingabedatentabelle auf Amazon S3 hoch**

1. Melden Sie sich bei der an AWS-Managementkonsole und öffnen Sie die Amazon S3 S3-Konsole unter [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. Wählen Sie **Buckets** und dann einen Bucket zum Speichern Ihrer Datentabelle aus. 

1. Wählen Sie **Hochladen** und folgen Sie dann den Anweisungen.

1. Wählen Sie die Registerkarte **Objekte**, um das Präfix anzuzeigen, in dem Ihre Daten gespeichert sind. Notieren Sie sich den Namen des Ordners.

   Sie können den Ordner auswählen, um die Datentabelle anzuzeigen.

## Schritt 4: Erstellen Sie eine AWS Glue Tabelle
<a name="create-glue-table"></a>

**Anmerkung**  
Wenn Sie partitionierte AWS Glue Tabellen benötigen, fahren Sie mit [Schritt 4: Erstellen Sie eine partitionierte Tabelle AWS Glue](#create-partitioned-glue-table) fort.

Die Eingabedaten in Amazon S3 müssen katalogisiert AWS Glue und als AWS Glue Tabelle dargestellt werden. Weitere Informationen zum Erstellen einer AWS Glue Tabelle mit Amazon S3 als Eingabe finden Sie unter [Arbeiten mit Crawlern auf der AWS Glue Konsole](https://docs.aws.amazon.com/glue/latest/dg/console-crawlers.html) im *AWS Glue Entwicklerhandbuch*.

In diesem Schritt richten Sie einen Crawler ein, der alle Dateien in AWS Glue Ihrem S3-Bucket crawlt und eine Tabelle erstellt. AWS Glue 

**Anmerkung**  
AWS Entity Resolution unterstützt derzeit keine Amazon S3 S3-Standorte, bei denen Sie registriert sind AWS Lake Formation.

**Um eine AWS Glue Tabelle zu erstellen**

1. Melden Sie sich bei der an AWS-Managementkonsole und öffnen Sie die AWS Glue Konsole unter [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/).

1. Wählen Sie in der Navigationsleiste **Crawlers** aus.

1. Wählen Sie Ihren S3-Bucket aus der Liste aus und wählen Sie dann **Crawler erstellen** aus.

1. **Geben Sie auf der Seite **„Crawler-Eigenschaften festlegen**“ einen **Crawler-Namen** und eine optionale **Beschreibung** ein und wählen Sie dann Weiter aus.**

1. Fahren Sie mit der **Seite Crawler hinzufügen** fort und geben Sie die Details an. 

1. **Wählen Sie auf der Seite „IAM-Rolle** **auswählen“ die Option **Vorhandene IAM-Rolle auswählen aus** und klicken Sie dann auf Weiter.**

   Sie können bei Bedarf auch **eine IAM-Rolle erstellen** wählen oder Ihren Administrator die IAM-Rolle erstellen lassen.

1. **Behalten Sie unter **Einen Zeitplan für diesen Crawler erstellen** die Standardeinstellung **Frequenz** (Bei **Bedarf ausführen) bei** und wählen Sie dann Weiter aus.**

1. **Geben **Sie für Configure the Crawler's output** die AWS Glue Datenbank ein und wählen Sie dann Next aus.**

1. Überprüfen Sie alle Details und wählen Sie dann **Fertig stellen.**

1. Aktivieren Sie auf der Seite **Crawler** das Kontrollkästchen neben Ihrem S3-Bucket und wählen Sie dann **Crawler ausführen** aus.

1. Nachdem der Crawler fertig ausgeführt wurde, wählen Sie in der AWS Glue Navigationsleiste **Datenbanken** und dann Ihren Datenbanknamen aus.

1. Wählen Sie auf der **Datenbankseite** **Tabellen in \$1Ihr Datenbankname\$1** aus.

   1. Sehen Sie sich die Tabellen in der AWS Glue Datenbank an.

   1. Um das Schema einer Tabelle anzuzeigen, wählen Sie eine bestimmte Tabelle aus.

   1. Notieren Sie sich den AWS Glue Datenbanknamen und den AWS Glue Tabellennamen.

Sie sind jetzt bereit, ein Schema-Mapping zu erstellen. Weitere Informationen finden Sie unter [Eine Schemazuordnung erstellen](create-schema-mapping.md).

## Schritt 4: Erstellen Sie eine partitionierte Tabelle AWS Glue
<a name="create-partitioned-glue-table"></a>

**Anmerkung**  
Die AWS Glue Partitionierungsfunktion in AWS Entity Resolution wird nur in Workflows zur ID-Zuordnung unterstützt. Mit dieser AWS Glue Partitionierungsfunktion können Sie bestimmte Partitionen für die Verarbeitung auswählen. AWS Entity Resolution  
Wenn Sie keine partitionierten AWS Glue Tabellen benötigen, können Sie diesen Schritt überspringen.

Eine partitionierte AWS Glue Tabelle spiegelt automatisch neue Partitionen in der AWS Glue Tabelle wider, wenn Sie der Datenstruktur neue Ordner hinzufügen (z. B. einen neuen Tagesordner unter einem Monat). 

Wenn Sie eine partitionierte AWS Glue Tabelle erstellen, können Sie angeben AWS Entity Resolution, welche Partitionen Sie in einem ID-Zuordnungs-Workflow verarbeiten möchten. Jedes Mal, wenn Sie den ID-Zuordnungs-Workflow ausführen, werden dann nur die Daten in diesen Partitionen verarbeitet, anstatt alle Daten in der gesamten AWS Glue Tabelle zu verarbeiten. Diese Funktion ermöglicht eine genauere, effizientere und kostengünstigere Datenverarbeitung und bietet Ihnen mehr Kontrolle und Flexibilität bei der Verwaltung Ihrer Aufgaben zur Entitätsauflösung. AWS Entity Resolution

Sie können in einem ID-Zuordnungs-Workflow eine partitionierte AWS Glue Tabelle für das Quellkonto erstellen. 

Sie müssen zuerst die Eingabedaten in Amazon S3 katalogisieren AWS Glue und als AWS Glue Tabelle darstellen. Weitere Informationen zum Erstellen einer AWS Glue Tabelle mit Amazon S3 als Eingabe finden Sie unter [Arbeiten mit Crawlern auf der AWS Glue Konsole](https://docs.aws.amazon.com/glue/latest/dg/console-crawlers.html) im *AWS Glue Entwicklerhandbuch*.

In diesem Schritt richten Sie einen Crawler ein, der alle Dateien in AWS Glue Ihrem S3-Bucket crawlt und dann eine partitionierte Tabelle erstellt. AWS Glue 

**Anmerkung**  
AWS Entity Resolution unterstützt derzeit keine Amazon S3 S3-Standorte, bei denen Sie registriert sind AWS Lake Formation.

**Um eine partitionierte Tabelle AWS Glue zu erstellen**

1. Melden Sie sich bei der an AWS-Managementkonsole und öffnen Sie die AWS Glue Konsole unter [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/).

1. Wählen Sie in der Navigationsleiste **Crawlers** aus.

1. Wählen Sie Ihren S3-Bucket aus der Liste aus und wählen Sie dann **Crawler erstellen** aus.

1. **Geben Sie auf der Seite **„Crawler-Eigenschaften festlegen**“ einen **Crawler-Namen** und optional eine **Beschreibung** ein und wählen Sie dann Weiter aus.**

1. Fahren Sie mit der **Seite Crawler hinzufügen** fort und geben Sie die Details an. 

1. **Wählen Sie auf der Seite „IAM-Rolle** **auswählen“ die Option **Vorhandene IAM-Rolle auswählen aus** und klicken Sie dann auf Weiter.**

   Sie können bei Bedarf auch **eine IAM-Rolle erstellen** wählen oder Ihren Administrator die IAM-Rolle erstellen lassen.

1. **Behalten Sie unter **Einen Zeitplan für diesen Crawler erstellen** die Standardeinstellung **Frequenz** (Bei **Bedarf ausführen) bei** und wählen Sie dann Weiter aus.**

1. **Geben **Sie für Configure the Crawler's output** die AWS Glue Datenbank ein und wählen Sie dann Next aus.**

1. Überprüfen Sie alle Details und wählen Sie dann **Fertig stellen.**

1. Aktivieren Sie auf der Seite **Crawler** das Kontrollkästchen neben Ihrem S3-Bucket und wählen Sie dann **Crawler ausführen** aus.

1. Nachdem der Crawler fertig ausgeführt wurde, wählen Sie in der AWS Glue Navigationsleiste **Datenbanken** und dann Ihren Datenbanknamen aus.

1. Wählen Sie auf der **Datenbankseite** unter **Tabellen** die Tabelle aus, die partitioniert werden soll.

1. Wählen Sie **in der Tabellenübersicht** die Dropdownliste **Aktionen** aus und wählen Sie dann Tabelle **bearbeiten** aus.

   1. Wählen Sie unter **Tabelleneigenschaften** die Option **Hinzufügen** aus.

   1. Geben Sie für den neuen **Schlüssel** ein**aerPushDownPredicateString**.

   1. Geben Sie für den neuen **Wert** ein**'<PartitionKey>=<PartitionValue'**.

   1. Notieren Sie sich den AWS Glue Datenbanknamen und den AWS Glue Tabellennamen.

Sie sind jetzt bereit für: 
+ [Erstellen Sie ein Schema-Mapping](create-schema-mapping.md) und dann [einen ID-Mapping-Workflow für ein solches AWS-Konto](creating-id-mapping-workflow-same-account.md).
+ [Erstellen Sie eine ID-Namespace-Quelle](create-id-namespace-source.md), [erstellen Sie ein ID-Namespace-Ziel](create-id-namespace-target.md) und [erstellen Sie dann einen ID-Zuordnungs-Workflow für zwei. AWS-Konten](creating-id-mapping-workflow-two-accounts.md)

# Vorbereiten von Eingabedaten von Drittanbietern
<a name="prepare-third-party-input-data"></a>

Datendienste von Drittanbietern stellen Kennungen bereit, die mit Ihren bekannten Kennungen abgeglichen werden können. 

AWS Entity Resolution unterstützt derzeit die folgenden Dienste von Datenanbietern von Drittanbietern:


**Dienste von Datenanbietern**  

| Name des Unternehmens | Verfügbar AWS-Regionen | Kennung | 
| --- | --- | --- | 
| LiveRamp | USA Ost (Nord-Virginia) (us-east-1), USA Ost (Ohio) (us-east-2) und USA West (Oregon) (US-West-2) | Rampen-ID | 
| TransUnion | USA Ost (Nord-Virginia) (us-east-1), USA Ost (Ohio) (us-east-2) und USA West (Oregon) (US-West-2) | TransUnion Einzelperson und Haushalt IDs | 
| Einheitliche ID 2.0 | USA Ost (Nord-Virginia) (us-east-1), USA Ost (Ohio) (us-east-2) und USA West (Oregon) (US-West-2) | unformatierte UID 2 | 

In den folgenden Schritten wird beschrieben, wie Drittanbieterdaten für die Verwendung eines auf [Provider-Services basierenden Matching-Workflows oder eines ID-Zuordnungs-Workflows](glossary.md#provider-service-matching) [auf Anbieterservice-Basis](create-IDMW-provider-services-one-acct.md) vorbereitet werden. 

**Topics**
+ [Schritt 1: Abonnieren Sie einen Anbieterdienst unter AWS Data Exchange](#subscribe-provider-service)
+ [Schritt 2: Bereite Datentabellen von Drittanbietern vor](#prepare-third-party-data-tables)
+ [Schritt 3: Speichern Sie Ihre Eingabedatentabelle in einem unterstützten Datenformat](#save-third-party-data-tables)
+ [Schritt 4: Laden Sie Ihre Eingabedatentabelle auf Amazon S3 hoch](#upload-third-party-data-tables)
+ [Schritt 5: Erstellen Sie eine AWS Glue Tabelle](#create-glue-table-third-party-data-tables)

## Schritt 1: Abonnieren Sie einen Anbieterdienst unter AWS Data Exchange
<a name="subscribe-provider-service"></a>

Wenn Sie ein Abonnement bei einem Anbieterdienst abgeschlossen haben AWS Data Exchange, können Sie einen Abgleichsworkflow mit einem der folgenden Anbieterdienste ausführen, um Ihre bekannten Kennungen mit Ihrem bevorzugten Anbieter abzugleichen. Ihre Daten werden mit einer Reihe von Eingaben abgeglichen, die von Ihrem bevorzugten Anbieter definiert wurden.

Um einen Anbieterdienst zu abonnieren auf AWS Data Exchange

1. Sehen Sie sich die Anbieterliste unter an AWS Data Exchange. Die folgenden Anbieterlisten sind verfügbar:
   + LiveRamp
     + [LiveRampAuflösung der Identität](https://aws.amazon.com/marketplace/pp/prodview-v4557zxjo6ykq)
     + [LiveRampTranscodierung](https://aws.amazon.com/marketplace/pp/prodview-bpp2fvfcxk2kg)
   + TransUnion
     + TruAudience Auflösung und Anreicherung von Identitäten
   + Einheitliche ID 2.0
     + [Einheitliche ID 2.0-Identitätslösung](https://aws.amazon.com/marketplace/pp/prodview-66zqls7iqsm6o?sr=0-4&ref_=beagle&applicationId=AWSMPContessa#offers)

1. Führen Sie je nach Angebotstyp einen der folgenden Schritte aus.
   + **Privates Angebot** — Wenn Sie bereits eine Geschäftsbeziehung mit einem Anbieter haben, folgen Sie dem Verfahren für [private Produkte und Angebote](https://docs.aws.amazon.com/data-exchange/latest/userguide/subscribe-to-private-offer.html) im *AWS Data Exchange Benutzerhandbuch*, um ein privates Angebot anzunehmen AWS Data Exchange.
   + **Bringen Sie Ihr eigenes Abonnement** mit — Wenn Sie bereits ein bestehendes Datenabonnement bei einem Anbieter haben, folgen Sie dem Verfahren für [BYOS-Angebote (Bring Your Own Subscription)](https://docs.aws.amazon.com/data-exchange/latest/userguide/subscribe-to-byos-offer.html) im *AWS Data Exchange Benutzerhandbuch*, um ein BYOS-Angebot anzunehmen. AWS Data Exchange

1. Nachdem Sie einen Provider-Service am abonniert haben AWS Data Exchange, können Sie einen passenden Workflow oder einen ID-Mapping-Workflow mit diesem Provider-Service erstellen. 

Weitere Informationen zum Zugriff auf ein Anbieterprodukt, das Folgendes enthält APIs, finden Sie unter [Zugreifen auf ein API-Produkt](https://docs.aws.amazon.com/data-exchange/latest/userguide/subscribing-to-product.html#use-API-product) im im *AWS Data Exchange Benutzerhandbuch*.

## Schritt 2: Bereite Datentabellen von Drittanbietern vor
<a name="prepare-third-party-data-tables"></a>

Für jeden Drittanbieter-Service gelten unterschiedliche Empfehlungen und Richtlinien, um einen erfolgreichen Matching-Workflow sicherzustellen. 

Informationen zur Erstellung von Datentabellen von Drittanbietern finden Sie in der folgenden Tabelle:


**Richtlinien für Dienste von Datenanbietern**  

| Service für Anbieter | Eindeutige ID erforderlich? | Aktionen | 
| --- | --- | --- | 
| LiveRamp | Ja |  Stellen Sie Folgendes sicher: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/entityresolution/latest/userguide/prepare-third-party-input-data.html)  | 
| TransUnion | Ja |  Stellen Sie sicher, dass es sich bei den folgenden Spalten um eine `string` Typspalte in der Eingabeansicht handelt:  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/entityresolution/latest/userguide/prepare-third-party-input-data.html)  | 
| Vereinheitlichte ID 2.0 | Ja |  Stellen Sie Folgendes sicher: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/entityresolution/latest/userguide/prepare-third-party-input-data.html)  Eine bestimmte E-Mail oder Telefonnummer zu einem bestimmten Zeitpunkt führt zu demselben UID2 Rohwert, unabhängig davon, wer die Anfrage gestellt hat. Rohsalze UID2s werden durch Zugabe von Salzen aus Salzkübeln gewonnen, die etwa einmal pro Jahr rotiert werden, sodass auch der Rohstoff UID2 mitgerissen wird. Die Salzkübel wechseln im Laufe des Jahres zu unterschiedlichen Zeiten. AWS Entity Resolution verfolgt derzeit nicht den Wechsel zwischen Salzeimern und Rohsalz. Es wird daher empfohlen UID2s, den Rohsalz täglich zu regenerieren. UID2s Weitere Informationen finden Sie unter [Wie oft sollte bei UID2s inkrementellen Updates aktualisiert werden?](https://unifiedid.com/docs/getting-started/gs-faqs#how-often-should-uid2s-be-refreshed-for-incremental-updates) in der UID 2.0-Dokumentation.   | 

## Schritt 3: Speichern Sie Ihre Eingabedatentabelle in einem unterstützten Datenformat
<a name="save-third-party-data-tables"></a>

Wenn Sie Ihre Eingabedaten von Drittanbietern bereits in einem unterstützten Datenformat gespeichert haben, können Sie diesen Schritt überspringen. 

Um sie verwenden zu können AWS Entity Resolution, müssen die Eingabedaten in einem Format vorliegen, das AWS Entity Resolution unterstützt. 

AWS Entity Resolution unterstützt die folgenden Datenformate:
+ Kommagetrennter Wert (CSV)
**Anmerkung**  
LiveRamp unterstützt nur CSV-Dateien.
+ Parquet

## Schritt 4: Laden Sie Ihre Eingabedatentabelle auf Amazon S3 hoch
<a name="upload-third-party-data-tables"></a>

Wenn Sie Ihre Drittanbieter-Datentabelle bereits in Amazon S3 haben, können Sie diesen Schritt überspringen.

**Anmerkung**  
Sie können die Eingabedaten in Amazon S3 S3-Ressourcen in jeder Region der AWS kommerziellen Partition speichern, in der S3 unterstützt wird. Auf diese Daten kann aus einer anderen Region oder AWS-Konto bei der Ausführung des passenden Workflows zugegriffen werden.

**So laden Sie Ihre Eingabedatentabelle auf Amazon S3 hoch**

1. Melden Sie sich bei der an AWS-Managementkonsole und öffnen Sie die Amazon S3 S3-Konsole unter [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. Wählen Sie **Buckets** und dann einen Bucket zum Speichern Ihrer Datentabelle aus. 

1. Wählen Sie **Hochladen** und folgen Sie dann den Anweisungen.

1. Wählen Sie die Registerkarte **Objekte**, um das Präfix anzuzeigen, in dem Ihre Daten gespeichert sind. Notieren Sie sich den Namen des Ordners.

   Sie können den Ordner auswählen, um die Datentabelle anzuzeigen.

## Schritt 5: Erstellen Sie eine AWS Glue Tabelle
<a name="create-glue-table-third-party-data-tables"></a>

Die Eingabedaten in Amazon S3 müssen katalogisiert AWS Glue und als AWS Glue Tabelle dargestellt werden. Weitere Informationen zum Erstellen einer AWS Glue Tabelle mit Amazon S3 als Eingabe finden Sie unter [Arbeiten mit Crawlern auf der AWS Glue Konsole](https://docs.aws.amazon.com/glue/latest/dg/console-crawlers.html) im *AWS Glue Entwicklerhandbuch*.

**Anmerkung**  
AWS Entity Resolution unterstützt keine partitionierten Tabellen.

In diesem Schritt richten Sie einen Crawler ein, der alle Dateien in AWS Glue Ihrem S3-Bucket crawlt und eine Tabelle erstellt. AWS Glue 

**Anmerkung**  
AWS Entity Resolution unterstützt derzeit keine Amazon S3 S3-Standorte, bei denen Sie registriert sind AWS Lake Formation.

**Um eine AWS Glue Tabelle zu erstellen**

1. Melden Sie sich bei der an AWS-Managementkonsole und öffnen Sie die AWS Glue Konsole unter [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/).

1. Wählen Sie in der Navigationsleiste **Crawlers** aus.

1. Wählen Sie Ihren S3-Bucket aus der Liste aus und klicken Sie dann auf **Crawler hinzufügen**.

1. **Geben Sie auf der Seite **Crawler hinzufügen** einen **Crawler-Namen** ein und wählen Sie dann Weiter aus.**

1. Fahren Sie mit der **Seite Crawler hinzufügen** fort und geben Sie die Details an. 

1. **Wählen Sie auf der Seite „IAM-Rolle** **auswählen“ die Option **Vorhandene IAM-Rolle auswählen aus** und klicken Sie dann auf Weiter.**

   Sie können bei Bedarf auch **eine IAM-Rolle erstellen** wählen oder Ihren Administrator die IAM-Rolle erstellen lassen.

1. **Behalten Sie unter **Einen Zeitplan für diesen Crawler erstellen** die Standardeinstellung **Frequenz** (Bei **Bedarf ausführen) bei** und wählen Sie dann Weiter aus.**

1. **Geben **Sie für Configure the Crawler's output** die AWS Glue Datenbank ein und wählen Sie dann Next aus.**

1. Überprüfen Sie alle Details und wählen Sie dann **Fertig stellen.**

1. Aktivieren Sie auf der Seite **Crawler** das Kontrollkästchen neben Ihrem S3-Bucket und wählen Sie dann **Crawler ausführen** aus.

1. Nachdem der Crawler fertig ausgeführt wurde, wählen Sie in der AWS Glue Navigationsleiste **Datenbanken** und dann Ihren Datenbanknamen aus.

1. Wählen Sie auf der **Datenbankseite** **Tabellen in \$1Ihr Datenbankname\$1** aus.

   1. Sehen Sie sich die Tabellen in der AWS Glue Datenbank an.

   1. Um das Schema einer Tabelle anzuzeigen, wählen Sie eine bestimmte Tabelle aus.

   1. Notieren Sie sich den AWS Glue Datenbanknamen und den AWS Glue Tabellennamen.

Sie sind jetzt bereit, ein Schema-Mapping zu erstellen. Weitere Informationen finden Sie unter [Eine Schemazuordnung erstellen](create-schema-mapping.md).