

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Siapkan tabel data masukan
<a name="prepare-data-tables"></a>

Di Resolusi Entitas AWS, setiap *tabel data input* Anda berisi catatan sumber. Catatan ini berisi pengidentifikasi konsumen seperti nama depan, nama belakang, alamat email, atau nomor telepon. Rekaman sumber ini dapat dicocokkan dengan catatan sumber lain yang Anda berikan dalam tabel data input yang sama atau lainnya. Setiap record harus memiliki Record ID ([ID Unik](glossary.md#unique-id-defn)) yang unik dan Anda harus mendefinisikannya sebagai kunci utama saat membuat pemetaan skema di dalamnya. Resolusi Entitas AWS

Setiap tabel data input tersedia sebagai AWS Glue tabel yang didukung oleh Amazon S3. Anda dapat menggunakan data pihak pertama yang sudah ada dalam Amazon S3, atau mengimpor tabel data dari penyedia SaaS pihak ketiga lainnya ke Amazon S3. Setelah mengunggah data ke Amazon S3, Anda dapat menggunakan AWS Glue crawler untuk membuat tabel data di. AWS Glue Data Catalog Anda kemudian dapat menggunakan tabel data sebagai masukan ke Resolusi Entitas AWS.

Bagian berikut menjelaskan cara menyiapkan data pihak pertama dan data pihak ketiga.

**Topics**
+ [Mempersiapkan data masukan pihak pertama](prepare-input-data.md)
+ [Mempersiapkan data input pihak ketiga](prepare-third-party-input-data.md)

# Mempersiapkan data masukan pihak pertama
<a name="prepare-input-data"></a>

[Langkah-langkah berikut menjelaskan cara menyiapkan data pihak pertama untuk digunakan dalam alur kerja pencocokan berbasis [aturan, alur kerja pencocokan berbasis pembelajaran mesin, atau alur](creating-matching-workflow-rule-based.md)[kerja pemetaan ID](create-matching-workflow-ml.md).](create-id-mapping-workflow.md) 

## Langkah 1: Siapkan tabel data pihak pertama
<a name="prepare-first-party-tables"></a>

Setiap jenis alur kerja yang cocok memiliki serangkaian rekomendasi dan pedoman yang berbeda untuk membantu memastikan kesuksesan.

Untuk menyiapkan tabel data pihak pertama, lihat tabel berikut: 


**Pedoman tabel data pihak pertama**  

| Jenis alur kerja | Diperlukan | 
| --- | --- | 
| Alur kerja pencocokan berbasis aturan dengan tipe aturan Lanjutan |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/entityresolution/latest/userguide/prepare-input-data.html)  | 
| alur kerja pencocokan berbasis aturan dengan tipe aturan Sederhana |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/entityresolution/latest/userguide/prepare-input-data.html)  | 
| alur kerja pencocokan berbasis pembelajaran mesin |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/entityresolution/latest/userguide/prepare-input-data.html)  | 
| Alur kerja pemetaan ID  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/entityresolution/latest/userguide/prepare-input-data.html)  | 

## Langkah 2: Simpan tabel data input Anda dalam format data yang didukung
<a name="save-input-data"></a>

Jika Anda telah menyimpan data input pihak pertama dalam format data yang didukung, Anda dapat melewati langkah ini. 

Untuk menggunakannya Resolusi Entitas AWS, data input harus dalam format yang Resolusi Entitas AWS mendukung. 

Resolusi Entitas AWS mendukung format data berikut:
+ nilai dipisahkan koma (CSV)
+ Parquet

## Langkah 3: Unggah tabel data input Anda ke Amazon S3
<a name="upload-to-s3"></a>

Jika Anda sudah memiliki tabel data pihak pertama di Amazon S3, Anda dapat melewati langkah ini.

**catatan**  
Anda dapat menyimpan data input di Amazon S3Resources di Wilayah mana pun di partisi AWS komersial tempat S3 didukung. Data ini dapat diakses dari Wilayah yang berbeda atau Akun AWS saat menjalankan alur kerja yang cocok.

**Untuk mengunggah tabel data input Anda ke Amazon S3**

1. Masuk ke Konsol Manajemen AWS dan buka konsol Amazon S3 di. [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)

1. Pilih **Bucket**, lalu pilih bucket untuk menyimpan tabel data Anda. 

1. Pilih **Unggah**, lalu ikuti petunjuknya.

1. Pilih tab **Objek** untuk melihat awalan tempat data Anda disimpan. Catat nama folder.

   Anda dapat memilih folder untuk melihat tabel data.

## Langkah 4: Buat AWS Glue tabel
<a name="create-glue-table"></a>

**catatan**  
Jika Anda membutuhkan AWS Glue tabel yang dipartisi, lewati ke. [Langkah 4: Buat tabel yang dipartisi AWS Glue](#create-partitioned-glue-table)

Data input di Amazon S3 harus dikatalogkan AWS Glue dan direpresentasikan sebagai tabel. AWS Glue *Untuk informasi selengkapnya tentang cara membuat AWS Glue tabel dengan Amazon S3 sebagai input, lihat [Bekerja dengan crawler di AWS Glue konsol di Panduan Pengembang](https://docs.aws.amazon.com/glue/latest/dg/console-crawlers.html)AWS Glue .*

Pada langkah ini, Anda menyiapkan crawler yang meng-crawl semua file di bucket S3 dan membuat tabel. AWS Glue AWS Glue 

**catatan**  
Resolusi Entitas AWS saat ini tidak mendukung lokasi Amazon S3 yang terdaftar di. AWS Lake Formation

**Untuk membuat AWS Glue tabel**

1. Masuk ke Konsol Manajemen AWS dan buka AWS Glue konsol di [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/).

1. Dari bilah navigasi, pilih **Crawler**.

1. Pilih bucket S3 Anda dari daftar, lalu pilih **Buat crawler**.

1. **Pada halaman **Setel properti crawler**, masukkan **Deskripsi** opsional **Nama** crawler, lalu pilih Berikutnya.**

1. Lanjutkan melalui **halaman Add crawler**, tentukan detailnya. 

1. **Pada halaman **Pilih peran IAM**, pilih **Pilih peran IAM yang ada**, lalu pilih Berikutnya.**

   Anda juga dapat memilih **Buat peran IAM** atau minta administrator Anda membuat peran IAM jika diperlukan.

1. Untuk **Buat jadwal untuk crawler ini**, pertahankan default **Frekuensi** (**Jalankan sesuai permintaan**) dan kemudian pilih **Berikutnya**.

1. Untuk **Mengkonfigurasi output crawler**, masukkan AWS Glue database dan kemudian pilih **Berikutnya**.

1. Tinjau semua detail, lalu pilih **Selesai**.

1. Pada halaman **Crawler**, pilih kotak centang di samping bucket S3 Anda, lalu pilih **Jalankan** crawler.

1. Setelah crawler selesai berjalan, pada bilah AWS Glue navigasi, pilih **Databases**, dan kemudian pilih nama database Anda.

1. Pada halaman **Database**, pilih **Tabel di \$1nama database Anda\$1**.

   1. Lihat tabel dalam AWS Glue database.

   1. Untuk melihat skema tabel, pilih tabel tertentu.

   1. Buat catatan nama AWS Glue database dan nama AWS Glue tabel.

Anda sekarang siap untuk membuat pemetaan skema. Untuk informasi selengkapnya, lihat [Membuat pemetaan skema](create-schema-mapping.md).

## Langkah 4: Buat tabel yang dipartisi AWS Glue
<a name="create-partitioned-glue-table"></a>

**catatan**  
Fitur AWS Glue partisi hanya didukung dalam alur Resolusi Entitas AWS kerja pemetaan ID. Fitur AWS Glue partisi ini memungkinkan Anda untuk memilih partisi tertentu untuk diproses dengan. Resolusi Entitas AWS  
Jika Anda tidak memerlukan AWS Glue tabel yang dipartisi, Anda dapat melewati langkah ini.

 AWS Glue Tabel yang dipartisi secara otomatis mencerminkan partisi baru dalam AWS Glue tabel saat Anda menambahkan folder baru ke struktur data (seperti folder hari baru di bawah satu bulan). 

Saat Anda membuat AWS Glue tabel yang dipartisi Resolusi Entitas AWS, Anda dapat menentukan partisi mana yang ingin Anda proses dalam alur kerja pemetaan ID. Kemudian, setiap kali Anda menjalankan alur kerja pemetaan ID, hanya data di partisi tersebut yang diproses, daripada memproses semua data di seluruh tabel. AWS Glue Fitur ini memungkinkan pemrosesan data yang lebih tepat, efisien, dan hemat biaya Resolusi Entitas AWS, memberi Anda kontrol dan fleksibilitas yang lebih besar dalam mengelola tugas resolusi entitas Anda. 

Anda dapat membuat AWS Glue tabel yang dipartisi untuk akun sumber dalam alur kerja pemetaan ID. 

Anda harus terlebih dahulu membuat katalog data input di Amazon S3 AWS Glue dan merepresentasikannya sebagai AWS Glue tabel. *Untuk informasi selengkapnya tentang cara membuat AWS Glue tabel dengan Amazon S3 sebagai input, lihat [Bekerja dengan crawler di AWS Glue konsol di Panduan Pengembang](https://docs.aws.amazon.com/glue/latest/dg/console-crawlers.html)AWS Glue .*

Pada langkah ini, Anda menyiapkan crawler yang meng-crawl semua file di bucket S3 lalu membuat tabel yang dipartisi. AWS Glue AWS Glue 

**catatan**  
Resolusi Entitas AWS saat ini tidak mendukung lokasi Amazon S3 yang terdaftar di. AWS Lake Formation

**Untuk membuat tabel yang dipartisi AWS Glue**

1. Masuk ke Konsol Manajemen AWS dan buka AWS Glue konsol di [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/).

1. Dari bilah navigasi, pilih **Crawler**.

1. Pilih bucket S3 Anda dari daftar, lalu pilih **Buat crawler**.

1. **Pada halaman **Setel properti crawler**, masukkan **Nama** crawler, **Deskripsi** opsional, lalu pilih Berikutnya.**

1. Lanjutkan melalui **halaman Add crawler**, tentukan detailnya. 

1. **Pada halaman **Pilih peran IAM**, pilih **Pilih peran IAM yang ada**, lalu pilih Berikutnya.**

   Anda juga dapat memilih **Buat peran IAM** atau minta administrator Anda membuat peran IAM jika diperlukan.

1. Untuk **Buat jadwal untuk crawler ini**, pertahankan default **Frekuensi** (**Jalankan sesuai permintaan**) dan kemudian pilih **Berikutnya**.

1. Untuk **Mengkonfigurasi output crawler**, masukkan AWS Glue database dan kemudian pilih **Berikutnya**.

1. Tinjau semua detail, lalu pilih **Selesai**.

1. Pada halaman **Crawler**, pilih kotak centang di samping bucket S3 Anda, lalu pilih **Jalankan** crawler.

1. Setelah crawler selesai berjalan, pada bilah AWS Glue navigasi, pilih **Databases**, dan kemudian pilih nama database Anda.

1. Pada halaman **Database**, di bawah **Tabel**, pilih tabel yang akan dipartisi.

1. Pada **ikhtisar Tabel**, pilih dropdown **Tindakan**, lalu pilih **Edit** tabel.

   1. Di bawah **Properti tabel**, pilih **Tambah**.

   1. Untuk **Kunci** baru, masukkan**aerPushDownPredicateString**.

   1. Untuk **Nilai** baru, masukkan**'<PartitionKey>=<PartitionValue'**.

   1. Buat catatan nama AWS Glue database dan nama AWS Glue tabel.

Anda sekarang siap untuk: 
+ [Buat pemetaan skema](create-schema-mapping.md) dan kemudian [buat alur kerja pemetaan ID untuk satu](creating-id-mapping-workflow-same-account.md). Akun AWS
+ [Buat sumber namespace ID](create-id-namespace-source.md), [buat target namespace ID](create-id-namespace-target.md), lalu [buat alur kerja pemetaan ID](creating-id-mapping-workflow-two-accounts.md) di dua. Akun AWS

# Mempersiapkan data input pihak ketiga
<a name="prepare-third-party-input-data"></a>

Layanan data pihak ketiga menyediakan pengidentifikasi yang dapat dicocokkan dengan pengidentifikasi Anda yang dikenal. 

Resolusi Entitas AWS saat ini mendukung layanan penyedia data pihak ketiga berikut:


**Layanan penyedia data**  

| Nama perusahaan | Tersedia Wilayah AWS | Pengidentifikasi | 
| --- | --- | --- | 
| LiveRamp | AS Timur (Virginia N.) (us-timur-1), AS Timur (Ohio) (us-timur-2), dan AS Barat (Oregon) (us-barat-2) | ID Ramp | 
| TransUnion | AS Timur (Virginia N.) (us-timur-1), AS Timur (Ohio) (us-timur-2), dan AS Barat (Oregon) (us-barat-2) | TransUnion Individu dan Rumah Tangga IDs | 
| ID Terpadu 2.0 | AS Timur (Virginia N.) (us-timur-1), AS Timur (Ohio) (us-timur-2), dan AS Barat (Oregon) (us-barat-2) | UID mentah 2 | 

Langkah-langkah berikut menjelaskan cara menyiapkan data pihak ketiga untuk menggunakan [alur kerja pencocokan berbasis layanan penyedia atau alur kerja pemetaan](glossary.md#provider-service-matching) ID [berbasis layanan penyedia](create-IDMW-provider-services-one-acct.md). 

**Topics**
+ [Langkah 1: Berlangganan layanan penyedia di AWS Data Exchange](#subscribe-provider-service)
+ [Langkah 2: Siapkan tabel data pihak ketiga](#prepare-third-party-data-tables)
+ [Langkah 3: Simpan tabel data input Anda dalam format data yang didukung](#save-third-party-data-tables)
+ [Langkah 4: Unggah tabel data input Anda ke Amazon S3](#upload-third-party-data-tables)
+ [Langkah 5: Buat AWS Glue tabel](#create-glue-table-third-party-data-tables)

## Langkah 1: Berlangganan layanan penyedia di AWS Data Exchange
<a name="subscribe-provider-service"></a>

Jika Anda memiliki langganan dengan layanan penyedia AWS Data Exchange, Anda dapat menjalankan alur kerja yang cocok dengan salah satu layanan penyedia berikut untuk mencocokkan pengenal yang dikenal dengan penyedia pilihan Anda. Data Anda akan dicocokkan dengan serangkaian input yang ditentukan oleh penyedia pilihan Anda.

Untuk berlangganan layanan penyedia di AWS Data Exchange

1. Lihat daftar penyedia di AWS Data Exchange. Daftar penyedia berikut tersedia:
   + LiveRamp
     + [LiveRampResolusi Identitas](https://aws.amazon.com/marketplace/pp/prodview-v4557zxjo6ykq)
     + [LiveRampTranscoding](https://aws.amazon.com/marketplace/pp/prodview-bpp2fvfcxk2kg)
   + TransUnion
     + TruAudience Resolusi & Pengayaan Identitas
   + ID Terpadu 2.0
     + [Resolusi Identitas ID 2.0 Terpadu](https://aws.amazon.com/marketplace/pp/prodview-66zqls7iqsm6o?sr=0-4&ref_=beagle&applicationId=AWSMPContessa#offers)

1. Selesaikan salah satu langkah berikut, tergantung pada jenis penawaran Anda.
   + **Penawaran pribadi** — Jika Anda memiliki hubungan yang sudah ada dengan penyedia, ikuti prosedur [produk dan penawaran Pribadi](https://docs.aws.amazon.com/data-exchange/latest/userguide/subscribe-to-private-offer.html) dalam *Panduan AWS Data Exchange Pengguna* untuk menerima penawaran pribadi di AWS Data Exchange.
   + **Bawa langganan Anda sendiri** — Jika Anda sudah memiliki langganan data yang ada dengan penyedia, ikuti prosedur [penawaran Bring Your Own Subscription (BYOS)](https://docs.aws.amazon.com/data-exchange/latest/userguide/subscribe-to-byos-offer.html) di *Panduan AWS Data Exchange Pengguna* untuk menerima penawaran BYOS di. AWS Data Exchange

1. Setelah berlangganan layanan penyedia AWS Data Exchange, Anda dapat membuat alur kerja yang cocok atau alur kerja pemetaan ID dengan layanan penyedia tersebut. 

Untuk informasi selengkapnya tentang cara mengakses produk penyedia yang berisi APIs, lihat [Mengakses produk API](https://docs.aws.amazon.com/data-exchange/latest/userguide/subscribing-to-product.html#use-API-product) di *Panduan AWS Data Exchange Pengguna*.

## Langkah 2: Siapkan tabel data pihak ketiga
<a name="prepare-third-party-data-tables"></a>

Setiap layanan pihak ketiga memiliki serangkaian rekomendasi dan pedoman yang berbeda untuk membantu memastikan alur kerja pencocokan yang berhasil. 

Untuk menyiapkan tabel data pihak ketiga, lihat tabel berikut:


**Pedoman layanan penyedia data**  

| Layanan penyedia | Diperlukan ID unik? | Tindakan | 
| --- | --- | --- | 
| LiveRamp | Ya |  Pastikan yang berikut ini: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/entityresolution/latest/userguide/prepare-third-party-input-data.html)  | 
| TransUnion | Ya |  Pastikan yang berikut ini adalah kolom `string` tipe dalam tampilan input:  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/entityresolution/latest/userguide/prepare-third-party-input-data.html)  | 
| ID Terpadu 2.0 | Ya |  Pastikan yang berikut ini: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/entityresolution/latest/userguide/prepare-third-party-input-data.html)  Email atau nomor telepon tertentu, pada waktu tertentu, menghasilkan UID2 nilai mentah yang sama, tidak peduli siapa yang mengajukan permintaan. Mentah UID2s dibuat dengan menambahkan garam dari ember garam yang diputar kira-kira setahun sekali, UID2 menyebabkan bahan mentah juga diputar dengannya. Ember garam yang berbeda berputar pada waktu yang berbeda sepanjang tahun. Resolusi Entitas AWS saat ini tidak melacak ember garam yang berputar dan mentah UID2s, jadi disarankan agar Anda meregenerasi mentah setiap hari. UID2s Untuk informasi selengkapnya, lihat [Seberapa sering UID2s harus di-refresh untuk pembaruan tambahan?](https://unifiedid.com/docs/getting-started/gs-faqs#how-often-should-uid2s-be-refreshed-for-incremental-updates) dalam dokumentasi UID 2.0.   | 

## Langkah 3: Simpan tabel data input Anda dalam format data yang didukung
<a name="save-third-party-data-tables"></a>

Jika Anda telah menyimpan data input pihak ketiga dalam format data yang didukung, Anda dapat melewati langkah ini. 

Untuk menggunakannya Resolusi Entitas AWS, data input harus dalam format yang Resolusi Entitas AWS mendukung. 

Resolusi Entitas AWS mendukung format data berikut:
+ nilai dipisahkan koma (CSV)
**catatan**  
LiveRamp hanya mendukung file CSV.
+ Parquet

## Langkah 4: Unggah tabel data input Anda ke Amazon S3
<a name="upload-third-party-data-tables"></a>

Jika Anda sudah memiliki tabel data pihak ketiga di Amazon S3, Anda dapat melewati langkah ini.

**catatan**  
Anda dapat menyimpan data input di sumber daya Amazon S3 di Wilayah mana pun di partisi AWS komersial tempat S3 didukung. Data ini dapat diakses dari Wilayah yang berbeda atau Akun AWS saat menjalankan alur kerja yang cocok.

**Untuk mengunggah tabel data input Anda ke Amazon S3**

1. Masuk ke Konsol Manajemen AWS dan buka konsol Amazon S3 di. [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)

1. Pilih **Bucket**, lalu pilih bucket untuk menyimpan tabel data Anda. 

1. Pilih **Unggah**, lalu ikuti petunjuknya.

1. Pilih tab **Objek** untuk melihat awalan tempat data Anda disimpan. Catat nama folder.

   Anda dapat memilih folder untuk melihat tabel data.

## Langkah 5: Buat AWS Glue tabel
<a name="create-glue-table-third-party-data-tables"></a>

Data input di Amazon S3 harus dikatalogkan AWS Glue dan direpresentasikan sebagai tabel. AWS Glue *Untuk informasi selengkapnya tentang cara membuat AWS Glue tabel dengan Amazon S3 sebagai input, lihat [Bekerja dengan crawler di AWS Glue konsol di Panduan Pengembang](https://docs.aws.amazon.com/glue/latest/dg/console-crawlers.html)AWS Glue .*

**catatan**  
Resolusi Entitas AWS tidak mendukung tabel yang dipartisi.

Pada langkah ini, Anda menyiapkan crawler yang meng-crawl semua file di bucket S3 dan membuat tabel. AWS Glue AWS Glue 

**catatan**  
Resolusi Entitas AWS saat ini tidak mendukung lokasi Amazon S3 yang terdaftar di. AWS Lake Formation

**Untuk membuat AWS Glue tabel**

1. Masuk ke Konsol Manajemen AWS dan buka AWS Glue konsol di [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/).

1. Dari bilah navigasi, pilih **Crawler**.

1. Pilih bucket S3 Anda dari daftar, lalu pilih **Tambahkan crawler**.

1. **Pada halaman **Add crawler**, masukkan **nama Crawler** lalu pilih Next.**

1. Lanjutkan melalui **halaman Add crawler**, tentukan detailnya. 

1. **Pada halaman **Pilih peran IAM**, pilih **Pilih peran IAM yang ada**, lalu pilih Berikutnya.**

   Anda juga dapat memilih **Buat peran IAM** atau minta administrator Anda membuat peran IAM jika diperlukan.

1. Untuk **Buat jadwal untuk crawler ini**, pertahankan default **Frekuensi** (**Jalankan sesuai permintaan**) dan kemudian pilih **Berikutnya**.

1. Untuk **Mengkonfigurasi output crawler**, masukkan AWS Glue database dan kemudian pilih **Berikutnya**.

1. Tinjau semua detail, lalu pilih **Selesai**.

1. Pada halaman **Crawler**, pilih kotak centang di samping bucket S3 Anda, lalu pilih **Jalankan** crawler.

1. Setelah crawler selesai berjalan, pada bilah AWS Glue navigasi, pilih **Databases**, dan kemudian pilih nama database Anda.

1. Pada halaman **Database**, pilih **Tabel di \$1nama database Anda\$1**.

   1. Lihat tabel dalam AWS Glue database.

   1. Untuk melihat skema tabel, pilih tabel tertentu.

   1. Buat catatan nama AWS Glue database dan nama AWS Glue tabel.

Anda sekarang siap untuk membuat pemetaan skema. Lihat informasi yang lebih lengkap di [Membuat pemetaan skema](create-schema-mapping.md).