1단계:에서 공급자 서비스 구독 AWS Data Exchange 2단계: 타사 데이터 테이블 준비 3단계: 입력 데이터 테이블을 지원되는 데이터 형식으로 저장 4단계: Amazon S3에 입력 데이터 테이블 업로드 5단계: AWS Glue 테이블 생성

타사 입력 데이터 준비

타사 데이터 서비스는 알려진 식별자와 일치시킬 수 있는 식별자를 제공합니다.

AWS Entity Resolution 는 현재 다음과 같은 타사 데이터 공급자 서비스를 지원합니다.

데이터 공급자 서비스
회사 이름	사용 가능 AWS 리전	식별자
LiveRamp	미국 동부(버지니아 북부)(us-east-1), 미국 동부(오하이오)(us-east-2) 및 미국 서부(오레곤)(us-west-2)	램프 ID
TransUnion	미국 동부(버지니아 북부)(us-east-1), 미국 동부(오하이오)(us-east-2) 및 미국 서부(오레곤)(us-west-2)	TransUnion 개별 및 가구 IDs
통합 ID 2.0	미국 동부(버지니아 북부)(us-east-1), 미국 동부(오하이오)(us-east-2) 및 미국 서부(오레곤)(us-west-2)	원시 UID 2

다음 단계에서는 공급자 서비스 기반 매칭 워크플로 또는 공급자 서비스 기반 ID 매핑 워크플로를 사용하도록 타사 데이터를 준비하는 방법을 설명합니다.

를 통해 공급자 서비스를 구독한 경우 다음 공급자 서비스 중 하나와 일치하는 워크플로를 실행하여 알려진 식별자를 선호하는 공급자와 일치시킬 AWS Data Exchange수 있습니다. 데이터는 선호하는 공급자가 정의한 입력 세트와 일치합니다.

에서 공급자 서비스를 구독하려면 AWS Data Exchange

공급자 목록을 봅니다 AWS Data Exchange. 다음 공급자 목록을 사용할 수 있습니다.
- LiveRamp
  - LiveRamp 자격 증명 확인
  - LiveRamp 트랜스코딩
- TransUnion
  - TruAudience 자격 증명 확인 및 보강
- 통합 ID 2.0
  - 통합 ID 2.0 자격 증명 확인
제안 유형에 따라 다음 단계 중 하나를 완료합니다.
- 비공개 제안 - 공급자와 기존 관계를 맺고 있는 경우 사용 AWS Data Exchange 설명서의 비공개 제품 및 제안 절차에 따라 비공개 제안을 수락합니다 AWS Data Exchange.
- 자체 구독 사용 - 공급자와 기존 데이터 구독을 이미 보유한 경우 사용 AWS Data Exchange 설명서의 BYOS(Bring Your Own Subscription) 제안 절차에 따라 BYOS 제안을 수락합니다 AWS Data Exchange.
에서 공급자 서비스를 구독한 후 해당 공급자 서비스와 일치하는 워크플로 또는 ID 매핑 워크플로를 생성할 AWS Data Exchange수 있습니다.

APIs가 포함된 공급자 제품에 액세스하는 방법에 대한 자세한 내용은 AWS Data Exchange 사용 설명서의 API 제품 액세스를 참조하세요.

2단계: 타사 데이터 테이블 준비

각 타사 서비스에는 성공적인 매칭 워크플로를 보장하는 데 도움이 되는 다양한 권장 사항 및 지침이 있습니다.

타사 데이터 테이블을 준비하려면 다음 표를 참조하세요.

데이터 공급자 서비스 지침
공급자 서비스	고유 ID가 필요합니까?	작업
LiveRamp	예	다음을 확인하세요. 고유 ID는 고유한 가명 식별자 또는 행 ID일 수 있습니다. 데이터 입력 파일 형식 및 정규화는 LiveRamp 지침에 따라 조정됩니다. 일치하는 워크플로의 입력 파일 형식 지정 지침에 대한 자세한 내용은 LiveRamp 설명서의 ADX를 통해 자격 증명 확인 수행을 참조하세요. ID 매핑 워크플로의 입력 파일 형식 지정 지침에 대한 자세한 내용은 LiveRamp 설명서의 ADX를 통한 트랜스코딩 수행을 참조하세요.
TransUnion	예	입력 보기에서 다음 열이 `string` 유형 열인지 확인합니다. 고유 ID는 필수이며 CRM ID, 연락처 ID, 사용자 ID 또는 고유 ID일 수 있습니다. `Name` `First Name`는 소문자 또는 대문자일 수 있으며 별명이 지원되지만 제목과 접미사는 제외해야 합니다. `Last Name`는 소문자 또는 대문자, 중간 이니셜은 제외할 수 있습니다. `Address` `Street address1` 및 `Street address1`는 있는 경우 한 `Full address` 줄로 결합됩니다. `City`는와 분리되어 있습니다`Full address`. `Zip` (또는 `zip plus4`)에는 공백, 하이픈 또는 공백과 같은 특수 문자가 없습니다. 데이터가 없는 경우 null을 사용합니다. `State`는 대문자로 2자 코드로 지정됩니다. `Phone` `Phone number`는 공백이나 하이픈과 같은 특수 문자 없이 10자리여야 합니다. `Email addresses`는 일반 텍스트 또는 SHA256-hashed 소문자 문자열입니다. `Date of Birth`는 y`yyy-mm-dd` 형식입니다. `Digital identifiers` (디바이스 IDs)에는 IDs 하이픈(36자 길이의 원시 디바이스 IDs/MAIDs/IFAs)이 있고 하이픈(32 및 40자 길이의 긴 해시 디바이스 IDs/MAIDs/IFAs. `IPV4`는 점선 소수 표기법으로 표현되는 32비트 IP 주소입니다. 예: `192.0.2.1` `IPV6`는 콜론으로 구분된 16진수 표기법으로 표현되는 128비트 IP 주소입니다. 예: `2001:db8:0000:0000:0000:0000:0000:0001` `MAID` (모바일 광고 ID)는 광고 목적으로 모바일 디바이스에 할당된 고유한 영숫자 문자열입니다. MAID는 일반적으로 36자입니다. 예: `a1b2c3d4-5678-90ab-cdef-EXAMPLE11111`
통합 ID 2.0	예	다음을 확인하세요. 고유 ID는 해시일 수 없습니다. `Phone number` 또는`Email addresses`는 스키마에서 모두 사용되는 것은 아닙니다. UID2는 UID2 생성을 위해 이메일과 전화번호를 모두 지원합니다. 그러나 스키마 매핑에 두 값이 모두 있는 경우 워크플로는 출력의 각 레코드를 복제합니다. 한 레코드는 UID2 생성을 위해 이메일을 사용하고 두 번째 레코드는 전화번호를 사용합니다. 데이터에 이메일과 전화번호가 혼합되어 있고 출력에 이러한 레코드 복제를 원하지 않는 경우 가장 좋은 방법은 스키마 매핑을 사용하여 각각에 대해 별도의 워크플로를 생성하는 것입니다. 이 시나리오에서는 두 번 단계를 진행합니다. 이메일용 워크플로 하나와 전화번호용 워크플로 하나를 각각 생성합니다. 참고 특정 이메일 또는 전화번호는 언제든지 누가 요청했는지에 관계없이 동일한 원시 UID2 값을 생성합니다. 원시 UID2s 약 1년에 한 번 교체되는 솔트 버킷에서 솔트를 추가하여 생성되므로 원시 UID2도 함께 교체됩니다. 솔트 버킷마다 연중 서로 다른 시간에 교체됩니다. AWS Entity Resolution 현재는 솔트 버킷과 원시 UID2s 교체를 추적하지 않으므로 원시 UID2s를 매일 재생성하는 것이 좋습니다. 자세한 내용은 증분 업데이트를 위해 UID2s 얼마나 자주 새로 고쳐야 합니까?를 참조하세요. UID 2.0 설명서의 .

3단계: 입력 데이터 테이블을 지원되는 데이터 형식으로 저장

타사 입력 데이터를 지원되는 데이터 형식으로 이미 저장한 경우이 단계를 건너뛸 수 있습니다.

AWS Entity Resolution를 사용하려면 입력 데이터가에서 AWS Entity Resolution 지원하는 형식이어야 합니다.

AWS Entity Resolution 는 다음 데이터 형식을 지원합니다.

쉼표로 구분된 값(CSV)

참고
LiveRamp는 CSV 파일만 지원합니다.
PARQUET

4단계: Amazon S3에 입력 데이터 테이블 업로드

Amazon S3에 타사 데이터 테이블이 이미 있는 경우이 단계를 건너뛸 수 있습니다.

참고

S3가 지원되는 상용 파티션의 모든 리전에 있는 Amazon S3 리소스에 입력 데이터를 저장할 수 있습니다. AWS 이 데이터는 다른 리전에서 또는 일치하는 워크플로를 실행할 AWS 계정 때 액세스할 수 있습니다.

입력 데이터 테이블을 Amazon S3에 업로드하려면

에 로그인 AWS Management Console 하고 https://console.aws.amazon.com/s3/ Amazon S3 콘솔을 엽니다.
버킷을 선택한 다음 데이터 테이블을 저장할 버킷을 선택합니다.
업로드를 선택한 다음 안내를 따릅니다.
개체 탭을 선택하여 데이터가 저장되는 접두사를 확인합니다. 폴더의 이름을 메모해 둡니다.

폴더를 선택하여 데이터 테이블을 볼 수 있습니다.

5단계: AWS Glue 테이블 생성

Amazon S3의 입력 데이터는에서 카탈로그화 AWS Glue 되고 AWS Glue 테이블로 표시되어야 합니다. Amazon S3를 입력으로 사용하여 AWS Glue 테이블을 생성하는 방법에 대한 자세한 내용은 개발자 안내서의 AWS Glue 콘솔에서 크롤러 작업을 참조하세요. AWS Glue

참고

AWS Entity Resolution 는 분할된 테이블을 지원하지 않습니다.

이 단계에서는 S3 버킷의 모든 파일을 크롤링하고 AWS Glue 테이블을 생성하는에 AWS Glue 크롤러를 설정합니다.

참고

AWS Entity Resolution 는 현재에 등록된 Amazon S3 위치를 지원하지 않습니다 AWS Lake Formation.

AWS Glue 테이블을 생성하려면

에 로그인 AWS Management Console 하고 https://console.aws.amazon.com/glue/ AWS Glue 콘솔을 엽니다.
탐색 모음에서 크롤러를 선택합니다.
목록에서 S3 버킷을 선택한 다음 크롤러 추가를 선택합니다.
크롤러 추가 페이지에서 크롤러 이름을 입력한 후 다음을 선택합니다.
크롤러 추가 페이지를 계속 진행하여 세부 정보를 지정합니다.
IAM 역할 선택 페이지에서 기존 IAM 역할 선택을 선택한 후 다음을 선택합니다.

필요한 경우 IAM 역할 생성을 선택하거나 관리자가 IAM 역할을 생성하도록 할 수도 있습니다.
이 크롤러에 대한 일정 생성의 경우 빈도 기본값(요청 시 실행)을 유지하고 다음을 선택합니다.
크롤러의 출력 구성에 AWS Glue 데이터베이스를 입력한 후 다음을 선택합니다.
크롤러 세부 정보를 검토한 다음 마침을 선택합니다.
크롤러 페이지에서 S3 버킷 옆의 확인란을 선택하고 크롤러 실행을 선택합니다.
크롤러 실행이 완료되면 AWS Glue 탐색 모음에서 데이터베이스를 선택한 다음 데이터베이스 이름을 선택합니다.
데이터베이스 페이지에서 {사용자 데이터베이스 이름} 에서 테이블을 선택합니다.
1. AWS Glue 데이터베이스의 테이블을 봅니다.
2. 테이블의 스키마를 보려면 특정 테이블을 선택합니다.
3. AWS Glue 데이터베이스 이름과 AWS Glue 테이블 이름을 기록해 둡니다.

이제 스키마 매핑을 생성할 준비가 되었습니다. 자세한 내용은 스키마 매핑 생성 단원을 참조하십시오.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

자사 입력 데이터 준비

스키마 매핑