AWS Clean Rooms ML - AWS Clean Rooms

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

AWS Clean Rooms ML

AWS Clean Rooms ML은 데이터를 서로 공유할 필요 없이 두 당사자가 데이터에서 유사한 사용자를 식별할 수 있는 개인 정보 보호 방법을 제공합니다. 첫 번째 당사자가 교육 데이터를 다음 주소로 가져옵니다. AWS Clean Rooms 비슷한 모델을 만들고 구성한 다음 이를 협업과 연계할 수 있도록 말이죠. 그런 다음 시드 데이터를 컬래버레이션에 가져와 훈련 데이터와 유사한 유사한 세그먼트를 만듭니다.

작동하는 방식에 대한 자세한 설명은 교차 계정 작업 섹션을 참조하세요.

  • 훈련 데이터 공급자 – 훈련 데이터를 제공하고 유사 모델을 생성 및 구성한 다음 해당 유사 모델을 공동 작업에 연결하는 역할을 합니다.

  • 시드 데이터 공급자 - 시드 데이터를 제공하고 유사 세그먼트를 생성하여 유사 세그먼트를 내보내는 역할을 합니다.

  • 훈련 데이터 - 유사 모델을 생성하는 데 사용되는 훈련 데이터 공급자의 데이터입니다. 훈련 데이터는 사용자 동작의 유사성을 측정하는 데 사용됩니다.

    훈련 데이터에는 사용자 ID, 항목 ID 및 타임스탬프 열이 포함되어야 합니다. 필요에 따라 훈련 데이터에 다른 상호작용을 수치적 특징 또는 범주형 특징으로 포함할 수 있습니다. 상호작용의 예로는 시청한 동영상, 구매한 항목, 읽은 기사 목록 등이 있습니다.

  • 시드 데이터 - 유사 세그먼트를 만드는 데 사용되는 시드 데이터 공급자의 데이터입니다. 시드 데이터는 직접 제공할 수도 있고, 결과를 바탕으로 제공할 수도 있습니다. AWS Clean Rooms 쿼리. 유사 세그먼트는 시드 사용자와 가장 유사한 훈련 데이터의 사용자 집합입니다.

  • 유사 모델 - 다른 데이터 세트에서 유사한 사용자를 찾는 데 사용되는 훈련 데이터의 기계 학습 모델입니다.

    를 API 사용할 때 오디언스 모델이라는 용어는 유사 모델과 동일하게 사용됩니다. 예를 들어 를 사용하여 유사 모델을 만들 CreateAudienceModelAPI수 있습니다.

  • 유사 세그먼트 — 시드 데이터와 가장 유사한 훈련 데이터의 하위 집합입니다.

    를 사용할 API 때는 를 사용하여 유사 세그먼트를 만듭니다. StartAudienceGenerationJobAPI

훈련 데이터 공급자의 데이터는 시드 데이터 공급자와 공유되지 않으며 시드 데이터 공급자의 데이터도 훈련 데이터 공급자와 공유되지 않습니다. 유사 세그먼트 출력은 훈련 데이터 공급자와 공유되지만 시드 데이터 공급자와는 공유되지 않습니다.

유사 모델에 대한 자세한 내용은 다음 주제를 참조하세요.

수정할 수 있다면 방법이 무엇입니까? AWS Clean Rooms ML이 작동합니다.

방법 개요 AWS Clean Rooms ML의 작동 방식.

Clean Rooms ML에서는 교육 데이터 공급자와 시드 데이터 공급자 등 두 당사자가 순차적으로 작업해야 합니다. AWS Clean Rooms 데이터를 협업으로 가져오는 것. 훈련 데이터 공급자가 먼저 완료해야 하는 워크플로는 다음과 같습니다.

  1. 교육 데이터 제공자의 데이터는 다음 위치에 저장되어야 합니다. AWS Glue 사용자 항목 상호 작용의 데이터 카탈로그 테이블. 교육 데이터에는 최소한 사용자 ID 열, 상호 작용 ID 열, 타임스탬프 열이 포함되어야 합니다.

  2. 훈련 데이터 제공자는 훈련 데이터를 다음과 같이 등록합니다. AWS Clean Rooms.

  3. 훈련 데이터 공급자는 여러 시드 데이터 공급자와 공유할 수 있는 유사 모델을 생성합니다. 유사 모델은 신경망이며, 훈련하는 데 최대 24시간이 걸릴 수 있습니다. 모델은 자동으로 재학습되지 않으므로 매주 모델을 재학습하는 것이 좋습니다.

  4. 훈련 데이터 공급자는 관련성 지표 공유 여부 및 출력 세그먼트의 Amazon S3 위치를 포함하여 유사 모델을 구성합니다. 훈련 데이터 공급자는 단일 유사 모델에서 구성된 유사 모델을 여러 개 생성할 수 있습니다.

  5. 교육 데이터 제공자는 구성된 대상 모델을 시드 데이터 공급자와 공유하는 컬래버레이션에 연결합니다.

시드 데이터 공급자가 다음으로 완료해야 하는 워크플로는 다음과 같습니다.

  1. 시드 데이터 공급자의 데이터는 Amazon S3 버킷에 저장될 수 있으며 쿼리 결과에서 가져올 수 있습니다.

  2. 시드 데이터 공급자는 훈련 데이터 공급자와 공유하는 공동 작업을 엽니다.

  3. 시드 데이터 공급자는 협업 페이지의 Clean Rooms ML 탭에서 유사한 세그먼트를 생성합니다.

  4. 시드 데이터 제공자는 관련성 지표가 공유된 경우 이를 평가하고 유사 세그먼트를 내보내 외부에서 사용할 수 있도록 할 수 있습니다. AWS Clean Rooms.