기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
계정 탈취 인사이트
ATI (Account Takeover Insights) 모델 유형은 계정이 악의적인 도용, 피싱 또는 자격 증명 도용을 통해 손상되었는지 탐지하여 온라인 사기 활동을 식별합니다. Account Takeover Insights는 온라인 비즈니스의 로그인 이벤트를 사용하여 모델을 학습시키는 기계 학습 모델입니다.
실시간 로그인 흐름에 훈련된 Account Takeover Insights 모델을 내장하여 계정 침해 여부를 감지할 수 있습니다. 이 모델은 다양한 인증 및 로그인 유형을 평가합니다. 여기에는 웹 애플리케이션 로그인, API 기반 인증 및 (SSO) 가 포함됩니다. single-sign-on 계정 테이크오버 인사이트 모델을 사용하려면 유효한 로그인 자격 증명을 제시한 후 GetEventPredictionAPI를 호출하십시오. API는 계정 도용 위험을 수치화하는 점수를 생성합니다. Amazon Fraud Detector는 사용자가 정의한 점수와 규칙을 사용하여 로그인 이벤트에 대해 하나 이상의 결과를 반환합니다. 결과는 사용자가 구성한 결과입니다. 수신한 결과에 따라 각 로그인에 대해 적절한 조치를 취할 수 있습니다. 즉, 로그인을 위해 제공된 자격 증명을 승인하거나 이의를 제기할 수 있습니다. 예를 들어 추가 인증 수단으로 계정 PIN을 요청하여 자격 증명에 이의를 제기할 수 있습니다.
또한 계정 탈취 인사이트 모델을 사용하여 비동기적으로 계정 로그인을 평가하고 고위험 계정에 조치를 취할 수 있습니다. 예를 들어 검토자가 계정 일시 중지와 같은 추가 조치가 필요한지 판단할 수 있도록 고위험 계정을 조사 대기열에 추가할 수 있습니다.
계정 탈취 인사이트 모델은 비즈니스의 과거 로그인 이벤트가 포함된 데이터세트를 사용하여 학습됩니다. 이 데이터를 제공합니다. 필요에 따라 계정을 합법적이거나 사기성 계정으로 표시할 수 있습니다. 하지만 모델을 학습시키는 데 반드시 필요한 것은 아닙니다. 계정 탈취 인사이트 모델은 계정의 성공적인 로그인 기록을 기반으로 이상 현상을 탐지합니다. 또한 악의적인 계정 도용 이벤트의 위험 증가를 시사하는 사용자 행동의 이상을 탐지하는 방법도 학습합니다. 일반적으로 동일한 장치 및 IP 주소를 사용하여 로그인하는 사용자를 예로 들 수 있습니다. 사기범은 일반적으로 다른 장치 및 지리적 위치에서 로그인합니다. 이 기법은 비정상적인 활동에 대한 위험 점수를 산출하는데, 이는 일반적으로 악의적인 계정 도용의 주요 특징입니다.
계정 탈취 인사이트 모델을 교육하기 전에 Amazon Fraud Detector는 여러 기계 학습 기술을 조합하여 데이터 강화, 데이터 집계 및 데이터 변환을 수행합니다. 그런 다음, Amazon Fraud Detector는 교육 프로세스 중에 사용자가 제공하는 원시 데이터 요소를 보강합니다. 원시 데이터 요소의 예로는 IP 주소 및 사용자 에이전트가 있습니다. Amazon Fraud Detector는 이러한 요소를 사용하여 로그인 데이터를 설명하는 추가 입력을 생성합니다. 이러한 입력에는 디바이스, 브라우저 및 지리적 위치 입력이 포함됩니다. 또한 Amazon Fraud Detector는 사용자가 제공한 로그인 데이터를 사용하여 과거 사용자 행동을 설명하는 집계된 변수를 지속적으로 계산합니다. 사용자 행동의 예로는 사용자가 특정 IP 주소에서 로그인한 횟수 등이 있습니다. Amazon Fraud Detector는 이러한 추가 보강 및 집계를 사용하여 로그인 이벤트의 작은 입력 집합에서 강력한 모델 성능을 생성할 수 있습니다.
Account Takeover Insights 모델은 악의적인 공격자가 사람인지 로봇인지에 관계없이 악의적인 공격자가 합법적인 계정에 액세스하는 사례를 탐지합니다. 이 모델은 계정 침해의 상대적 위험을 나타내는 단일 점수를 산출합니다. 침해되었을 수 있는 계정은 고위험 계정으로 플래그가 지정됩니다. 두 가지 방법 중 하나로 고위험 계정을 처리할 수 있습니다. 어느 쪽이든 추가 신원 확인을 시행할 수 있습니다. 또는 계정을 대기열로 보내 수동 조사를 진행할 수도 있습니다.
데이터 소스 선택
계정 탈취 인사이트 모델은 Amazon Fraud Detector에 내부적으로 저장된 데이터 세트를 기반으로 학습됩니다. Amazon Fraud Detector에 로그인 이벤트 데이터를 저장하려면 사용자의 로그인 이벤트가 포함된 CSV 파일을 생성하십시오. 각 이벤트에 이벤트 타임스탬프, 사용자 ID, IP 주소, 사용자 에이전트, 로그인 데이터의 유효 여부와 같은 로그인 데이터를 포함하십시오. CSV 파일을 생성한 후 먼저 Amazon Fraud Detector에 파일을 업로드한 다음 가져오기 기능을 사용하여 데이터를 저장합니다. 그런 다음 저장된 데이터를 사용하여 모델을 학습시킬 수 있습니다. Amazon Fraud Detector를 사용하여 이벤트 데이터 세트를 저장하는 방법에 대한 자세한 내용은 다음을 참조하십시오. Amazon Fraud Detector를 사용하여 이벤트 데이터를 내부적으로 저장하십시오.
데이터 준비
Amazon Fraud Detector에서는 UTF-8 형식으로 인코딩된 CSV (쉼표로 구분된 값) 파일로 사용자 계정 로그인 데이터를 제공해야 합니다. CSV 파일의 첫 줄에는 파일 헤더가 포함되어야 합니다. 파일 헤더는 이벤트 메타데이터와 각 데이터 요소를 설명하는 이벤트 변수로 구성됩니다. 이벤트 데이터는 헤더 뒤에 옵니다. 이벤트 데이터의 각 줄은 단일 로그인 이벤트의 데이터로 구성됩니다.
Account Takeover Insights 모델의 경우 CSV 파일의 헤더 라인에 다음과 같은 이벤트 메타데이터와 이벤트 변수를 제공해야 합니다.
이벤트 메타데이터
CSV 파일 헤더에 다음 메타데이터를 제공하는 것이 좋습니다. 이벤트 메타데이터는 대문자여야 합니다.
EVENT_ID - 로그인 이벤트의 고유 식별자입니다.
ENTITY_TYPE - 로그인 이벤트를 수행하는 주체 (예: 판매자 또는 고객).
ENTITY_ID - 로그인 이벤트를 수행하는 엔티티의 식별자입니다.
EVENT_TIMESTAMP - 로그인 이벤트가 발생한 시점의 타임스탬프입니다. 타임스탬프는 ISO 8601 표준 (UTC) 을 준수해야 합니다.
EVENT_LABEL (권장) - 이벤트를 사기 또는 합법적인 이벤트로 분류하는 라벨입니다. “사기”, “합법적”, “1" 또는 “0"과 같은 모든 레이블을 사용할 수 있습니다.
참고
이벤트 메타데이터는 대문자여야 합니다. 대소문자를 구분합니다.
로그인 이벤트에는 레이블이 필요하지 않습니다. 하지만 EVENT_LABEL 메타데이터를 포함하고 로그인 이벤트의 레이블을 제공하는 것이 좋습니다. 레이블이 불완전하거나 산발적이어도 괜찮습니다. 라벨을 제공하면 Amazon Fraud Detector가 라벨을 사용하여 계정 도용 발견률을 자동으로 계산하고 모델 성과 차트와 표에 표시합니다.
이벤트 변수
계정 인수 인사이트 모델의 경우 반드시 제공해야 하는 필수 (필수) 변수와 선택적 변수가 모두 있습니다. 변수를 만들 때는 변수를 올바른 변수 유형에 할당해야 합니다. 모델 교육 프로세스의 일환으로 Amazon Fraud Detector는 변수와 연결된 변수 유형을 사용하여 변수 강화 및 기능 엔지니어링을 수행합니다.
참고
이벤트 변수 이름은 소문자여야 합니다. 대소문자를 구분합니다.
필수 변수
계정 인수 인사이트 모델을 학습하려면 다음 변수가 필요합니다.
범주 | 변수 유형 | 설명 |
---|---|---|
IP 주소 |
IP_ADDRESS |
로그인 이벤트에 사용된 IP 주소 |
브라우저 및 장치 |
유저 에이전트 |
로그인 이벤트에 사용된 브라우저, 디바이스, OS |
유효한 자격 증명 |
유효성이 검증됨 |
로그인에 사용된 자격 증명이 유효한지 여부를 나타냅니다. |
선택적 변수
다음 변수는 계정 인수 인사이트 모델 교육을 위한 선택 사항입니다.
범주 | 유형 | 설명 |
---|---|---|
브라우저 및 기기 |
지문 |
브라우저 또는 기기 핑거프린트의 고유 식별자 |
세션 ID |
SESSION_ID |
인증 세션의 식별자입니다. |
레이블 |
이벤트_라벨 |
이벤트를 사기 또는 합법적인 이벤트로 분류하는 라벨입니다. “사기”, “합법적”, “1" 또는 “0"과 같은 모든 레이블을 사용할 수 있습니다. |
Timestamp |
라벨_타임스탬프 |
라벨이 마지막으로 업데이트된 시점의 타임스탬프입니다. EVENT_LABEL이 제공되는 경우 이는 필수입니다. |
참고
두 필수 변수 (선택 변수) 에 원하는 변수 이름을 제공할 수 있습니다. 각 필수 및 선택적 변수를 올바른 변수 유형에 할당하는 것이 중요합니다.
추가 변수를 제공할 수 있습니다. 하지만 Amazon Fraud Detector에는 계정 탈취 인사이트 모델 교육을 위한 이러한 변수가 포함되지 않습니다.
데이터 선택
데이터 수집은 계정 탈취 인사이트 모델을 만드는 중요한 단계입니다. 로그인 데이터를 수집하기 시작할 때 다음 요구 사항 및 권장 사항을 고려하십시오.
필수
-
1,500개 이상의 사용자 계정 예시를 제공하고 각 예시마다 최소 2개의 관련 로그인 이벤트를 포함하십시오.
-
데이터세트는 최소 30일간의 로그인 이벤트를 포함해야 합니다. 나중에 모델 학습에 사용할 이벤트의 특정 시간 범위를 지정할 수 있습니다.
권장
데이터셋에는 실패한 로그인 이벤트의 예가 포함되어 있습니다. 이러한 실패한 로그인에 '사기' 또는 '합법적'이라는 라벨을 붙일 수도 있습니다.
6개월 이상의 로그인 이벤트와 함께 10만 개의 엔티티를 포함하여 과거 데이터를 준비하세요.
최소 요구 사항을 이미 충족하는 데이터 세트가 없는 경우 SendEventAPI 작업을 호출하여 Amazon Fraud Detector로 이벤트 데이터를 스트리밍하는 것을 고려해 보십시오.
데이터 검증
계정 탈취 인사이트 모델을 생성하기 전에 Amazon Fraud Detector는 모델 교육을 위해 데이터 세트에 포함시킨 메타데이터와 변수가 크기 및 형식 요구 사항을 충족하는지 확인합니다. 자세히 알아보려면 데이터 세트 검증의 내용을 참조하세요. 또한 다른 요구 사항도 확인합니다. 데이터셋이 검증을 통과하지 못하면 모델이 생성되지 않습니다. 모델을 성공적으로 만들려면 다시 훈련하기 전에 검증을 통과하지 못한 데이터를 수정해야 합니다.
일반적인 데이터세트 오류
계정 탈취 인사이트 모델 교육을 위해 데이터 세트를 검증할 때 Amazon Fraud Detector는 이러한 문제와 기타 문제를 스캔한 후 하나 이상의 문제가 발생하면 오류를 발생시킵니다.
CSV 파일은 UTF-8 형식이 아닙니다.
CSV 파일 헤더에는
EVENT_ID
,ENTITY_ID
, 또는 메타데이터 중 하나 이상이 포함되어 있지 않습니다.EVENT_TIMESTAMP
CSV 파일 헤더에는
IP_ADDRESS
USERAGENT
, 또는 변수 유형 중 하나 이상의 변수가 포함되어 있지 않습니다.VALIDCRED
동일한 변수 유형에 연결된 변수가 두 개 이상 있습니다.
의 값 중 0.1% 이상이 지원되는 날짜 및 타임스탬프 형식이 아닌 null이나 값을
EVENT_TIMESTAMP
포함합니다.첫 번째 이벤트와 마지막 이벤트 사이의 일 수는 30일 미만입니다.
변수 유형의
IP_ADDRESS
변수 중 10% 이상이 유효하지 않거나 null입니다.변수 유형의
USERAGENT
변수 중 50% 이상이 null을 포함합니다.VALIDCRED
변수 유형의 모든 변수는 로 설정됩니다.false