Variables - Amazon Fraud Detector

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Variables

변수는 사기 예측에 사용하려는 데이터 요소를 나타냅니다. 이러한 변수는 모델 학습을 위해 준비한 이벤트 데이터 세트, Amazon Fraud Detector 모델의 위험 점수 출력 또는 Amazon 모델에서 가져올 수 있습니다. SageMaker 이벤트 데이터셋에서 가져온 변수에 대한 자세한 내용은 을 참조하십시오데이터 모델 탐색기를 사용하여 이벤트 데이터세트 요구 사항 가져오기.

사기 예측에 사용할 변수를 먼저 생성한 다음 이벤트 유형을 생성할 때 이벤트에 추가해야 합니다. 생성하는 각 변수에는 데이터 유형, 기본값 및 선택적으로 변수 유형을 할당해야 합니다. Amazon Fraud Detector는 IP 주소, 은행 식별 번호 (BIN), 전화 번호 등 사용자가 제공하는 일부 변수를 강화하여 추가 입력을 생성하고 이러한 변수를 사용하는 모델의 성능을 향상시킵니다.

데이터 유형

변수에는 해당 변수가 나타내는 데이터 요소의 데이터 유형이 있어야 하며 선택적으로 사전 변수 유형 정의된 데이터 유형 중 하나를 할당할 수 있습니다. 변수 유형에 할당된 변수의 경우 데이터 유형이 미리 선택됩니다. 가능한 데이터 유형에는 다음 유형이 포함됩니다.

데이터 형식 설명 기본값 예제 값
문자열 문자, 정수 또는 둘 다의 모든 조합 <empty>

ABC, 123, 1D3B

Integer 양수 또는 음수 정수 0 1, -1
부울 참 또는 거짓 False 참, 거짓
DateTime ISO 8601 표준 UTC 형식으로만 지정된 날짜 및 시간 <empty> 2019-11-30T 13:01:01 Z
Float 소수점이 있는 숫자 0.0 4.01, 0.10

기본값

변수에는 기본값이 있어야 합니다. Amazon Fraud Detector가 부정 행위 예측을 생성할 때 Amazon Fraud Detector가 변수에 대한 값을 받지 못하는 경우 규칙 또는 모델을 실행하는 데 이 기본값이 사용됩니다. 입력한 기본값은 선택한 데이터 유형과 일치해야 합니다. Amazon Fraud Detector는 AWS 콘솔에서 정수, 부울, 부동 소수점, 문자열의 false 경우 (비어 있음) 의 0 기본값을 할당합니다. 0.0 이러한 모든 데이터 유형에 대해 사용자 지정 기본값을 설정할 수 있습니다.

변수 유형

변수를 만들 때 선택적으로 변수를 변수 유형에 할당할 수 있습니다. 변수 유형은 모델을 학습시키고 사기 예측을 생성하는 데 사용되는 일반적인 데이터 요소를 나타냅니다. 관련 변수 유형이 있는 변수만 모델 학습에 사용할 수 있습니다. 모델 학습 프로세스의 일부로 Amazon Fraud Detector는 변수와 연결된 변수 유형을 사용하여 변수 강화, 기능 엔지니어링 및 위험 점수를 매깁니다.

Amazon Fraud Detector는 변수에 할당하는 데 사용할 수 있는 다음과 같은 변수 유형을 미리 정의했습니다.

범주 변수 유형 설명 데이터 형식
세션 IP_ADDRESS 이벤트 기간 동안 수집된 IP 주소 문자열 192.0.2.0

참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 지리적 위치 강화 섹션을 참조하세요.

사용자 에이전트 이벤트 기간 동안 수집되는 사용자 에이전트 문자열 모질라 5.0 (윈도우 NT 10.0, 윈64, x64, rv:68.0) 게코 20100101
지문 이벤트에 사용된 장치의 고유 식별자 문자열 sadfow987u234
SESSION_ID 이벤트의 활성 세션의 세션 ID 문자열 sid123456789
유효한_자격 증명_인증서_유효 이벤트 로그인에 사용된 자격 증명이 유효한지 여부를 나타냅니다. 부울 True
사용자 이메일_주소 이벤트 기간 동안 수집된 이메일 주소 문자열 abc@domain.com
PHONE_NUMBER 이벤트 기간 동안 수집된 전화번호 문자열 +1 555-0100

참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 전화번호 강화 섹션을 참조하세요.

결제 청구_이름 청구서 수신 주소와 연결된 이름 문자열 John Doe
청구_전화 청구서 수신 주소와 연결된 전화번호 문자열 +1 555-0100

참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 전화번호 강화 섹션을 참조하세요.

청구_주소_L1 청구서 수신 주소의 첫 번째 줄 문자열 모든 거리
청구_주소_L2 청구서 수신 주소의 두 번째 줄 문자열 모든 유닛 123
빌링_시티 청구서 수신 주소에 있는 도시 문자열 모든 도시
청구_주 청구서 수신 주소에 있는 주 또는 도 문자열 모든 주 또는 도
청구_국가 청구서 수신 주소에 있는 국가 문자열 모든 국가

참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 지리적 위치 강화 섹션을 참조하세요.

빌링_ZIP 청구서 수신 주소에 있는 우편번호 문자열 01234

참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 지리적 위치 강화 섹션을 참조하세요.

배송 배송_이름 배송 주소와 연결된 이름 문자열 John Doe
배송_전화 배송 주소와 연결된 전화번호 문자열 +1 555-0100

참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 전화번호 강화 섹션을 참조하세요.

배송_주소_L1 배송 주소의 첫 번째 줄 문자열 123 Any Street
배송_주소_L2 배송 주소의 두 번째 줄 문자열 유닛 123
배송_도시 배송 주소에 있는 도시 문자열 모든 도시
배송_상태 배송 주소에 있는 주 또는 도 문자열 모든 주
배송_국가 배송지 주소에 있는 해당 국가 문자열 모든 국가

참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 지리적 위치 강화 섹션을 참조하세요.

배송_ZIP 배송 주소에 있는 우편 번호 문자열 01234

참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 지리적 위치 강화 섹션을 참조하세요.

결제 주문_ID 거래의 고유 식별자 문자열 LUX60
가격 총 주문 가격 문자열 560.00
통화_코드 ISO 4217 통화 코드 문자열 USD
결제_유형 이벤트 기간 동안 결제에 사용되는 결제 수단 문자열 크레디트 카드
인증_코드 신용 카드 발급사 또는 발급 은행에서 보낸 영숫자 코드 문자열 0000
AVS 카드 프로세서의 주소 확인 시스템 (AVS) 응답 코드 문자열 Y
제품 제품_카테고리 주문 품목의 제품 카테고리 문자열 키친
사용자 지정(Custom) NUMERIC 실수로 표현할 수 있는 모든 변수 Float 1.224
CATEGORICAL 카테고리, 세그먼트 또는 그룹을 설명하는 모든 변수 문자열 라지
자유_양식_텍스트 이벤트의 일부로 캡처된 모든 자유 형식 텍스트 (예: 고객 리뷰 또는 의견) 문자열 자유 형식 텍스트 입력의 예

변수 유형에 변수 할당

모델을 훈련하는 데 변수를 사용할 계획이라면 변수에 할당할 올바른 변수 유형을 선택하는 것이 중요합니다. 잘못된 변수 유형 할당은 모델 성능에 부정적인 영향을 미칠 수 있습니다. 또한 나중에 할당을 변경하기가 매우 어려워질 수 있습니다. 특히 여러 모델 및 이벤트에서 변수를 사용한 경우에는 더욱 그렇습니다.

변수에 사전 정의된 변수 유형 중 하나 또는 사용자 지정 변수 유형 (FREE_FORM_TEXT,CATEGORICAL, 또는NUMERIC) 중 하나를 할당할 수 있습니다.

변수를 올바른 변수 유형에 할당하기 위한 중요 참고 사항

  1. 변수가 사전 정의된 변수 유형 중 하나와 일치하는 경우 해당 변수를 사용하십시오. 변수 유형이 변수와 일치하는지 확인하십시오. 예를 들어 ip_address 변수를 EMAIL_ADDRESS 변수 유형에 할당하면 ip_address 변수에는 ASN, ISP, 지리적 위치 및 위험 점수와 같은 강화 기능이 포함되지 않습니다. 자세한 정보는 가변 인리치먼트을 참조하세요.

  2. 변수가 사전 정의된 변수 유형과 일치하지 않는 경우 아래 나열된 권장 사항에 따라 사용자 지정 변수 유형 중 하나를 할당하십시오.

  3. 일반적으로 순서가 자연스럽지 않고 범주, 세그먼트 또는 그룹에 넣을 수 있는 변수에 CATEGORICAL 변수 유형을 할당합니다. 모델 학습에 사용하는 데이터세트에는 판매자_ID, campaign_id 또는 policy_id와 같은 ID 변수가 있을 수 있습니다. 이러한 변수는 그룹을 나타냅니다 (예: 동일한 policy_id를 가진 모든 고객이 그룹을 나타냄). 다음 데이터가 있는 변수에는 CATEGORICAL 변수 유형을 할당해야 합니다 -

    • 고객_ID, 세그먼트_ID, 색상_ID, 부서_코드 또는 제품_ID와 같은 데이터를 포함하는 변수.

    • 참, 거짓 또는 null 값을 가진 부울 데이터를 포함하는 변수.

    • 회사 이름, 제품 범주, 카드 유형 또는 추천 매체와 같은 그룹 또는 범주에 넣을 수 있는 변수.

    참고

    ENTITY_ID아마존 사기 탐지기가 ENTITY_ID 변수에 할당하는 데 사용하는 예약 변수 유형입니다. ENTITY_ID 변수는 평가하려는 작업을 시작하는 개체의 ID입니다. 거래 사기 인사이트 (TFI) 모델 유형을 생성하는 경우 ENTITY_ID 변수를 제공해야 합니다. 데이터의 어떤 변수가 작업을 시작하는 엔티티를 고유하게 식별하는지 결정하여 ENTITY_ID 변수로 전달해야 합니다. 데이터셋의 다른 모든 ID가 존재하고 모델 학습에 사용하는 경우 CATEGORICAL 변수 유형을 할당하십시오. 데이터세트의 개체가 아닌 다른 ID의 예로는 판매자_ID, 정책_ID, 캠페인_ID가 있습니다.

  4. 텍스트 블록이 포함된 변수에 FREE_FORM_TEXT 변수 유형을 지정합니다. FREE_FORM_TEXT 변수 유형의 예로는 사용자 리뷰, 댓글, 날짜 및 추천 코드가 있습니다. FREE_FORM_TEXT 데이터에는 구분 기호로 구분된 여러 토큰이 포함됩니다. 구분 기호는 영숫자 및 밑줄 기호 이외의 모든 문자일 수 있습니다. 예를 들어 사용자 리뷰와 댓글은 “공백” 구분 기호로 구분할 수 있으며, 날짜 및 추천 코드는 하이픈을 구분 기호로 사용하여 접두사, 접미사 및 중간 부분을 구분할 수 있습니다. 아마존 사기 탐지기는 구분 기호를 사용하여 FREE_FORM_TEXT 변수에서 데이터를 추출합니다.

  5. 실수이고 고유한 순서가 있는 변수에 NUMERIC 변수 유형을 할당합니다. NUMERIC 변수의 예로는 요일, 사고 심각도, 고객 등급 등이 있습니다. 이러한 변수에 CATEGORICAL 변수 유형을 할당할 수 있지만 고유한 순서가 있는 모든 실수 변수를 NUMERIC 변수 유형에 할당하는 것이 좋습니다.

가변 인리치먼트

Amazon Fraud Detector는 IP 주소, 은행 식별 번호 (BIN), 전화 번호 등 사용자가 제공하는 일부 원시 데이터 요소를 강화하여 추가 입력을 생성하고 이러한 데이터 요소를 사용하는 모델의 성능을 향상시킵니다. 강화 기능은 잠재적으로 의심스러운 상황을 식별하고 모델이 더 많은 부정 행위를 포착하는 데 도움이 됩니다.

전화번호 강화

Amazon Fraud Detector는 지리적 위치, 원래 배송사 및 전화번호의 유효성과 관련된 추가 정보로 전화번호 데이터를 강화합니다. 전화번호 강화 기능은 2021년 12월 13일 또는 그 이후에 교육을 받고 전화번호가 국가 코드 (+xxx) 를 포함하는 모든 모델에 대해 자동으로 활성화됩니다. 모델에 전화번호 변수를 포함시켰고 2021년 12월 13일 이전에 학습시킨 경우 모델을 다시 학습시켜 이 강화 기능을 활용할 수 있도록 하십시오.

데이터를 성공적으로 보강하려면 전화번호 변수에 다음 형식을 사용하는 것이 좋습니다.

변수 형식 설명
PHONE_NUMBER E.164 스탠다드 전화번호에 국가 코드 (+xxx) 를 포함해야 합니다.
청구_전화 및 배송_전화 E.164 스탠다드 전화번호에 국가 코드 (+xxx) 를 포함해야 합니다.

지리적 위치 강화

2022년 2월 8일부터 아마존 사기 탐지기는 이벤트에 제공한 IP_주소, 청구_ZIP 및 배송_ZIP 값 간의 물리적 거리를 계산합니다. 계산된 거리는 사기 탐지 모델의 입력으로 사용됩니다.

지리적 위치 보강을 활성화하려면 이벤트 데이터에 세 가지 변수 (IP_ADDRESS, BILLING_ZIP 또는 SHIPPING_ZIP) 중 2개 이상이 포함되어야 합니다. 또한 각 청구_우편 번호와 배송_우편 번호에는 각각 유효한 청구_국가 코드 및 배송_국가 코드가 있어야 합니다. 2022년 2월 8일 이전에 학습된 모델에 이러한 변수가 포함되어 있는 경우 모델을 다시 학습시켜 지리적 위치 강화를 활성화해야 합니다.

데이터가 유효하지 않아 Amazon Fraud Detector가 이벤트의 IP_ADDRESS, BILLING_ZIP 또는 SHIPPING_ZIP 값과 연결된 위치를 확인할 수 없는 경우 특수 자리 표시자 값이 대신 사용됩니다. 예를 들어 이벤트에 유효한 IP_ADDRESS 및 BILLING_ZIP 값이 있지만 SHIPPING_ZIP 값은 유효하지 않다고 가정해 보겠습니다. 이 경우 IP_ADDRESS—> BILLING_ZIP에 대해서만 인리치먼트가 수행됩니다. IP_주소—>배송_ZIP 및 청구_ZIP—>배송_ZIP에 대해서는 강화가 수행되지 않습니다. 대신 자리 표시자 값이 대신 사용됩니다. 모델에 지리적 위치 보강을 활성화했는지 여부에 관계없이 모델의 성능은 변하지 않습니다.

BILLING_ZIP 및 SHIPPING_ZIP 변수를 CUSTOM_CATEGORICAL 변수 유형에 매핑하여 지리적 위치 강화를 거부할 수 있습니다. 변수 유형을 변경해도 모델의 성능에는 영향을 주지 않습니다.

지리적 위치 변수 형식

위치 데이터를 성공적으로 보강하려면 다음과 같은 지리 위치 변수 형식을 사용하는 것이 좋습니다.

변수 형식 설명
IP_ADDRESS IPv4 주소 예를 들어 - 1.1.1.1
청구_우편번호 및 배송_ZIP 지정된 국가의 ISO 3166-1 알파-2 우편 번호 자세한 내용은 이 항목의 국가 및 관할 구역 코드 섹션을 참조하십시오.
청구_국가 및 배송_국가 ISO 3166-1 알파-2 두 글자 표준 국가 코드 자세한 내용은 이 항목의 국가 및 관할 구역 코드 섹션을 참조하십시오. Amazon Fraud Detector는 국가 이름의 일반적인 변형을 모두 ISO 3166-1 두 글자 표준 국가 코드와 일치시키려고 합니다. 그러나 정확히 일치한다는 보장은 할 수 없습니다.

다음 표에는 Amazon Fraud Detector가 지리적 위치 강화를 지원하는 국가 및 지역의 전체 목록이 나와 있습니다. 각 국가 및 지역에는 지정된 국가 코드 (특히 ISO 3166-1 alpha-2 두 글자 국가 코드) 와 우편 번호가 있습니다.

우편 번호 형식

  • 9 - 넘버

  • a - 레터

  • [X] - X는 선택 사항입니다. 예를 들어, 거스니 “GY9 [9] 9aa”는 “GY9 9aa”와 “GY99 9aa”가 모두 유효하다는 것을 의미합니다. 한 가지 형식을 사용하세요.

  • [X/XX] - X 또는 XX 중 하나를 사용할 수 있습니다. 예를 들어 버뮤다의 “aa [aa/99]”는 “aa aa”와 “aa 99"가 모두 유효함을 의미합니다. 다음 형식 중 하나를 사용하되 둘 다 사용하지는 마십시오.

  • 일부 국가에는 고정 접두사가 있습니다. 예를 들어, 안도라의 우편 번호는 AD999 입니다. 즉, 국가 코드는 문자 AD로 시작하고 그 뒤에 숫자 3개가 와야 합니다.

코드 이름 우편 번호
광고 안도라 AD999
AR 네덜란드령 안틸 제도 9999
AT 오스트리아 9999
AU 호주 9999
아즈 아제르바이잔 AZ 9999
BD 방글라데시 9999
있다 벨기에 9999
가방 불가리아 9999
BM 버뮤다 aa [aa/99]
BY 벨로루시 999999
CA 캐나다 a9a 9a9
CH 스위스 9999
CL 칠레 9999999
CO 콜롬비아 999999
CR 코스타리카 99999
싸이 사이프러스 9999
CZ 체코 999 99
DE 독일 99999
DK 덴마크 9999
DO 도미니카 공화국 99999
DZ 알제리 99999
EE 에스토니아 99999
ES 스페인 99999
FI 핀란드 99999
FM 미크로네시아 연방 99999
FO 페로 제도 999
FR 프랑스 99999
GB 영국 [a] [a/9] 9aa
GG 건지 GY9 [9] 9aa
GL 그린란드 9999
GP 과들루프 99999
GT 과테말라 99999
99999
HR 크로아티아 99999
헝가리 9999
IE 아일랜드 a99 [a/9] [a/9] [a/9] [a/9]
맨 섬 IM9 [9] 9aa
IN 인도 999999
IS 아이슬란드 999
그것을 이탈리아 99999
JE 저지 JE9 [9] 9aa
JP 일본 999-9999
KR 대한민국 99999
리히텐슈타인 9999
LK 스리랑카 99999
LT 리투아니아 99999
룩셈부르크 L-9999
LV 라트비아 LV-9999
MC 모나코 99999
MD 몰도바 공화국 9999
MH 마셜 제도 99999
MK 북 마케도니아 9999
지도 북마리아나 제도 99999
MQ 마티니크 99999
몰타 aaa 999
MX 멕시코 99999
말레이시아 99999
NL 네덜란드 999 a
아니요 노르웨이 9999
NZ 뉴질랜드 9999
PH 필리핀 9999
PK 파키스탄 99999
PL 폴란드 99-999
PR 푸에르토리코 99999
PT 포르투갈 9999-999
PW 팔라우 99999
다시

레위니옹

99999
RO 루마니아 999999
RU 러시아 연방 999999
사용 스웨덴 999 99
SG 싱가포르 999999
슬로베니아 9999
SK 슬로바키아 999 99
SM 산마리노 99999
TH 태국 99999
TR 터키 99999
UA 우크라이나 99999
US 미국 99999
사세요 우루과이 99999
VI 미국령 버진 제도 99999
WF 월리스 푸투나 99999
YT 마요트 99999
ZA 남아프리카공화국 9999

사용자 에이전트 강화

ATI (어카운트 테이크오버 인사이트) 모델을 만드는 경우 데이터셋에 useragent 변수 유형의 변수를 제공해야 합니다. 이 변수에는 로그인 이벤트의 브라우저, 장치 및 OS 데이터가 포함됩니다. Amazon Fraud Detector는, 등의 user_agent_family OS_family 추가 정보를 사용하여 사용자 에이전트 데이터를 강화합니다. device_family