기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Variables
변수는 사기 예측에 사용하려는 데이터 요소를 나타냅니다. 이러한 변수는 모델 학습을 위해 준비한 이벤트 데이터 세트, Amazon Fraud Detector 모델의 위험 점수 출력 또는 Amazon 모델에서 가져올 수 있습니다. SageMaker 이벤트 데이터셋에서 가져온 변수에 대한 자세한 내용은 을 참조하십시오데이터 모델 탐색기를 사용하여 이벤트 데이터세트 요구 사항 가져오기.
사기 예측에 사용할 변수를 먼저 생성한 다음 이벤트 유형을 생성할 때 이벤트에 추가해야 합니다. 생성하는 각 변수에는 데이터 유형, 기본값 및 선택적으로 변수 유형을 할당해야 합니다. Amazon Fraud Detector는 IP 주소, 은행 식별 번호 (BIN), 전화 번호 등 사용자가 제공하는 일부 변수를 강화하여 추가 입력을 생성하고 이러한 변수를 사용하는 모델의 성능을 향상시킵니다.
데이터 유형
변수에는 해당 변수가 나타내는 데이터 요소의 데이터 유형이 있어야 하며 선택적으로 사전 변수 유형 정의된 데이터 유형 중 하나를 할당할 수 있습니다. 변수 유형에 할당된 변수의 경우 데이터 유형이 미리 선택됩니다. 가능한 데이터 유형에는 다음 유형이 포함됩니다.
데이터 형식 | 설명 | 기본값 | 예제 값 |
---|---|---|---|
문자열 | 문자, 정수 또는 둘 다의 모든 조합 | <empty> |
ABC, 123, 1D3B |
Integer | 양수 또는 음수 정수 | 0 | 1, -1 |
부울 | 참 또는 거짓 | False | 참, 거짓 |
DateTime | ISO 8601 표준 UTC 형식으로만 지정된 날짜 및 시간 | <empty> | 2019-11-30T 13:01:01 Z |
Float | 소수점이 있는 숫자 | 0.0 | 4.01, 0.10 |
기본값
변수에는 기본값이 있어야 합니다. Amazon Fraud Detector가 부정 행위 예측을 생성할 때 Amazon Fraud Detector가 변수에 대한 값을 받지 못하는 경우 규칙 또는 모델을 실행하는 데 이 기본값이 사용됩니다. 입력한 기본값은 선택한 데이터 유형과 일치해야 합니다. Amazon Fraud Detector는 AWS 콘솔에서 정수, 부울, 부동 소수점, 문자열의 false
경우 (비어 있음) 의 0
기본값을 할당합니다. 0.0
이러한 모든 데이터 유형에 대해 사용자 지정 기본값을 설정할 수 있습니다.
변수 유형
변수를 만들 때 선택적으로 변수를 변수 유형에 할당할 수 있습니다. 변수 유형은 모델을 학습시키고 사기 예측을 생성하는 데 사용되는 일반적인 데이터 요소를 나타냅니다. 관련 변수 유형이 있는 변수만 모델 학습에 사용할 수 있습니다. 모델 학습 프로세스의 일부로 Amazon Fraud Detector는 변수와 연결된 변수 유형을 사용하여 변수 강화, 기능 엔지니어링 및 위험 점수를 매깁니다.
Amazon Fraud Detector는 변수에 할당하는 데 사용할 수 있는 다음과 같은 변수 유형을 미리 정의했습니다.
범주 | 변수 유형 | 설명 | 데이터 형식 | 예 |
---|---|---|---|---|
세션 | IP_ADDRESS | 이벤트 기간 동안 수집된 IP 주소 | 문자열 | 192.0.2.0 참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 지리적 위치 강화 섹션을 참조하세요. |
사용자 에이전트 | 이벤트 기간 동안 수집되는 사용자 에이전트 | 문자열 | 모질라 5.0 (윈도우 NT 10.0, 윈64, x64, rv:68.0) 게코 20100101 | |
지문 | 이벤트에 사용된 장치의 고유 식별자 | 문자열 | sadfow987u234 | |
SESSION_ID | 이벤트의 활성 세션의 세션 ID | 문자열 | sid123456789 | |
유효한_자격 증명_인증서_유효 | 이벤트 로그인에 사용된 자격 증명이 유효한지 여부를 나타냅니다. | 부울 | True | |
사용자 | 이메일_주소 | 이벤트 기간 동안 수집된 이메일 주소 | 문자열 | abc@domain.com |
PHONE_NUMBER | 이벤트 기간 동안 수집된 전화번호 | 문자열 | +1 555-0100 참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 전화번호 강화 섹션을 참조하세요. |
|
결제 | 청구_이름 | 청구서 수신 주소와 연결된 이름 | 문자열 | John Doe |
청구_전화 | 청구서 수신 주소와 연결된 전화번호 | 문자열 | +1 555-0100 참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 전화번호 강화 섹션을 참조하세요. |
|
청구_주소_L1 | 청구서 수신 주소의 첫 번째 줄 | 문자열 | 모든 거리 | |
청구_주소_L2 | 청구서 수신 주소의 두 번째 줄 | 문자열 | 모든 유닛 123 | |
빌링_시티 | 청구서 수신 주소에 있는 도시 | 문자열 | 모든 도시 | |
청구_주 | 청구서 수신 주소에 있는 주 또는 도 | 문자열 | 모든 주 또는 도 | |
청구_국가 | 청구서 수신 주소에 있는 국가 | 문자열 | 모든 국가 참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 지리적 위치 강화 섹션을 참조하세요. |
|
빌링_ZIP | 청구서 수신 주소에 있는 우편번호 | 문자열 | 01234 참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 지리적 위치 강화 섹션을 참조하세요. |
|
배송 | 배송_이름 | 배송 주소와 연결된 이름 | 문자열 | John Doe |
배송_전화 | 배송 주소와 연결된 전화번호 | 문자열 | +1 555-0100 참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 전화번호 강화 섹션을 참조하세요. |
|
배송_주소_L1 | 배송 주소의 첫 번째 줄 | 문자열 | 123 Any Street | |
배송_주소_L2 | 배송 주소의 두 번째 줄 | 문자열 | 유닛 123 | |
배송_도시 | 배송 주소에 있는 도시 | 문자열 | 모든 도시 | |
배송_상태 | 배송 주소에 있는 주 또는 도 | 문자열 | 모든 주 | |
배송_국가 | 배송지 주소에 있는 해당 국가 | 문자열 | 모든 국가 참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 지리적 위치 강화 섹션을 참조하세요. |
|
배송_ZIP | 배송 주소에 있는 우편 번호 | 문자열 | 01234 참고: Amazon 사기 탐지기는 이 데이터를 강화합니다. 자세한 내용은 지리적 위치 강화 섹션을 참조하세요. |
|
결제 | 주문_ID | 거래의 고유 식별자 | 문자열 | LUX60 |
가격 | 총 주문 가격 | 문자열 | 560.00 | |
통화_코드 | ISO 4217 통화 코드 | 문자열 | USD | |
결제_유형 | 이벤트 기간 동안 결제에 사용되는 결제 수단 | 문자열 | 크레디트 카드 | |
인증_코드 | 신용 카드 발급사 또는 발급 은행에서 보낸 영숫자 코드 | 문자열 | 0000 | |
AVS | 카드 프로세서의 주소 확인 시스템 (AVS) 응답 코드 | 문자열 | Y | |
제품 | 제품_카테고리 | 주문 품목의 제품 카테고리 | 문자열 | 키친 |
사용자 지정(Custom) | NUMERIC | 실수로 표현할 수 있는 모든 변수 | Float | 1.224 |
CATEGORICAL | 카테고리, 세그먼트 또는 그룹을 설명하는 모든 변수 | 문자열 | 라지 | |
자유_양식_텍스트 | 이벤트의 일부로 캡처된 모든 자유 형식 텍스트 (예: 고객 리뷰 또는 의견) | 문자열 | 자유 형식 텍스트 입력의 예 |
변수 유형에 변수 할당
모델을 훈련하는 데 변수를 사용할 계획이라면 변수에 할당할 올바른 변수 유형을 선택하는 것이 중요합니다. 잘못된 변수 유형 할당은 모델 성능에 부정적인 영향을 미칠 수 있습니다. 또한 나중에 할당을 변경하기가 매우 어려워질 수 있습니다. 특히 여러 모델 및 이벤트에서 변수를 사용한 경우에는 더욱 그렇습니다.
변수에 사전 정의된 변수 유형 중 하나 또는 사용자 지정 변수 유형 (FREE_FORM_TEXT
,CATEGORICAL
, 또는NUMERIC
) 중 하나를 할당할 수 있습니다.
변수를 올바른 변수 유형에 할당하기 위한 중요 참고 사항
-
변수가 사전 정의된 변수 유형 중 하나와 일치하는 경우 해당 변수를 사용하십시오. 변수 유형이 변수와 일치하는지 확인하십시오. 예를 들어 ip_address 변수를
EMAIL_ADDRESS
변수 유형에 할당하면 ip_address 변수에는 ASN, ISP, 지리적 위치 및 위험 점수와 같은 강화 기능이 포함되지 않습니다. 자세한 정보는 가변 인리치먼트을 참조하세요. -
변수가 사전 정의된 변수 유형과 일치하지 않는 경우 아래 나열된 권장 사항에 따라 사용자 지정 변수 유형 중 하나를 할당하십시오.
-
일반적으로 순서가 자연스럽지 않고 범주, 세그먼트 또는 그룹에 넣을 수 있는 변수에
CATEGORICAL
변수 유형을 할당합니다. 모델 학습에 사용하는 데이터세트에는 판매자_ID, campaign_id 또는 policy_id와 같은 ID 변수가 있을 수 있습니다. 이러한 변수는 그룹을 나타냅니다 (예: 동일한 policy_id를 가진 모든 고객이 그룹을 나타냄). 다음 데이터가 있는 변수에는 CATEGORICAL 변수 유형을 할당해야 합니다 --
고객_ID, 세그먼트_ID, 색상_ID, 부서_코드 또는 제품_ID와 같은 데이터를 포함하는 변수.
-
참, 거짓 또는 null 값을 가진 부울 데이터를 포함하는 변수.
-
회사 이름, 제품 범주, 카드 유형 또는 추천 매체와 같은 그룹 또는 범주에 넣을 수 있는 변수.
참고
ENTITY_ID
아마존 사기 탐지기가 ENTITY_ID 변수에 할당하는 데 사용하는 예약 변수 유형입니다. ENTITY_ID 변수는 평가하려는 작업을 시작하는 개체의 ID입니다. 거래 사기 인사이트 (TFI) 모델 유형을 생성하는 경우 ENTITY_ID 변수를 제공해야 합니다. 데이터의 어떤 변수가 작업을 시작하는 엔티티를 고유하게 식별하는지 결정하여 ENTITY_ID 변수로 전달해야 합니다. 데이터셋의 다른 모든 ID가 존재하고 모델 학습에 사용하는 경우 CATEGORICAL 변수 유형을 할당하십시오. 데이터세트의 개체가 아닌 다른 ID의 예로는 판매자_ID, 정책_ID, 캠페인_ID가 있습니다. -
-
텍스트 블록이 포함된 변수에
FREE_FORM_TEXT
변수 유형을 지정합니다. FREE_FORM_TEXT 변수 유형의 예로는 사용자 리뷰, 댓글, 날짜 및 추천 코드가 있습니다. FREE_FORM_TEXT 데이터에는 구분 기호로 구분된 여러 토큰이 포함됩니다. 구분 기호는 영숫자 및 밑줄 기호 이외의 모든 문자일 수 있습니다. 예를 들어 사용자 리뷰와 댓글은 “공백” 구분 기호로 구분할 수 있으며, 날짜 및 추천 코드는 하이픈을 구분 기호로 사용하여 접두사, 접미사 및 중간 부분을 구분할 수 있습니다. 아마존 사기 탐지기는 구분 기호를 사용하여 FREE_FORM_TEXT 변수에서 데이터를 추출합니다. -
실수이고 고유한 순서가 있는 변수에 NUMERIC 변수 유형을 할당합니다. NUMERIC 변수의 예로는 요일, 사고 심각도, 고객 등급 등이 있습니다. 이러한 변수에 CATEGORICAL 변수 유형을 할당할 수 있지만 고유한 순서가 있는 모든 실수 변수를 NUMERIC 변수 유형에 할당하는 것이 좋습니다.
가변 인리치먼트
Amazon Fraud Detector는 IP 주소, 은행 식별 번호 (BIN), 전화 번호 등 사용자가 제공하는 일부 원시 데이터 요소를 강화하여 추가 입력을 생성하고 이러한 데이터 요소를 사용하는 모델의 성능을 향상시킵니다. 강화 기능은 잠재적으로 의심스러운 상황을 식별하고 모델이 더 많은 부정 행위를 포착하는 데 도움이 됩니다.
전화번호 강화
Amazon Fraud Detector는 지리적 위치, 원래 배송사 및 전화번호의 유효성과 관련된 추가 정보로 전화번호 데이터를 강화합니다. 전화번호 강화 기능은 2021년 12월 13일 또는 그 이후에 교육을 받고 전화번호가 국가 코드 (+xxx) 를 포함하는 모든 모델에 대해 자동으로 활성화됩니다. 모델에 전화번호 변수를 포함시켰고 2021년 12월 13일 이전에 학습시킨 경우 모델을 다시 학습시켜 이 강화 기능을 활용할 수 있도록 하십시오.
데이터를 성공적으로 보강하려면 전화번호 변수에 다음 형식을 사용하는 것이 좋습니다.
변수 | 형식 | 설명 |
---|---|---|
PHONE_NUMBER | E.164 스탠다드 |
전화번호에 국가 코드 (+xxx) 를 포함해야 합니다. |
청구_전화 및 배송_전화 | E.164 스탠다드 |
전화번호에 국가 코드 (+xxx) 를 포함해야 합니다. |
지리적 위치 강화
2022년 2월 8일부터 아마존 사기 탐지기는 이벤트에 제공한 IP_주소, 청구_ZIP 및 배송_ZIP 값 간의 물리적 거리를 계산합니다. 계산된 거리는 사기 탐지 모델의 입력으로 사용됩니다.
지리적 위치 보강을 활성화하려면 이벤트 데이터에 세 가지 변수 (IP_ADDRESS, BILLING_ZIP 또는 SHIPPING_ZIP) 중 2개 이상이 포함되어야 합니다. 또한 각 청구_우편 번호와 배송_우편 번호에는 각각 유효한 청구_국가 코드 및 배송_국가 코드가 있어야 합니다. 2022년 2월 8일 이전에 학습된 모델에 이러한 변수가 포함되어 있는 경우 모델을 다시 학습시켜 지리적 위치 강화를 활성화해야 합니다.
데이터가 유효하지 않아 Amazon Fraud Detector가 이벤트의 IP_ADDRESS, BILLING_ZIP 또는 SHIPPING_ZIP 값과 연결된 위치를 확인할 수 없는 경우 특수 자리 표시자 값이 대신 사용됩니다. 예를 들어 이벤트에 유효한 IP_ADDRESS 및 BILLING_ZIP 값이 있지만 SHIPPING_ZIP 값은 유효하지 않다고 가정해 보겠습니다. 이 경우 IP_ADDRESS—> BILLING_ZIP에 대해서만 인리치먼트가 수행됩니다. IP_주소—>배송_ZIP 및 청구_ZIP—>배송_ZIP에 대해서는 강화가 수행되지 않습니다. 대신 자리 표시자 값이 대신 사용됩니다. 모델에 지리적 위치 보강을 활성화했는지 여부에 관계없이 모델의 성능은 변하지 않습니다.
BILLING_ZIP 및 SHIPPING_ZIP 변수를 CUSTOM_CATEGORICAL 변수 유형에 매핑하여 지리적 위치 강화를 거부할 수 있습니다. 변수 유형을 변경해도 모델의 성능에는 영향을 주지 않습니다.
지리적 위치 변수 형식
위치 데이터를 성공적으로 보강하려면 다음과 같은 지리 위치 변수 형식을 사용하는 것이 좋습니다.
변수 | 형식 | 설명 |
---|---|---|
IP_ADDRESS | IPv4 주소 |
예를 들어 - 1.1.1.1 |
청구_우편번호 및 배송_ZIP | 지정된 국가의 ISO 3166-1 알파-2 우편 번호 |
자세한 내용은 이 항목의 국가 및 관할 구역 코드 섹션을 참조하십시오. |
청구_국가 및 배송_국가 | ISO 3166-1 알파-2 |
자세한 내용은 이 항목의 국가 및 관할 구역 코드 섹션을 참조하십시오. Amazon Fraud Detector는 국가 이름의 일반적인 변형을 모두 ISO 3166-1 두 글자 표준 국가 코드와 일치시키려고 합니다. 그러나 정확히 일치한다는 보장은 할 수 없습니다. |
다음 표에는 Amazon Fraud Detector가 지리적 위치 강화를 지원하는 국가 및 지역의 전체 목록이 나와 있습니다. 각 국가 및 지역에는 지정된 국가 코드 (특히 ISO 3166-1 alpha-2 두 글자 국가 코드) 와 우편 번호가 있습니다.
우편 번호 형식
9 - 넘버
a - 레터
[X] - X는 선택 사항입니다. 예를 들어, 거스니 “GY9 [9] 9aa”는 “GY9 9aa”와 “GY99 9aa”가 모두 유효하다는 것을 의미합니다. 한 가지 형식을 사용하세요.
[X/XX] - X 또는 XX 중 하나를 사용할 수 있습니다. 예를 들어 버뮤다의 “aa [aa/99]”는 “aa aa”와 “aa 99"가 모두 유효함을 의미합니다. 다음 형식 중 하나를 사용하되 둘 다 사용하지는 마십시오.
일부 국가에는 고정 접두사가 있습니다. 예를 들어, 안도라의 우편 번호는 AD999 입니다. 즉, 국가 코드는 문자 AD로 시작하고 그 뒤에 숫자 3개가 와야 합니다.
코드 | 이름 | 우편 번호 |
---|---|---|
광고 | 안도라 | AD999 |
AR | 네덜란드령 안틸 제도 | 9999 |
AT | 오스트리아 | 9999 |
AU | 호주 | 9999 |
아즈 | 아제르바이잔 | AZ 9999 |
BD | 방글라데시 | 9999 |
있다 | 벨기에 | 9999 |
가방 | 불가리아 | 9999 |
BM | 버뮤다 | aa [aa/99] |
BY | 벨로루시 | 999999 |
CA | 캐나다 | a9a 9a9 |
CH | 스위스 | 9999 |
CL | 칠레 | 9999999 |
CO | 콜롬비아 | 999999 |
CR | 코스타리카 | 99999 |
싸이 | 사이프러스 | 9999 |
CZ | 체코 | 999 99 |
DE | 독일 | 99999 |
DK | 덴마크 | 9999 |
DO | 도미니카 공화국 | 99999 |
DZ | 알제리 | 99999 |
EE | 에스토니아 | 99999 |
ES | 스페인 | 99999 |
FI | 핀란드 | 99999 |
FM | 미크로네시아 연방 | 99999 |
FO | 페로 제도 | 999 |
FR | 프랑스 | 99999 |
GB | 영국 | [a] [a/9] 9aa |
GG | 건지 | GY9 [9] 9aa |
GL | 그린란드 | 9999 |
GP | 과들루프 | 99999 |
GT | 과테말라 | 99999 |
총 | 괌 | 99999 |
HR | 크로아티아 | 99999 |
휴 | 헝가리 | 9999 |
IE | 아일랜드 | a99 [a/9] [a/9] [a/9] [a/9] |
임 | 맨 섬 | IM9 [9] 9aa |
IN | 인도 | 999999 |
IS | 아이슬란드 | 999 |
그것을 | 이탈리아 | 99999 |
JE | 저지 | JE9 [9] 9aa |
JP | 일본 | 999-9999 |
KR | 대한민국 | 99999 |
리 | 리히텐슈타인 | 9999 |
LK | 스리랑카 | 99999 |
LT | 리투아니아 | 99999 |
루 | 룩셈부르크 | L-9999 |
LV | 라트비아 | LV-9999 |
MC | 모나코 | 99999 |
MD | 몰도바 공화국 | 9999 |
MH | 마셜 제도 | 99999 |
MK | 북 마케도니아 | 9999 |
지도 | 북마리아나 제도 | 99999 |
MQ | 마티니크 | 99999 |
산 | 몰타 | aaa 999 |
MX | 멕시코 | 99999 |
내 | 말레이시아 | 99999 |
NL | 네덜란드 | 999 a |
아니요 | 노르웨이 | 9999 |
NZ | 뉴질랜드 | 9999 |
PH | 필리핀 | 9999 |
PK | 파키스탄 | 99999 |
PL | 폴란드 | 99-999 |
PR | 푸에르토리코 | 99999 |
PT | 포르투갈 | 9999-999 |
PW | 팔라우 | 99999 |
다시 |
레위니옹 |
99999 |
RO | 루마니아 | 999999 |
RU | 러시아 연방 | 999999 |
사용 | 스웨덴 | 999 99 |
SG | 싱가포르 | 999999 |
시 | 슬로베니아 | 9999 |
SK | 슬로바키아 | 999 99 |
SM | 산마리노 | 99999 |
TH | 태국 | 99999 |
TR | 터키 | 99999 |
UA | 우크라이나 | 99999 |
US | 미국 | 99999 |
사세요 | 우루과이 | 99999 |
VI | 미국령 버진 제도 | 99999 |
WF | 월리스 푸투나 | 99999 |
YT | 마요트 | 99999 |
ZA | 남아프리카공화국 | 9999 |
사용자 에이전트 강화
ATI (어카운트 테이크오버 인사이트) 모델을 만드는 경우 데이터셋에 useragent
변수 유형의 변수를 제공해야 합니다. 이 변수에는 로그인 이벤트의 브라우저, 장치 및 OS 데이터가 포함됩니다. Amazon Fraud Detector는, 등의 user_agent_family
OS_family
추가 정보를 사용하여 사용자 에이전트 데이터를 강화합니다. device_family