本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Variables
變數代表您要在詐騙預測中使用的資料元素。這些變數可從您為訓練模型準備的事件資料集、Amazon 詐騙偵測器模型的風險分數輸出或 Amazon 模SageMaker型中擷取。如需有關從事件資料集取得之變數的詳細資訊,請參閱使用資料模型總管取得事件資料集需求。
您必須先建立您要用於詐騙預測的變數,然後在建立事件類型時新增至事件中。您建立的每個變數都必須指派資料類型、預設值,以及選擇性的變數類型。Amazon 詐騙偵測器會豐富您提供的某些變數,例如 IP 位址、銀行識別號碼 (BIN) 和電話號碼,以建立其他輸入並提升使用這些變數的模型效能。
資料類型
變數必須具有變數所代表之資料元素的資料類型,並且可以選擇性地指派其中一個預先定義的變數變數類型。對於指派給變數類型的變數,會預先選取資料類型。可能的資料類型包括下列類型:
資料類型 | 描述 | 預設值 | 範例值 |
---|---|---|---|
字串 | 字母、整數或兩者的任意組合 | <empty> |
ABC, 123, 1 日 |
整數 | 正整數或負數 | 0 | 1, -1 |
Boolean | 真或假 | False | 真假 |
DateTime | 僅以 ISO 8601 標準世界標準格式指定的日期和時間 | <empty> | 2019-11-30T13:01:01Z |
Float | 帶有小數點的數字 | 0.0 | 4.01 |
預設值
變數必須具有預設值。當 Amazon 詐騙偵測器產生詐騙預測時,如果 Amazon 詐騙偵測器未收到變數的值,則會使用此預設值執行規則或模型。您提供的預設值必須與選取的資料類型相符。在 AWS 主控台中,Amazon 詐騙偵測器會0
為整數、布林值、false
浮點數和字串 (空白) 指派預設值。0.0
您可以為任何這些資料類型設定自訂預設值。
變數類型
當您建立變數時,您可以選擇性地將變數指派給變數類型。變數類型代表用來訓練模型和產生詐騙預測的常見資料元素。只有具有關聯變數類型的變數才能用於模型訓練。做為模型訓練程序的一部分,Amazon 詐騙偵測器會使用與變數關聯的變數類型來執行變數擴充、功能工程和風險評分。
Amazon 詐騙偵測器已預先定義下列可用於指派給變數的變數類型。
類別 | 變數類型 | 描述 | 資料類型 | 範例 |
---|---|---|---|---|
Session (工作階段) | IP_ADDRESS | 活動期間收集的 IP 位址 | 字串 | 192.0.2.0 注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 地理位置豐富 |
用戶代理 | 在事件期間收集的使用者代理程式 | 字串 | Mozilla 5.0 (視窗新界 10.0, 64, RV: 68.0) 壁虎 | |
指紋 | 用於事件之裝置的唯一識別碼 | 字串 | 薩德福烏 | |
SESSION_ID | 事件作用中工作階段的工作階段 ID | 字串 | sid123456789 | |
是有效的憑證 | 指出用於事件登入的認證是否有效 | Boolean | True | |
使用者 | 電子郵件地址 | 活動期間收集的電子郵件地址 | 字串 | abc@domain.com |
PHONE_NUMBER | 活動期間收集的電話號碼 | 字串 | +1 555-0100 注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 電話號碼豐富 |
|
帳單 | 帳單名稱 | 與帳單地址相關聯的名稱 | 字串 | 约翰·杜 |
帳單電話 | 與帳單地址相關聯的電話號碼 | 字串 | +1 555-0100 注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 電話號碼豐富 |
|
帳單地址 | 帳單地址的第一行 | 字串 | 任何街道 | |
帳單地址 | 帳單地址的第二行 | 字串 | 任何單位 123 | |
帳單城市 | 帳單地址中的城市 | 字串 | 任何城市 | |
帳單狀態 | 帳單地址中的州或省 | 字串 | 任何州或省 | |
帳單國家 | 帳單地址中的國家/地區 | 字串 | 任何國家 注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 地理位置豐富 |
|
帳單拉鍊 | 帳單地址中的郵遞區號 | 字串 | 01234 注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 地理位置豐富 |
|
運費 | 出貨名稱 | 與運送地址相關聯的名稱 | 字串 | 约翰·杜 |
運送電話 | 與運送地址相關聯的電話號碼 | 字串 | +1 555-0100 注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 電話號碼豐富 |
|
運送地址 _L1 | 送貨地址的第一行 | 字串 | 任何街道 | |
運送地址 _L2 | 送貨地址的第二行 | 字串 | 第 123 單元 | |
運送城市 | 運送地址中的城市 | 字串 | 任何城市 | |
運送狀態 | 運送地址中的州或省 | 字串 | 任何州 | |
運送國家 | 運送地址中的國家/地區 | 字串 | 任何國家 注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 地理位置豐富 |
|
出貨 _ 拉鍊 | 運送地址中的郵遞區號 | 字串 | 01234 注意:Amazon 詐騙偵測器會豐富這項資料。如需詳細資訊,請參閱 地理位置豐富 |
|
付款 | 訂單識別碼 | 交易的唯一識別碼 | 字串 | LUX60 |
價格 | 總訂單價格 | 字串 | 560.00 | |
貨幣代碼 | 新加坡貨幣代碼 | 字串 | USD | |
付款類型 | 活動期間用於付款的付款方式 | 字串 | 信用卡 | |
驗證碼 | 信用卡發卡機構或發卡銀行所傳送的英文字母代碼 | 字串 | 0000 | |
AVS | 記憶卡處理器的位址驗證系統 (AVS) 回應碼 | 字串 | Y | |
產品 | 產品類別 | 訂單項目的產品類別 | 字串 | 廚房 |
自訂 | NUMERIC | 任何可以表示為實數的變數 | Float | 1.224 |
CATEGORICAL | 描述類別、區段或群組的任何變數 | 字串 | 大型 | |
自由格式文字 | 作為活動一部分擷取的任何自由格式文字 (例如,客戶評論或留言) | 字串 | 自由格式文本輸入的示例 |
將變量分配給變量類型
如果您打算使用變數來訓練模型,請務必選擇正確的變數類型來指派給變數。不正確的變數類型指派可能會對模型效能產生負面影響。對於稍後更改分配也會變得非常困難,特別是如果多個模型和事件使用了該變量。
您可以為變數指派任何一種預先定義的變數類型或其中一個自訂變數類型 — FREE_FORM_TEXT
CATEGORICAL
、或NUMERIC
。
將變數指派給正確變數類型的重要注意事項
-
如果變數與其中一個預先定義的變數類型相符,請使用它。請確定變數類型對應於變數。例如,如果您將 ip_address 變數指派給
EMAIL_ADDRESS
變數類型,則 ip_address 變數將不會充實豐富,例如 ASN、ISP、地理位置和風險評分。如需詳細資訊,請參閱變數豐富。 -
如果變數與任何預先定義的變數類型不相符,請遵循下列建議指派其中一個自訂變數類型。
-
將
CATEGORICAL
變數類型指派給通常沒有自然順序且可以放入類別、區段或群組的變數。您用來訓練模型的資料集可能具有 ID 變數,例如,商業識別碼、活動識別碼或政策識別碼。這些變數代表群組 (例如,具有相同政策_id 的所有客戶代表一個群組)。具有以下數據的變量必須分配分類變量類型--
包含客戶識別碼、區段 ID、顏色 ID 、部門代碼或產品 ID 等資料的變數。
-
包含具有真、假或空值之布林值資料的變數。
-
可以放入群組或類別的變數,例如公司名稱、產品類別、卡片類型或推薦媒介。
注意
ENTITY_ID
是亞馬遜欺詐檢測器用於分配給 ENTITY_ID 變量的保留變量類型。ENTITY_ID 變數是啟動您要評估之動作的實體識別碼。如果您要建立交易詐騙洞察 (TFI) 模型類型,則必須提供 ENTITY_ID 變數。您將需要決定數據中的哪個變量唯一標識起始操作的實體,並將其作為 ENTITY_ID 變量傳遞。如果資料集中的所有其他 ID 存在,以及您是否使用它們進行模型訓練,請將 CATEGORICAL 變數類型指派給資料集中的所有其他 ID。其他不是資料集中實體的 ID 範例可以是商業 ID、政策識別碼和促銷活動 ID 。 -
-
將
FREE_FORM_TEXT
變數類型指派給包含文字區塊的變數。FREE_FORM_TEXT 變數類型的範例包括 — 使用者評論、註解、日期和推薦代碼。FREE_FORM_TEXT 資料包含多個以分隔符號分隔的記號。分隔符可以是字母數字和下劃線符號以外的任何字符。例如,用戶評論和評論可以用「空格」分隔符分隔,日期和推薦代碼可以使用連字符作為分隔符來分隔出前綴,後綴和中間部分。亞馬遜詐騙偵測器使用分隔符號從 FREE_FORM_TEXT 變數擷取資料。 -
將 NUMERIC 變數類型指派給實數且具有固有排序的變數。NUMERIC 變數的範例包括週的日期、事件嚴重性、客戶評級。雖然您可以將 CATEGORIAL 變數類型指派給這些變數,但我們強烈建議您將所有具有固有順序的實數變數指派給 NUMERIC 變數類型。
變數豐富
Amazon 詐騙偵測器可豐富您提供的某些原始資料元素,例如 IP 位址、銀行識別號碼 (BIN) 和電話號碼,以建立額外的輸入並提升使用這些資料元素的模型效能。強化功能有助於識別潛在的可疑情況,並幫助模型捕獲更多欺詐行為。
電話號碼豐富
Amazon 詐騙偵測器會使用與地理位置、原始電信業者和電話號碼有效性相關的其他資訊來豐富電話號碼資料。所有在 2021 年 12 月 13 日或之後接受訓練且電話號碼包含國家/地區代碼 (+xxx) 的型號,都會自動啟用電話號碼強化功能。如果您已在模型中包含電話號碼變數,並且在 2021 年 12 月 13 日之前對其進行了訓練,請重新訓練模型,以便它可以利用此擴充功能。
我們強烈建議您對電話號碼變數使用以下格式,以確保資料能夠成功豐富。
地理位置豐富
從 2022 年 2 月 8 日開始,亞馬遜欺詐偵測器會計算您為事件提供的 IP_ADDRESS、BILLING_ZIP 和運送 _ZIP 值之間的實際距離。計算出的距離會用作詐騙偵測模型的輸入。
若要啟用地理位置擴充功能,您的事件資料必須至少包含下列三個變數中的兩個:IP_ADDRESS、BILLING_ZIP 或出貨。此外,每個郵遞區號和運送郵遞區號必須分別具有有效的帳單國家代碼和運送國家代碼。如果您擁有在 2022 年 2 月 8 日之前進行訓練的模型,且其中包含這些變數,則必須重新訓練模型以啟用地理位置擴充。
如果由於資料無效,亞馬遜詐騙偵測器無法判斷事件的 IP_ADDRESS、BILLING_ZIP 或出貨值相關聯的位置,則會改用特殊的預留位置值。例如,假設事件具有有效的 IP_ADDRESS 和比林格 ZIP 值,但出貨 _ ZIP 值無效。在此情況下,僅針對 IP 位址 —> 帳單 ZIP 進行豐富。IP 位址 —> 郵遞區號和帳單郵遞區號-> 出貨 _ 郵遞不會完成豐富作業。取而代之的是,佔位符值用於它們的位置。無論您的模型是否啟用了地理位置擴充功能,模型的效能都不會改變。
您可以通過將您的 BILLING_ZIP 和運輸變量映射到自定義分類變量類型來選擇退出地理位置擴充。變更變數類型不會影響模型的效能。
地理位置變量格式
我們強烈建議您對地理位置變數使用以下格式,以確保您的位置資料能夠成功充實。
變數 | 格式 | 描述 |
---|---|---|
IP_ADDRESS | IPv4 位址 |
舉個例子-1.1.1.1 |
拉鍊和郵編付運輸 | 指定國家/地區的 ISO 3166-1 字母 2 字母 |
如需詳細資訊,請參閱本主題中的國家和地區代碼一節。 |
帳單國家及運送國家 | 兩個字母的標準國家 |
如需詳細資訊,請參閱本主題中的國家和地區代碼一節。Amazon 詐騙偵測器會嘗試將國家/地區名稱的所有常見變體與 ISO 3166-1 兩個字母的標準國家/地區代碼相符。但是,我們不能保證它們會被正確匹配。 |
下表提供 Amazon 詐騙偵測器支援用於擴充地理位置的國家和地區的完整清單。每個國家和地區都有一個指定的國家/地區代碼(特別是 ISO 3166-1 字母 2 字母的兩個字母的國家/地區代碼)和一個郵政編碼。
郵遞區號格式
9-號碼
一個-字母
[X]-X 是可選的。例如,格爾斯尼「GY9 [9] 9aa」意味著「GY9 9 AA」和「GY99 9aa」都是有效的。使用一種格式。
[X/XX]-可以使用 X 或 XX。例如,百慕達「aa [aa/99]」意味著「AA AA」和「AA 99」均為有效。請使用下列其中一種格式,但不要同時使用兩種格式。
某些國家/地區有固定的前綴 例如,安道爾的郵遞區號為 AD999。這意味著國家/地區代碼必須以 AD 字母開頭,後跟三個數字。
Code | 名稱 | 郵政編碼 |
---|---|---|
廣告 | 安道爾 | AD999 |
AR | 荷屬安地列斯 | 9999 |
AT | 奧地利 | 9999 |
AU | 澳洲 | 9999 |
AZ | 亞塞拜然 | AZ |
BD | 孟加拉 | 9999 |
是 | 比利時 | 9999 |
BG | 保加利亞 | 9999 |
BM | 百慕達 | AA [aa/99] |
BY | 白俄羅斯 | 999999 |
CA | 加拿大 | a9a |
CH | 瑞士 | 9999 |
CL | 智利 | 9999999 |
CO | 哥倫比亞 | 999999 |
CR | 哥斯大黎加 | 99999 |
CY | 賽普勒斯 | 9999 |
鋯石 | 捷克 | 999 99 |
DE | 德國 | 99999 |
DK | 丹麥 | 9999 |
DO | 多明尼加共和國 | 99999 |
DZ | 阿爾及利亞 | 99999 |
EE | 愛沙尼亞 | 99999 |
ES | 西班牙 | 99999 |
FI | 芬蘭 | 99999 |
FM | 密克罗尼西亚联邦 | 99999 |
FO | 法羅群島 | 999 |
法國 | 法國 | 99999 |
GB | 英國 | 一個 [一] 9 [A/9] 9aa |
GG | 根西島 | GY9 [9] 9 節 |
GL | 格陵蘭 | 9999 |
GP | 瓜地洛普 | 99999 |
GT | 瓜地馬拉 | 99999 |
顾 | 關島 | 99999 |
小時 | 克羅埃西亞 | 99999 |
胡 | 匈牙利 | 9999 |
IE | 愛爾蘭 | 一九九 [A/9] [A/9] [a/9] [a/9] |
我 | 曼島 | IM9 [9] 9AA |
IN | 印度 | 999999 |
IS | 冰島 | 999 |
它 | 義大利 | 99999 |
流行性 | 澤西島 | JE9 [9] 9 |
JP | 日本 | 999-9999 |
KR | 大韓民國 | 99999 |
李 | 列支敦斯登 | 9999 |
LK | 斯里蘭卡 | 99999 |
LT | 立陶宛 | 99999 |
呂 | 盧森堡 | L-9999 |
LV | 拉脫維亞 | LV-9999 |
MC | 摩納哥 | 99999 |
MD | 摩尔多瓦共和国 | 9999 |
MH | 馬紹爾群島 | 99999 |
MK | 北馬其頓 | 9999 |
MP | 北马里亚纳群岛 | 99999 |
MQ | 馬提尼克 | 99999 |
山 | 馬爾他 | AAA 9999 |
MX | 墨西哥 | 99999 |
我的 | 馬來西亞 | 99999 |
NL | 荷蘭 | 九九九 |
NO | 挪威 | 9999 |
NZ | 紐西蘭 | 9999 |
酸鹼度 | 菲律賓 | 9999 |
PK | 巴基斯坦 | 99999 |
PL | 波蘭 | 99-999 |
PR | 波多黎各 | 99999 |
PT | 葡萄牙 | 9999-999 |
PW | 帛琉 | 99999 |
回覆 |
團圓 |
99999 |
RO | 羅馬尼亞 | 999999 |
茹 | 俄罗斯联邦 | 999999 |
SE | 瑞典 | 999 99 |
SG | 新加坡 | 999999 |
SI | 斯洛維尼亞 | 9999 |
SK | 斯洛伐克 | 999 99 |
SM | 聖馬利諾 | 99999 |
日 | 泰國 | 99999 |
TR | 土耳其 | 99999 |
UA | 烏克蘭 | 99999 |
美國 | 美國 | 99999 |
UY | 烏拉圭 | 99999 |
六 | 美屬維京群島 | 99999 |
WF | 瓦利斯和富圖納群島 | 99999 |
YT | 馬約特島 | 99999 |
ZA | 南非 | 9999 |
使用者代理程式豐富
如果您建立帳戶接管見解 (ATI) 模型,則必須在資料集中提供useragent
變數類型的變數。此變數包含登入事件的瀏覽器、裝置和作業系統資料。Amazon 詐騙偵測器透過其他資訊 (例如user_agent_family
OS_family
、和) 來豐富使用者代理程式資料。device_family