Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Variables
Les variables représentent les éléments de données que vous souhaitez utiliser dans une prévision de fraude. Ces variables peuvent être extraites de l'ensemble de données d'événements que vous avez préparé pour entraîner votre modèle, des résultats des scores de risque de votre modèle Amazon Fraud Detector ou des SageMaker modèles Amazon. Pour plus d'informations sur les variables extraites du jeu de données d'événements, consultezObtenez les exigences relatives aux ensembles de données d'événements à l'aide de l'explorateur de modèles.
Les variables que vous souhaitez utiliser dans vos prévisions de fraude doivent d'abord être créées, puis ajoutées à l'événement lors de la création de votre type d'événement. Chaque variable que vous créez doit se voir attribuer un type de données, une valeur par défaut et éventuellement un type de variable. Amazon Fraud Detector enrichit certaines des variables que vous fournissez, telles que les adresses IP, les numéros d'identification bancaire (BIN) et les numéros de téléphone, afin de créer des entrées supplémentaires et d'améliorer les performances des modèles qui utilisent ces variables.
Types de données
Les variables doivent avoir un type de données pour l'élément de données qu'elles représentent et peuvent éventuellement se voir attribuer l'un des types prédéfinisTypes de variables. Pour les variables affectées à un type de variable, le type de données est présélectionné. Les types de données possibles incluent les types suivants :
Type de données | Description | Valeur par défaut | Exemples de valeur |
---|---|---|---|
Chaîne | N'importe quelle combinaison de lettres, de chiffres entiers ou des deux | <empty> |
abc, 123 ans, 1D3B |
Entier | Nombres entiers positifs ou négatifs | 0 | 1, -1 |
Booléen | Vrai ou faux | False | Vrai, Faux |
DateTime | Date et heure spécifiées uniquement au format UTC de la norme ISO 8601 | <empty> | 2019-11-30T 13:01:01 Z |
Float | Nombres avec virgule décimale | 0.0 | 4,01, 0,10 |
Valeur par défaut
Les variables doivent avoir une valeur par défaut. Lorsqu'Amazon Fraud Detector génère des prévisions de fraude, cette valeur par défaut est utilisée pour exécuter une règle ou un modèle si Amazon Fraud Detector ne reçoit aucune valeur pour une variable. Les valeurs par défaut que vous fournissez doivent correspondre au type de données sélectionné. Dans la console AWS, Amazon Fraud Detector attribue la valeur par défaut 0
pour les entiers, pour les booléens, false
pour les flottants et (vide) 0.0
pour les chaînes. Vous pouvez définir une valeur par défaut personnalisée pour n'importe lequel de ces types de données.
Types de variables
Lorsque vous créez une variable, vous pouvez éventuellement l'affecter à un type de variable. Le type de variable représente les éléments de données courants utilisés pour former des modèles et générer des prévisions de fraude. Seules les variables associées à un type de variable peuvent être utilisées pour l'apprentissage du modèle. Dans le cadre du processus de formation du modèle, Amazon Fraud Detector utilise le type de variable associé à la variable pour effectuer des enrichissements variables, une ingénierie des fonctionnalités et une évaluation des risques.
Amazon Fraud Detector a prédéfini les types de variables suivants qui peuvent être utilisés pour les attribuer à vos variables.
Catégorie | Type de variable | Description | Type de données | Exemple |
---|---|---|---|---|
Session | IP_ADDRESS | L'adresse IP collectée lors de l'événement | Chaîne | 192,2.0 Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement de la géolocalisation. |
AGENT UTILISATEUR | L'agent utilisateur collecté lors de l'événement | Chaîne | Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv:68.0) Gecko 20100101 | |
EMPREINTE DIGITALE | L'identifiant unique d'un appareil utilisé pour l'événement | Chaîne | sadfow987u234 | |
SESSION_ID | L'ID de session pour la session active de l'événement | Chaîne | sid123456789 | |
LES INFORMATIONS D'IDENTIFICATION SONT-ELLES VALIDES | Indique si les informations d'identification utilisées pour la connexion aux événements sont valides | Booléen | True | |
Utilisateur | ADRESSE_E-MAIL | L'adresse e-mail collectée lors de l'événement | Chaîne | abc@domain.com |
PHONE_NUMBER | Le numéro de téléphone collecté lors de l'événement | Chaîne | +1 555-0100 Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement du numéro de téléphone. |
|
Facturation | NOM_DE FACTURATION | Le nom associé à l'adresse de facturation | Chaîne | Jean Dupont |
TÉLÉPHONE DE FACTURATION | Le numéro de téléphone associé à l'adresse de facturation | Chaîne | +1 555-0100 Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement du numéro de téléphone. |
|
ADRESSE_DE FACTURATION_L1 | La première ligne de l'adresse de facturation | Chaîne | N'importe quelle rue | |
ADRESSE_DE FACTURATION_L2 | La deuxième ligne de l'adresse de facturation | Chaîne | N'importe quelle unité 123 | |
BILLING_CITY | La ville indiquée dans l'adresse de facturation | Chaîne | N'importe quelle ville | |
ÉTAT DE FACTURATION | État ou province indiqué dans l'adresse de facturation | Chaîne | N'importe quel État ou province | |
PAYS_DE_FACTURATION | Le pays indiqué dans l'adresse de facturation | Chaîne | N'importe quel pays Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement de la géolocalisation. |
|
ZIP DE FACTURATION | Le code postal qui se trouve dans l'adresse de facturation | Chaîne | 01234 Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement de la géolocalisation. |
|
Expédition | NOM_D'EXPÉDITION | Le nom associé à l'adresse de livraison | Chaîne | Jean Dupont |
TÉLÉPHONE D'EXPÉDITION | Le numéro de téléphone associé à l'adresse de livraison | Chaîne | +1 555-0100 Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement du numéro de téléphone. |
|
ADRESSE_DE LIVRAISON_L1 | La première ligne de l'adresse de livraison | Chaîne | 123 Any Street | |
ADRESSE_DE LIVRAISON_L2 | La deuxième ligne de l'adresse de livraison | Chaîne | Unité 123 | |
VILLE_D'EXPÉDITION | La ville indiquée dans l'adresse de livraison | Chaîne | N'importe quelle ville | |
ÉTAT_D'EXPÉDITION | État ou province indiqué dans l'adresse de livraison | Chaîne | N'importe quel État | |
PAYS_D'EXPÉDITION | Le pays dans lequel se trouve l'adresse de livraison | Chaîne | N'importe quel pays Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement de la géolocalisation. |
|
ZIP_D'EXPÉDITION | Le code postal qui se trouve dans l'adresse de livraison | Chaîne | 01234 Remarque : Amazon Fraud Detector enrichit ces données. Pour de plus amples informations, consultez Enrichissement de la géolocalisation. |
|
Paiement | IDENTIFIANT_COMMANDE | L'identifiant unique de la transaction | Chaîne | LUX60 |
PRIX | Le prix total de la commande | Chaîne | 560,00 | |
CODE_DEVISE | Le code de devise ISO 4217 | Chaîne | USD | |
TYPE_DE PAIEMENT | Le mode de paiement utilisé pour le paiement lors de l'événement | Chaîne | Carte de crédit | |
CODE D'AUTHENTIFICATION | Le code alphanumérique envoyé par l'émetteur de la carte de crédit ou la banque émettrice | Chaîne | 0000 | |
AVS | Le code de réponse du système de vérification d'adresse (AVS) émis par le processeur de la carte | Chaîne | Y | |
Produit | CATÉGORIE_PRODUIT | La catégorie de produit de l'article commandé | Chaîne | Cuisine |
Personnalisé | NUMERIC | Toute variable pouvant être représentée sous forme de nombre réel | Float | 1,224 |
CATEGORICAL (catégorie) | Toute variable décrivant des catégories, des segments ou des groupes | Chaîne | Large | |
TEXTE_FORMULAIRE LIBRE | Tout texte en format libre capturé dans le cadre de l'événement (par exemple, un avis ou un commentaire d'un client) | Chaîne | Exemple de saisie de texte sous forme libre |
Affectation d'une variable à un type de variable
Si vous envisagez d'utiliser une variable pour entraîner votre modèle, il est important que vous choisissiez le type de variable approprié à affecter à la variable. Une attribution incorrecte du type de variable peut avoir un impact négatif sur les performances de votre modèle. Il peut également s'avérer très difficile de modifier l'affectation ultérieurement, en particulier si plusieurs modèles et événements ont utilisé la variable.
Vous pouvez attribuer à votre variable l'un des types de variables prédéfinis ou l'un des types de variables personnalisés —FREE_FORM_TEXT
,CATEGORICAL
, ouNUMERIC
.
Remarques importantes concernant l'affectation de variables aux bons types de variables
-
Si la variable correspond à l'un des types de variables prédéfinis, utilisez-la. Assurez-vous que le type de variable correspond à la variable. Par exemple, si vous attribuez une variable ip_address à un type de variable, la
EMAIL_ADDRESS
variable ip_address ne sera pas enrichie par des enrichissements tels que l'ASN, l'ISP, la géolocalisation et le score de risque. Pour plus d'informations, veuillez consulter Enrichissements variables. -
Si la variable ne correspond à aucun type de variable prédéfini, suivez les recommandations ci-dessous pour attribuer l'un des types de variables personnalisés.
-
Attribuez un type de
CATEGORICAL
variable à des variables qui n'ont généralement pas d'ordre naturel et qui peuvent être placées dans des catégories, des segments ou des groupes. Le jeu de données que vous utilisez pour entraîner votre modèle peut contenir des variables d'identification telles que merchant_id, campaign_id ou policy_id. Ces variables représentent des groupes (par exemple, tous les clients ayant le même policy_id représentent un groupe). Les variables contenant les données suivantes doivent se voir attribuer le type de variable CATEGORICAL --
Variables contenant des données telles que Customer_ID, Segment_ID, Color_ID, department_code ou Product_ID.
-
Variables contenant des données booléennes avec des valeurs vraies, fausses ou nulles.
-
Variables pouvant être placées dans des groupes ou des catégories telles que le nom de l'entreprise, la catégorie de produit, le type de carte ou le support de référence.
Note
ENTITY_ID
est un type de variable réservé utilisé par Amazon Fraud Detector pour attribuer à la variable ENTITY_ID. La variable ENTITY_ID est l'ID de l'entité qui lance l'action que vous souhaitez évaluer. Si vous créez un type de modèle Transaction Fraud Insight (TFI), vous devez fournir la variable ENTITY_ID. Vous devrez décider quelle variable de vos données identifie de manière unique l'entité à l'origine de l'action et la transmettre en tant que variable ENTITY_ID. Attribuez le type de variable CATEGORICAL à tous les autres ID de votre jeu de données, s'ils sont présents et si vous les utilisez pour l'apprentissage du modèle. Parmi les autres identifiants qui ne constituent pas une entité dans votre jeu de données, citons Merchant_ID, Policy_ID et Campaign_ID. -
-
Attribuez un type de
FREE_FORM_TEXT
variable aux variables qui contiennent un bloc de texte. Voici des exemples de types de variables FREE_FORM_TEXT : les avis des utilisateurs, les commentaires, les dates et les codes de référence. Les données FREE_FORM_TEXT contiennent plusieurs jetons séparés par un délimiteur. Les délimiteurs peuvent être n'importe quel caractère autre que le caractère alphanumérique et le trait de soulignement. Par exemple, les avis et les commentaires des utilisateurs peuvent être séparés par un séparateur « espace », tandis que les dates et les codes de référence peuvent utiliser des traits d'union comme délimiteurs pour séparer le préfixe, le suffixe et les parties intermédiaires. Amazon Fraud Detector utilise les délimiteurs pour extraire les données des variables FREE_FORM_TEXT. -
Attribuez le type de variable NUMÉRIQUE aux variables qui sont des nombres réels et qui ont un ordre inhérent. Des exemples de variables NUMERIC incluent day_of_the_week, incident_severity, customer_rating. Bien que vous puissiez attribuer le type de variable CATEGORICAL à ces variables, nous vous recommandons vivement d'attribuer toutes les variables numériques avec un ordre inhérent au type de variable NUMÉRIQUE.
Enrichissements variables
Amazon Fraud Detector enrichit certains éléments de données brutes que vous fournissez, tels que les adresses IP, les numéros d'identification bancaire (BIN) et les numéros de téléphone, afin de créer des entrées supplémentaires et d'améliorer les performances des modèles qui utilisent ces éléments de données. L'enrichissement permet d'identifier les situations potentiellement suspectes et aide les modèles à détecter davantage de fraudes.
Enrichissement du numéro de téléphone
Amazon Fraud Detector enrichit les données relatives aux numéros de téléphone avec des informations supplémentaires relatives à la géolocalisation, à l'opérateur d'origine et à la validité du numéro de téléphone. L'enrichissement des numéros de téléphone est automatiquement activé pour tous les modèles qui sont formés le 13 décembre 2021 ou après cette date et dont le numéro de téléphone inclut un code de pays (+xxx). Si vous avez inclus une variable de numéro de téléphone dans votre modèle et que vous l'avez entraînée avant le 13 décembre 2021, réentraînez votre modèle afin qu'il puisse tirer parti de cet enrichissement.
Nous vous recommandons vivement d'utiliser le format suivant pour les variables de numéro de téléphone afin de garantir un enrichissement réussi de vos données.
Variable | Format | Description |
---|---|---|
PHONE_NUMBER | La norme E.164 |
Assurez-vous d'inclure le code du pays (+xxx) avec le numéro de téléphone. |
BILLING_PHONE et SHIPPING_PHONE | La norme E.164 |
Assurez-vous d'inclure le code du pays (+xxx) avec le numéro de téléphone. |
Enrichissement de la géolocalisation
À compter du 8 février 2022, Amazon Fraud Detector calcule la distance physique entre les valeurs IP_ADDRESS, BILLING_ZIP et SHIPPING_ZIP que vous fournissez pour un événement. Les distances calculées sont utilisées comme entrées dans votre modèle de détection des fraudes.
Pour permettre l'enrichissement de la géolocalisation, les données de votre événement doivent inclure au moins deux des trois variables : IP_ADDRESS, BILLING_ZIP ou SHIPPING_ZIP. En outre, chaque valeur BILLING_ZIP et SHIPPING_ZIP doit comporter respectivement un code BILLING_COUNTRY et un code SHIPPING_COUNTRY valides. Si votre modèle a été entraîné avant le 8 février 2022 et qu'il inclut ces variables, vous devez réentraîner le modèle pour permettre l'enrichissement par géolocalisation.
Si Amazon Fraud Detector ne parvient pas à déterminer l'emplacement associé aux valeurs IP_ADDRESS, BILLING_ZIP ou SHIPPING_ZIP pour un événement en raison de la non-validité des données, une valeur d'espace réservé spéciale est utilisée à la place. Supposons, par exemple, qu'un événement possède des valeurs IP_ADDRESS et BILLING_ZIP valides, mais que la valeur SHIPPING_ZIP ne l'est pas. Dans ce cas, l'enrichissement est effectué uniquement pour IP_ADDRESS—> BILLING_ZIP. L'enrichissement n'est pas effectué pour IP_ADDRESS—>SHIPPING_ZIP et BILLING_ZIP—>SHIPPING_ZIP. Au lieu de cela, les valeurs des espaces réservés sont utilisées à leur place. Que l'enrichissement par géolocalisation soit activé ou non pour votre modèle, les performances de votre modèle ne changent pas.
Vous pouvez désactiver l'enrichissement par géolocalisation en mappant vos variables BILLING_ZIP et SHIPPING_ZIP au type de variable CUSTOM_CATEGORICAL. La modification du type de variable n'affecte pas les performances de votre modèle.
Format variable de géolocalisation
Nous vous recommandons vivement d'utiliser le format suivant pour les variables de géolocalisation afin de vous assurer que vos données de localisation sont correctement enrichies.
Variable | Format | Description |
---|---|---|
IP_ADDRESS | Adresse IPv4 |
Par exemple - 1.1.1.1 |
BILLING_ZIP et SHIPPING_ZIP | Le code postal ISO 3166-1 alpha-2 |
Pour plus d'informations, consultez la section Codes de pays et de territoires de cette rubrique. |
BILLING_COUNTRY et SHIPPING_COUNTRY | Le code de pays standard à deux lettres ISO 3166-1 alpha-2 |
Pour plus d'informations, consultez la section Codes de pays et de territoires de cette rubrique. Amazon Fraud Detector essaie de faire correspondre toutes les variantes courantes du nom d'un pays à son code de pays standard à deux lettres ISO 3166-1. Cependant, nous ne pouvons pas garantir qu'ils seront correctement mis en correspondance. |
Le tableau suivant fournit une liste complète des pays et territoires pris en charge par Amazon Fraud Detector pour l'enrichissement de la géolocalisation. Chaque pays et territoire est associé à un code de pays (en particulier, le code de pays à deux lettres ISO 3166-1 alpha-2) et à un code postal.
Format du code postal
9 - numéro
une - lettre
[X] - X est facultatif. Par exemple, « GY9 [9] 9aa » de Guersney signifie que « GY9 9aa » et « GY99 9aa » sont valides. Utilisez un seul format.
[X/XX] : vous pouvez utiliser X ou XX. Par exemple, « aa [aa/99] » des Bermudes signifie que « aa aa » et « aa 99 » sont valides. Utilisez l'un de ces formats, mais pas les deux.
Certains pays ont un préfixe fixe. Par exemple, le code postal d'Andorre est AD999. Cela signifie que le code du pays doit commencer par les lettres AD suivies de trois chiffres.
Code | Nom | Code postal |
---|---|---|
AD | Andorre | ANNONCE 999 |
AR | Antilles néerlandaises | 9999 |
AT | Autriche | 9999 |
AU | Australie | 9999 |
AZ | Azerbaïdjan | COMME 9999 |
BD | Bangladesh | 9999 |
ÊTRE | Belgique | 9999 |
SAC | Bulgarie | 9999 |
BM | Bermudes | aa [aa/99] |
BY | Biélorussie | 999999 |
CA | Canada | a9a 9a9 |
CHAP | Suisse | 9999 |
CL | Chili | 9999999 |
CO | Colombie | 999999 |
CR | Costa Rica | 99999 |
CY | Chypre | 9999 |
RÉPUBLIQUE TCHÈQUE | Tchéquie | 99 99 |
DE | Allemagne | 99999 |
DK | Danemark | 9999 |
DO | République Dominicaine | 99999 |
DZ | Algérie | 99999 |
EE | Estonie | 99999 |
ES | Espagne | 99999 |
FI | Finlande | 99999 |
FM | États fédérés de Micronésie | 99999 |
POUR | Iles Féroé | 999 |
FR | France | 99999 |
Go | Royaume-Uni | [a] 9 [a/9] 9aa |
GG | Guernesey | GY9 [9] 9aa |
GRAND LIVRE | Groenland | 9999 |
GRAND PRIX | Guadeloupe | 99999 |
GT | Guatemala | 99999 |
GU | Guam | 99999 |
HR | Croatie | 99999 |
HU | Hongrie | 9999 |
IE | Irlande | a99 [a/9] [a/9] [a/9] |
IM | Île de Man | IM9 [9] 9aa |
IN | Inde | 999999 |
IS | Islande | 999 |
IL | Italie | 99999 |
JE | Jersey | JE9 [9] 9aa |
JP | Japon | 999-9999 |
KR | République de Corée | 99999 |
LI | Liechtenstein | 9999 |
LK | Sri Lanka | 99999 |
LT | Lituanie | 99999 |
LU | Luxembourg | L-9999 |
LV | Lettonie | LV-9999 |
MAÎTRE DES CÉRÉMONIES | Monaco | 99999 |
MARYLAND | République de Moldova | 9999 |
MH | Îles Marshall | 99999 |
MK | Macédoine du Nord | 9999 |
MP | Îles Mariannes du Nord | 99999 |
MQ | Matinique | 99999 |
MT | Malte | aaa 999 |
MX | Mexique | 99999 |
MON | Malaisie | 99999 |
NL | Pays-Bas | 999 aa |
NO | Norvège | 9999 |
NZ | Nouvelle-Zélande | 9999 |
PH | Philippines | 9999 |
PK | Pakistan | 99999 |
PL | Pologne | 99-999 |
PR | Porto Rico | 99999 |
PT | Portugal | 9999-999 |
PW | Palaos | 99999 |
RE |
Réunion |
99999 |
RO | Roumanie | 999999 |
RU | Fédération de Russie | 999999 |
SE | Suède | 99 99 |
SG | Singapour | 999999 |
SI | Slovénie | 9999 |
SK | Slovaquie | 99 99 |
HM | Saint-Marin | 99999 |
TH | Thaïlande | 99999 |
TR | Turquie | 99999 |
UA | Ukraine | 99999 |
ETATS-UNIS | États-Unis | 99999 |
BUY | Uruguay | 99999 |
VI | Iles Vierges américaines | 99999 |
WF | Wallis-et-Futuna | 99999 |
YT | Mayotte | 99999 |
ZA | Afrique du Sud | 9999 |
Enrichissement des agents utilisateurs
Si vous créez le modèle Account Takeover Insights (ATI), vous devez fournir une variable du type de useragent
variable dans votre jeu de données. Cette variable contient les données du navigateur, de l'appareil et du système d'exploitation d'un événement de connexion. Amazon Fraud Detector enrichit les données utilisateur/agent avec des informations supplémentaires telles que user_agent_family
OS_family
, et. device_family