Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Variables
Las variables representan los elementos de datos que desea utilizar en una predicción de fraude. Estas variables se pueden extraer del conjunto de datos de eventos que preparó para entrenar su modelo, de los resultados de la puntuación de riesgo de su modelo de Amazon Fraud Detector o de SageMaker los modelos de Amazon. Para obtener más información sobre las variables tomadas del conjunto de datos de eventos, consulteObtenga los requisitos del conjunto de datos de eventos mediante el explorador de modelos de datos.
Las variables que desee utilizar en su predicción de fraude deben crearse primero y, a continuación, agregarse al evento al crear su tipo de evento. A cada variable que cree se le debe asignar un tipo de datos, un valor predeterminado y, opcionalmente, un tipo de variable. Amazon Fraud Detector enriquece algunas de las variables que usted proporciona, como las direcciones IP, los números de identificación bancaria (BIN) y los números de teléfono, para crear entradas adicionales y mejorar el rendimiento de los modelos que utilizan estas variables.
Tipos de datos
Las variables deben tener un tipo de datos para el elemento de datos que representa la variable y, opcionalmente, se les puede asignar uno de los predefinidosTipos de variables. Para las variables asignadas a un tipo de variable, el tipo de datos está preseleccionado. Los tipos de datos posibles incluyen los siguientes tipos:
Tipo de datos | Descripción | Valor predeterminado | Valores de ejemplo |
---|---|---|---|
Cadena | Cualquier combinación de letras, números enteros o ambos | <empty> |
abc, 123, 1D3B |
Entero | Números enteros positivos o negativos | 0 | 1, -1 |
Booleano | Verdadero o falso | False | Verdadero, falso |
DateTime | Fecha y hora especificadas únicamente en el formato UTC de la norma ISO 8601 | <empty> | 2019-11-30T 13:01:01 Z |
Float | Números con puntos decimales | 0.0 | 4,01, 0,10 |
Valor predeterminado
Las variables deben tener un valor predeterminado. Cuando Amazon Fraud Detector genera predicciones de fraude, este valor predeterminado se utiliza para ejecutar una regla o un modelo si Amazon Fraud Detector no recibe un valor para una variable. Los valores predeterminados que proporcione deben coincidir con el tipo de datos seleccionado. En la consola de AWS, Amazon Fraud Detector asigna el valor predeterminado 0
para números enteros, false
booleanos, flotantes y (vacío) 0.0
para cadenas. Puede establecer un valor predeterminado personalizado para cualquiera de estos tipos de datos.
Tipos de variables
Al crear una variable, puede asignarla opcionalmente a un tipo de variable. El tipo de variable representa los elementos de datos comunes que se utilizan para entrenar modelos y generar predicciones de fraude. Solo se pueden usar variables con un tipo de variable asociado para el entrenamiento del modelo. Como parte del proceso de entrenamiento del modelo, Amazon Fraud Detector utiliza el tipo de variable asociado a la variable para realizar el enriquecimiento de las variables, la ingeniería de funciones y la puntuación del riesgo.
Amazon Fraud Detector ha predefinido los siguientes tipos de variables que se pueden utilizar para asignarlos a sus variables.
Categoría | Tipo variable | Descripción | Tipo de datos | Ejemplo |
---|---|---|---|---|
Session (Sesión) | IP_ADDRESS | La dirección IP que se recopila durante el evento | Cadena | 192.0.2.0 Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de geolocalización |
AGENTE DE USUARIO | El agente de usuario que se recopila durante el evento | Cadena | Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv:68.0) Gecko 20100101 | |
HUELLA DACTILAR | El identificador único del dispositivo utilizado para el evento | Cadena | sadfow987u234 | |
SESSION_ID | El identificador de sesión de la sesión activa del evento | Cadena | sid123456789 | |
SON_ACREDITACIONES_VALIDAS | Indica si las credenciales utilizadas para el inicio de sesión en el evento son válidas | Booleano | True | |
Usuario | DIRECCIÓN_DE_CORREO | La dirección de correo electrónico que se recopila durante el evento | Cadena | abc@domain.com |
PHONE_NUMBER | El número de teléfono obtenido durante el evento | Cadena | +1 555-0100 Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de números de teléfono |
|
Facturación | NOMBRE_DE_FACTURACIÓN | El nombre asociado a la dirección de facturación | Cadena | John Doe |
TELÉFONO_DE_FACTURACIÓN | El número de teléfono asociado a la dirección de facturación | Cadena | +1 555-0100 Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de números de teléfono |
|
DIRECCIÓN_DE_FACTURACIÓN_L1 | La primera línea de la dirección de facturación | Cadena | Cualquier calle | |
DIRECCIÓN_DE_FACTURACIÓN_L2 | La segunda línea de la dirección de facturación | Cadena | Cualquier unidad 123 | |
BILLING_CITY | La ciudad que aparece en la dirección de facturación | Cadena | Cualquier ciudad | |
ESTADO_DE_FACTURACIÓN | El estado o la provincia que aparece en la dirección de facturación | Cadena | Cualquier estado o provincia | |
PAÍS DE FACTURACIÓN | El país que aparece en la dirección de facturación | Cadena | Cualquier país Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de geolocalización |
|
ZIP DE FACTURACIÓN | El código postal que aparece en la dirección de facturación | Cadena | 01234 Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de geolocalización |
|
Envío | NOMBRE_DE_ENVÍO | El nombre asociado a la dirección de envío | Cadena | John Doe |
TELÉFONO_DE_ENVÍO | El número de teléfono asociado a la dirección de envío | Cadena | +1 555-0100 Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de números de teléfono |
|
DIRECCIÓN_DE_ENVÍO_L1 | La primera línea de la dirección de envío | Cadena | Cualquier Calle 123 | |
DIRECCIÓN_DE_ENVÍO_L2 | La segunda línea de la dirección de envío | Cadena | Unidad 123 | |
CIUDAD_DE_ENVÍO | La ciudad que aparece en la dirección de envío | Cadena | Cualquier ciudad | |
ESTADO_DE_ENVÍO | El estado o la provincia que aparece en la dirección de envío | Cadena | Cualquier estado | |
PAÍS_DE_ENVÍO | El país en el que se encuentra la dirección de envío | Cadena | Cualquier país Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de geolocalización |
|
SHIPPING_ZIP | El código postal que aparece en la dirección de envío | Cadena | 01234 Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de geolocalización |
|
Pago | IDENTIFICADOR DEL PEDIDO | El identificador único de la transacción | Cadena | LUX60 |
PRECIO | El precio total del pedido | Cadena | 560,00 | |
CÓDIGO_DIVISA | El código de divisa ISO 4217 | Cadena | USD | |
TIPO_DE_PAGO | El método de pago que se utiliza para el pago durante el evento | Cadena | Tarjeta de crédito | |
CÓDIGO DE AUTENTICACIÓN | El código alfanumérico que envía el emisor de la tarjeta de crédito o el banco emisor | Cadena | 0000 | |
AVS | El código de respuesta del sistema de verificación de direcciones (AVS) del procesador de la tarjeta | Cadena | Y | |
Producto | CATEGORÍA_DE_PRODUCTO | La categoría de producto del artículo del pedido | Cadena | Cocina |
Personalizado | NUMERIC | Cualquier variable que pueda representarse como un número real | Float | 1.224 |
CATEGÓRICO | Cualquier variable que describa categorías, segmentos o grupos | Cadena | Grande | |
TEXTO_FORMATO_LIBRE | Cualquier texto en formato libre que se capture como parte del evento (por ejemplo, la opinión o el comentario de un cliente) | Cadena | Ejemplo de entrada de texto en formato libre |
Asignación de una variable a un tipo de variable
Si tiene previsto utilizar una variable para entrenar el modelo, es importante que elija el tipo de variable correcto para asignarlo a la variable. La asignación incorrecta del tipo de variable puede afectar negativamente al rendimiento del modelo. También puede resultar muy difícil cambiar la asignación más adelante, especialmente si varios modelos y eventos han utilizado la variable.
Puede asignar a la variable cualquiera de los tipos de variables predefinidos o uno de los tipos de variables personalizadas:FREE_FORM_TEXT
,CATEGORICAL
, oNUMERIC
.
Notas importantes para asignar variables a los tipos de variables correctos
-
Si la variable coincide con uno de los tipos de variables predefinidos, úsela. Asegúrese de que el tipo de variable se corresponde con la variable. Por ejemplo, si asigna una variable ip_address a un tipo de variable, la
EMAIL_ADDRESS
variable ip_address no se enriquecerá con enriquecimientos como ASN, ISP, geolocalización y puntuación de riesgo. Para obtener más información, consulte Enriquecimientos variables. -
Si la variable no coincide con ninguno de los tipos de variables predefinidos, siga las recomendaciones que se indican a continuación para asignar uno de los tipos de variables personalizados.
-
Asigne el tipo de
CATEGORICAL
variable a las variables que normalmente no tienen un orden natural y se pueden clasificar en categorías, segmentos o grupos. El conjunto de datos que utilizas para entrenar tu modelo puede tener variables de ID como merchant_id, campaign_id o policy_id. Estas variables representan grupos (por ejemplo, todos los clientes con el mismo policy_id representan un grupo). A las variables que tengan los siguientes datos se les debe asignar el tipo de variable CATEGÓRICA --
Variables que contienen datos como Customer_ID, Segment_ID, Color_ID, department_code o product_ID.
-
Variables que contienen datos booleanos con valores verdaderos, falsos o nulos.
-
Variables que se pueden clasificar en grupos o categorías, como el nombre de la empresa, la categoría de producto, el tipo de tarjeta o el medio de referencia.
nota
ENTITY_ID
es un tipo de variable reservada que Amazon Fraud Detector utiliza para asignar a la variable ENTITY_ID. La variable ENTITY_ID es el ID de la entidad que inicia la acción que desea evaluar. Si va a crear un tipo de modelo de Transaction Fraud Insight (TFI), debe proporcionar la variable ENTITY_ID. Deberá decidir qué variable de sus datos identifica de forma única a la entidad que inicia la acción y pasarla como variable ENTITY_ID. Asigne el tipo de variable CATEGÓRICA a todos los demás ID de su conjunto de datos, si están presentes y si los está utilizando para el entrenamiento de modelos. Algunos ejemplos de otros identificadores que no son una entidad del conjunto de datos son Merchant_ID, Policy_ID y Campaign_ID. -
-
Asigne el tipo de
FREE_FORM_TEXT
variable a las variables que contienen un bloque de texto. Algunos ejemplos de tipos de variables FREE_FORM_TEXT son las opiniones de los usuarios, los comentarios, las fechas y los códigos de referencia. Los datos FREE_FORM_TEXT contienen varios identificadores separados por un delimitador. Los delimitadores pueden ser cualquier carácter que no sea un símbolo alfanumérico y de subrayado. Por ejemplo, las opiniones y comentarios de los usuarios se pueden separar mediante un delimitador de «espacio», y las fechas y los códigos de referencia pueden utilizar guiones como delimitadores para separar el prefijo, el sufijo y las partes intermedias. Amazon Fraud Detector usa los delimitadores para extraer datos de las variables FREE_FORM_TEXT. -
Asigne el tipo de variable NUMÉRICA a las variables que son números reales y tienen un orden inherente. Algunos ejemplos de variables NUMÉRICAS son day_of_the_week, incident_severity y customer_rating. Si bien puede asignar el tipo de variable CATEGÓRICA a estas variables, se recomienda encarecidamente asignar todas las variables de números reales con un orden inherente al tipo de variable NUMÉRICA.
Enriquecimientos variables
Amazon Fraud Detector enriquece algunos de los elementos de datos sin procesar que usted proporciona, como las direcciones IP, los números de identificación bancaria (BIN) y los números de teléfono, para crear entradas adicionales y mejorar el rendimiento de los modelos que utilizan estos elementos de datos. El enriquecimiento ayuda a identificar situaciones potencialmente sospechosas y ayuda a los modelos a detectar más casos de fraude.
Enriquecimiento de números de teléfono
Amazon Fraud Detector enriquece los datos del número de teléfono con información adicional relacionada con la geolocalización, el operador original y la validez del número de teléfono. El enriquecimiento de números de teléfono se habilita automáticamente para todas las modelos que se capaciten el 13 de diciembre de 2021 o después de esa fecha y que tengan un número de teléfono que incluya un código de país (+xxx). Si has incluido la variable de número de teléfono en tu modelo y la has entrenado antes del 13 de diciembre de 2021, vuelve a entrenar tu modelo para que pueda aprovechar este enriquecimiento.
Le recomendamos encarecidamente que utilice el siguiente formato para las variables de número de teléfono a fin de garantizar que los datos se enriquezcan correctamente.
Variable | Formato | Descripción |
---|---|---|
PHONE_NUMBER | La norma E.164 |
Asegúrese de incluir el código de país (+xxx) con el número de teléfono. |
BILLING_PHONE y SHIPPING_PHONE | La norma E.164 |
Asegúrese de incluir el código de país (+xxx) con el número de teléfono. |
Enriquecimiento de geolocalización
A partir del 8 de febrero de 2022, Amazon Fraud Detector calculará la distancia física entre los valores IP_ADDRESS, BILLING_ZIP y SHIPPING_ZIP que proporcionas para un evento. Las distancias calculadas se utilizan como entradas para su modelo de detección de fraudes.
Para habilitar el enriquecimiento por geolocalización, los datos del evento deben incluir al menos dos de las tres variables: IP_ADDRESS, BILLING_ZIP o SHIPPING_ZIP. Además, cada valor de BILLING_ZIP y SHIPPING_ZIP debe tener un código BILLING_COUNTRY y un código SHIPPING_COUNTRY válidos, respectivamente. Si tiene un modelo que se entrenó antes del 8 de febrero de 2022 e incluye estas variables, debe volver a entrenar el modelo para habilitar el enriquecimiento de la geolocalización.
Si Amazon Fraud Detector no puede determinar la ubicación asociada a los valores IP_ADDRESS, BILLING_ZIP o SHIPPING_ZIP de un evento debido a que los datos no son válidos, se utiliza un valor de marcador de posición especial en su lugar. Por ejemplo, supongamos que un evento tiene valores IP_ADDRESS y BILLING_ZIP válidos, pero el valor SHIPPING_ZIP no lo es. En este caso, el enriquecimiento se realiza únicamente para IP_ADDRES—> BILLING_ZIP. El enriquecimiento no está hecho para IP_ADDRES—>SHIPPING_ZIP y BILLING_ZIP—>SHIPPING_ZIP. En cambio, los valores de los marcadores de posición se utilizan en su lugar. Independientemente de si el enriquecimiento por geolocalización está habilitado para su modelo o no, el rendimiento de su modelo no cambia.
Para excluirse del enriquecimiento por geolocalización, asigne sus variables BILLING_ZIP y SHIPPING_ZIP al tipo de variable CUSTOM_CATEGORICAL. Cambiar el tipo de variable no afecta al rendimiento del modelo.
Formato variable de geolocalización
Le recomendamos encarecidamente que utilice el siguiente formato para las variables de geolocalización a fin de garantizar que los datos de ubicación se enriquezcan correctamente.
Variable | Formato | Descripción |
---|---|---|
IP_ADDRESS | Dirección IPv4 |
Por ejemplo, 1.1.1.1 |
BILLING_ZIP y SHIPPING_ZIP | El código postal ISO 3166-1 alpha-2 |
Para obtener más información, consulte la sección Códigos de país y territorio de este tema. |
BILLING_COUNTRY y SHIPPING_COUNTRY | El código de país estándar de dos letras ISO 3166-1 alpha-2 |
Para obtener más información, consulte la sección Códigos de país y territorio de este tema. Amazon Fraud Detector intenta hacer coincidir todas las variaciones comunes del nombre de un país con su código de país estándar ISO 3166-1 de dos letras. Sin embargo, no podemos garantizar que coincidan correctamente. |
La siguiente tabla proporciona una lista completa de los países y territorios que Amazon Fraud Detector admite para el enriquecimiento de la geolocalización. Cada país y territorio tiene un código de país asignado (específicamente, el código de país de dos letras ISO 3166-1 alfa-2) y un código postal.
Formato de código postal
9 - número
a - letra
[X] - X es opcional. Por ejemplo, «GY9 [9] 9aa» de Guersney significa que tanto «GY9 9aa» como «GY99 9aa» son válidos. Usa un formato.
[X/XX]: se puede utilizar X o XX. Por ejemplo, «aa [aa/99]» de Bermudas significa que tanto «aa aa» como «aa 99" son válidas. Utilice uno de estos formatos, pero no utilice ambos.
Algunos países tienen un prefijo fijo. Por ejemplo, el código postal de Andorra es AD999. Esto significa que el código de país debe empezar con las letras AD seguidas de tres números.
Code | Nombre | Código postal |
---|---|---|
CE | Andorra | ANUNCIO 999 |
AR | Antillas holandesas | 9999 |
AT | Austria | 9999 |
AU | Australia | 9999 |
AZ | Azerbaiyán | COMO 9999 |
BD | Bangladesh | 9999 |
BE | Bélgica | 9999 |
BG | Bulgaria | 9999 |
BM | Bermudas | aa [aa/99] |
BY | Belarús | 999999 |
CA | Canadá | a9a 9a9 |
CH | Suiza | 9999 |
CL | Chile | 9999999 |
CO | Colombia | 999999 |
CR | Costa Rica | 99999 |
CY | Chipre | 9999 |
CZ | Chequia | 999 99 |
DE | Alemania | 99999 |
DK | Dinamarca | 9999 |
DO | República Dominicana | 99999 |
DZ | Argelia | 99999 |
EE | Estonia | 99999 |
ES | España | 99999 |
FI | Finlandia | 99999 |
FM | Estados Federados de Micronesia | 99999 |
FO | Islas Faroe | 999 |
FR | Francia | 99999 |
GB | Reino Unido | [a] 9 [a/9] 9aa |
GG | Guernsey | GY9 [9] 9aa |
GL | Groenlandia | 9999 |
GP | Guadalupe | 99999 |
GT | Guatemala | 99999 |
GU | Guam | 99999 |
HR | Croacia | 99999 |
HU | Hungría | 9999 |
IE | Irlanda | a99 [a/9] [a/9] [a/9] [a/9] |
SOY | Isla de Man | IM9 [9] 9aa |
IN | India | 999999 |
IS | Islandia | 999 |
IT | Italia | 99999 |
JE | Jersey | JE9 [9] 9aa |
JP | Japón | 999-9999 |
KR | República de Corea | 99999 |
LI | Liechtenstein | 9999 |
LK | Sri Lanka | 99999 |
LT | Lituania | 99999 |
LU | Luxemburgo | L-9999 |
LV | Letonia | LV-9999 |
MC | Mónaco | 99999 |
MD | República de Moldova | 9999 |
MH | Islas Marshall | 99999 |
MK | Macedonia del Norte | 9999 |
MAPA | Islas Marianas del Norte | 99999 |
MQ | Martinica | 99999 |
MT | Malta | aaa 9999 |
MX | México | 99999 |
MY | Malasia | 99999 |
NL | Países Bajos | 999 aa |
NO | Noruega | 9999 |
NZ | Nueva Zelanda | 9999 |
PH | Filipinas | 9999 |
PK | Pakistán | 99999 |
PL | Polonia | 99-999 |
PR | Puerto Rico | 99999 |
PT | Portugal | 9999-999 |
PW | Palaos | 99999 |
RE |
Reunión |
99999 |
RO | Rumanía | 999999 |
RU | Federación de Rusia | 999999 |
SE | Suecia | 999 99 |
SG | Singapur | 999999 |
SI | Eslovenia | 9999 |
SK | Eslovaquia | 999 99 |
SM | San Marino | 99999 |
TH | Tailandia | 99999 |
TR | Turquía | 99999 |
UA | Ucrania | 99999 |
EE. UU. | Estados Unidos | 99999 |
UY | Uruguay | 99999 |
VI | Islas Vírgenes (EE. UU.) | 99999 |
WF | Wallis y Futuna | 99999 |
YET | Mayotte | 99999 |
ZA | Sudáfrica | 9999 |
Enriquecimiento de agentes de usuario
Si crea el modelo Account Takeover Insights (ATI), debe proporcionar una variable del tipo de useragent
variable en su conjunto de datos. Esta variable contiene los datos del navegador, el dispositivo y el sistema operativo de un evento de inicio de sesión. Amazon Fraud Detector enriquece los datos del agente de usuario con información adicional user_agent_family
OS_family
, como, y. device_family