Variables - Amazon Fraud Detector

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Variables

Las variables representan los elementos de datos que desea utilizar en una predicción de fraude. Estas variables se pueden extraer del conjunto de datos de eventos que preparó para entrenar su modelo, de los resultados de la puntuación de riesgo de su modelo de Amazon Fraud Detector o de SageMaker los modelos de Amazon. Para obtener más información sobre las variables tomadas del conjunto de datos de eventos, consulteObtenga los requisitos del conjunto de datos de eventos mediante el explorador de modelos de datos.

Las variables que desee utilizar en su predicción de fraude deben crearse primero y, a continuación, agregarse al evento al crear su tipo de evento. A cada variable que cree se le debe asignar un tipo de datos, un valor predeterminado y, opcionalmente, un tipo de variable. Amazon Fraud Detector enriquece algunas de las variables que usted proporciona, como las direcciones IP, los números de identificación bancaria (BIN) y los números de teléfono, para crear entradas adicionales y mejorar el rendimiento de los modelos que utilizan estas variables.

Tipos de datos

Las variables deben tener un tipo de datos para el elemento de datos que representa la variable y, opcionalmente, se les puede asignar uno de los predefinidosTipos de variables. Para las variables asignadas a un tipo de variable, el tipo de datos está preseleccionado. Los tipos de datos posibles incluyen los siguientes tipos:

Tipo de datos Descripción Valor predeterminado Valores de ejemplo
Cadena Cualquier combinación de letras, números enteros o ambos <empty>

abc, 123, 1D3B

Entero Números enteros positivos o negativos 0 1, -1
Booleano Verdadero o falso False Verdadero, falso
DateTime Fecha y hora especificadas únicamente en el formato UTC de la norma ISO 8601 <empty> 2019-11-30T 13:01:01 Z
Float Números con puntos decimales 0.0 4,01, 0,10

Valor predeterminado

Las variables deben tener un valor predeterminado. Cuando Amazon Fraud Detector genera predicciones de fraude, este valor predeterminado se utiliza para ejecutar una regla o un modelo si Amazon Fraud Detector no recibe un valor para una variable. Los valores predeterminados que proporcione deben coincidir con el tipo de datos seleccionado. En la consola de AWS, Amazon Fraud Detector asigna el valor predeterminado 0 para números enteros, false booleanos, flotantes y (vacío) 0.0 para cadenas. Puede establecer un valor predeterminado personalizado para cualquiera de estos tipos de datos.

Tipos de variables

Al crear una variable, puede asignarla opcionalmente a un tipo de variable. El tipo de variable representa los elementos de datos comunes que se utilizan para entrenar modelos y generar predicciones de fraude. Solo se pueden usar variables con un tipo de variable asociado para el entrenamiento del modelo. Como parte del proceso de entrenamiento del modelo, Amazon Fraud Detector utiliza el tipo de variable asociado a la variable para realizar el enriquecimiento de las variables, la ingeniería de funciones y la puntuación del riesgo.

Amazon Fraud Detector ha predefinido los siguientes tipos de variables que se pueden utilizar para asignarlos a sus variables.

Categoría Tipo variable Descripción Tipo de datos Ejemplo
Session (Sesión) IP_ADDRESS La dirección IP que se recopila durante el evento Cadena 192.0.2.0

Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de geolocalización

AGENTE DE USUARIO El agente de usuario que se recopila durante el evento Cadena Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv:68.0) Gecko 20100101
HUELLA DACTILAR El identificador único del dispositivo utilizado para el evento Cadena sadfow987u234
SESSION_ID El identificador de sesión de la sesión activa del evento Cadena sid123456789
SON_ACREDITACIONES_VALIDAS Indica si las credenciales utilizadas para el inicio de sesión en el evento son válidas Booleano True
Usuario DIRECCIÓN_DE_CORREO La dirección de correo electrónico que se recopila durante el evento Cadena abc@domain.com
PHONE_NUMBER El número de teléfono obtenido durante el evento Cadena +1 555-0100

Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de números de teléfono

Facturación NOMBRE_DE_FACTURACIÓN El nombre asociado a la dirección de facturación Cadena John Doe
TELÉFONO_DE_FACTURACIÓN El número de teléfono asociado a la dirección de facturación Cadena +1 555-0100

Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de números de teléfono

DIRECCIÓN_DE_FACTURACIÓN_L1 La primera línea de la dirección de facturación Cadena Cualquier calle
DIRECCIÓN_DE_FACTURACIÓN_L2 La segunda línea de la dirección de facturación Cadena Cualquier unidad 123
BILLING_CITY La ciudad que aparece en la dirección de facturación Cadena Cualquier ciudad
ESTADO_DE_FACTURACIÓN El estado o la provincia que aparece en la dirección de facturación Cadena Cualquier estado o provincia
PAÍS DE FACTURACIÓN El país que aparece en la dirección de facturación Cadena Cualquier país

Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de geolocalización

ZIP DE FACTURACIÓN El código postal que aparece en la dirección de facturación Cadena 01234

Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de geolocalización

Envío NOMBRE_DE_ENVÍO El nombre asociado a la dirección de envío Cadena John Doe
TELÉFONO_DE_ENVÍO El número de teléfono asociado a la dirección de envío Cadena +1 555-0100

Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de números de teléfono

DIRECCIÓN_DE_ENVÍO_L1 La primera línea de la dirección de envío Cadena Cualquier Calle 123
DIRECCIÓN_DE_ENVÍO_L2 La segunda línea de la dirección de envío Cadena Unidad 123
CIUDAD_DE_ENVÍO La ciudad que aparece en la dirección de envío Cadena Cualquier ciudad
ESTADO_DE_ENVÍO El estado o la provincia que aparece en la dirección de envío Cadena Cualquier estado
PAÍS_DE_ENVÍO El país en el que se encuentra la dirección de envío Cadena Cualquier país

Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de geolocalización

SHIPPING_ZIP El código postal que aparece en la dirección de envío Cadena 01234

Nota: Amazon Fraud Detector enriquece estos datos. Para obtener más información, consulte Enriquecimiento de geolocalización

Pago IDENTIFICADOR DEL PEDIDO El identificador único de la transacción Cadena LUX60
PRECIO El precio total del pedido Cadena 560,00
CÓDIGO_DIVISA El código de divisa ISO 4217 Cadena USD
TIPO_DE_PAGO El método de pago que se utiliza para el pago durante el evento Cadena Tarjeta de crédito
CÓDIGO DE AUTENTICACIÓN El código alfanumérico que envía el emisor de la tarjeta de crédito o el banco emisor Cadena 0000
AVS El código de respuesta del sistema de verificación de direcciones (AVS) del procesador de la tarjeta Cadena Y
Producto CATEGORÍA_DE_PRODUCTO La categoría de producto del artículo del pedido Cadena Cocina
Personalizado NUMERIC Cualquier variable que pueda representarse como un número real Float 1.224
CATEGÓRICO Cualquier variable que describa categorías, segmentos o grupos Cadena Grande
TEXTO_FORMATO_LIBRE Cualquier texto en formato libre que se capture como parte del evento (por ejemplo, la opinión o el comentario de un cliente) Cadena Ejemplo de entrada de texto en formato libre

Asignación de una variable a un tipo de variable

Si tiene previsto utilizar una variable para entrenar el modelo, es importante que elija el tipo de variable correcto para asignarlo a la variable. La asignación incorrecta del tipo de variable puede afectar negativamente al rendimiento del modelo. También puede resultar muy difícil cambiar la asignación más adelante, especialmente si varios modelos y eventos han utilizado la variable.

Puede asignar a la variable cualquiera de los tipos de variables predefinidos o uno de los tipos de variables personalizadas:FREE_FORM_TEXT,CATEGORICAL, oNUMERIC.

Notas importantes para asignar variables a los tipos de variables correctos

  1. Si la variable coincide con uno de los tipos de variables predefinidos, úsela. Asegúrese de que el tipo de variable se corresponde con la variable. Por ejemplo, si asigna una variable ip_address a un tipo de variable, la EMAIL_ADDRESS variable ip_address no se enriquecerá con enriquecimientos como ASN, ISP, geolocalización y puntuación de riesgo. Para obtener más información, consulte Enriquecimientos variables.

  2. Si la variable no coincide con ninguno de los tipos de variables predefinidos, siga las recomendaciones que se indican a continuación para asignar uno de los tipos de variables personalizados.

  3. Asigne el tipo de CATEGORICAL variable a las variables que normalmente no tienen un orden natural y se pueden clasificar en categorías, segmentos o grupos. El conjunto de datos que utilizas para entrenar tu modelo puede tener variables de ID como merchant_id, campaign_id o policy_id. Estas variables representan grupos (por ejemplo, todos los clientes con el mismo policy_id representan un grupo). A las variables que tengan los siguientes datos se les debe asignar el tipo de variable CATEGÓRICA -

    • Variables que contienen datos como Customer_ID, Segment_ID, Color_ID, department_code o product_ID.

    • Variables que contienen datos booleanos con valores verdaderos, falsos o nulos.

    • Variables que se pueden clasificar en grupos o categorías, como el nombre de la empresa, la categoría de producto, el tipo de tarjeta o el medio de referencia.

    nota

    ENTITY_IDes un tipo de variable reservada que Amazon Fraud Detector utiliza para asignar a la variable ENTITY_ID. La variable ENTITY_ID es el ID de la entidad que inicia la acción que desea evaluar. Si va a crear un tipo de modelo de Transaction Fraud Insight (TFI), debe proporcionar la variable ENTITY_ID. Deberá decidir qué variable de sus datos identifica de forma única a la entidad que inicia la acción y pasarla como variable ENTITY_ID. Asigne el tipo de variable CATEGÓRICA a todos los demás ID de su conjunto de datos, si están presentes y si los está utilizando para el entrenamiento de modelos. Algunos ejemplos de otros identificadores que no son una entidad del conjunto de datos son Merchant_ID, Policy_ID y Campaign_ID.

  4. Asigne el tipo de FREE_FORM_TEXT variable a las variables que contienen un bloque de texto. Algunos ejemplos de tipos de variables FREE_FORM_TEXT son las opiniones de los usuarios, los comentarios, las fechas y los códigos de referencia. Los datos FREE_FORM_TEXT contienen varios identificadores separados por un delimitador. Los delimitadores pueden ser cualquier carácter que no sea un símbolo alfanumérico y de subrayado. Por ejemplo, las opiniones y comentarios de los usuarios se pueden separar mediante un delimitador de «espacio», y las fechas y los códigos de referencia pueden utilizar guiones como delimitadores para separar el prefijo, el sufijo y las partes intermedias. Amazon Fraud Detector usa los delimitadores para extraer datos de las variables FREE_FORM_TEXT.

  5. Asigne el tipo de variable NUMÉRICA a las variables que son números reales y tienen un orden inherente. Algunos ejemplos de variables NUMÉRICAS son day_of_the_week, incident_severity y customer_rating. Si bien puede asignar el tipo de variable CATEGÓRICA a estas variables, se recomienda encarecidamente asignar todas las variables de números reales con un orden inherente al tipo de variable NUMÉRICA.

Enriquecimientos variables

Amazon Fraud Detector enriquece algunos de los elementos de datos sin procesar que usted proporciona, como las direcciones IP, los números de identificación bancaria (BIN) y los números de teléfono, para crear entradas adicionales y mejorar el rendimiento de los modelos que utilizan estos elementos de datos. El enriquecimiento ayuda a identificar situaciones potencialmente sospechosas y ayuda a los modelos a detectar más casos de fraude.

Enriquecimiento de números de teléfono

Amazon Fraud Detector enriquece los datos del número de teléfono con información adicional relacionada con la geolocalización, el operador original y la validez del número de teléfono. El enriquecimiento de números de teléfono se habilita automáticamente para todas las modelos que se capaciten el 13 de diciembre de 2021 o después de esa fecha y que tengan un número de teléfono que incluya un código de país (+xxx). Si has incluido la variable de número de teléfono en tu modelo y la has entrenado antes del 13 de diciembre de 2021, vuelve a entrenar tu modelo para que pueda aprovechar este enriquecimiento.

Le recomendamos encarecidamente que utilice el siguiente formato para las variables de número de teléfono a fin de garantizar que los datos se enriquezcan correctamente.

Variable Formato Descripción
PHONE_NUMBER La norma E.164 Asegúrese de incluir el código de país (+xxx) con el número de teléfono.
BILLING_PHONE y SHIPPING_PHONE La norma E.164 Asegúrese de incluir el código de país (+xxx) con el número de teléfono.

Enriquecimiento de geolocalización

A partir del 8 de febrero de 2022, Amazon Fraud Detector calculará la distancia física entre los valores IP_ADDRESS, BILLING_ZIP y SHIPPING_ZIP que proporcionas para un evento. Las distancias calculadas se utilizan como entradas para su modelo de detección de fraudes.

Para habilitar el enriquecimiento por geolocalización, los datos del evento deben incluir al menos dos de las tres variables: IP_ADDRESS, BILLING_ZIP o SHIPPING_ZIP. Además, cada valor de BILLING_ZIP y SHIPPING_ZIP debe tener un código BILLING_COUNTRY y un código SHIPPING_COUNTRY válidos, respectivamente. Si tiene un modelo que se entrenó antes del 8 de febrero de 2022 e incluye estas variables, debe volver a entrenar el modelo para habilitar el enriquecimiento de la geolocalización.

Si Amazon Fraud Detector no puede determinar la ubicación asociada a los valores IP_ADDRESS, BILLING_ZIP o SHIPPING_ZIP de un evento debido a que los datos no son válidos, se utiliza un valor de marcador de posición especial en su lugar. Por ejemplo, supongamos que un evento tiene valores IP_ADDRESS y BILLING_ZIP válidos, pero el valor SHIPPING_ZIP no lo es. En este caso, el enriquecimiento se realiza únicamente para IP_ADDRES—> BILLING_ZIP. El enriquecimiento no está hecho para IP_ADDRES—>SHIPPING_ZIP y BILLING_ZIP—>SHIPPING_ZIP. En cambio, los valores de los marcadores de posición se utilizan en su lugar. Independientemente de si el enriquecimiento por geolocalización está habilitado para su modelo o no, el rendimiento de su modelo no cambia.

Para excluirse del enriquecimiento por geolocalización, asigne sus variables BILLING_ZIP y SHIPPING_ZIP al tipo de variable CUSTOM_CATEGORICAL. Cambiar el tipo de variable no afecta al rendimiento del modelo.

Formato variable de geolocalización

Le recomendamos encarecidamente que utilice el siguiente formato para las variables de geolocalización a fin de garantizar que los datos de ubicación se enriquezcan correctamente.

Variable Formato Descripción
IP_ADDRESS Dirección IPv4 Por ejemplo, 1.1.1.1
BILLING_ZIP y SHIPPING_ZIP El código postal ISO 3166-1 alpha-2 del país especificado Para obtener más información, consulte la sección Códigos de país y territorio de este tema.
BILLING_COUNTRY y SHIPPING_COUNTRY El código de país estándar de dos letras ISO 3166-1 alpha-2 Para obtener más información, consulte la sección Códigos de país y territorio de este tema. Amazon Fraud Detector intenta hacer coincidir todas las variaciones comunes del nombre de un país con su código de país estándar ISO 3166-1 de dos letras. Sin embargo, no podemos garantizar que coincidan correctamente.

La siguiente tabla proporciona una lista completa de los países y territorios que Amazon Fraud Detector admite para el enriquecimiento de la geolocalización. Cada país y territorio tiene un código de país asignado (específicamente, el código de país de dos letras ISO 3166-1 alfa-2) y un código postal.

Formato de código postal

  • 9 - número

  • a - letra

  • [X] - X es opcional. Por ejemplo, «GY9 [9] 9aa» de Guersney significa que tanto «GY9 9aa» como «GY99 9aa» son válidos. Usa un formato.

  • [X/XX]: se puede utilizar X o XX. Por ejemplo, «aa [aa/99]» de Bermudas significa que tanto «aa aa» como «aa 99" son válidas. Utilice uno de estos formatos, pero no utilice ambos.

  • Algunos países tienen un prefijo fijo. Por ejemplo, el código postal de Andorra es AD999. Esto significa que el código de país debe empezar con las letras AD seguidas de tres números.

Code Nombre Código postal
CE Andorra ANUNCIO 999
AR Antillas holandesas 9999
AT Austria 9999
AU Australia 9999
AZ Azerbaiyán COMO 9999
BD Bangladesh 9999
BE Bélgica 9999
BG Bulgaria 9999
BM Bermudas aa [aa/99]
BY Belarús 999999
CA Canadá a9a 9a9
CH Suiza 9999
CL Chile 9999999
CO Colombia 999999
CR Costa Rica 99999
CY Chipre 9999
CZ Chequia 999 99
DE Alemania 99999
DK Dinamarca 9999
DO República Dominicana 99999
DZ Argelia 99999
EE Estonia 99999
ES España 99999
FI Finlandia 99999
FM Estados Federados de Micronesia 99999
FO Islas Faroe 999
FR Francia 99999
GB Reino Unido [a] 9 [a/9] 9aa
GG Guernsey GY9 [9] 9aa
GL Groenlandia 9999
GP Guadalupe 99999
GT Guatemala 99999
GU Guam 99999
HR Croacia 99999
HU Hungría 9999
IE Irlanda a99 [a/9] [a/9] [a/9] [a/9]
SOY Isla de Man IM9 [9] 9aa
IN India 999999
IS Islandia 999
IT Italia 99999
JE Jersey JE9 [9] 9aa
JP Japón 999-9999
KR República de Corea 99999
LI Liechtenstein 9999
LK Sri Lanka 99999
LT Lituania 99999
LU Luxemburgo L-9999
LV Letonia LV-9999
MC Mónaco 99999
MD República de Moldova 9999
MH Islas Marshall 99999
MK Macedonia del Norte 9999
MAPA Islas Marianas del Norte 99999
MQ Martinica 99999
MT Malta aaa 9999
MX México 99999
MY Malasia 99999
NL Países Bajos 999 aa
NO Noruega 9999
NZ Nueva Zelanda 9999
PH Filipinas 9999
PK Pakistán 99999
PL Polonia 99-999
PR Puerto Rico 99999
PT Portugal 9999-999
PW Palaos 99999
RE

Reunión

99999
RO Rumanía 999999
RU Federación de Rusia 999999
SE Suecia 999 99
SG Singapur 999999
SI Eslovenia 9999
SK Eslovaquia 999 99
SM San Marino 99999
TH Tailandia 99999
TR Turquía 99999
UA Ucrania 99999
EE. UU. Estados Unidos 99999
UY Uruguay 99999
VI Islas Vírgenes (EE. UU.) 99999
WF Wallis y Futuna 99999
YET Mayotte 99999
ZA Sudáfrica 9999

Enriquecimiento de agentes de usuario

Si crea el modelo Account Takeover Insights (ATI), debe proporcionar una variable del tipo de useragent variable en su conjunto de datos. Esta variable contiene los datos del navegador, el dispositivo y el sistema operativo de un evento de inicio de sesión. Amazon Fraud Detector enriquece los datos del agente de usuario con información adicional user_agent_familyOS_family, como, y. device_family