Variáveis - Amazon Fraud Detector

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Variáveis

As variáveis representam elementos de dados que você deseja usar em uma previsão de fraude. Essas variáveis podem ser obtidas do conjunto de dados de eventos que você preparou para treinar seu modelo, dos resultados de pontuação de risco do modelo Amazon Fraud Detector ou dos modelos de SageMaker IA da Amazon. Para obter mais informações sobre variáveis retiradas do conjunto de dados do evento, consulteObtenha os requisitos do conjunto de dados de eventos usando o Data models explorer.

As variáveis que você deseja usar em sua previsão de fraude devem primeiro ser criadas e depois adicionadas ao evento ao criar seu tipo de evento. Cada variável criada deve ser atribuída a um tipo de dados, um valor padrão e, opcionalmente, um tipo de variável. O Amazon Fraud Detector enriquece algumas das variáveis que você fornece, como endereços IP, números de identificação bancária (BINs) e números de telefone, para criar entradas adicionais e aumentar o desempenho dos modelos que usam essas variáveis.

Tipos de dados

As variáveis devem ter um tipo de dados para o elemento de dados que a variável representa e, opcionalmente, podem ser atribuídas a um dos predefinidosTipos de variáveis. Para variáveis atribuídas a um tipo de variável, o tipo de dados é pré-selecionado. Os tipos de dados possíveis incluem os seguintes tipos:

Tipo de dados Descrição Valor padrão Exemplos de valores
String Qualquer combinação de letras, números inteiros ou ambos <empty>

abc, 123, 13DB

Inteiro Números inteiros positivos ou negativos 0 1, -1
Booliano Verdadeiro ou falso Falso True, False
DateTime Data e hora especificadas somente no formato UTC padrão ISO 8601 <empty> 2019-11-30T 13:01:01 Z
Float Números com pontos decimais 0.0 4,01, 0,10

Valor padrão

As variáveis devem ter um valor padrão. Quando o Amazon Fraud Detector gera previsões de fraude, esse valor padrão é usado para executar uma regra ou modelo se o Amazon Fraud Detector não receber um valor para uma variável. Os valores padrão fornecidos devem corresponder ao tipo de dados selecionado. No Console da AWS, o Amazon Fraud Detector atribui o valor padrão de 0 para números inteiros, false para booleanos, 0.0 para flutuantes e (vazio) para cadeias de caracteres. Você pode definir um valor padrão personalizado para qualquer um desses tipos de dados.

Tipos de variáveis

Ao criar uma variável, você pode, opcionalmente, atribuir a variável a um tipo de variável. O tipo de variável representa os elementos de dados comuns usados para treinar modelos e gerar previsões de fraudes. Somente variáveis com um tipo de variável associado podem ser usadas para treinamento de modelos. Como parte do processo de treinamento do modelo, o Amazon Fraud Detector usa o tipo de variável associado à variável para realizar enriquecimentos variáveis, engenharia de recursos e pontuação de risco.

O Amazon Fraud Detector predefiniu os seguintes tipos de variáveis que podem ser usados para atribuir às suas variáveis.

Categoria Tipo de variável Descrição Tipo de dados Exemplo
Sessão IP_ADDRESS O endereço IP coletado durante o evento String 192.0.2.0

Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento de geolocalização

AGENTE DE USUÁRIO O agente do usuário que é coletado durante o evento String Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv: 68.0) Gecko 20100101
IMPRESSÃO DIGITAL O identificador exclusivo de um dispositivo usado para o evento String sadfow987u234
SESSION_ID O ID da sessão ativa do evento String sid:123456789
AS CREDENCIAIS SÃO VÁLIDAS Indica se as credenciais usadas para o login do evento são válidas Booliano Verdadeiro
Usuário ENDEREÇO_E-MAIL O endereço de e-mail coletado durante o evento String abc@domain.com
PHONE_NUMBER O número de telefone coletado durante o evento String +1 555-0100

Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento do número de telefone

Faturamento NOME_DE_COBRANÇA O nome associado ao endereço de cobrança String John Doe
TELEFONE_DE COBRANÇA O número de telefone associado ao endereço de cobrança String +1 555-0100

Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento do número de telefone

ENDEREÇO_DE_COBRANÇA_L1 A primeira linha do endereço de cobrança String Qualquer rua
ENDEREÇO_DE_COBRANÇA_L2 A segunda linha do endereço de cobrança String Qualquer unidade 123
CIDADE_FATURAMENTO A cidade que está no endereço de cobrança String Qualquer cidade
ESTADO_DE_COBRANÇA O estado ou província que está no endereço de cobrança String Qualquer estado ou província
PAÍS_DE COBRANÇA O país que está no endereço de cobrança String Qualquer país

Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento de geolocalização

ZIP DE FATURAMENTO O código postal que está no endereço de cobrança String 01234

Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento de geolocalização

Remessa NOME_DO_ENVIO O nome associado ao endereço de entrega String John Doe
TELEFONE_DE ENVIO O número de telefone associado ao endereço de entrega String +1 555-0100

Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento do número de telefone

ENDEREÇO_DE_ENVIO_L1 A primeira linha do endereço de entrega String 123 Any Street
ENDEREÇO_DE_ENVIO_L2 A segunda linha do endereço de entrega String Unidade 123
CIDADE_EXPEDIÇÃO A cidade que está no endereço de entrega String Qualquer cidade
ESTADO_DE_ENVIO O estado ou província que está no endereço de entrega String Qualquer estado
PAÍS DE ENVIO O país em que está está no endereço de entrega String Qualquer país

Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento de geolocalização

ZIP DE ENVIO O código postal que está no endereço de entrega String 01234

Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento de geolocalização

Pagamento ID_DO_PEDIDO O identificador exclusivo da transação String LUX60
PREÇO O preço total do pedido String 560,00
CÓDIGO_MOEDA O código monetário ISO 4217 String USD
TIPO_DE-PAGAMENTO A forma de pagamento usada para pagamento durante o evento String Cartão de crédito
CÓDIGO_AUTENTICAÇÃO O código alfanumérico enviado pelo emissor do cartão de crédito ou pelo banco emissor String 0000
AVS O código de resposta do sistema de verificação de endereço (AVS) do processador do cartão String S
Produto CATEGORIA_PRODUTO A categoria do produto do item do pedido String Cozinha
Personalizado NUMERIC Qualquer variável que possa ser representada como um número real Float 1.224
CATEGORICAL Qualquer variável que descreva categorias, segmentos ou grupos String Grande
TEXTO_DE_FORMATO LIVRE Qualquer texto de formato livre capturado como parte do evento (por exemplo, uma avaliação ou comentário de um cliente) String Exemplo de uma entrada de texto de formato livre

Atribuição de variável a um tipo de variável

Se você planeja usar uma variável para treinar seu modelo, é importante escolher o tipo certo de variável para atribuir à variável. A atribuição incorreta do tipo de variável pode afetar negativamente o desempenho do modelo. Também pode ser muito difícil alterar a atribuição posteriormente, especialmente se vários modelos e eventos tiverem usado a variável.

Você pode atribuir à sua variável qualquer um dos tipos de variáveis predefinidos ou um dos tipos de variáveis personalizadas —FREE_FORM_TEXT,CATEGORICAL, ouNUMERIC.

Notas importantes para atribuir variáveis aos tipos de variáveis corretos

  1. Se a variável corresponder a um dos tipos de variáveis predefinidos, use-a. Certifique-se de que o tipo de variável corresponda à variável. Por exemplo, se você atribuir uma variável ip_address ao tipo de variável, a EMAIL_ADDRESS variável ip_address não será enriquecida com enriquecimentos como ASN, ISP, localização geográfica e pontuação de risco. Para obter mais informações, consulte Enriquecimentos variáveis.

  2. Se a variável não corresponder a nenhum dos tipos de variáveis predefinidos, siga as recomendações listadas abaixo para atribuir um dos tipos de variáveis personalizados.

  3. Atribua o tipo de CATEGORICAL variável a variáveis que normalmente não têm ordenação natural e podem ser colocadas em categorias, segmentos ou grupos. O conjunto de dados que você está usando para treinar seu modelo pode ter variáveis de ID, como merchant_id, campaign_id ou policy_id. Essas variáveis representam grupos (por exemplo, todos os clientes com o mesmo policy_id representam um grupo). As variáveis que têm os seguintes dados devem ser atribuídas ao tipo de variável CATEGÓRICA -

    • Variáveis que contêm dados como Customer_ID, Segment_ID, Color_ID, department_code ou Product_ID.

    • Variáveis que contêm dados booleanos com valores verdadeiros, falsos ou nulos.

    • Variáveis que podem ser colocadas em grupos ou categorias, como nome da empresa, categoria do produto, tipo de cartão ou meio de referência.

    nota

    ENTITY_IDé um tipo de variável reservada usado pelo Amazon Fraud Detector para atribuir à variável ENTITY_ID. A variável ENTITY_ID é a ID da entidade que está iniciando a ação que você deseja avaliar. Se você estiver criando um tipo de modelo do Transaction Fraud Insight (TFI), deverá fornecer a variável ENTITY_ID. Você precisará decidir qual variável em seus dados identifica exclusivamente a entidade que está iniciando a ação e passá-la como variável ENTITY_ID. Atribua o tipo de variável CATEGÓRICA a todas as outras IDs em seu conjunto de dados, se elas estiverem presentes e se você as estiver usando para treinamento de modelos. Exemplos de outras IDs que não são uma entidade em seu conjunto de dados podem ser Merchant_ID, Policy_ID e Campaign_ID.

  4. Atribua o tipo de FREE_FORM_TEXT variável às variáveis que contêm um bloco de texto. Exemplos de tipos de variáveis FREE_FORM_TEXT são: avaliações de usuários, comentários, datas e códigos de referência. Os dados FREE_FORM_TEXT contêm vários tokens separados por um delimitador. Os delimitadores podem ser qualquer caractere que não seja o símbolo alfanumérico e de sublinhado. Por exemplo, avaliações e comentários de usuários podem ser separados por delimitador de “espaço”, datas e códigos de referência podem usar hífens como delimitadores para separar prefixo, sufixo e partes intermediárias. O Amazon Fraud Detector usa os delimitadores para extrair dados das variáveis FREE_FORM_TEXT.

  5. Atribua o tipo de variável NUMERIC a variáveis que sejam números reais e tenham ordenação inerente. Exemplos de variáveis NUMÉRICAS incluem day_of_the_week, incident_severity, customer_rating. Embora você possa atribuir o tipo de variável CATEGÓRICA a essas variáveis, é altamente recomendável atribuir todas as variáveis de números reais com ordem inerente ao tipo de variável NUMERIC.

Enriquecimentos variáveis

O Amazon Fraud Detector enriquece alguns dos elementos de dados brutos que você fornece, como endereços IP, números de identificação bancária (BINs) e números de telefone, para criar entradas adicionais e aumentar o desempenho dos modelos que usam esses elementos de dados. O enriquecimento ajuda a identificar situações potencialmente suspeitas e ajuda os modelos a capturar mais fraudes.

Enriquecimento do número de telefone

O Amazon Fraud Detector enriquece os dados do número de telefone com informações adicionais relacionadas à geolocalização, à operadora original e à validade do número de telefone. O enriquecimento do número de telefone é ativado automaticamente para todos os modelos treinados em ou após 13 de dezembro de 2021 e que tenham um número de telefone que inclua um código de país (+xxx). Se você incluiu a variável de número de telefone em seu modelo e a treinou antes de 13 de dezembro de 2021, treine novamente seu modelo para que ele possa aproveitar esse enriquecimento.

É altamente recomendável que você use o seguinte formato para variáveis de número de telefone para garantir que seus dados sejam enriquecidos com sucesso.

Variável Formato Descrição
PHONE_NUMBER O padrão E.164 Certifique-se de incluir o código do país (+xxx) com o número de telefone.
BILLING_PHONE e SHIPPING_PHONE O padrão E.164 Certifique-se de incluir o código do país (+xxx) com o número de telefone.

Enriquecimento de geolocalização

A partir de 8 de fevereiro de 2022, o Amazon Fraud Detector calcula a distância física entre os valores IP_ADDRESS, BILLING_ZIP e SHIPPING_ZIP que você fornece para um evento. As distâncias calculadas são usadas como entradas para seu modelo de detecção de fraudes.

Para permitir o enriquecimento da geolocalização, os dados do evento devem incluir pelo menos duas das três variáveis: IP_ADDRESS, BILLING_ZIP ou SHIPPING_ZIP. Além disso, cada valor BILLING_ZIP e SHIPPING_ZIP deve ter um código BILLING_COUNTRY e um código SHIPPING_COUNTRY válidos, respectivamente. Se você tem um modelo que foi treinado antes de 8 de fevereiro de 2022 e inclui essas variáveis, você deve treinar novamente o modelo para permitir o enriquecimento da geolocalização.

Se o Amazon Fraud Detector não conseguir determinar a localização associada aos valores IP_ADDRESS, BILLING_ZIP ou SHIPPING_ZIP de um evento devido à invalidade dos dados, um valor especial será usado em vez disso. Por exemplo, suponha que um evento tenha valores válidos de IP_ADDRESS e BILLING_ZIP, mas o valor SHIPPING_ZIP não seja válido. Nesse caso, o enriquecimento é feito somente para IP_ADDRESS—> BILLING_ZIP. O enriquecimento não é feito para IP_ADDRESS—>SHIPPING_ZIP e BILLING_ZIP—>SHIPPING_ZIP. Em vez disso, os valores do espaço reservado são usados em seu lugar. Não importa se o enriquecimento de geolocalização está habilitado para seu modelo ou não, o desempenho do seu modelo não muda.

Você pode desativar o enriquecimento da geolocalização mapeando suas variáveis BILLING_ZIP e SHIPPING_ZIP para o tipo de variável CUSTOM_CATEGORICAL. Alterar o tipo de variável não afeta o desempenho do seu modelo.

Formato de variável de geolocalização

É altamente recomendável que você use o seguinte formato para variáveis de geolocalização para garantir que seus dados de localização sejam enriquecidos com sucesso.

Variável Formato Descrição
IP_ADDRESS IPv4endereço Por exemplo - 1.1.1.1
BILLING_ZIP e SHIPPING_ZIP O código postal ISO 3166-1 alfa-2 para o país especificado Para obter mais informações, consulte a seção Códigos de país e território neste tópico.
COUNTRY_COUNTRY e SHIPPING_COUNTRY O código de país padrão de duas letras ISO 3166-1 alfa-2 Para obter mais informações, consulte a seção Códigos de país e território neste tópico. O Amazon Fraud Detector tenta combinar todas as variações comuns do nome de um país com o código de país padrão de duas letras ISO 3166-1. No entanto, não podemos garantir que eles sejam combinados corretamente.

A tabela a seguir fornece uma lista completa dos países e territórios que são suportados pelo Amazon Fraud Detector para enriquecimento de geolocalização. Cada país e território tem um código de país atribuído (especificamente, o código de país de duas letras ISO 3166-1 alfa-2) e um código postal.

Formato de código postal

  • 9 - número

  • a - letra

  • [X] - X é opcional. Por exemplo, Guersney "GY9[9] 9aa” significa que tanto "9aa” quanto "GY9 9aa” são válidos. GY99 Use um formato.

  • [X/XX] - X ou XX podem ser usados. Por exemplo, Bermudas “aa [aa/99]” significa que tanto “aa aa” quanto “aa 99" são válidos. Use qualquer um desses formatos, mas não use os dois.

  • Alguns países têm prefixo fixo. Por exemplo, o código postal de AD999 Andorra é. Isso significa que o código do país deve começar com as letras AD seguidas por três números.

Código Name CEP
AD Andorra AD999
AR Antilhas Holandesas 9999
AT Áustria 9999
AU Austrália 9999
AZ Azerbaijão Z 9999
BD Bangladesh 9999
BE Bélgica 9999
BG Bulgária 9999
BM Bermudas aa [aa/99]
BY Bielorrússia 999999
CA Canadá a9a 9a9
CH Suíça 9999
CL Chile 9999999
CO Colômbia 999999
CR Costa Rica 99999
CY Chipre 9999
CZ Tchéquia 999 99
DE Alemanha 99999
DK Dinamarca 9999
DO República Dominicana 99999
DZ Argélia 99999
EE Estônia 99999
ES Espanha 99999
FI Finlândia 99999
FM Estados Federados da Micronésia 99999
FO Ilhas Faroe 999
FR França 99999
GB Reino Unido [a] 9 [a/9] 9aa
GG Guernsey GY9[9] 9aa
GL Groenlândia 9999
GP Guadalupe 99999
GT Guatemala 99999
GU Guam 99999
HR Croácia 99999
HU Hungria 9999
IE Irlanda a99 [a/9] [a/9] [a/9] [a/9]
IM Ilha de Man IM9[9] 9aa
IN Índia 999999
IS Islândia 999
IT Itália 99999
JE Jérsei JE9[9] 9aa
JP Japão 999-9999
KR República da Coreia 99999
LI Liechtenstein 9999
LK Sri Lanka 99999
LT Lituânia 99999
LU Luxemburgo L-9999
LV Letônia LV-9999
MC Mônaco 99999
MD República da Moldávia 9999
MH Ilhas Marshall 99999
MK Macedônia do Norte 9999
MP Ilhas Marianas do Norte 99999
MQ Matinique 99999
MT Malta aaa 9999
MX México 99999
MY Malásia 99999
NL Holanda 999 aa
NO Noruega 9999
NZ Nova Zelândia 9999
PH Filipinas 9999
PK Paquistão 99999
PL Polônia 99-999
PR Porto Rico 99999
PT Portugal 9999-999
PW Palau 99999
RE

Reunião

99999
RO Romênia 999999
RU Federação Russa 999999
SE Suécia 999 99
SG Cingapura 999999
SI Eslovênia 9999
SK Eslováquia 999 99
SM São Marinho 99999
TH Tailândia 99999
TR Turquia 99999
UA Ucrânia 99999
EUA Estados Unidos 99999
UY Uruguai 99999
VI Ilhas Virgens Americanas 99999
WF Wallis e Futuna 99999
YT Mayotte 99999
ZA África do Sul 9999

Enriquecimento do agente de usuário

Se você criar o modelo Account Takeover Insights (ATI), deverá fornecer uma variável do tipo useragent variável em seu conjunto de dados. Essa variável contém os dados do navegador, do dispositivo e do sistema operacional de um evento de login. O Amazon Fraud Detector enriquece os dados do agente do usuário com informações adicionais, como, e. user_agent_family OS_family device_family