As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Variáveis
As variáveis representam elementos de dados que você deseja usar em uma previsão de fraude. Essas variáveis podem ser obtidas do conjunto de dados de eventos que você preparou para treinar seu modelo, dos resultados de pontuação de risco do modelo Amazon Fraud Detector ou dos modelos de SageMaker IA da Amazon. Para obter mais informações sobre variáveis retiradas do conjunto de dados do evento, consulteObtenha os requisitos do conjunto de dados de eventos usando o Data models explorer.
As variáveis que você deseja usar em sua previsão de fraude devem primeiro ser criadas e depois adicionadas ao evento ao criar seu tipo de evento. Cada variável criada deve ser atribuída a um tipo de dados, um valor padrão e, opcionalmente, um tipo de variável. O Amazon Fraud Detector enriquece algumas das variáveis que você fornece, como endereços IP, números de identificação bancária (BINs) e números de telefone, para criar entradas adicionais e aumentar o desempenho dos modelos que usam essas variáveis.
Tipos de dados
As variáveis devem ter um tipo de dados para o elemento de dados que a variável representa e, opcionalmente, podem ser atribuídas a um dos predefinidosTipos de variáveis. Para variáveis atribuídas a um tipo de variável, o tipo de dados é pré-selecionado. Os tipos de dados possíveis incluem os seguintes tipos:
Tipo de dados | Descrição | Valor padrão | Exemplos de valores |
---|---|---|---|
String | Qualquer combinação de letras, números inteiros ou ambos | <empty> |
abc, 123, 13DB |
Inteiro | Números inteiros positivos ou negativos | 0 | 1, -1 |
Booliano | Verdadeiro ou falso | Falso | True, False |
DateTime | Data e hora especificadas somente no formato UTC padrão ISO 8601 | <empty> | 2019-11-30T 13:01:01 Z |
Float | Números com pontos decimais | 0.0 | 4,01, 0,10 |
Valor padrão
As variáveis devem ter um valor padrão. Quando o Amazon Fraud Detector gera previsões de fraude, esse valor padrão é usado para executar uma regra ou modelo se o Amazon Fraud Detector não receber um valor para uma variável. Os valores padrão fornecidos devem corresponder ao tipo de dados selecionado. No Console da AWS, o Amazon Fraud Detector atribui o valor padrão de 0
para números inteiros, false
para booleanos, 0.0
para flutuantes e (vazio) para cadeias de caracteres. Você pode definir um valor padrão personalizado para qualquer um desses tipos de dados.
Tipos de variáveis
Ao criar uma variável, você pode, opcionalmente, atribuir a variável a um tipo de variável. O tipo de variável representa os elementos de dados comuns usados para treinar modelos e gerar previsões de fraudes. Somente variáveis com um tipo de variável associado podem ser usadas para treinamento de modelos. Como parte do processo de treinamento do modelo, o Amazon Fraud Detector usa o tipo de variável associado à variável para realizar enriquecimentos variáveis, engenharia de recursos e pontuação de risco.
O Amazon Fraud Detector predefiniu os seguintes tipos de variáveis que podem ser usados para atribuir às suas variáveis.
Categoria | Tipo de variável | Descrição | Tipo de dados | Exemplo |
---|---|---|---|---|
Sessão | IP_ADDRESS | O endereço IP coletado durante o evento | String | 192.0.2.0 Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento de geolocalização |
AGENTE DE USUÁRIO | O agente do usuário que é coletado durante o evento | String | Mozilla 5.0 (Windows NT 10.0, Win64, x64, rv: 68.0) Gecko 20100101 | |
IMPRESSÃO DIGITAL | O identificador exclusivo de um dispositivo usado para o evento | String | sadfow987u234 | |
SESSION_ID | O ID da sessão ativa do evento | String | sid:123456789 | |
AS CREDENCIAIS SÃO VÁLIDAS | Indica se as credenciais usadas para o login do evento são válidas | Booliano | Verdadeiro | |
Usuário | ENDEREÇO_E-MAIL | O endereço de e-mail coletado durante o evento | String | abc@domain.com |
PHONE_NUMBER | O número de telefone coletado durante o evento | String | +1 555-0100 Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento do número de telefone |
|
Faturamento | NOME_DE_COBRANÇA | O nome associado ao endereço de cobrança | String | John Doe |
TELEFONE_DE COBRANÇA | O número de telefone associado ao endereço de cobrança | String | +1 555-0100 Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento do número de telefone |
|
ENDEREÇO_DE_COBRANÇA_L1 | A primeira linha do endereço de cobrança | String | Qualquer rua | |
ENDEREÇO_DE_COBRANÇA_L2 | A segunda linha do endereço de cobrança | String | Qualquer unidade 123 | |
CIDADE_FATURAMENTO | A cidade que está no endereço de cobrança | String | Qualquer cidade | |
ESTADO_DE_COBRANÇA | O estado ou província que está no endereço de cobrança | String | Qualquer estado ou província | |
PAÍS_DE COBRANÇA | O país que está no endereço de cobrança | String | Qualquer país Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento de geolocalização |
|
ZIP DE FATURAMENTO | O código postal que está no endereço de cobrança | String | 01234 Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento de geolocalização |
|
Remessa | NOME_DO_ENVIO | O nome associado ao endereço de entrega | String | John Doe |
TELEFONE_DE ENVIO | O número de telefone associado ao endereço de entrega | String | +1 555-0100 Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento do número de telefone |
|
ENDEREÇO_DE_ENVIO_L1 | A primeira linha do endereço de entrega | String | 123 Any Street | |
ENDEREÇO_DE_ENVIO_L2 | A segunda linha do endereço de entrega | String | Unidade 123 | |
CIDADE_EXPEDIÇÃO | A cidade que está no endereço de entrega | String | Qualquer cidade | |
ESTADO_DE_ENVIO | O estado ou província que está no endereço de entrega | String | Qualquer estado | |
PAÍS DE ENVIO | O país em que está está no endereço de entrega | String | Qualquer país Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento de geolocalização |
|
ZIP DE ENVIO | O código postal que está no endereço de entrega | String | 01234 Observação: o Amazon Fraud Detector enriquece esses dados. Para ter mais informações, consulte Enriquecimento de geolocalização |
|
Pagamento | ID_DO_PEDIDO | O identificador exclusivo da transação | String | LUX60 |
PREÇO | O preço total do pedido | String | 560,00 | |
CÓDIGO_MOEDA | O código monetário ISO 4217 | String | USD | |
TIPO_DE-PAGAMENTO | A forma de pagamento usada para pagamento durante o evento | String | Cartão de crédito | |
CÓDIGO_AUTENTICAÇÃO | O código alfanumérico enviado pelo emissor do cartão de crédito ou pelo banco emissor | String | 0000 | |
AVS | O código de resposta do sistema de verificação de endereço (AVS) do processador do cartão | String | S | |
Produto | CATEGORIA_PRODUTO | A categoria do produto do item do pedido | String | Cozinha |
Personalizado | NUMERIC | Qualquer variável que possa ser representada como um número real | Float | 1.224 |
CATEGORICAL | Qualquer variável que descreva categorias, segmentos ou grupos | String | Grande | |
TEXTO_DE_FORMATO LIVRE | Qualquer texto de formato livre capturado como parte do evento (por exemplo, uma avaliação ou comentário de um cliente) | String | Exemplo de uma entrada de texto de formato livre |
Atribuição de variável a um tipo de variável
Se você planeja usar uma variável para treinar seu modelo, é importante escolher o tipo certo de variável para atribuir à variável. A atribuição incorreta do tipo de variável pode afetar negativamente o desempenho do modelo. Também pode ser muito difícil alterar a atribuição posteriormente, especialmente se vários modelos e eventos tiverem usado a variável.
Você pode atribuir à sua variável qualquer um dos tipos de variáveis predefinidos ou um dos tipos de variáveis personalizadas —FREE_FORM_TEXT
,CATEGORICAL
, ouNUMERIC
.
Notas importantes para atribuir variáveis aos tipos de variáveis corretos
-
Se a variável corresponder a um dos tipos de variáveis predefinidos, use-a. Certifique-se de que o tipo de variável corresponda à variável. Por exemplo, se você atribuir uma variável ip_address ao tipo de variável, a
EMAIL_ADDRESS
variável ip_address não será enriquecida com enriquecimentos como ASN, ISP, localização geográfica e pontuação de risco. Para obter mais informações, consulte Enriquecimentos variáveis. -
Se a variável não corresponder a nenhum dos tipos de variáveis predefinidos, siga as recomendações listadas abaixo para atribuir um dos tipos de variáveis personalizados.
-
Atribua o tipo de
CATEGORICAL
variável a variáveis que normalmente não têm ordenação natural e podem ser colocadas em categorias, segmentos ou grupos. O conjunto de dados que você está usando para treinar seu modelo pode ter variáveis de ID, como merchant_id, campaign_id ou policy_id. Essas variáveis representam grupos (por exemplo, todos os clientes com o mesmo policy_id representam um grupo). As variáveis que têm os seguintes dados devem ser atribuídas ao tipo de variável CATEGÓRICA --
Variáveis que contêm dados como Customer_ID, Segment_ID, Color_ID, department_code ou Product_ID.
-
Variáveis que contêm dados booleanos com valores verdadeiros, falsos ou nulos.
-
Variáveis que podem ser colocadas em grupos ou categorias, como nome da empresa, categoria do produto, tipo de cartão ou meio de referência.
nota
ENTITY_ID
é um tipo de variável reservada usado pelo Amazon Fraud Detector para atribuir à variável ENTITY_ID. A variável ENTITY_ID é a ID da entidade que está iniciando a ação que você deseja avaliar. Se você estiver criando um tipo de modelo do Transaction Fraud Insight (TFI), deverá fornecer a variável ENTITY_ID. Você precisará decidir qual variável em seus dados identifica exclusivamente a entidade que está iniciando a ação e passá-la como variável ENTITY_ID. Atribua o tipo de variável CATEGÓRICA a todas as outras IDs em seu conjunto de dados, se elas estiverem presentes e se você as estiver usando para treinamento de modelos. Exemplos de outras IDs que não são uma entidade em seu conjunto de dados podem ser Merchant_ID, Policy_ID e Campaign_ID. -
-
Atribua o tipo de
FREE_FORM_TEXT
variável às variáveis que contêm um bloco de texto. Exemplos de tipos de variáveis FREE_FORM_TEXT são: avaliações de usuários, comentários, datas e códigos de referência. Os dados FREE_FORM_TEXT contêm vários tokens separados por um delimitador. Os delimitadores podem ser qualquer caractere que não seja o símbolo alfanumérico e de sublinhado. Por exemplo, avaliações e comentários de usuários podem ser separados por delimitador de “espaço”, datas e códigos de referência podem usar hífens como delimitadores para separar prefixo, sufixo e partes intermediárias. O Amazon Fraud Detector usa os delimitadores para extrair dados das variáveis FREE_FORM_TEXT. -
Atribua o tipo de variável NUMERIC a variáveis que sejam números reais e tenham ordenação inerente. Exemplos de variáveis NUMÉRICAS incluem day_of_the_week, incident_severity, customer_rating. Embora você possa atribuir o tipo de variável CATEGÓRICA a essas variáveis, é altamente recomendável atribuir todas as variáveis de números reais com ordem inerente ao tipo de variável NUMERIC.
Enriquecimentos variáveis
O Amazon Fraud Detector enriquece alguns dos elementos de dados brutos que você fornece, como endereços IP, números de identificação bancária (BINs) e números de telefone, para criar entradas adicionais e aumentar o desempenho dos modelos que usam esses elementos de dados. O enriquecimento ajuda a identificar situações potencialmente suspeitas e ajuda os modelos a capturar mais fraudes.
Enriquecimento do número de telefone
O Amazon Fraud Detector enriquece os dados do número de telefone com informações adicionais relacionadas à geolocalização, à operadora original e à validade do número de telefone. O enriquecimento do número de telefone é ativado automaticamente para todos os modelos treinados em ou após 13 de dezembro de 2021 e que tenham um número de telefone que inclua um código de país (+xxx). Se você incluiu a variável de número de telefone em seu modelo e a treinou antes de 13 de dezembro de 2021, treine novamente seu modelo para que ele possa aproveitar esse enriquecimento.
É altamente recomendável que você use o seguinte formato para variáveis de número de telefone para garantir que seus dados sejam enriquecidos com sucesso.
Enriquecimento de geolocalização
A partir de 8 de fevereiro de 2022, o Amazon Fraud Detector calcula a distância física entre os valores IP_ADDRESS, BILLING_ZIP e SHIPPING_ZIP que você fornece para um evento. As distâncias calculadas são usadas como entradas para seu modelo de detecção de fraudes.
Para permitir o enriquecimento da geolocalização, os dados do evento devem incluir pelo menos duas das três variáveis: IP_ADDRESS, BILLING_ZIP ou SHIPPING_ZIP. Além disso, cada valor BILLING_ZIP e SHIPPING_ZIP deve ter um código BILLING_COUNTRY e um código SHIPPING_COUNTRY válidos, respectivamente. Se você tem um modelo que foi treinado antes de 8 de fevereiro de 2022 e inclui essas variáveis, você deve treinar novamente o modelo para permitir o enriquecimento da geolocalização.
Se o Amazon Fraud Detector não conseguir determinar a localização associada aos valores IP_ADDRESS, BILLING_ZIP ou SHIPPING_ZIP de um evento devido à invalidade dos dados, um valor especial será usado em vez disso. Por exemplo, suponha que um evento tenha valores válidos de IP_ADDRESS e BILLING_ZIP, mas o valor SHIPPING_ZIP não seja válido. Nesse caso, o enriquecimento é feito somente para IP_ADDRESS—> BILLING_ZIP. O enriquecimento não é feito para IP_ADDRESS—>SHIPPING_ZIP e BILLING_ZIP—>SHIPPING_ZIP. Em vez disso, os valores do espaço reservado são usados em seu lugar. Não importa se o enriquecimento de geolocalização está habilitado para seu modelo ou não, o desempenho do seu modelo não muda.
Você pode desativar o enriquecimento da geolocalização mapeando suas variáveis BILLING_ZIP e SHIPPING_ZIP para o tipo de variável CUSTOM_CATEGORICAL. Alterar o tipo de variável não afeta o desempenho do seu modelo.
Formato de variável de geolocalização
É altamente recomendável que você use o seguinte formato para variáveis de geolocalização para garantir que seus dados de localização sejam enriquecidos com sucesso.
Variável | Formato | Descrição |
---|---|---|
IP_ADDRESS | IPv4 |
Por exemplo - 1.1.1.1 |
BILLING_ZIP e SHIPPING_ZIP | O código postal ISO 3166-1 alfa-2 |
Para obter mais informações, consulte a seção Códigos de país e território neste tópico. |
COUNTRY_COUNTRY e SHIPPING_COUNTRY | O código de país padrão de duas letras ISO 3166-1 alfa-2 |
Para obter mais informações, consulte a seção Códigos de país e território neste tópico. O Amazon Fraud Detector tenta combinar todas as variações comuns do nome de um país com o código de país padrão de duas letras ISO 3166-1. No entanto, não podemos garantir que eles sejam combinados corretamente. |
A tabela a seguir fornece uma lista completa dos países e territórios que são suportados pelo Amazon Fraud Detector para enriquecimento de geolocalização. Cada país e território tem um código de país atribuído (especificamente, o código de país de duas letras ISO 3166-1 alfa-2) e um código postal.
Formato de código postal
9 - número
a - letra
[X] - X é opcional. Por exemplo, Guersney "GY9[9] 9aa” significa que tanto "9aa” quanto "GY9 9aa” são válidos. GY99 Use um formato.
[X/XX] - X ou XX podem ser usados. Por exemplo, Bermudas “aa [aa/99]” significa que tanto “aa aa” quanto “aa 99" são válidos. Use qualquer um desses formatos, mas não use os dois.
Alguns países têm prefixo fixo. Por exemplo, o código postal de AD999 Andorra é. Isso significa que o código do país deve começar com as letras AD seguidas por três números.
Código | Name | CEP |
---|---|---|
AD | Andorra | AD999 |
AR | Antilhas Holandesas | 9999 |
AT | Áustria | 9999 |
AU | Austrália | 9999 |
AZ | Azerbaijão | Z 9999 |
BD | Bangladesh | 9999 |
BE | Bélgica | 9999 |
BG | Bulgária | 9999 |
BM | Bermudas | aa [aa/99] |
BY | Bielorrússia | 999999 |
CA | Canadá | a9a 9a9 |
CH | Suíça | 9999 |
CL | Chile | 9999999 |
CO | Colômbia | 999999 |
CR | Costa Rica | 99999 |
CY | Chipre | 9999 |
CZ | Tchéquia | 999 99 |
DE | Alemanha | 99999 |
DK | Dinamarca | 9999 |
DO | República Dominicana | 99999 |
DZ | Argélia | 99999 |
EE | Estônia | 99999 |
ES | Espanha | 99999 |
FI | Finlândia | 99999 |
FM | Estados Federados da Micronésia | 99999 |
FO | Ilhas Faroe | 999 |
FR | França | 99999 |
GB | Reino Unido | [a] 9 [a/9] 9aa |
GG | Guernsey | GY9[9] 9aa |
GL | Groenlândia | 9999 |
GP | Guadalupe | 99999 |
GT | Guatemala | 99999 |
GU | Guam | 99999 |
HR | Croácia | 99999 |
HU | Hungria | 9999 |
IE | Irlanda | a99 [a/9] [a/9] [a/9] [a/9] |
IM | Ilha de Man | IM9[9] 9aa |
IN | Índia | 999999 |
IS | Islândia | 999 |
IT | Itália | 99999 |
JE | Jérsei | JE9[9] 9aa |
JP | Japão | 999-9999 |
KR | República da Coreia | 99999 |
LI | Liechtenstein | 9999 |
LK | Sri Lanka | 99999 |
LT | Lituânia | 99999 |
LU | Luxemburgo | L-9999 |
LV | Letônia | LV-9999 |
MC | Mônaco | 99999 |
MD | República da Moldávia | 9999 |
MH | Ilhas Marshall | 99999 |
MK | Macedônia do Norte | 9999 |
MP | Ilhas Marianas do Norte | 99999 |
MQ | Matinique | 99999 |
MT | Malta | aaa 9999 |
MX | México | 99999 |
MY | Malásia | 99999 |
NL | Holanda | 999 aa |
NO | Noruega | 9999 |
NZ | Nova Zelândia | 9999 |
PH | Filipinas | 9999 |
PK | Paquistão | 99999 |
PL | Polônia | 99-999 |
PR | Porto Rico | 99999 |
PT | Portugal | 9999-999 |
PW | Palau | 99999 |
RE |
Reunião |
99999 |
RO | Romênia | 999999 |
RU | Federação Russa | 999999 |
SE | Suécia | 999 99 |
SG | Cingapura | 999999 |
SI | Eslovênia | 9999 |
SK | Eslováquia | 999 99 |
SM | São Marinho | 99999 |
TH | Tailândia | 99999 |
TR | Turquia | 99999 |
UA | Ucrânia | 99999 |
EUA | Estados Unidos | 99999 |
UY | Uruguai | 99999 |
VI | Ilhas Virgens Americanas | 99999 |
WF | Wallis e Futuna | 99999 |
YT | Mayotte | 99999 |
ZA | África do Sul | 9999 |
Enriquecimento do agente de usuário
Se você criar o modelo Account Takeover Insights (ATI), deverá fornecer uma variável do tipo useragent
variável em seu conjunto de dados. Essa variável contém os dados do navegador, do dispositivo e do sistema operacional de um evento de login. O Amazon Fraud Detector enriquece os dados do agente do usuário com informações adicionais, como, e. user_agent_family
OS_family
device_family