As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Informações sobre fraudes em transações
O tipo de modelo Transaction Fraud Insights foi projetado para detectar fraudes on-line ou card-not-present em transações. O Transaction Fraud Insights é um modelo de aprendizado de máquina supervisionado, o que significa que ele usa exemplos históricos de transações fraudulentas e legítimas para treinar o modelo.
O modelo Transaction Fraud Insights usa um conjunto de algoritmos de aprendizado de máquina para enriquecimento, transformação e classificação de fraudes de dados. Ele utiliza um mecanismo de engenharia de recursos para criar agregados em nível de entidade e de evento. Como parte do processo de treinamento do modelo, o Transaction Fraud Insights enriquece elementos de dados brutos, como endereço IP e número BIN, com dados de terceiros, como a geolocalização do endereço IP ou o banco emissor de um cartão de crédito. Além de dados de terceiros, o Transaction Fraud Insights usa algoritmos de aprendizado profundo que levam em conta os padrões de fraude observados na Amazon. AWS Esses padrões de fraude se tornam recursos de entrada para seu modelo usando um algoritmo de aumento de árvore de gradiente.
Para aumentar o desempenho, o Transaction Fraud Insights otimiza os hiperparâmetros do algoritmo de aumento da árvore de gradiente por meio de um processo de otimização bayesiano, treinando sequencialmente dezenas de modelos diferentes com parâmetros de modelo variados (como número de árvores, profundidade das árvores, número de amostras por folha), bem como diferentes estratégias de otimização, como aumentar a população minoritária de fraudes para lidar com taxas de fraude muito baixas.
Como parte do processo de treinamento do modelo, o mecanismo de engenharia de recursos do modelo Transaction Fraud calcula os valores de cada entidade exclusiva em seu conjunto de dados de treinamento para ajudar a melhorar as previsões de fraudes. Por exemplo, durante o processo de treinamento, o Amazon Fraud Detector calcula e armazena a última vez que uma entidade fez uma compra e atualiza dinamicamente esse valor sempre que você chama a API GetEventPrediction
ouSendEvent
. Durante uma previsão de fraude, as variáveis do evento são combinadas com outros metadados da entidade e do evento para prever se a transação é fraudulenta.
Seleção da fonte de dados
Os modelos do Transaction Fraud Insights são treinados em conjuntos de dados armazenados internamente somente com o Amazon Fraud Detector (INGESTED_EVENTS). Isso permite que o Amazon Fraud Detector atualize continuamente os valores calculados sobre as entidades que você está avaliando. Para obter mais informações sobre as fontes de dados disponíveis, consulte Armazenamento de dados de eventos
Preparar dados
Antes de treinar um modelo do Transaction Fraud Insights, certifique-se de que seu arquivo de dados contenha todos os cabeçalhos, conforme mencionado em Prepare o conjunto de dados do evento. O modelo Transaction Fraud Insights compara novas entidades que são recebidas com os exemplos de entidades fraudulentas e legítimas no conjunto de dados, por isso é útil fornecer muitos exemplos para cada entidade.
O Amazon Fraud Detector transforma automaticamente o conjunto de dados de eventos armazenado no formato correto para treinamento. Depois que o modelo concluir o treinamento, você poderá revisar as métricas de desempenho e determinar se deve adicionar entidades ao seu conjunto de dados de treinamento.
Seleção de dados
Por padrão, o Transaction Fraud Insights treina todo o seu conjunto de dados armazenado para o tipo de evento selecionado. Opcionalmente, você pode definir um intervalo de tempo para reduzir os eventos usados para treinar seu modelo. Ao definir um intervalo de tempo, certifique-se de que os registros usados para treinar o modelo tenham tido tempo suficiente para amadurecer. Ou seja, já passou tempo suficiente para garantir que registros legítimos e fraudulentos tenham sido identificados corretamente. Por exemplo, para fraudes de estorno, geralmente são necessários 60 dias ou mais para identificar corretamente eventos fraudulentos. Para obter o melhor desempenho do modelo, certifique-se de que todos os registros em seu conjunto de dados de treinamento estejam maduros.
Não há necessidade de selecionar um intervalo de tempo que represente uma taxa de fraude ideal. O Amazon Fraud Detector coleta amostras automaticamente de seus dados para alcançar o equilíbrio entre taxas de fraude, intervalo de tempo e contagem de entidades.
O Amazon Fraud Detector retornará um erro de validação durante o treinamento do modelo se você selecionar um intervalo de tempo no qual não haja eventos suficientes para treinar um modelo com sucesso. Para conjuntos de dados armazenados, o campo EVENT_LABEL é opcional, mas os eventos devem ser rotulados para serem incluídos em seu conjunto de dados de treinamento. Ao configurar seu modelo de treinamento, você pode escolher se deseja ignorar eventos não rotulados, assumir um rótulo legítimo para eventos não rotulados ou assumir um rótulo fraudulento para eventos não rotulados.
Variáveis do evento
O tipo de evento usado para treinar o modelo deve conter pelo menos 2 variáveis, além dos metadados de eventos obrigatórios, que passaram pela validação de dados e podem conter até 100 variáveis. Geralmente, quanto mais variáveis você fornece, melhor o modelo pode diferenciar entre fraude e eventos legítimos. Embora o modelo Transaction Fraud Insight possa suportar dezenas de variáveis, incluindo variáveis personalizadas, recomendamos que você inclua endereço IP, endereço de e-mail, tipo de instrumento de pagamento, preço do pedido e BIN do cartão.
Validando dados
Como parte do processo de treinamento, o Transaction Fraud Insights valida o conjunto de dados de treinamento para problemas de qualidade de dados que possam afetar o treinamento do modelo. Depois de validar os dados, o Amazon Fraud Detector toma as medidas apropriadas para criar o melhor modelo possível. Isso inclui emitir avisos sobre possíveis problemas de qualidade de dados, remover automaticamente variáveis com problemas de qualidade de dados ou emitir um erro e interromper o processo de treinamento do modelo. Para obter mais informações, consulte Validação do conjunto de dados.
O Amazon Fraud Detector emitirá um aviso, mas continuará treinando um modelo se o número de entidades exclusivas for inferior a 1.500, pois isso pode afetar a qualidade dos dados de treinamento. Se você receber um aviso, revise a métrica de desempenho.