Preparar los datos de eventos para su almacenamiento - Amazon Fraud Detector

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Preparar los datos de eventos para su almacenamiento

Los datos de eventos que se almacenan internamente con Amazon Fraud Detector se almacenan a nivel deEvent Type recursos. Por lo tanto, todos los datos de eventos que provienen del mismo evento se almacenan en uno soloEvent Type. Los eventos almacenados se pueden usar posteriormente para entrenar un modelo nuevo o volver a entrenar un modelo existente. Al entrenar un modelo con los datos de eventos almacenados, puede especificar opcionalmente un intervalo de tiempo de eventos para limitar el tamaño del conjunto de datos de entrenamiento.

Cada vez que almacena sus datos en Amazon Fraud Detector, mediante la consola de Amazon Fraud Detector, laSendEvent API o laCreateBatchImportJob API, Amazon Fraud Detector valida los datos antes de almacenarlos. Si los datos no se validan, los datos del evento no se almacenan.

Requisitos previos para almacenar datos internamente con Amazon Fraud Detector

  • Para garantizar que los datos del evento pasen la validación y que el conjunto de datos se almacene correctamente, asegúrese de haber utilizado la información proporcionada por el explorador de modelos de datos para preparar su conjunto de datos.

  • Creó un tipo de evento para los datos de eventos que desea almacenar en Amazon Fraud Detector. Si no lo has hecho, sigue las instrucciones para crear un tipo de evento.

Validación de datos inteligente

Al cargar el conjunto de datos en la consola de Amazon Fraud Detector para importarlo por lotes, Amazon Fraud Detector utiliza la validación inteligente de datos (SDV) para validar el conjunto de datos antes de importarlos. El SDV escanea el archivo de datos cargado e identifica problemas como la falta de datos y el formato o los tipos de datos incorrectos. Además de validar el conjunto de datos, el SDV también proporciona un informe de validación que enumera todos los problemas que se identificaron y sugiere acciones para solucionar los problemas más impactantes. Algunos de los problemas identificados por el SDV pueden ser críticos y deben solucionarse antes de que Amazon Fraud Detector pueda importar correctamente su conjunto de datos. Para obtener más información, consulte Informe de validación de datos inteligentes.

El SDV valida el conjunto de datos a nivel de archivo y a nivel de datos (fila). A nivel de archivo, el SDV escanea el archivo de datos e identifica problemas como los permisos inadecuados para acceder al archivo, el tamaño del archivo, el formato de archivo y los encabezados (metadatos de eventos y variables de eventos) incorrectos. A nivel de datos, el SDV analiza los datos de cada evento (fila) e identifica problemas como el formato de datos, la longitud de los datos, el formato de marca de tiempo y los valores nulos incorrectos.

Actualmente, la validación inteligente de datos solo está disponible en la consola de Amazon Fraud Detector y la validación está activada de forma predeterminada. Si no desea que Amazon Fraud Detector utilice la validación inteligente de datos antes de importar su conjunto de datos, desactive la validación en la consola de Amazon Fraud Detector cuando cargue su conjunto de datos.

Validar los datos almacenados al utilizar las API o elAWS SDK

Al cargar eventos mediante la operaciónSendEvent,GetEventPrediction, o laCreateBatchImportJob API, Amazon Fraud Detector valida lo siguiente:

  • La EventIngestion configuración de ese tipo de evento está HABILITADA.

  • Las marcas de tiempo de los eventos no se pueden actualizar. Un evento con un ID de evento repetido y un EVENT_TIMESTAMP diferente se tratará como un error.

  • Los nombres y valores de las variables coinciden con el formato esperado. Para obtener más información, consulte Crear una variable

  • Las variables obligatorias se rellenan con un valor.

  • Todas las marcas de tiempo de los eventos no tienen más de 18 meses y no están en el future.