Ejemplo: Detección de anomalías de datos y obtención de una explicación (función RANDOM_CUT_FOREST_WITH_EXPLANATION) - Guía para desarrolladores de Amazon Kinesis Data Analytics SQL para aplicaciones

Para proyectos nuevos, le recomendamos que utilice el nuevo servicio gestionado para Apache Flink Studio en lugar de Kinesis Data Analytics SQL for Applications. El servicio gestionado para Apache Flink Studio combina la facilidad de uso con capacidades analíticas avanzadas, lo que le permite crear aplicaciones sofisticadas de procesamiento de flujos en cuestión de minutos.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ejemplo: Detección de anomalías de datos y obtención de una explicación (función RANDOM_CUT_FOREST_WITH_EXPLANATION)

Amazon Kinesis Data Analytics proporciona la función RANDOM_CUT_FOREST_WITH_EXPLANATION, que asigna una puntuación de anomalías a cada registro en función de los valores de las columnas numéricas. La función también ofrece una explicación de la anomalía. Para obtener más información, consulte RANDOM_CUT_FOREST_WITH_EXPLANATION en la referencia SQL de Amazon Managed Service para Apache Flink.

En este ejercicio, escribirá el código de una aplicación para obtener las puntuaciones de anomalías para los registros del origen de streaming de la aplicación. También obtendrá una explicación para cada anomalía.

Primer paso

Paso 1: Preparar los datos