Ejemplo: Detección de anomalías de datos y obtención de una explicación (función RANDOM_CUT_FOREST_WITH_EXPLANATION) - Guía para desarrolladores de Amazon Kinesis Data Analytics SQL para aplicaciones

Tras considerarlo detenidamente, hemos decidido interrumpir Amazon Kinesis Data Analytics SQL para aplicaciones en dos pasos:

1. A partir del 15 de octubre de 2025, no podrá crear nuevos Kinesis Data Analytics SQL para aplicaciones.

2. Eliminaremos sus aplicaciones a partir del 27 de enero de 2026. No podrá iniciar ni utilizar Amazon Kinesis Data Analytics SQL para aplicaciones. A partir de ese momento, el soporte para Amazon Kinesis Data Analytics dejará SQL de estar disponible. Para obtener más información, consulte Suspensión de Amazon Kinesis Data Analytics SQL for Applications.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ejemplo: Detección de anomalías de datos y obtención de una explicación (función RANDOM_CUT_FOREST_WITH_EXPLANATION)

Amazon Kinesis Data Analytics proporciona la función RANDOM_CUT_FOREST_WITH_EXPLANATION, que asigna una puntuación de anomalías a cada registro en función de los valores de las columnas numéricas. La función también ofrece una explicación de la anomalía. Para obtener más información, consulte RANDOM_CUT_FOREST_WITH_EXPLANATION en la referencia SQL de Amazon Managed Service para Apache Flink.

En este ejercicio, escribirá el código de una aplicación para obtener las puntuaciones de anomalías para los registros del origen de streaming de la aplicación. También obtendrá una explicación para cada anomalía.

Primer paso

Paso 1: Preparar los datos