Exemple : détection d'anomalies de données et message d'explication (fonction RANDOM_CUT_FOREST_WITH_EXPLANATION) - Guide du développeur d'Amazon Kinesis Data Analytics SQL pour applications

Pour les nouveaux projets, nous vous recommandons d'utiliser le nouveau service géré pour Apache Flink Studio plutôt que Kinesis Data Analytics SQL for Applications. Le service géré pour Apache Flink Studio allie facilité d’utilisation et capacités analytiques avancées, ce qui vous permet de créer des applications sophistiquées de traitement des flux en quelques minutes.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Exemple : détection d'anomalies de données et message d'explication (fonction RANDOM_CUT_FOREST_WITH_EXPLANATION)

Amazon Kinesis Data Analytics fournit la fonction RANDOM_CUT_FOREST_WITH_EXPLANATION, qui attribue un score d’anomalie à chaque enregistrement en fonction de valeurs dans les colonnes numériques. La fonction fournit également une explication de l'anomalie. Pour plus d’informations, consultez RANDOM_CUT_FOREST_WITH_EXPLANATION dans le manuel Référence SQL du service géré Amazon pour Apache Flink.

Dans cet exercice, vous allez écrire du code d'application pour obtenir des scores d'anomalie pour des enregistrements dans la source de diffusion de votre application. Vous allez également obtenir une explication pour chaque anomalie.

Première étape

Étape 1 : Préparation des données