Exemplo: como detectar anomalias de dados e obter uma explicação (função RANDOM_CUT_FOREST_WITH_EXPLANATION) - Guia do desenvolvedor do Amazon Kinesis Data Analytics SQL para aplicativos

Após uma análise cuidadosa, decidimos descontinuar o Amazon Kinesis Data Analytics SQL para aplicativos em duas etapas:

1. A partir de 15 de outubro de 2025, você não poderá criar um novo Kinesis Data Analytics SQL para aplicativos.

2. Excluiremos seus aplicativos a partir de 27 de janeiro de 2026. Você não poderá iniciar ou operar seu Amazon Kinesis Data Analytics SQL para aplicativos. O suporte não estará mais disponível para o Amazon Kinesis Data Analytics SQL a partir desse momento. Para obter mais informações, consulte Descontinuação do Amazon Kinesis Data Analytics SQL para aplicativos.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Exemplo: como detectar anomalias de dados e obter uma explicação (função RANDOM_CUT_FOREST_WITH_EXPLANATION)

O Amazon Kinesis Data Analytics fornece a função RANDOM_CUT_FOREST_WITH_EXPLANATION que atribui uma pontuação de anomalias a cada registro de acordo com os valores nas colunas numéricas. A função também fornece uma explicação da anomalia. Para obter mais informações, consulte RANDOM_CUT_FOREST_WITH_EXPLANATION em Amazon Managed Service for Apache Flink SQL Reference.

Neste exercício, você escreve o código de aplicativo para obter pontuações de anomalias para os registros na origem de streaming do aplicativo. Você também pode obter uma explicação para cada anomalia.

Primeira etapa

Etapa 1: Preparar os dados