Schritt 3: Untersuchen der Ergebnisse - Entwicklerhandbuch für Amazon Kinesis Data Analytics for SQL Applications

Nach reiflicher Überlegung haben wir beschlossen, Amazon Kinesis Data Analytics für SQL Anwendungen in zwei Schritten einzustellen:

1. Ab dem 15. Oktober 2025 können Sie keine neuen Kinesis Data Analytics für SQL Anwendungen erstellen.

2. Wir werden Ihre Anwendungen ab dem 27. Januar 2026 löschen. Sie können Ihre Amazon Kinesis Data Analytics for SQL Applications weder starten noch betreiben. SQLAb diesem Zeitpunkt ist kein Support mehr für Amazon Kinesis Data Analytics verfügbar. Weitere Informationen finden Sie unter Einstellung von Amazon Kinesis Data Analytics for SQL Applications.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Schritt 3: Untersuchen der Ergebnisse

Wenn Sie den SQL-Code für dieses Beispiel ausführen, werden zuerst Zeilen mit einer Anomaliebewertung gleich null angezeigt. Dies geschieht während des anfänglichen Lernens. Danach sollten die Ergebnisse wie folgt aussehen:

ROWTIME SYSTOLIC DIASTOLIC BLOODPRESSURELEVEL ANOMALY_SCORE ANOMALY_EXPLANATION 27:49.0 101 66 NORMAL 0.711460417 {"Systolic":{"DIRECTION":"LOW","STRENGTH":"0.0922","ATTRIBUTION_SCORE":"0.3792"},"Diastolic":{"DIRECTION":"HIGH","STRENGTH":"0.0210","ATTRIBUTION_SCORE":"0.3323"}} 27:50.0 144 123 HIGH 3.855851061 {"Systolic":{"DIRECTION":"HIGH","STRENGTH":"0.8567","ATTRIBUTION_SCORE":"1.7447"},"Diastolic":{"DIRECTION":"HIGH","STRENGTH":"7.0982","ATTRIBUTION_SCORE":"2.1111"}} 27:50.0 113 69 NORMAL 0.740069409 {"Systolic":{"DIRECTION":"LOW","STRENGTH":"0.0549","ATTRIBUTION_SCORE":"0.3750"},"Diastolic":{"DIRECTION":"LOW","STRENGTH":"0.0394","ATTRIBUTION_SCORE":"0.3650"}} 27:50.0 105 64 NORMAL 0.739644157 {"Systolic":{"DIRECTION":"HIGH","STRENGTH":"0.0245","ATTRIBUTION_SCORE":"0.3667"},"Diastolic":{"DIRECTION":"LOW","STRENGTH":"0.0524","ATTRIBUTION_SCORE":"0.3729"}} 27:50.0 100 65 NORMAL 0.736993425 {"Systolic":{"DIRECTION":"HIGH","STRENGTH":"0.0203","ATTRIBUTION_SCORE":"0.3516"},"Diastolic":{"DIRECTION":"LOW","STRENGTH":"0.0454","ATTRIBUTION_SCORE":"0.3854"}} 27:50.0 108 69 NORMAL 0.733767202 {"Systolic":{"DIRECTION":"LOW","STRENGTH":"0.0974","ATTRIBUTION_SCORE":"0.3961"},"Diastolic":{"DIRECTION":"LOW","STRENGTH":"0.0189","ATTRIBUTION_SCORE":"0.3377"}}
  • Der Algorithmus in der Funktion RANDOM_CUT_FOREST_WITH_EXPLANATION erkennt, dass die Spalten Systolic und Diastolic numerisch sind und nutzt sie als Eingabe.

  • Da sich in der Spalte BloodPressureLevel Text befindet, wird sie vom Algorithmus nicht berücksichtigt. Diese Spalte ist dient nur als visuelle Hilfe, sodass sie normalen, hohen und niedrigen Blutdruckwerte in diesem Beispiel schnell zu erkennen sind.

  • In der Spalte ANOMALY_SCORE sind Datensätze mit höherer Bewertung anormal. Der zweite Datensatz in diesem Beispiel-Ergebnissatz ist mit einer Anomaliebewertung von 3,855851061 am meisten anormal.

  • Um zu verstehen, wie stark jede der numerischen Spalten, die vom Algorithmus berücksichtigt wird, zur Anomaliebewertung beiträgt, nehmen Sie auf das JSON-Feld mit dem Namen ATTRIBUTION_SCORE in der Spalte ANOMALY_SCORE Bezug. Im Falle der zweiten Zeile in dieser Gruppe von Beispielergebnissen tragen die Spalten Systolic und Diastolic im Verhältnis von 1,7447:2,1111 zur Anomalie bei. Anders ausgedrückt lässt sich die Begründung der Anomaliebewertung zu 45 Prozent auf den systolischen Wert zurückführen. Der verbleibende Beitrag ist im diastolischen Wert begründet.

  • Anhand des JSON-Feldes mit dem Namen DIRECTION können Sie bestimmen, in welcher Richtung der durch die zweite Zeile in diesem Beispiel dargestellte Punkt anormal ist. In diesem Fall sind sowohl der diastolische als auch der systolische Wert beide als HIGH gekennzeichnet. Dem JSON-Feld mit dem Namen STRENGTH können Sie entnehmen, mit welcher Wahrscheinlichkeit diese Richtungen richtig sind. In diesem Beispiel findet der Algorithmus es wahrscheinlicher, dass der diastolische Wert hoch ist. Tatsächlich liegt der normale Wert der diastolischen Messung gewöhnlich bei 60-80 und ein Wert von 123 ist viel höher als erwartet.