Requêtes à fenêtres - Guide du développeur d'Amazon Kinesis Data Analytics SQL pour applications

Pour les nouveaux projets, nous vous recommandons d'utiliser le nouveau service géré pour Apache Flink Studio plutôt que Kinesis Data Analytics SQL for Applications. Le service géré pour Apache Flink Studio allie facilité d’utilisation et capacités analytiques avancées, ce qui vous permet de créer des applications sophistiquées de traitement des flux en quelques minutes.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Requêtes à fenêtres

Les requêtes SQL dans votre code d'application s'exécutent en continu sur des flux intégrés à l'application. Un flux intégré à l'application représente des données illimitées qui circulent en continu dans votre application. Par conséquent, pour obtenir des ensembles de résultats de cette entrée continuellement mise à jour, vous bornez souvent des requêtes à l'aide d'une fenêtre définie en termes de temps ou de lignes. Ces requêtes sont également appelées SQL à fenêtres.

Pour une requête à fenêtres temporelle, vous spécifiez la durée de la fenêtre (par exemple, une fenêtre d'une minute). Cela nécessite une colonne d'horodatage dans votre flux intégré à l'application qui augmente de façon monotone. (L’horodatage d’une nouvelle ligne est supérieur ou égal à celui de la ligne précédente.) Amazon Kinesis Data Analytics fournit cette colonne d’horodatage appelée ROWTIME pour chaque flux intégré à l’application. Vous pouvez utiliser cette colonne lors de la spécification de requêtes temporelles. Pour votre application, vous pouvez choisir une autre option d'horodatage. Pour de plus amples informations, veuillez consulter Horodatages et colonne ROWTIME.

Pour une requête à fenêtres basées sur les lignes, vous spécifiez la longueur de la fenêtre en termes de nombre de lignes.

Vous pouvez spécifier une requête pour traiter des enregistrements dans une fenêtre bascule, une fenêtre défilante ou une fenêtre stagger, en fonction des besoins de votre application. Kinesis Data Analytics prend en charge les types de fenêtres suivants :

  • Stagger Windows : requête qui regroupe les données à l'aide de fenêtres clés basées sur la durée qui s'ouvrent à mesure que les données arrivent. Les clés permettent le chevauchement de plusieurs fenêtres. Il s'agit de la méthode recommandée pour agréger les données à l'aide de fenêtres temporelles, car les fenêtres Stagger réduisent les retards ou les out-of-order données par rapport aux fenêtres Tumbling.

  • Fenêtres bascules : requête qui regroupe les données à l'aide de différentes fenêtres basées sur la durée qui s'ouvrent et se ferment à intervalles réguliers.

  • Fenêtres défilantes : requête qui regroupe les données en continu, à l'aide d'un intervalle de temps fixe ou d'un intervalle rowcount.