Dans sa famille Kinesis, Amazon Web Services vient d’ajouter un service. Le premier, Kenesis Streams, est sorti en 2013 pour permettre de collecter et stocker dans le cloud public plusieurs téraoctets de données par heure, à partir de centaines de milliers de sources. Le deuxième, Kinesis Firehose, permet de rediriger les données venant de dispositifs IoT vers les services de base de données Redshift ou de stockage S3. Cette fois, avec Kinesis Analytics, les développeurs vont pouvoir bâtir des applications capables d’analyser en temps réel les flux de données qui arrivent.
Une fois qu’un utilisateur a mis en place un flux avec Kinesis Analytics, les résultats peuvent être envoyés vers quatre services différents dont Amazon S3, Redshift et Elasticsearch. Le service est intéressant pour travailler sur certains types de données qui sont modifiées rapidement en temps réel : par exemple, celles provenant de capteurs ou bien les informations reçues en direct d’une salle de marché.
Reporting périodique, monitoring et sessionisation
Pour contrôler les sous-ensembles de données traités par une requête, l’utilisateur passe par une fenêtre de traitement. Kinesis Analytics supporte trois différents types de fenêtres. Les « Tumbling windows » sont utilisées pour les reportings périodiques. Elles serviront à synthétiser des données au fil du temps. Les « Sliding windows » seront choisies pour des tâches de monitoring ou de détection de tendances. Enfin, les « Custom windows » conviennent mieux lorsque le jeu de données n’est pas directement lié au temps. Si l’on analyse les données de connexions et de clics, ce type de fenêtre servira pour analyser les caractéristiques des sessions actives des visiteurs sur un site web (sessionisation), cite AWS en exemple. Dans un billet, le fournisseur présente un scénario qui expose la mise en œuvre du nouveau service.
Commentaire