Les quelques semaines qui ont précédé le premier tour de la présidentielle 2017 ont vu s’affronter deux camps au sujet des intentions de vote des électeurs. Si les sondeurs semblent être revenus en grâce avec des pronostics proches des chiffres définitifs, les officines spécialisées dans le traitement des big data, avec notamment l’analyse des données issues des réseaux sociaux, ont bu la coupe jusqu’à la lie. Nous vous entretenions il y a quinze jours du travail réalisé par ces agences numériques pour le compte de certains candidats. Après le premier tour de la présidentielle 2017, il n’est pas inutile de revenir sur certains chiffres brandis par les militants dans leurs débats contradictoires.
Associée à M6, Vigiglobe, une société installée à Sophia Antipolis et dirigée par un ancien de l'institut de sondage TNS, avait par exemple pressenti – sans donner de vrai pronostics - un second tour avec un face à face Fillon/Mélenchon ou Fillon/Macron en analysant la dynamique des réseaux sociaux. Seul bémol, malgré les professions de foi sur Twitter et Facebook, François Fillon n’a pas passé l’écueil du premier tour. L’agence canadienne Filteris, qui prédisait la qualification de François Fillon le 23 avril, n’a pas réussi à passer le premier tour. Un baromètre que les militants du candidat des Républicains diffusait sans compter avant le premier tour pour convaincre des chances de leur poulain malgré les affaires et les mises en examen. Grâce à la magie des algorithmes appliqués aux big data (capter les tendances sur les réseaux sociaux avec les tweets, les publications Facebook, les commentaires d'article...), les prédictions étaient très précises avec des chiffres au centième près : 22,09% pour Fillon, 21,75% pour Le Pen et 19,92% pour Macron deux jours avant le scrutin. Une agence suisse plus modeste, Enigma, analysait quant à elle les Google Trends des deux précédentes élections françaises pour affirmer sans détour à douze jours du scrutin du 23 avril : « Si on réplique le modèle de lecture des deux élections précédentes, la réponse est François Fillon contre Jean-Luc Mélenchon ».
Les estimations d'un sondeur traditionnel avant le premier tour.
Les Russes en embuscade
Les Russes de Brand Analytics, adossés à l’irrésistible SputnikTV, pointaient également un second tour Fillon/Le Pen en exploitant les médias sociaux : « Le champ informationnel change très vite grâce aux réseaux sociaux. Les technologies utilisées lors des sondages traditionnels n'arrivent pas toujours à refléter ces changements […]. À la différence des sondages traditionnels, nous travaillons en temps réel et […] pouvons analyser les réponses des personnes qui sont réellement intéressées (qui se rendront aux urnes, enverront un texto, etc.) », affirmait doctement Svetlana Krylova, directrice du centre d'analyse Brand Analytics à Sputnik France le 23 février dernier. Et encore : « Nous n'étudions pas les échantillons de 1 000-1 600 personnes, nous étudions les opinions des centaines de milliers voire des millions de personnes qui se sont déjà exprimées ». Tout ça pour ça…
Enfin, les étudiants de l’école Télécom ParisTech ont élaboré avec la magazine Le Point le programme PredictMyPresident qui annonçait un second tour Le Pen/Fillon avec des scores de 24,13% pour la première et 21,77% pour le second (20,32% pour Macron). Dans un communiqué de presse publié par Le Point, les cinq étudiants à l’origine de ce projet expliquent : « L'algorithme que nous avons développé a présenté des faiblesses – son résultat au 15 avril n'ayant pas su prédire le second tour Macron-Le Pen –, mais il a montré des qualités encourageantes pour l'avenir ». Les sciences politiques sont finalement une science plus complexe que les télécoms, même avec l’appoint des templates du big data et des éditorialistes zélés du Point.
Et pour le 7 mai
Pour résumer, tous les spécialistes autoproclamés du big data politique annonçaient Fillon au second tour. Et pour la prochaine échéance, le dernier tour de la présidentielle, les agences et autres plates-formes analytiques sont beaucoup plus frileuses : les tweets enflammés pour un candidat et leur cortège d’anti-tweets en réaction, les volumes de recherche sur Google, le tweet pulse – le fameux buzz tellement prisé par les équipes marketing – et les algorithmes obscurs ne livrent pas de chiffres précis à la différence des instituts de sondage (Odoxa, Sofres, Ipsos) qui tâtent eux aussi du big data (voir ci-dessous).