Des data scientists et des experts en apprentissage machine de l’entreprise polonaise Deepsense.io ont mis au point un moteur de reconnaissance d'image qui doit permettre de suivre les baleines noires de l’Atlantique Nord, une population de cétacés en voie de disparition. « Le défi était de trouver une solution pour identifier et mémoriser 500 « visages » de baleines », a déclaré le CTO de Deepsense.io. L’objectif final étant de permettre aux chercheurs d’identifier en temps réel un spécimen sur une photo prise pendant un survol.

Lors de la conférence Strata+Hadoop qui s’est tenue à Londres du 31 mai au 1er juin, le CTO de Deepsense.io, Piotr Niedzwiedz, a raconté dans quelle circonstance la biologiste marine Christin Khan – qui survole chaque jour les océans pour photographier des baleines en voie de disparition pour le compte de l'Agence américaine d'observation océanique et atmosphérique (National Oceanic and Atmospheric Administration - NOAA) – a lancé son projet d’identification des baleines noires de l’Atlantique Nord. En se connectant sur Facebook, elle s’est dit : « Sur le réseau social, on peut identifier ses amis dans les photos en ligne. Pourquoi ne pourrait-on pas faire la même chose avec les baleines noires ? »

 

Sur le site Web Kaggle, une plateforme sur laquelle les entreprises organisent des compétitions en science des données, Christin Khan a lancé un concours appelé Right Whale Recognition. Les participants devaient proposer une solution de reconnaissance d’image pour répertorier et suivre la maigre population de baleines noires de l’Atlantique Nord en voie de disparition. Grâce à son algorithme capable de reconnaître les baleines avec un taux de précision de 87 %, Deepsense.io a gagné la compétition. Le CTO de Deepsense.io, Piotr Niedzwiedz, a exposé les défis du concours : « D’une part, les humains sont incapables de mémoriser 500 « visages » de baleine. Ensuite, seul le motif de callosité blanc situé autour de l’évent, ce trou par lequel la baleine souffle quand elle remonte à la surface, unique pour chaque baleine, permet de différencier les individus de cette population de cétacés ».

Maciej Klimek, data scientist senior de Deepsense.io, a expliqué comment il avait architecturé le réseau neuronal convolutif sous-jacent (Convolutional neural networks - CNN), très performant dans d’autres tâches de reconnaissance d’image, et les algorithmes pour mettre au point le système. Un autre handicap tenait à la pauvreté des données disponibles, très insuffisantes par rapport à la plupart des projets big data. Cela tient probablement au faible nombre de spécimens - 447 - restant à l'état sauvage. Compte tenu de la taille limitée des échantillons visuels, et leur qualité très disparate - les photos ont été prises à différents moments de la journée, avec des appareils différents, à des distances très variables, et certains spécimens ont été beaucoup plus photographiés que d’autres - Deepsense.io a dû trouver un moyen de multiplier les données d’apprentissage. Pour augmenter la taille de l’échantillon, chaque pixel a été rééchantillonné, légèrement pivoté, retourné ou recoloré. Après quoi, en utilisant deux GPU Tesla K80 et GRID K520 de Nvidia, les data scientists ont fabriqué une quinzaine de modèles d’apprentissage qu’ils ont combiné entre eux.

Des passeports numériques pour les baleines 

D’après Maciej Klimek, « les cinq heures passées à appliquer un étiquetage universel aux données - en utilisant Sloth sous Python - n’ont pas été les plus intéressantes du projet, mais elles ont été de loin les plus efficaces, car elles ont permis d’améliorer nettement les résultats ». Afin de normaliser les données, l’équipe a défini un système de coordonnées autour de la tête de l’animal sur lequel baser l’identification. Ils ont pu ainsi créer une bibliothèque d’images standardisées, l’équivalent d’une banque de « photos de passeport » des baleines. Ensuite, « contrairement à ce que nous pensions au départ, les problèmes que nous avons eu à résoudre étaient assez semblables à ceux posés par la reconnaissance faciale humaine », a déclaré Piotr Niedzwiedz.

Tous les détails techniques concernant le développement du système sont disponibles sur le site de Deepsense.io.