La science des données est récente sous le vocable anglo-saxon de data science. Mais elle est issue de multiples sciences et techniques antérieures, notamment les mathématiques probabilistes et l'algorithmie. Elle utilise également des outils et langages qui ne sont pas spécifiques. Par contre, l'approche va être, elle, plus spécifique.
Il était temps de faire le point sur la data science et son praticien, le data scientist. Eric Biernat et Michel Lutz, travaillant tous les deux au cabinet Octo Technology, s'y attachent au travers de l'ouvrage Data Science : fondamentaux et études de cas - Machine Learning avec Python et R.
Une approche par la pratique
Après quelques bases, justement nommées « B.A.-ba du data scientist », l'ouvrage s'attache à décrire les outils théoriques et mathématiques nécessaires, des bases algorithmiques à « l'artillerie lourde ». Les auteurs veillent ensuite à montrer concrètement comment utiliser ces outils, y compris du point de vue de la programmation informatique. L'approche développée est réellement pratique. De ce fait, schémas, formules et listings de programmes remplissent les pages. L'usage de l'ouvrage suppose donc déjà un réel bagage préalable.