La rentrée littéraire concerne également la data science. Encore un nouvel ouvrage sur le sujet, c'est vrai, mais le titre de « Data Science : cours et exercices » qui vient de paraître chez Eyrolles est explicite. L'approche est ici strictement pédagogique et progressive, l'ouvrage étant destiné à ceux qui veulent comprendre et pratiquer cette nouvelle discipline qu'est la science des données.
Au fil des chapitres, les différents auteurs vont donc dérouler la méthode préconisée, dans un ordre chronologique. Après des explications très claires et séquentielles, avec des exemples, chaque chapitre comporte des exercices pour que les lecteurs puissent mettre en pratique les techniques acquises. Pour certains chapitres, il est nécessaire au préalable de maîtriser quelques notions mathématiques nécessaires. A l'inverse, les concepts mathématiques propres à la data science sont clairement explicités.
L'ouvrage débute avec les étapes de collecte et de préparation (pré-traitement, gestion des systèmes distribués, usage du calcul à haute performance...). Viennent ensuite les étapes de modélisation, du deep learning et de la visualisation.