Le pot de terre contre le pot de fer. Depuis quelques années, les spécialistes de la génomique sont confrontés à un problème d’auto-correction du nommage des gènes, transformés en date par le logiciel Excel de Microsoft. Par exemple, si on rentre le nom MARCH1 pour Membrane Associated Ring-CH-Type Finger 1, le tableur le reconnait automatiquement comme la date du 1er mars. Plusieurs noms se trouvent dans ce cas-là et la seule échappatoire pour les scientifiques était de changer les données manuellement dans chaque colonne.
Un travail fastidieux et source d’erreurs comme le rappelle The Verge. Une étude de 2016 a examiné les données génétiques dans 3 597 articles publiés et a constaté qu'environ un cinquième d'entre elles avaient été affectées par des erreurs d'Excel.
Changement de nomenclature acté
Le problème est mineur pour Microsoft, car la firme n’a pas apporté de modification spécifique à Excel. Le salut est donc venu du Comité de nomenclature des gènes (HUGO) qui a proposé purement et simplement de modifier le nom des gènes. Ainsi MARCH1 devient maintenant MARCHF1, tandis que SEPT1 se transforme en SEPTIN1. A noter que 27 noms ont été changés au cours de l’année dernière. Les directives du comité entérinent cette évolution.
Sur Twitter, cette décision est diversement appréciée par les scientifiques. Certains ont « jubilé » et « salué » un grand jour pour la science. D’autres sont plus critiques et s’interrogent : pourquoi a-t-il été plus facile de renommer les gènes humains que de modifier le fonctionnement d'Excel ? Un débat qui mérite réflexion et qui repose la question de la prédominance du tableur de Microsoft dans plusieurs domaines comme les sciences, mais aussi la planification budgétaire, l’analyse de données, etc.
En l'occurrence le problème n'est pas de méconnaître la fonction mais d'avoir systématiquement à l'appliquer. Excel est nativement configuré ainsi. Lorsque l'on sait par ailleurs que les documents Excel peuvent facilement intégrer tout un ensemble de règle, qu'ils peuvent faire l'objet d'extractions en csv, autre... Facile de se prendre les pieds dans le tapis ... Je rencontre les mêmes problèmes lorsque je manipule des cellules de 12 chiffres (clé d'identifiant) ... systématiquement mis sous forme d'exposant par défaut ...
Signaler un abusPunaise, c'est fou ! Juste parce que des scientifiques ne savent pas utiliser une fonction de base d'Excel (le format des cellules), il a fallu changer le nom des gènes !!? Assez incroyable...
Signaler un abusC'est très simple d'éviter ce problème...
Signaler un abusIl suffit de modifier le type des cases de 'automatique' à 'texte' pour éviter les conversions automatique...
Dommage que tous ces scientifiques ne connaissent pas LibreOffice Calc, celui-ci ( 6.4.4.2) ne connait pas ce problème et il aurait été inutile de modifier la nomenclature.
Signaler un abusLa preuve :
https://lsdm.live/uploads/images/img5f2d1dada65f0.jpg