Dix logiciels qui font avancer la science

Delphine Sabattier : Dix logiciels français ont donc été récompensés [1] pour leur contribution à l’avancée scientifique. On en parle avec Roberto Di Cosmo. Bonjour Roberto.

Roberto Di Cosmo : Bonjour.

Delphine Sabattier : Vous êtes connecté avec nous ce matin. Merci beaucoup. Vous êtes le directeur de Software Heritage [2], on en a parlé dans votre grande interview. Je rappelle rapidement que c’est une initiative qui est portée à la fois par l’Inria [Institut national de recherche en informatique et en automatique] et l’UNESCO pour la préservation et le partage du patrimoine logiciel mondial.
Vous faites donc partie du comité d’organisation du prix science ouverte du logiciel libre de la recherche. Ont donc été récompensés des logiciels libres mis au point par des équipes françaises pour leur contribution au progrès de la recherche. Ce prix était une première cette année. Est-ce que ça a été difficile de trouver des candidats qui correspondent vraiment aux critères fixés, puisqu’il fallait trouver à la fois du logiciel open source, mais aussi français, qui sert la recherche scientifique ?

Roberto Di Cosmo : Tout d’abord merci pour l’invitation. C’est un vrai plaisir d’être ici avec vous pour parler de ça.
Il faut savoir que la France a joué un rôle majeur dans le développement du logiciel libre, pas seulement dans le monde de la recherche, mais en particulier dans le monde de la recherche. Parmi les candidats il y avait des logiciels dont le développement a commencé dans les années 80, pour vous dire depuis combien de temps il y a des contributions majeures françaises dans la recherche.
En réalité, dans la constitution de ce prix qui est effectivement une première au niveau mondial – c’est la première fois qu’à un niveau aussi élevé, c’est-à-dire qu’un ministère de la Recherche dans un pays majeur comme la France organise un prix pour reconnaître les contributions d’équipes de recherche aux avancées de la science à travers des logiciels libres –, on voulait reconnaître qu’il y a effectivement plusieurs formes de contributions différentes dans ce logiciel. Il peut y avoir des contributions scientifiques/techniques très pointues, il peut y avoir la difficulté ou la mission de construire une large communauté autour d’un logiciel, il peut y avoir la nécessité de construire une documentation, il peut y avoir d’autres choses qu’on n’avait pas imaginées donc on avait laissé une quatrième catégorie pour un prix du jury dans lequel le jury a choisi ce qu’il trouvait de plus pertinent parmi ces candidatures.
Non seulement ça n’a pas été difficile de trouver des candidats, il y a eu 129 candidatures, toutes excellentes a dit le jury, c’est dire la richesse de la contribution des équipes françaises au progrès de la science à travers le logiciel libre et ce n’était pas qu’en informatique, il y avait tous les domaines. Il y avait les neurosciences, il y avait du traitement du langage, du traitement du signal, il y avait des interfaces cérébrales, il y avait des choses pour l’astrophysique. Une richesse incroyable !

Delphine Sabattier : L’objectif de ce prix c’est justement de mettre en avant toute cette richesse. Quelles étaient les qualités sur lesquelles étaient jugées les logiciels, qu’ont regardé les membres du jury ?

Roberto Di Cosmo : Vous imaginez qu’avec 129 candidatures les membres du jury ont eu un travail assez compliqué à faire et ce n’est pas l’ensemble la production. Ce sont des gens qui considéraient qu’ils avaient une forte chance de remporter ces prix ; il y a une dose d’autocensure extrêmement élevée donc la qualité était exceptionnelle dans toutes les soumissions qui ont été trouvées. Donc le jury a choisi – je ne faisais pas partie du jury, pour rappeler les choses, j’ai participé à l’organisation du prix ; le jury était souverain et a décidé tout seul –, et il a été précisé qu’effectivement on cherchait la qualité de la contribution scientifique et technique : est-ce qu’on va résoudre un problème scientifique particulier ? Est-ce qu’il y a une difficulté technique particulière ? Comment on a développé ce logiciel ? Mais aussi comment on s’est assuré que la communauté soit construite autour de ce logiciel pour en garantir la pérennité ou pour en faciliter l’usage, comment on a construit une documentation de qualité qui permet l’utilisation ou la contribution. C’est cet ensemble des facteurs qui ont été tous pris en compte et, bien évidemment, il s’agit de logiciels de la recherche, pour la recherche, donc est-ce qu’il y avait une reconnaissance par les pairs ? Est-ce qu’il y a des publications scientifiques qui ont été produites grâce à ça ou qui mentionnaient ce logiciel ?, c’est évidemment un critère majeur.

Delphine Sabattier : Que pouvez-vous nous dire justement de ces projets qui ont été plus que sélectionnés, qui ont été récompensés ? Leur domaine d’action, leur apport à la connaissance scientifique ?

Roberto Di Cosmo : Si vous regardez ces quatre catégories, la contribution scientifique/technique, la communauté, la documentation et le prix du jury, il y a eu quatre prix mais aussi six accessits, donc finalement il y a dix logiciels, globalement, qui ont été distingués.
Dans la première catégorie on a l’assistant de démonstration Coq [3]. C’est ce logiciel dont le développement a effectivement commencé en 1984, pour vous dire ! C’est un logiciel qui permet de formaliser des preuves mathématiques, de vérifier des preuves mathématiques. Il a notamment été utilisé pour prouver le fameux théorème des quatre couleurs ; si vous prenez un plan quelconque, géographique quelconque, vous arrivez à tout colorer avec quatre couleurs sans mélanger deux zones différentes. C’est un gros problème mathématique dont la preuve formelle a été réalisée grâce à ce logiciel et grâce à ce logiciel-là aussi on a pu produire les premiers compilateurs certifiés qui ont un impact important par exemple dans l’avionique, on a un système de haute sécurité. C’est à la frontière entre mathématiques et informatique.

Delphine Sabattier : Ça c’était le lauréat dans la catégorie scientifique et technique. Le prix du jury peut-être, parce qu’on ne va pas pouvoir tous les citer malheureusement.

Roberto Di Cosmo : Gammapy [4] a reçu du prix du jury. C’est un logiciel qui est utilisé en astrophysique pour collecter et traiter des données qui viennent des grands télescopes, c’est encore un autre domaine.
Après, comme nous sommes dans une émission qui parle aussi aux industriels, je veux signaler l’accessit, dans la catégorie scientifique et technique, du logiciel qui s’appelle Coriolis [5]. C’est la seule chaîne en logiciel libre disponible au niveau mondial qui permet de fabriquer des microprocesseurs. Vous avez de la conception à la fabrication du microprocesseur et, dans une période dans laquelle on se rend compte… ; vous avez vu les annonces faites hier par le ministère de l’Industrie, au niveau européen, sur le fait que l’Europe va investir des dizaines de milliards pour réindustrialiser la production des microprocesseurs, disposer de ce type d’outil est essentiel pour la souveraineté européenne.

Delphine Sabattier : Oui. Ça sera d’ailleurs un des sujets qu’on abordera dans Tech talk juste après.
La communauté scientifique connaît-elle déjà ces outils libres, ouverts, ou se tourne-t-elle généralement vers d’autre types de solutions ?

Roberto Di Cosmo : C’est une bonne question. Ça dépend. On parle de communauté scientifique, mais il y a plein de silos selon avec qui et où vous travaillez. Par exemple le deuxième logiciel lauréat qui est Scikit-learn [6], dans la catégorie communauté, a été développé à l’origine pour les besoins internes dans l’équipe et maintenant c’est LE logiciel de référence au niveau mondial, pas juste en France, au niveau mondial, pour l’apprentissage statistique. C’est une forme d’intelligence artificielle, techniquement, cet apprentissage statistique. Ils ont des milliers de contributeurs un niveau planétaire et une utilisation massive partout. Donc oui, il y a de plus un plus de nos communautés scientifiques qui utilisent des logiciels libres. Ça permet de faciliter l’utilisation en innovant, il n’y a pas besoin de passer des commandes, des choses bizarres, mais surtout on peut contribuer, on peut parler avec des gens qui les développent et ça apporte une véritable valeur supplémentaire dans une démarche de science ouverte qui est de plus en plus généralisée.

Delphine Sabattier : Donc logiciel libre et science ouverte font bon ménage. C’est un ménage naturel, c’est-à-dire que c’est la volonté de diffuser plus largement le savoir ?

Roberto Di Cosmo : Absolument ! D’ailleurs si vous regardez justement la notion de logiciel libre, parfois on parle free software, d’open source, globalement la notion de logiciel libre date des années 1980 ; la notion de science ouverte est beaucoup plus récente, mais les principes du logiciel libres sont très similaires à ceux de la science ouverte : comment faire pour partager les connaissances, pour travailler, construire mieux sur les résultats des autres de façon collaborative. Donc effectivement il y a un très grand alignement et ça fait vraiment plaisir de voir que dans un mouvement de science ouverte qui est devenu très populaire dans les années récentes, enfin on reconnaît l’importance du logiciel comme un véritable pionnier et un pilier essentiel de l’activité scientifique internationale.

Delphine Sabattier : Oui. J’ai oublié de rappeler que ce prix a été créé par le ministère de l’Enseignement supérieur de la Recherche et de l’Innovation dans le cadre du deuxième plan national pour la science ouverte.
Merci beaucoup Roberto Di Cosmo de nous avoir éclairés sur ces pépites du logiciel qui font progresser la recherche scientifique.

Roberto Di Cosmo : Merci.

Delphine Sabattier : À suivre dans Smart Tech, on va justement parler du plan de réindustrialisation de la France avec les start-ups.