Quelles nouvelles de la bibliothèque universelle des logiciels - Roberto Di Cosmo

Prenons des nouvelles d’un projet enthousiasmant, d’une utopie en construction, le projet mondial de préservation et de partage de notre patrimoine numérique commun : Software Heritage. Une véritable bibliothèque universelle des codes sources et des logiciels libres, imaginée et construite en réseau par notre invité, le chercheur en informatique Roberto Di Cosmo, dans l’esprit des pionniers du web : le partage et la diffusion des connaissances, en toute liberté et ouvert à tous sur la planète. Depuis 2017, l’Unesco, le CNRS et de nombreuses institutions universitaires à travers le monde ont répondu présent à cette initiative sans précédent. Pourquoi et comment partager ce patrimoine universel de l‘humanité ?

Voix off : Autour de la question. Qu’est-ce que ça va changer ? Comment ça se passe ailleurs ? Pourquoi ça ? En quoi ça nous touche ?
Caroline Lachowsky.

Caroline Lachowsky : Bonjour. Ravie de vous retrouver chers amis auditeurs à l’esprit libre et curieux pour prendre des nouvelles d’un projet enthousiasmant, d’une utopie en construction, il n’y en a pas tant que ça par les temps qui courent. C’est le projet mondial de préservation et de partage de notre patrimoine numérique commun, Software Heritage [1], une véritable bibliothèque universelle des codes sources, des logiciels libres, imaginée et construite en réseau par notre invité, le chercheur en informatique Roberto Di Cosmo [2], dans l’esprit des pionniers du Web, le partage et la diffusion des connaissances en toute liberté, ouvert à tous sur la planète.
Depuis 2017, l’Unesco, le CNRS et de nombreuses institutions universitaires et techniques à travers le monde ont répondu présent à cette initiative sans précédent : pourquoi et comment partager ce patrimoine universel de l’humanité ?
Bienvenue au cœur de ce chantier pas tout à fait comme les autres, sur le site virtuel de la bibliothèque universelle des codes sources et des logiciels libres.

Harold Abelson, voix off : Programs must be written for people to read and only incidentally for machines to execute.

Caroline Lachowsky : C’est un des pionniers et fervent défenseur du logiciel libre, le chercheur Harold Abelson du MIT qui le disait en 1985, je traduis : « Les programmes informatiques doivent être écrits pour que les gens puissent les lire et accessoirement pour que les machines les exécutent. »
Merci de nous le rappeler. Roberto Di Cosmo, bonjour.

Roberto Di Cosmo : Bonjour Caroline. Un plaisir d’être ici avec vous aujourd’hui.

Caroline Lachowsky : Un plaisir partagé d’être en direct avec vous ensemble en studio, Roberto Di Cosmo, pour nous donner des nouvelles de ce formidable projet de bibliothèque universelle des codes sources et des logiciels libres. Un projet, j’ai envie de dire à la fois essentiel, utopique et monumental que vous construisez, que vous portez avec votre petite équipe, Roberto, depuis plus de trois ans. Je rappelle que vous êtes chercheur en informatique, détaché de l’Inria, porteur donc initiateur et développeur de Software Heritage. Comment définiriez-vous ce projet très inspirant ? J’ai envie de dire que c’est un des projets les plus inspirants de la décennie.

Roberto Di Cosmo : Merci de dire ça. Ça fait plaisir de voir qu’effectivement on peut apprécier l’importance des logiciels qui sont autour de nous. Si on regarde autour de nous aujourd’hui, tout notre monde, en particulier dans cette période de crise dans laquelle on a besoin de visioconférence, de communication, de courrier électronique, d’activités, d’applications de partout, ce sont les logiciels qui sont au cœur de notre société. D’une certaine façon ils construisent le tissu de notre société moderne.
Déjà, on a un peu de mal à voir les logiciels, on appuie sur des boutons, on voit des applications, etc. Il faut savoir que ces logiciels ne sortent pas de rien, ils ont été développés, écrits – on dit effectivement écrire un programme –, conçus par des personnes, par des êtres humains qui ont développé ces logiciels, les codes sources de ces logiciels, qui sont après traduits dans un langage qui est exécutable par la machine. Effectivement, les premiers efforts sont faits par des êtres humains qui décrivent les fonctionnements de ces applications, de ces logiciels que nous utilisons. Ce sont des descriptions très complexes.
Quand j’étais petit j’étais fana d’astronomie et de fusées, etc. Quand j’étais beaucoup plus jeune, je me souviens qu’on m’avait dit que la navette spatiale était l’objet le plus complexe jamais conçu par l’être humain, on parle des années 80.
Aujourd’hui, les logiciels sur lesquels nous nous appuyons pour faire fonctionner notre société sont énormément plus complexes que ces navettes spatiales d’un temps, dans les systèmes d’exploitation, ce qu’il y a dans nos téléphones.

Caroline Lachowsky : Chacun de ces logiciels est plus complexe.

Roberto Di Cosmo : Chacun de ces logiciels est d’une complexité énorme et pour les faire fonctionner il faut effectivement arriver à les comprendre. Il y a toute une population technique, une sorte de nouveaux littéraires du 21e siècle, ce sont les développeurs qui écrivent cette littérature technique pour que les machines puissent faire ce dont on a besoin.
Il faut savoir que cette littérature technique était normalement réservée au cercle des gens qui développent, était donc peu vue, peu connue, mais c‘est une partie essentielle de notre patrimoine culturel technique et scientifique. On s’est aperçu, il y a cinq ou six ans, qu’effectivement personne ne s’intéressait à préserver ce patrimoine culturel, à faire en sorte qu’il soit réuni dans une unique grande bibliothèque d’Alexandrie pour que, après, ça soit accessible à tous et préservé sur le long temps. C’est à ce moment-là qu’on s’est lancés dans cette initiative, vous dites ambitieuse, un peu folle, mais je dirais passionnante, d’aller retrouver tous ces logiciels, collecter tous ces logiciels, tous ces codes sources, les archiver de façon qu’on ne puisse pas les perdre et faire en sorte que ça soit facilement accessible à tous.

Caroline Lachowsky : On va justement revenir sur la façon dont vous faites, parce qu’à chaque étape il y a de questions. On l’a dit, on l’avait dit ici même en 2018, je vous avais reçu au démarrage de Software Heritage, vous avez commencé par collecter les codes sources des tout premiers informaticiens, parce qu’en plus ils sont encore vivants ou ils étaient encore vivants. On le rappelle, même pour moi, si j’ai bien compris, les codes sources c’est évidemment un langage informatique, mathématique, mais avec des annotations absolument humaines de chacun de ces développeurs pour pouvoir aller plus loin, pour pouvoir les comprendre, pour pouvoir les reproduire. Vous avez commencé par collecter ces trésors, effectivement culturels, techniques de l’humanité avant qu’ils ne disparaissent. Vous avez notamment récupéré le code source d’Apollo, vous parliez d’astronomie, c’est ça.

Roberto Di Cosmo : Il y a énormément de logiciels anciens mais qui restent quand même passionnants. Effectivement, parmi les nombreux logiciels qu’on a pu retrouver il y a le code source du système de contrôle et guidage de l’Apollo 11 qui a permis de mettre les pieds du premier homme sur la lune. Au passage je signale que c’est grâce à une femme, Margaret Hamilton, qui avait piloté l’équipe des personnes qui ont développé ce logiciel. On peut effectivement aller regarder ce logiciel. Je vais essayer d’expliquer ça à travers la radio : si vous regardez dans l’archive vous allez retrouver quelques bribes de ce logiciel-là et là-dedans, par exemple dans la colonne de gauche vous allez voir un charabia technique totalement incompréhensible, c’est quelque qui est réservé, qui doit être traduit pour la machine, et, dans la colonne de droite il y a tout un tas de commentaires écrits en anglais – c’était une équipe américaine à l’époque – dans lesquels, essentiellement, les développeurs annotaient ce que le logiciel était censé faire à cet endroit-là. Par exemple, pour faire retourner les modules lunaires pour mettre les pattes vers la lune pour pouvoir alunir, il fallait faire tout un tas d’instructions. Tous ces commentaires étaient effectivement annotés et ces commentaires n’existent plus pour la machine, c’est-à-dire qu’une fois qu’on a construit l’exécutable qui est exécuté par la machine, ces commentaires disparaissent. Ces commentaires sont seulement une transmission des connaissances du développeur, de la personne qui écrit le logiciel, à une autre personne qui va devoir lire le logiciel, qui peut être la même personne un peu plus tard.

Caroline Lachowsky : C’est donc d’humain à humain. Au fond ce n’est pas d’humain à la machine, c’est d’humain à humain.

Roberto Di Cosmo : Évidement, d’une certaine façon, des fois on peut dire que le code source du logiciel c’est un message envoyé d’un humain à un autre humain pour lui expliquer ce qu’on veut que l’ordinateur fasse. C’est très important. Ces objets sont très complexes. Quand il y a un problème, il faut retrouver l’explication de ce qu’il fait. Toujours pour revenir à Apollo 11, il y a un moment mythique, le moment de l’alunissage. À quelques dizaines de secondes, à une poignée de secondes de l’alunissage, il y a un code d’erreur qui s’affiche sur l’ordinateur de bord, qui était 12.01 et on entend Amstrong qui parle avec une froideur, un sang froid impressionnant, qui demande à Houston de lui expliquer ce que veut bien dire « 12.01 ». Il y avait les jeunes ingénieurs qui avaient la pile de tous les codes sources, qui fouillent dedans pour voir ce qu’est ce code 12.01. Très rapidement, ils découvrent que c’était finalement un détail mineur, il n’y avait rien de grave. Il a dit « OK, on y va », et c’est comme ça qu’on a eu le premier alunissage. Vous voyez que ces commentaires sont super importants.

Caroline Lachowsky : Donc l’importance de ces commentaires qu’il faut donc retrouver, collecter, archiver, partager. À chaque fois, à chaque étape ça soulève des questions monumentales autour de la mise en place de cette bibliothèque universelle des codes sources et des logiciels. Il y a évidemment celle de la quantité de données à archiver et à partager, qui ne cesse d’augmenter, chaque année, chaque mois, chaque jour, presque chaque seconde. Comment faire avec l’exponentiel ? C’est tout le sens de la question que vous pose, Roberto, Cécile Lestienne, ma consœur directrice de la rédaction de Cerveau & Psycho.

Cécile Lestienne, voix off : Ces projets de conservation sont toujours fascinants et intéressants. La question que je me pose c’est comment, derrière, va-t-on pouvoir étudier tout ça ?

Caroline Lachowsky : Roberto Di Cosmo, qu’est-ce qu’on va faire de tout ça, de tout ce que vous collectez et archivez ?

Roberto Di Cosmo : C’est une excellente question.
Effectivement. Déjà, ce n’est pas facile retrouver tous les logiciels parce qu’ils sont pas mal éparpillés sur la planète dans des plateformes qui ne sont pas tout à fait compatibles les unes avec les autres, il faut tous les collecter. Une fois qu’on a construit toute cette archive, ce qu’on est en train de faire. Pour vous donner quelques chiffres : aujourd’hui on a déjà 150 millions de projets logiciels archivés.

Caroline Lachowsky : 150 millions ! Waouh !

Roberto Di Cosmo : 150 millions. Il y en a des tout petits qui n’ont aucun intérêt. Il y en a des très grands, très sophistiqués, historiques, c’est le cas de l’Apollo 11 ou du noyau Linux qui est utilisé partout dans nos ordinateurs modernes. Évidemment, il y a un peu de tout, comme dans une grande bibliothèque, vous avez de grandes œuvres et de petites œuvres, là c’est pareil.
Ce qu’on est en train de faire : on structure tous ces logiciels dans une structure qui est très particulière — on ne va pas rentrer dans les détails techniques ici — qui permet effectivement de tracer non seulement les logiciels eux-mêmes mais comment ils ont été développés, par qui, comment ils ont évolué dune version préliminaire, en version intermédiaire, en version finale, etc.

Caroline Lachowsky : La trace de tout. Vous gardez la trace de tout.

Roberto Di Cosmo : La trace de toutes les modifications : qui a modifié, quoi, pourquoi, à quel moment. Quand on a besoin de développer des objets techniques aussi complexes, il faut garder la trace de leurs modifications. On préserve tout ça et cet énorme graphe, cette énorme structure mathématique qu’on construit, nous donne une sorte de vision complète de l’évolution du développement logiciel sur les dernières 60 années.
Effectivement, comment étudier tout ça ? Il y a tellement de prismes, d’axes pour regarder les choses. On peut avoir un prisme purement technique, c’est-à-dire essayer de voir la qualité de certains logiciels, comment ça a évolué ; c’est le domaine, par exemple, du génie logiciel qui est une branche de l’informatique. Vous pouvez avoir des études de nature plus, comment dire, sciences humaines, c’est-à-dire l’histoire des communautés de développement. Ou alors, pour citer mon numéro deux sur le projet qui est Stefano Zacchiroli [3], un autre italien – il y a des Italiens qui arrivent en France de temps à autre ! – qui a publié récemment un article [4] passionnant. Il a regardé tout l’historique qu’on a reconstruit dans l’archive pour voir quelle est la contribution, par exemple, des femmes. Là il a découvert qu’historiquement il y a à peu près 8 % de femmes parmi les contributeurs aux logiciels depuis très longtemps, mais il y a un petit espoir, si on regarde sur les dernières années, maintenant on est passé de 8 à 10 %.

Caroline Lachowsky : Ça augmente un peu.

Roberto Di Cosmo : On a besoin de plus de femmes, on a énormément besoin de femmes en informatique.

Caroline Lachowsky : Appel à toutes les informaticiennes et futures informaticiennes qui nous écoutent.

Roberto Di Cosmo : Absolument.

Caroline Lachowsky : Comment fait-on pour retrouver selon les critères que l’on choisit ? Est-ce qu’il y a un moteur de recherche ? Comment est-ce possible de retrouver dans cette immense banque de données logiciels, bibliothèque universelle des codes sources, Roberto Di Cosmo.

Roberto Di Cosmo : Ça c’est un grand défi. Effectivement, on est tellement habitué, dans notre monde d’aujourd’hui, à avoir des outils informatiques extrêmement performants – des moteurs de recherche, des systèmes collaboratifs – qu’on a tendance à les prendre pour acquis. Évidemment ça doit être facile de faire un moteur de recherche sur les codes sources des logiciels, vu que vous avez tellement de moteurs de recherche, pour ne pas en citer, Google, Bing et compagnie, ou Qwant [5] le moteur de recherche français.

Caroline Lachowsky : Libre.

Roberto Di Cosmo : Mais construire un moteur de recherche c’est extrêmement compliqué. Nous avons commencé par faire un moteur de recherche simple, qui vous permet de chercher non pas à l’intérieur des logiciels, mais dans les noms des 150 millions de logiciels, de projets qu’on a déjà archivés.

Caroline Lachowsky : Quand on le connaît, on peut le retrouver.

Roberto Di Cosmo : Si vous connaissez l’URL, vous pouvez le retrouver. Par contre, l’étape suivante qui est un défi beaucoup plus important, c’est de pouvoir de chercher à l’intérieur de cette grande masse de codes de façon intelligente, pour poser des questions du style : est-ce qu’il y a un logiciel qui est utile en biologie, aujourd’hui, pour la bio ? Est-ce qu’il y a un logiciel qui a été développé récemment ? Est-ce qu’il y a un logiciel qui est compatible avec tel système d’exploitation ou qui a été développé par des développeurs à plusieurs endroits de la planète ? Donc pouvoir poser ces types de questions c’est quelque chose auquel on veut répondre, mais il faut plus de ressources que celles que nous avons aujourd’hui, donc c’est dans la ligne de mire de ce qu’on veut faire. On espère y arriver un peu plus en avant.

Caroline Lachowsky : Petit à petit, lentement, l’oiseau de cette bibliothèque universelle fait son nid.

Roberto Di Cosmo : lentement mais sûrement.

Caroline Lachowsky : Autour de la question, comment construire cette bibliothèque universelle et virtuelle des codes sources accessible à tous. Rappelons que c’est cette philosophie-là des pionniers du Web, c’est vraiment pour que tout le monde puisse y avoir accès, on va y revenir. On continue de s’interroger ensemble, Roberto Di Cosmo, sur cette utopie en marche qui est en train de devenir réalité, à l’écoute de votre choix musical.
C’est Vangelis qui vous inspire, Conquest Of Paradise. Tiens donc ! Vous nous direz pourquoi ensuite.

[Vangelis,Conquest Of Paradise]

Caroline Lachowsky : Grandiose. Vangelis sur RFI, Conquest Of Paradise. Pourquoi ce choix, Roberto Di Cosmo ?

Roberto Di Cosmo : D’abord j’adore Vangelis, ça me rappelle quand j’étais un peu plus jeune. C’est la bande sonore qui était associée à ce film où on voit la découverte de ce continent nouveau, la découverte de l’Amérique, c’était la conquête du paradis.
Je pense que ça nous inspire un peu. Justement le travail qu’on est en train de faire, aller récolter tous des codes sources qui étaient relativement inconnus du grand public alors qu’ils sont fondamentaux dans notre société moderne ; on est en train de construire un peu, de découvrir, de remettre ensemble ce continent nouveau qu’il faut découvrir. Est-ce que c’est un paradis ? Non ! C’est un peu plus compliqué, effectivement. Il y a plein de choses à faire, ce n’est pas si facile que ça, ce n’est pas suffisant de débarquer, planter un drapeau, mais disons que l’inspiration c’est un peu ça, un moyen de reconstruire quelque chose, ce qui est passionnant et fascinant.

Caroline Lachowsky : Un nouveau paradis partagé par tous, parce c’est vraiment ça qui est à la base.
Autour de la question, quelles nouvelles de la bibliothèque universelle des codes sources, ce sont plutôt des bonnes nouvelles que vous nous donnez, Roberto Di Cosmo, sur l’avancée de ce projet donc d’archivage, de collecte, de préservation, de partage de ce patrimoine numérique mondial, ces codes sources des logiciels, inventés, on l’a dit, par des hommes et aussi par des femmes pour d’autres hommes et d’autres femmes et pas juste pour faire tourner des machines.
À ce sujet, une autre citation que vous nous avez soufflée, d’un des pionniers du Web qui vous inspire, Roberto Di Cosmo, c’est le professeur à Standford et pionnier de l’algorithmie, Donald Knuth.

Donald Knuth, voix off : Programming is the art of telling another human being what one wants the computer to do.

Caroline Lachowsky : « L’art du codage, l’art de la programmation, c’est l’art de dire à un autre être humain ce que l’on veut que l’ordinateur fasse. » Là, j’ai l’impression que vous nous remettez les pendules à l’heure, Roberto Di Cosmo. On a justement un peu l’impression de se faire calculer par nos ordinateurs. Or, au départ, ce sont bien des êtres humains qui introduisent tout ça dans des machines pour servir d’autres êtres humains et pas les machines elles-mêmes, ce ne sont pas les machines ni que l’on sert ni qui doivent nous commander ou nous calculer.

Roberto Di Cosmo : Exactement. C’est ça aussi que je trouve fascinant. On a par exemple tendance à regarder l’informatique comme un objet purement technique. En réalité, c’est une histoire de femmes et d’hommes, ce sont des histoires passionnantes. Vous retrouvez les personnes qui ont découvert tout ça. À un moment, en réalité, on ne savait même pas à quoi ça allait servir et, finalement, ça a complètement transformé notre monde et c’est ce qui a permis de réagir aussi vite à cette crise du virus aujourd’hui. Si vous regardez, ce sont les moyens technologiques qui ont été développés grâce à ces développements des logiciels, de l’Internet, du Web, toutes les technologies, tous les systèmes, tous les programmes qui ont permis d’analyser ce virus et de réagir très rapidement et finalement nous permettre de reprendre un peu la main sur cette crise.
C’est important qu’on sache que tout ceci existe, que ceci est important, c’est aussi un patrimoine qui doit être accessible à tous.

Caroline Lachowsky : C’est à la fois un patrimoine essentiel et ça doit être accessible à tous. On va y revenir parce que c’est ça aussi une des grandes questions aujourd’hui. C’est bien pour ça que vous avez voulu monter cette bibliothèque universelle des codes sources et des logiciels libres. Il faut bien que le logiciel soit libre pour qu’on puisse monter.

Roberto Di Cosmo : Non. On garde tout, ne vous inquiétez pas. Pas seulement les logiciels libres, on garde absolument tout.

Caroline Lachowsky : Formidable ! Vous gardez tout à travers le monde. Je vous propose d’écouter, Roberto Di Cosmo, à travers la question « quelles bonnes nouvelles de la bibliothèque universelle des logiciels » l’éclairage inspirant de Magda Fusaro. Elle est rectrice de l’UQAM, l’Université du Québec à Montréal, la première université hors Europe qui a rejoint ce projet, Software Heritage, en 2018. Magda Fusaro est interrogée par notre reporter Charlie Dupiot.

Magda Fusaro, voix off : Au début du projet, lorsqu’on m’a gentiment demandé pourquoi il fallait, entre guillemets, « adhérer », ça n’a pas été une obligation, c’est vraiment un souhait réel de faire contribuer des organismes comme le mien, comme l’Université du Québec à Montréal qui est donc une grande université à Montréal, à un projet qui dépasse simplement le rôle des institutions. Je pense que c’est un projet de bibliothèque, tout simplement. Software Heritage est une immense bibliothèque, une librairie du logiciel, des codes sources libres pour pouvoir garder des traces de tout ce code fabuleux qui se crée, pour permettre à d’autres, développeurs, programmeurs, analystes et autres personnes qui croient en l’informatique, et on est nombreux je crois, par les temps qui courent, à considérer que ça a quand même pas mal d’avantages. Donc de pouvoir un jour, dans 50 ans, 50 000 ans, qui sait, avoir accès à ces données, parce que ce sont des données, ce sont des données brutes, du code et il faut le protéger au même titre qu’on protège un patrimoine, par exemple qu’il s’agisse de patrimoine historique, de patrimoine urbain, sans parler bien sûr de la littérature, tout le patrimoine qui nous vient des livres. Pourquoi on conserverait l’un et pas l’autre ?
L’autre aspect que j’ai trouvé fascinant dans ce projet, c’est d’éviter de refaire les choses. Quelqu’un qui a développé un code fabuleux, une ligne, plusieurs milliers de lignes de code, pourquoi ne pas y avoir accès et permettre à des jeunes, plus jeunes et moins jeunes d’ailleurs, de s’approprier ce code-là, de pouvoir le partager, l’améliorer, en faire un vrai projet logiciel et créer quelque chose de nouveau à chaque fois. Le faire à l’échelle d’une planète c’est fabuleux, c’est juste fabuleux !

Charlie Dupiot, voix off : Qu’est-ce que vous aimeriez voir améliorer ? Qu’est-ce qui reste à améliorer pour vous dans ce projet ?

Magda Fusaro, voix off : Peut-être, certainement, voir de quelle manière on peut davantage impliquer les plus jeunes, en fait ceux qui choisissent le baccalauréat en informatique, donc l’équivalent de la licence. Comment intégrer nos jeunes étudiantes, étudiants, tout de suite à se préoccuper du patrimoine code. Je crois que c’est quelque chose qui mériterait qu’on puisse faire une opération, quelle qu’elle soit, d’éducation. Comment développer une culture du patrimoine pour permettre à un organisme comme celui-ci de pouvoir avoir davantage d’abonnés, de contributeurs. Je pense que ce serait quelque chose qui serait intéressant.
Également un autre aspect qui n‘est pas banal, mais là ça relève plutôt des politiques publiques : comment faire en sorte que nos gouvernements soutiennent ces initiatives ? Il faut également les encourager par l’entremise de politiques publiques : favoriser les dépôts, contribuer réellement. Les gouvernements sont également des grands producteurs de code.
Tout ce qui est de la notion d’un patrimoine mérite d’être protégé. D’ailleurs, ce n’est pas pour rien que c’est sous le patronage de l’Unesco au même titre qu’un jour, peut-être, certaines lignes de code ou certaines programmations recevront un label, waouh !, qui serait de l’ordre du patrimoine mondial de l’Unesco. Je crois que ça va faire partie de quelque chose qui va rester pour les années à venir. Il me semble que c’est important. Oui, tout à fait.

Caroline Lachowsky : Vous voulez réagir, Roberto Di Cosmo, à ces propos de Magda Fusaro, rectrice de l’Université du Québec à Montréal. C’est la première université, hors Europe, qui a soutenu ce fabuleux projet de bibliothèque universelle des logiciels et elle le soutient, ô combien. Elle a tout compris.

Roberto Di Cosmo : Exactement. Je me rappelle que la rencontre avec madame Fusaro était passionnante. Elle était déjà rectrice quand on s’est rencontrés, elle est encore rectrice. Elle a compris immédiatement la portée du projet. C’était un énorme plaisir d’échanger avec elle. Effectivement, elle touche des sujets qui sont importants : la reconnaissance du patrimoine logiciel en tant que tel ; ce n’est pas juste un objet technique, c’est beaucoup plus que ça, c’est une partie de notre patrimoine cultuel. L’importance c’est faire en sorte que les gens se saisissent de cette importance.

Caroline Lachowsky : Le comprennent, se rendent compte à quel point c’est important et à quel point c’est notre trace, celle aussi qu’il faut transmettre. Il y a vraiment la question de la trans mission aux générations ftures pour qu’elles puissent revenir dessus, comprendre, l’améliorer. Il y a cette question-là.

Roberto Di Cosmo : Il y a cette question-là et il y a effectivement le fait de ne pas se limiter à la dimension purement technique de l’objet de notre temps. Il faut regarder tout ce qui se passe autour, dans tous les contextes, comment les gens travaillent ensemble pour le développer, pour le faire avancer, etc.
Aussi retrouver la trace. Des fois, c’est comme le vin. Des fois, un vin ancien peut être meilleur qu’un vin tout jeune, donc un ancien logiciel n’est pas forcément mauvais. Vous pouvez trouver des algorithmes particulièrement intéressants et bien développés qui peuvent dater d’il y a longtemps, qui sont encore intéressants aujourd’hui. Donc savoir retrouver l’ancien et retrouver les choses intéressantes dedans, c’est vraiment important.

Caroline Lachowsky : On peut les développer et les jeunes peuvent les développer, revenir dessus. Enfin les jeunes, oui, ou des esprits jeunes et nouveaux peuvent revenir sur les anciens logiciels.

Roberto Di Cosmo : Exactement. Des fois, il y a une vertu pédagogique à regarder un peu le passé. Bien comprendre comment ces systèmes, qui sont hyper-complexes, fonctionnent, des fois ça aide. Voir comment des systèmes anciens qui étaient plus petits, qui étaient à l’origine plus simples, posaient les questions et comment ils s’y attaquaient. Voir des projets complets qui étaient plus petits, plus limités, c’est une façon simple pour mieux comprendre ce qui se passe dans les systèmes complexes d’aujourd’hui. Il y a cette dimension pédagogique qui n’est pas à oublier.
Il y a une remarque de la rectrice que je trouve particulièrement importante et qui revient à votre question de tout à l’heure. Effectivement, quand on a décidé de lancer Software Heritage, on n’avait rien, juste une vision, mais la vision était claire dès le départ, grâce au fait de l’avoir travaillée avec des personnes comme Jean-François Abramatic qui a été un des premiers directeurs du W3C [World Wide Web Consortium], comme Antoine Petit, comme d’autres avec qui on a discuté du projet. L’idée c’était vraiment de construire une infrastructure, une bibliothèque, qui est propriété de toute la planète, au service de toute la planète. Ce n’est pas construire une start-up, une entreprise ou juste une organisation purement limitée à un seul pays. On souhaite que cet objet soit vraiment partagé par tous et préservé sur le long terme. Qu’il réponde aux besoins à la fois du patrimoine culturel, de la recherche et pas seulement la recherche sur le passé, mais la recherche sur le futur, comprendre comment trouver rapidement les meilleurs codes, les choses les plus adaptées à nos besoins et aussi à l’industrie et aussi à l’éducation.
Il faut qu’on adresse toute cette panoplie de sujets et, pour ça, on a besoin du soutien de différentes natures. Si vous regardez sur le site web aujourd’hui vous verrez qu’on a plusieurs soutiens : on a des soutiens d’industriels, on a des soutiens d’universités. Petit à petit on commence à avoir de vrais soutiens institutionnels. On est très contents d’avoir le CNRS qui nous a rejoins récemment.

Caroline Lachowsky : Le Centre national de la recherche scientifique.

Roberto Di Cosmo : Mais aussi, par exemple, le ministère de la Recherche. Vous retrouvez aussi des services du Premier ministre pour l’archivage des codes sources publics, c’est porté par la DINUM [Direction interministérielle du numérique] qu’on remercie. Mais ça ne suffit pas. Il faut qu’on dépasse nos frontières, il faut qu’on trouve un soutien à travers plusieurs gouvernements et plusieurs institutions au niveau international. C’est le travail qu’on essaye de faire maintenant avec l’aide de l’Unesco et ce n’est pas facile !

Caroline Lachowsky : Avec l’aide de l’Unesco, essayer d’élargir hors l’Europe, y compris au Québec, de toucher les Suds, très important de partager avec les Suds, on y viendra aussi pour ce qui est de la préservation de toutes ces archives, les préserver à plusieurs des endroits de la planète. Quid des GAFA, des grosses entreprises privées ? Est-ce qu’elles sont quand même concernées même si ce n’est pas du logiciel libre ? Est-ce que vous avez leur soutien ? C’est compliqué.

Roberto Di Cosmo : Il y a 20 ans j’étais un peu le porte-parole du logiciel libre en France quand c’était difficile. Aujourd’hui c’est beaucoup plus facile. Le logiciel libre est utilisé quand même assez largement par pas mal d’entreprises, même les grandes entreprises, vous parlez des GAFAM, ce sont des utilisateurs massifs de logiciels libres.
Après, à mon avis, ils pourraient faire beaucoup plus que ce qu’ils font aujourd’hui pour soutenir le logiciel libre, des fois c’est juste des petits gestes. Ça serait bien qu’ils s’engagent beaucoup plus que ce qu’ils font maintenant.
Je ne pense pas qu’ils nous voient uniquement comme un compétiteur ou comme un ennemi. Au contraire ! En réalité, ce qu’on fait, on véhicule l’importance du développement logiciel, ce qui est quelque chose d’essentiel pour toute l’industrie et on fournit essentiellement une base de connaissances, de références universelles pour tout le monde, qui a aussi des applications, potentiellement, industrielles, avec la différence qu’on n’est pas là pour enrichir des actionnaires. On est là pour maintenir sur le long terme une infrastructure au service de tous. C’est une sorte de bien commun et tout le défi est comment faire pour maintenir ce bien commun au service de tous sans que personne puisse tirer la couverture un peu trop de son côté.

Caroline Lachowsky : Sacré défi, on n’a pas l’habitude de ça aujourd’hui, mais on a besoin de ça aujourd’hui, franchement. Ce bien commun.

Roberto Di Cosmo : Je trouve que c’est une des choses qui me permet de bien dormir la nuit et d’être content des choses qu’on fait, de l’énergie qu’on met tous dans notre équipe.

Caroline Lachowsky : L’énergie considérable que vous devez mettre là-dedans, Roberto Di Cosmo. Plus ça marche, on comprend bien, plus ça s’étend et cette bibliothèque des codes sources va s’étendre, plus ça ouvre des questions, à commencer par celle que soulève tout de suite de Mathieu Nowak, mon confrère de Sciences et Avenir. On l’écoute.

Mathieu Nowak, voix off : Il y a toujours cette question dans l’archivage : est-ce qu’il faut tout conserver ? Elle se posera aussi fatalement pour le logiciel une fois que les quantités de données seront monstrueuses. Est-ce que vous pensez qu’il faudra éternellement conserver tous les logiciels ? Sinon comment va-t-on choisir ceux qu’on garde ?

Caroline Lachowsky : Comment faire le choix ? D’ailleurs est-ce qu’il faut faire un tri, Roberto Di Cosmo ?

Roberto Di Cosmo : C’est une très belle question. La bibliothèque qu’on construit est une bibliothèque un peu particulière. Quand on discute avec nos collègues qui sont archivistes ou bibliothécaires, quand on leur explique ce qu’on fait, ils restent un peu surpris, parce que, effectivement, nous ne filtrons rien. Nous ne prenons aucune décision sur ce qui mérite d’être archivé et sur ce qui ne mérite pas d’être archivé. Ça peut être surprenant pour un bibliothécaire. Si quelqu’un arrive chez vous avec un brouillon de papier sur lequel il a gribouillé quelque chose, il demande de le déposer à la BNF, on l’éconduit gentiment à la porte en disant que c’est n’est pas forcément là l’endroit pour garder ces petites notes.

Caroline Lachowsky : Ça ne nous intéressent pas.

Roberto Di Cosmo : Alors que nous, au contraire, on dit merci ça nous intéresse. On dépose tout et on récupère tout. Pourquoi ? Pour deux raisons.
Une première raison est une raison technique. Grâce au type de technologie qu’on utilise – et à nouveau ça va au-delà de la discussion d’aujourd’hui donc faites-moi confiance –, on utilise une technologie qui nous permet effectivement de dédupliquer massivement tous les contenus archivés.

Caroline Lachowsky : Dédupliquer.

Roberto Di Cosmo : Dédupliquer. Je l’explique. Dans le monde du logiciel, du développement logiciel, on réutilise très souvent les mêmes segments, les mêmes copies, on réutilise pas mal de choses, on copie beaucoup. Ce n’est pas vraiment du plagiat, quelquefois c’est nécessaire, on est obligé de copier, donc il y a pas mal de redondance. Si on arrive à enlever cette redondance et à tout comprimer d’une façon plus compacte, on arrive à tenir dans des volumes qui ne sont pas énormes. Grâce au fait qu’aujourd’hui vous avez la croissance de la mémoire sur disque, différentes technologies qui sont utilisées pour vous permettre de mettre sur YouTube ce que vous voulez, donc grâce à ça, la taille qu’on utilise pour archiver tous ces logiciels n’est pas énorme. Donc on peut se permettre de ne rien jeter. Mais même si on peut se permettre de ne rien jeter, on peut se poser la question de pourquoi tout garder quand même. Il y a une vraie réponse philosophique là-derrière. Ça vient du fait que les logiciels, tels qu’ils sont développés maintenant, surtout aujourd’hui avec l’essor incroyable du logiciel libre et de l’open source, vous retrouvez souvent des tout petits projets qui sont déposés, mis à disposition du public. Et quand vous regardez les tout petit projets, en soi, est-ce qu’il faut les garder ou pas ? Ça ressemble à un gribouillis sur un papier, mais vous ne savez pas si ce gribouillis sur un papier c’est Picasso qui a fait un dessin sur le coin d’une nappe au restaurant – on espère revenir au restaurant – ou si c’est juste un gribouillis qui ne vaut rien. Comme on ne peut pas savoir quelle est sa valeur, on garde avec l’idée que plus tard, s’il a de la valeur, s’il va se développer, si ce petit gribouillis va devenir un grand logiciel très important, on aura gardé la trace de tout, même des premiers gribouillis de son développement.

Caroline Lachowsky : On va garder les traces de ces premiers prémices, l’origine de ces esquisses, dans l’idée aussi que d’autres peuvent s’en servir pour aller beaucoup plus loin.

Roberto Di Cosmo : C’est ça. Pour comprendre comment il a été développé, pour comprendre d’où ça vient, pour connaître toute l’histoire de ce qui a été fait.

Caroline Lachowsky : Comment, puisque vous gardez tout, on l’a bien compris, que ce n’est pas trop « volumineux » entre guillemets puisque vous arrivez à supprimer les redondances, comment faites-vous ? Une copie, deux copies, mille copies ? Comment faites-vous ?

Roberto Di Cosmo : C’est une bonne question. C’est effectivement tellement compliqué de réunir tous ces logiciels en se connectant sur plein de plateformes, etc., pour lesquelles, d’ailleurs, on a besoin d’aide pour élargir ce type de couverture, qu’on ne veut pas les perdre, une fois qu’on les a, tous ces contenus. Comment fait-on pour s’assurer de ne pas les perdre ? On utilise essentiellement deux stratégies.
Une première stratégie interne, chez nous, c’est effectivement d’avoir plusieurs copies sous notre contrôle. On en a aujourd’hui essentiellement trois à peu près sous notre contrôle complet.

Caroline Lachowsky : De Software Heritage, l’équipe de Roberto Di Cosmo,

Roberto Di Cosmo : Ce n’est pas mon équipe, disons que c’est toute l’équipe qui travaille ensemble sur le projet, c’est un projet qui me dépasse largement.
Trois copies sont sous notre contrôle, mais ça ne suffit pas, parce qu’on pourrait devenir tous fous et décider de brûler tout ce qu’on a fait et ça, ce n’est pas bien. Ou on pourrait se faire pirater ou, je ne sais pas, un accident.
Donc on a lancé un deuxième programme pour essayer de préserver ça largement, c’est ce qu’on appelle un programme miroir. Qu’est-ce que c’est un miroir dans notre terminologie ? C’est une copie de l’archive complète mais qui n’est pas sous notre contrôle, qui est sous le contrôle de quelqu’un d’autre, une autre entité.

Caroline Lachowsky : Carrément. D’accord.

Roberto Di Cosmo : Pour l’instant on a signé deux accords, un avec une entreprise en Suède, l’autre avec une grande institution de recherche qui est en Italie. On a deux premières copies indépendantes donc des miroirs. L’avantage c’est que même s’il arrive quelque chose aux copies sous notre contrôle, si on disparaît, on devient tous fous, on décide de se suicider – j’espère que ça n’arrivera pas malgré le confinement continu.

Caroline Lachowsky : Tenez bon ! Malgré tout, si ça vous arrivait de devenir fous, on est tranquille, il y a des copies en miroir.

Roberto Di Cosmo : Il y a des copies qui ne dépendent pas de nous. C’est le travail qu’on est en train de construire, on n’y est pas encore, on est au milieu du gué. On espère ne pas devenir fous tout de suite, parce qu’il faut d’abord mettre en place les autres miroirs.

Caroline Lachowsky : Oui, il faut mettre en place les autres miroirs, j’imagine ailleurs aussi. Ce qui évite aussi une forme de souveraineté locale, d’un pays, nationale, c’est vraiment universel.

Roberto Di Cosmo : Exactement. C’est vraiment universel. Vous utilisez le mot « souveraineté ». Si je peux prendre 30 secondes, c’est un sujet important. On parle beaucoup de souveraineté, on s’est rendu compte avec cette crise sanitaire du fait que dépendre d’autres entités ou d’autres pays qui n’ont pas forcément le même agenda quand il s’agit des crises majeures ce n’est pas forcément une bonne idée. Vous voyez que pour le code source des logiciels, vu que les logiciels sont tous entremêlés, on a besoin d’avoir accès aux différentes sources, aux différents briques logicielles pour tout ce qu’on fait, c’est important de pouvoir garder un accès libre et sans contrainte à l’histoire du développement de tous ces logiciels. Pour faire ça, il faut que tous ces logiciels soient collectés dans une archive qu’on construit, qui est indépendante du pouvoir des uns et des autres, des entreprises, qui ne dépende pas d’une seule entité. Les mécanismes miroirs qu’on met en place pour préserver les codes d’accidents, répondent, en réalité, aussi à l’enjeu de souveraineté qui, pour une fois, n’est pas une souveraineté rivale. C’est-à-dire que si moi je suis souverain vous ne l’êtes plus ; si moi je contrôle les noyaux de la technologie et de l’Internet, vous êtes dépendant. Non. Si chaque pays, chaque région, chaque entité a son miroir, chacun est indépendant sans rien enlever à l’indépendance des autres. C’est un peu ce vers quoi on essaye de tendre, mais c’est un discours qu’il faut expliquer, répéter, pour que petit à petit les différents pouvoirs politiques, dans les différents pays, puissent s’en saisir. La France a commencé à le faire, il faut aller plus loin et plus vite.

Caroline Lachowsky : En Europe et ailleurs.
Autour de la question de Software Heritage, de cette bibliothèque universelle des codes sources, nus continuons de nous interroger ensemble sur cette véritable utopie en marche, c’est ça qui est bien, pour la préservation et le libre partage des connaissances.
The Pursuit Of Knowledge, joli titre de Zack Hemsey. Passer d’une oreille à l’autre et entre toutes les oreilles sur RFI.

[Zack Hemsey, The Pursuit Of Knowledge]

Caroline Lachowsky : The Pursuit Of Knowledge, « La poursuite de la connaissance », morceau de Zack Hemsey sur RFI. C’est pour vous, Roberto Di Cosmo.

Roberto Di Cosmo : Merci.

Caroline Lachowsky : Qui mettez toute votre énergie à collecter, préserver, partager en accès libre les codes sources des logiciels, en open source justement. Une aventure scientifique, une aventure humaine, un vrai défi que de monter cette bibliothèque universelle des codes sources. SoftWare Heritage protège notamment les codes sources de tous les langages informatiques déjà créés et qui vont être créés dans l’avenir, ce qui soutient et inspire les chercheurs de par le monde.
Direction maintenant Nagoya, au Japon, avec le mathématicien Jacques Garrigue, professeur au Département de mathématiques de l’université de Nagoya où il développe un langage informatique, OCaml, déjà protégé par Software Heritage. Il s’en explique au micro de notre reporter Charlie Dupiot depuis Nagoya au Japon.

Jacques Garrigue, voix off : Sachant qu’il y a de par le monde des milliers de langages de programmation qui ont tous des aspects intéressants, chacun invente son petit cocktail qui est censé pouvoir permettre aux gens de développer les programmes plus rapidement, plus agréablement, du coup, il y a des milliers de recettes, des milliers d’approches. L’enjeu c’est de préserver toute cette diversité, les outils qui permettent de les utiliser. Si on n’a pas cet outil-là, le langage disparaît. C’est comme avoir la grammaire d’un langage sans personne qui le parle.

Charlie Dupiot, voix off : Vous travaillez à l’université de Nagoya, au Japon. Est-ce que vous savez si cette idée de préserver des logiciels est partagée par certains de vos collègues japonais ?

Jacques Garrigue, voix off : Les Japonais sont assez sensibles à conserver les choses, des patrimoines plus intangibles. Vous savez qu’au Japon un maître est quelque chose de très important, dans la culture japonaise, maître du thé, maître d’un art, et ces gens peuvent être considérés comme des trésors vivants officiellement par l’État. Ça, ça va un peu dans cette direction-là. Le logiciel pourrait rentrer dans cette catégorie-là, quelque chose qu’il faut sauvegarder parce que ça fait partie du patrimoine culturel, parce qu’on s’en sert pour créer des choses.

Charlie Dupiot, voix off : Finalement, que vous apporte à vous ce projet Software Heritage ? Est-ce que vous auriez un message à faire passer à notre invité Roberto Di Cosmo ?

Jacques Garrigue, voix off : C’est surtout une confiance, savoir que les choses ne vont pas être perdues. Jusqu’à présent, tout ce que j’ai fait c’était au niveau individuel, prendre soin, que tout ce que j’avais développé je le gardais en l’état, mais c’est beaucoup de travail. Savoir que les choses vont être préservées, ça fait chaud au cœur.

Caroline Lachowsky : Donc ça fait chaud au cœur de tous les mathématiciens et informaticiens, mais pas seulement, ça peut faire chaud au cœur de chacun de nous que de se rendre compte à quel point il est important de préserver et de partager, parce que ce sont les deux en même temps, c’est préserver et partager ces codes sources qui sont véritablement un langage, un patrimoine culturel, on peut le dire comme ça, de l’humanité, commun.

Roberto Di Cosmo : Tout à fait. Effectivement, il y a trois mots-clefs qu’on utilise dans la construction de la bibliothèque : collecter, donc aller chercher ; préserver, ne pas perdre et partager, rendre disponible à tous, mais partager avec tous de telle façon qu’on ne perde pas les traces des objets dont on veut parler. Par exemple, quand on a fait un développement logiciel pour la recherche scientifique, qui peut être en biologie, en physique, en sciences humaines, en littérature, on a besoin de savoir si ces résultats sont vraiment fiables, si on peut les reproduire, parce qu’il n’y a pas de science sans capacité de vérifier. Il est important que les logiciels qui sont utilisés dans ces démarches scientifiques puissent être archivés, identifiés, référencés précisément de façon à ce que quelqu’un qui veut comprendre comment le résultat a été obtenu, puisse retrouver exactement la version du logiciel avec laquelle on a travaillé. C’est aussi à ça qu’on s’attelle. On peut chercher, on peut référencer.

Caroline Lachowsky : Disons la mémoire aussi, c’est ça, la mémoire.

Roberto Di Cosmo : Oui, c’est la mémoire et aussi des références pérennes, permanentes dans l’archive, qui font en sorte que vous sachiez exactement de quel logiciel, à quel moment vous êtes en train de parler.

Caroline Lachowsky : C’est fondamental. Fondamental pour la science, fondamental aussi dans votre démarche, puisque, on le rappelle, c’est ouvert à tous, disponible pour tous, cette démarche de science ouverte dont on parle aujourd’hui, dont l’Unesco se fait porte-parole, l’IRD [Institut de recherche pour le développement] aussi. On parle de science ouverte, on parle de One Health, de santé globale, tout ça va ensemble. Vraiment la notion de science ouverte, c’est-à-dire que quiconque en ait besoin, tous les chercheurs du monde, où qu’ils soient, puissent y avoir accès. C’est là aussi l’énorme avantage de cette bibliothèque universelle, virtuelle, des codes sources, c’est qu’on peut partout dans le monde, où qu’on soit, quelle que soit sa couleur, sa race son niveau d’études son gouvernement…

Roberto Di Cosmo : Absolument, on peut y accéder. La science ouverte est un mouvement relativement récent, vraiment récent pour quelque chose qui est profond, le fait de se dire que les résultats de la recherche scientifique doivent être accessibles le plus largement possible. On s’est très souvent focalisé sur les publications, la chose que tout le monde arrive à comprendre, même si, des fois, c’est difficile de les lire ! Après, on a découvert que les données sont importantes, sans les données on ne peut rien reproduire. C’est seulement récemment qu’on s’est rendu compte qu’il y a un troisième pilier fondamental, ce sont les logiciels. Pour construire ces piliers logiciels de la science ouverte que nous travaillons aujourd’hui, justement main dans la main, avec le ministère de la Recherche. J’ai eu le privilège de participer au comité d’orientation pour la science ouverte. On a discuté aussi du logiciel ; petit à petit ça fait son chemin alors qu’il était plutôt inconnu au bataillon il y a un certain temps.

Caroline Lachowsky : Maintenant il en fait partie, véritablement.

Roberto Di Cosmo : Il commence à faire à en faire partie, même au niveau de l’Europe, mais il faut quand même que ça dépasse toutes les limites et toutes les barrières.

Caroline Lachowsky : Il faut aussi que ça aille au Sud, d’une manière aussi que ça atteigne le Sud où il y a des jeunes développeurs informaticiens, mathématiciens, qui ont des idées, qui ont des outils, et là ça peut vraiment ouvrir la science et ouvrir la recherche et les données.

Roberto Di Cosmo : Exactement. Il ne faut surtout pas que ça soit considéré comme quelque chose de limité à un pays particulier. D’ailleurs à ce propos, il y a un an on avait travaillé avec l’Unesco et avec mon ancienne université en Italie, l’université de Pise, là où l’informatique est née en Italie il y a plus de 50 ans, c’était le cinquantenaire de la création du premier Département d’informatique en Italie qui était à l’université de Pise. À cette occasion, on a travaillé ensemble pour construire un protocole, un processus qui décrit comment aller récupérer les logiciels historiques dans chaque pays pour reconstruire l’histoire, les mettre en valeur, les archiver dans Software Heritage et les rendre facilement disponibles. C’était une aventure très intéressante, ça s’appelle Software Heritage Acquisition Process. Maintenant il est disponible, il est promu par l’Unesco [6] pour qu’on puisse récupérer ce patrimoine historique dans différents pays.
On parlait des jeunes. Des fois ça peut être intéressant pour des gens qui font plutôt des métiers techniques, de l’informatique, des choses comme ça, de pouvoir avoir des stages, faire des petits travaux à côté d’autres personnes qui ont plutôt une culture d’historien, d’archiviste, en allant reconstruire, retrouver dans leur propre institution, leur propre université, leur propre centre de recherche, certains bijoux et aller parler avec les personnes qui sont encore vivantes. On a la chance d’avoir, la plupart du temps, les personnes qui ont développé tout ça encore là, pendant quelques années. Donc on peut aller les retrouver, reconstruire cette histoire, reconstruire les objets, quand on a besoin de connaissances techniques, historiques ou humaines. C’est quand même une très belle aventure qui est ouverte à tous, dans tous les pays.

Caroline Lachowsky : Très belle aventure, titanesque, monumentale. Maintenant vous avez aussi des ambassadeurs, vous voulez promouvoir des sortes d’ambassadeurs pour effectivement dire que ça existe, dire qu’on peut y participer, parler de l’importance, parce que même moi que ne comprends pas grand-chose à l’informatique, je comprends l’importance de la préservation et du partage de ces codes sources. Vous voulez des ambassadeurs un peu partout ?

Roberto Di Cosmo : Pour être honnête, on s’était dit il y a longtemps qu’on aurait dû pouvoir démultiplier la capacité d’expliquer, de porter cette passion. Finalement on l’a fait. Il y a quelques semaines on a ouvert un programme d’ambassadeurs, il suffit d’aller sur le site web pour le retrouver.

Caroline Lachowsky : Le lien est sur notre page, le site de Software Heritage.

Roberto Di Cosmo : Il ne faut pas oublier qu’on est une petite équipe.

Caroline Lachowsky : Vous n’êtes pas nombreux pour tout ça !

Roberto Di Cosmo : L’idée c’est d’accueillir des personnes qui ont envie d’en savoir plus, d’être plus en contact avec nous pour porter la parole ailleurs, dans d’autres disciplines, dans d’autres domaines, un peu partout. Donc on a ouvert les portes pour faire ça et on va essayer de faire en sorte que la prochaine fois vous puissiez inviter quelqu’un d’autre pour parler du même projet.

Caroline Lachowsky : Avec grand plaisir. Et en plus vous pouvez désormais un peu financer. Vous ne faites pas que demander des financements, mais vous avez un tout petit peu les moyens de vos extraordinaires ambitions.

Roberto Di Cosmo : C’est vrai. Merci de me le rappeler. Effectivement, on l’a fait pendant longtemps et on continue. On a vraiment besoin d’avoir plus de financements, donc on a besoin de mécènes, on a besoin de donateurs parce que le travail est énorme. On ne travaille pas seulement pour obtenir des financements pour nous. Depuis un an, on a commencé à travailler pour obtenir des financements qui vont directement à des personnes qui contribuent au projet. C’est à travers une fondation hollandaise, NLnet, qu’on remercie, qui a financé deux petites entreprises qui ont travaillé avec nous pour sauver des logiciels en danger. On a sauvé un quart des millions de logiciels qui étaient en danger sur la plateforme Bitbucket et on l’a fait grâce à ces financements-là. On a aussi réussi à faire bouger un peu la fondation Sloan, une grande fondation américaine qui nous donne des financements pour financer des gens qui travaillent avec nous. On espère pouvoir faire ça plus et plus souvent et aussi, des fois, peut-être pour des étudiants. On n’a pas les capacités financières, on en demande, mais on sait reconnaître la bonne volonté : quand quelqu’un veut travailler avec nous, on essaie de trouver un moyen pour qu’il puisse le faire.

Caroline Lachowsky : Génial. Il ne reste plus qu’à souhaiter longue vie, très longue vie, bien plus longue que la nôtre à cette bibliothèque universelle des logiciels. Jusqu’où nous entraînerez-vous, Roberto Di Cosmo. On ne sait pas, mais on vous suit ! De toute façon, vous revenez quand vous voulez pour nous parler de ce projet Software Heritage. N’hésitez pas, chers amis auditeurs, à aller faire un tour sur cette plateforme, sur la Newsletter [7] aussi de Software Heritage. Le lien est évidemment sur notre page.
À bientôt Roberto Di Cosmo.

Roberto Di Cosmo : Merci beaucoup. Avec plaisir.