Solène Étienne : Nous revoilà au cœur du temple de la tech, VivaTech [1]. Mon prochain invité est une des voix les plus audibles en France quand on parle de souveraineté numérique et d’intelligence artificielle responsable. Yann Lechelle entrepreneur engagé, je dirais même multi-entrepreneur, a dirigé des pépites, a accompagné le développement de l’IA au sein de Scaleway et porte aujourd’hui Probabl [2] une startup spin-off d’Inria [Institut national de recherche en informatique et en automatique], spécialisée en IA probabiliste open source. Si vous vous demandez ce que tous ces mots veulent dire, restez avec nous. On va en savoir beaucoup plus dans quelques instants et quand beaucoup parlent de régulation lui, il construit les alternatives. Restez avec nous.
Voix off : Feuilleblanche – 40 nuances de Next.
Solène Étienne : Bonjour Yann.
Yann Lechelle : Bonjour.
Solène Étienne : Je suis ravie de t’accueillir dans notre studio 40 nuances de Next au cœur de VivaTech. Merci d’avoir accepté notre invitation.
Yann Lechelle : Avec grand plaisir. Merci
Solène Étienne : J’ai parlé en introduction d’IA, d’open source, d’IA probabiliste, je pense que j’ai peut-être un peu perdu nos auditeurs et nos auditrices et je veux bien que tu nous expliques tout cela, notamment dans le cadre de Probabl.
Yann Lechelle : Merci pour l’opportunité.
L’IA est un terme qui séduit, qui angoisse peut-être parfois, qui fascine, est un sujet qui existe depuis des décennies, plus de 50 ans. Cette IA existe sous plusieurs formes. Si on simplifie, l’IA c’est du logiciel, sauf qu’il n’est pas écrit systématiquement par un humain. Cette IA, d’une certaine manière, est beaucoup plus organique. Elle développe des processus qui s’apparentent parfois à l’intelligence humaine, c’est pour cela que le terme « intelligence artificielle » est sorti, il a été trouvé par des chercheurs, aux États-Unis il y a bien longtemps. La définition, aujourd’hui, évolue parce qu’il y a des innovations, notamment l’IA générative dont tout le monde parle aujourd’hui, mais il existe plusieurs familles au sein de l’IA.
Solène Étienne : On a tendance à les oublier parce qu’on met un peu tout dans le même paquet ?
Yann Lechelle : Absolument, on occulte.
Solène Étienne : C’est comme si on disait « attention, la vulgarisation va être à son comble », c’est un petit peu comme si on appelait tous les légumes « légume ».
Yann Lechelle : Un petit peu, alors qu’il y a tout un tas de familles.
L’IA existe sous plusieurs formes. Si on retient une définition globale, c’est plutôt cette idée que la machine va se saisir d’un problème et elle va, presque intuitivement, à travers des algorithmes – au fond, ce ne sont que des mathématiques appliquées –qui vont dire que la solution n’est pas le script habituel lorsqu’on code, mais plutôt un ensemble de nombres qui vont constituer une solution pour pouvoir aboutir à un résultat : une entrée, l’IA fait son travail et elle ressort un résultat qui est soit une prédiction ou, dans le cas de l’IA générative, un texte qui suit et qui est la réponse à un prompt.
Au fond, ces IA sont toutes les mêmes, puisque il y a un stimulus – d’ailleurs comme pour l’humain, il y a toujours un stimulus –, ensuite une réaction qui est cognitive et, à cette réaction, une réponse. Toutes les IA sont globalement dans ce schéma-là, en revanche nous nous focalisons sur l’IA prédictive, probabiliste, qui est beaucoup plus ancrée dans des données quantitatives dites tabulaires, c’est-à-dire des grands tableaux, plutôt un tableau excel avec plein de données dedans.
Solène Étienne : Plutôt que plein de contenus, textes ou images.
Yann Lechelle : On est donc plutôt dans l’IA des matheux, là où l’IA générative est l’IA des littéraires.
Solène Étienne : C’est une belle manière de l’expliquer. Et l’open source dans tout ça ?
Yann Lechelle : L’open source est un objet dont on me dit, quand j’en parle aux politiques, qu’il est ésotérique parce que personne n’y comprend rien. Tout le monde mélange l’open source au sens de l’IA, l’open source au sens du code source, tout le monde dit qu’on ne peut pas faire de business avec ça, ce qui est complètement faux, certains pensent que c’est gratuit alors que pas forcément.
Solène Étienne : Parce que c’est ouvert.
Yann Lechelle : Oui. Il faut donc distinguer le logiciel libre qui vient du mouvement créé par Richard Stallman autour de la Free Software Foundation [3], qui était véritablement un mouvement radical qui, peut-être d’ailleurs, voulait casser le modèle monopolistique d’IBM à l’époque, entreprise privée qui captait toute la valeur, tout l’oxygène dans la pièce. Richard Stallman a dit : « Ce n’est pas possible, le code doit appartenir à tous, doit bénéficier à tout le monde. » C’est comme cela qu’est né le free software, traduit en français « logiciel libre », parce que Free a une double connotation : libre et gratuit.
Solène Étienne : Alors qu’en français « libre », ce n’est pas gratuit.
Yann Lechelle : Sauf que si, la traduction était libre/gratuit, mais, dans le terme, ça ne veut pas dire ça par défaut. Il y a donc déjà une difficulté au niveau de la sémantique et du vocabulaire.
Plus tard est arrivé le mouvement open source [4] qui a balisé les conditions de business modèle, donc de licence. L’OSI, l’Open Source Initiative, a établi la première définition officielle de ce qu’est l’open source avec des qualités qui sont vertueuses mais qui ne sont pas incompatibles avec le monde du business.
Solène Étienne : Pour être, entre guillemets, « labellisé open source », j’imagine qu’il faut répondre à un certain nombre de critères.
Yann Lechelle : Tout à fait et avoir une licence compatible, par exemple des licences très permissives. Le logiciel libre s’intègre effectivement dans l’open source. En revanche, il y a aussi des licences qui sont doubles, qui sont contagieuses. Une licence contagieuse c’est : je peux créer un produit dérivé, mais je dois reconnaître l’attribution, la source.
Il y a donc tout un tas de règles qui créent des communs numériques et qui ont tendance à avoir un impact extrêmement positif sur la société, puisque tout le monde peut effectivement inspecter le code, le reproduire, le développer.
Chez Probabl, l’open source est un vecteur qui s’inscrit même dans la genèse de l’entreprise puisque nous sommes une spin-off d’Inria sur la base d’un actif qui s’appelle Scikit-learn [5], scientific learning for machine learning. Et il se trouve que Scikit-learn a été téléchargé 2,5 milliards de fois.
Solène Étienne : Incroyable !
Yann Lechelle : Cent millions de téléchargements par mois, dont 25 % en Chine, 22 % aux US, 3 % en France. Ça a été développé par des génies, à l’Inria, payés par le contribuable français, et on a donné cela à l’humanité tout entière. Extraordinaire ! Je n’ai aucun mérite, ce n’est pas moi !
Solène Étienne : Qu’est-ce qui explique que ça a été téléchargé autant aux États-Unis et pas en France ?
Yann Lechelle : Parce que nous sommes sur un objet qui a défini la catégorie, voire qui a permis la création de l’industrie de la science des données, pas plus pas moins. Les personnes à l’origine de ce projet sont trop humbles pour le reconnaître, mais, en fait, ce produit est arrivé au bon moment pour permettre la science des données.
Solène Étienne : Et nous, nous n’avons pas su le capter ?
Yann Lechelle : Ce n’est pas qu’on n’a pas su, c’est que ce n’était pas le projet à la base. En fait, on se rapproche de la science et de l’open science. Le domaine était en train d’émerger et personne ne s’est dit, à ce moment-là, « on va le monétiser, on va le commercialiser », ce n’était pas l’objet. C’était plutôt : « Qu’est-ce qu’on peut faire avec les mathématiques appliquées pour faire de la recherche ? ». Ce produit a donc été développé et, de fil en aiguille, il est devenu la référence incontournable devant même les équivalents en deep learning de Meta et de Google. C’est donc plus de popularité, c’est le framework de machine learning, c’est la bibliothèque Python de machine learning la plus populaire au monde. Tous les data scientists de la planète l’utilisent.
.
Mon rôle a été de répondre à l’appel de cette équipe qui se retrouvait devant un dilemme : un financement public voulait développer au-delà de ce produit, qui est un joyau, à la fois un joyau patrimonial au sens national, puisque c’est la France qui l’a développé et l’Inria était l’opérateur et le détenteur de la marque, il y a donc une propriété intellectuelle, au niveau de la marque, pas au niveau du code puisqu’il a été distribué, c’est trop tard et c’est très bien, avec la volonté de reconnaître que cet actif-là est aujourd’hui adopté par le monde industriel ; on n’est donc plus dans le monde de la recherche, on est dans le monde post-industrialisation. L’équipe avait besoin de s’entourer de personnes qui allaient aider à concevoir un business modèle. Je les ai rencontrés, ils sont venus me chercher, j’étais disponible, j’étais directeur général de Scaleway juste avant. Ayant quitté Scaleway, ils ont vu l’opportunité de me rencontrer. J’ai passé quelques mois à étudier l’actif, l’équipe, le soutien institutionnel. Tout était merveilleux, vraiment, je suis tombé de ma chaise plusieurs fois, et je suis tombé amoureux à la fois du sous-jacent, de l’équipe, mais, surtout, j’ai proposé une entreprise à mission de souveraineté industrielle et numérique, dans l’idée de valoriser cet actif de manière additive.
On peut très bien dire qu’un projet open source était open source et c’était très bien, mais on arrête de jouer, on change la licence et tout le monde doit passer à la caisse. C’est un modèle un peu soustractif, parce que la communauté n’avait pas prévu de passer à la caisse, elle a construit des dépendances, etc.
Ici, la nature du projet n’appelle pas ça et ce n’est pas le deal, donc, on a créé une entreprise qui vient chapeauter sans toucher à l’actif, au contraire continue à le maintenir, et qui vient développer des solutions complémentaires qui aident les entreprises à mieux faire du machine learning tout en maintenant l’actif et avec des services associés par ailleurs, comme la certification Scikit-learn. Scikit-learn est un produit qui nécessite des milliers d’heures de pratique pour le maîtriser, on vend donc la certification avec trois niveaux qui correspondent à l’actif.
Solène Étienne : C’est passionnant, je ne vois pas le temps passer, ce petit « ding ding » me dit qu’on arrive bientôt sur notre prochaine planète, mais nous allons quand même avoir le temps de finir cette conversation.
Le sujet de la souveraineté est un sujet qui est sur toutes les lèvres depuis quelques mois avec aussi ce qui se passe dans notre monde géopolitique, géoéconomique et les différents blocs. C’est un sujet qui te tient à cœur et, pour toi, la solution de la souveraineté dans l’IA passe par l’open source.
Yann Lechelle : Absolument. Même si, évidemment, on fait tout ce qu’il faut, globalement on n’est pas forcément en tête de la course, mais on est dans la course sur les sujets de financement, la French Tech a fait son travail, moi-même, cofondateur de France Digitale [6] il y a plus de dix ans. On fait donc ce qu’il faut pour alimenter le supply side, l’offre, qui grandit et qui, peut-être, deviendra massive, mais peut-être qu’il faudra 10,20, 30 ans.
L’open source est une arme qui peut être arsenalisée, weaponized, ce que les Chinois ont très bien compris. C’est grâce à l’openness, qui part de l’open science, donc la science ouverte, l’open source, les open models comme les LLM ouverts de Meta, de Mistral parfois, de DeepSeek chez les Chinois, que cette chaîne d’ouverture peut être utilisée non pas à des fins idéologiques, qui étaient plutôt celles de Richard Stallman, et même en le disant ce n’était peut-être pas le cas, qui voulait contrer l’acteur dominant. Il se trouve que cette arme de disruption massive peut être utilisée intelligemment, tactiquement, stratégiquement, parfois philosophiquement pourquoi pas, pour contrer la consolidation et une posture oligopolistique ou monopolistique.
En créant des communs numériques, on distribue la technologie et on coupe l’herbe sous le pied de l’acteur dominant. Aujourd’hui, ce sont les Américains et les Big Tech qui sont en position dominante et ce n’est pas non plus, pour eux, le meilleur d’être dans cette position parce que le régulateur n’a pas réussi à changer la donne, mais l’open source crée les conditions d’un nivellement. Il faut donc le maîtriser de manière très particulière, ce n’est pas qu’une idéologie de barbus idéalistes, et il m’arrive d’avoir une barbe. La question est plutôt : comment s’assure-t-on de distribuer la technologie au plus grand nombre et que l’équation soit gagnant-gagnant ? C’est vraiment cette équation-là qu’il faut résoudre.
Solène Étienne : Et toi, tu as une pédale sur laquelle accélérer, on parle de cela depuis le Sommet de l’IA [7] qui a eu lieu en février, c’est celle de l’open source ?
Yann Lechelle : L’openness parce que ça commence par l’open science. Il ne faut pas oublier, par exemple, que OpenAI, avec ChatGPT, n’existe que grâce à un papier d’open science chez Google. Il ne faut pas oublier que Microsoft a rattrapé Google, ou presque, dans le cloud grâce à Linux, non pas à Windows. Il ne faut pas oublier que Microsoft est dans la course contre AWS [Amazon Web Services] et Google grâce à Kubernetes [8] qui est un cheval de Troie open source. Donc l’open source se retrouve comme un instrument, une arme véritablement tactique de marketing et aussi, évidemment, de création d’un écosystème de partenaires, qu’on peut faire à tous les niveaux, qu’on peut exploiter au niveau national, supranational, l’Europe devrait l’utiliser. Or aujourd’hui, on a une ambivalence par rapport à l’open source parce que parfois même les lobbyistes américains nous disent « l’open source c’est mauvais, c’est plein de failles, c’est la communauté, on ne sait pas qui le gère, etc. », c’est complètement faux, ils l’utilisent aussi autant qu’ils le peuvent.
On devrait donc adopter une posture radicale au niveau national mais aussi européen, se demander comment l’Europe peut utiliser l’open source pour rattraper son retard plus rapidement. C’est ce sujet-là qui me tient à cœur, j’en développe toute une thèse. Je le vis évidemment au quotidien puisque Scikit-learn fait partie de ces sujets qui font que la France non seulement a permis l’émergence d’une industrie, mais il n’y a aucune concurrence directe sur Scikit-learn aujourd’hui, aucune !
Solène Étienne : Et pourtant, personne n’en parle trop.
Yann Lechelle : C’est mon job.
Solène Étienne : Nous sommes ravis de te donner ce micro pour en parler.
Comme je vois l’heure qui tourne, on a quelques petites rubriques amenées de notre podcast 40 nuances de Next. Une fois tu m’as dit que tu avais envie de nous parler de la claque.
Voix off : Waouh !
Solène Étienne : Elle fait plus mal dans les oreilles que sur le plateau.
La vie d’un entrepreneur est jalonnée de claques plusieurs fois par jour, de laquelle as-tu envie de nous parler sur le plateau ?
Yann Lechelle : Ma claque personnelle, et ça va reboucler avec ce qu’on s’est dit, c’est que je suis entrepreneur depuis 25 ans et finalement, peut-être de manière inconsciente, je me suis retrouvé en concurrence directe avec les Big Tech, les GAFAM – réseaux sociaux, applications mobiles, dans les app stores, recommandations d’applications, assistant vocal, contre Siri, etc., directeur général de Scaleway contre AWS. Finalement, même si chaque aventure a été différente dans sa constitution, avec des capitaux, sans capitaux, avec fondateur, cofondateurs, etc., je me suis rendu compte que nous n’avions pas de souveraineté. On parle de souveraineté, de manière même un petit peu fantasmée, en réalité nous n’en avons pas.
Solène Étienne : Un peu trop conceptuelle.
Yann Lechelle : C’est très conceptuel et, si on mesure réellement, alors cette souveraineté n’existe pas parce qu’elle est proche de zéro. La quantité d’achats endogènes, c’est-à-dire la quantité d’achats qui vient de nos technologies, de nos éditeurs logiciels, je ne parle pas des agences de conseil qui ne créent pas de valeur cumulative, je parle bien des éditeurs de logiciels et de matériels, donc toute la chaîne du numérique, représente 1 % des achats en France par rapport à nos besoins. Ce qui veut dire que 99 % est importé. Avec ce taux-là, chaque année on s’enfonce.
La claque, pour moi, a été d’arriver à réaliser cela, cette mesure, cette prise de conscience que certains ne veulent pas entendre parce que c’est une vérité trop dure à entendre. En revanche, elle est porteuse d’espoir puisque c’est difficile de tomber plus bas !
Solène Étienne : C’est sûr !
Yann Lechelle : Aujourd’hui, même s’il y a du sovereignty washing, même s’il y a de l’open source washing, il y a une convergence, il y a une prise de conscience, en réalité la prise de conscience est bel et bien là et il faut que la France et l’Europe se ressaisissent, saisissent la balle au bond et on peut remercier ce contexte géopolitique complexe qui nous le fait prendre conscience collectivement. J’ai eu mon propre chemin et je suis arrivé à cette conclusion-là il y a déjà quelques années, mais je ne peux pas le faire tout seul, de toute manière ce n’est pas mon job. Ensemble on doit saisir cette balle au niveau national et au niveau européen pour changer certaines choses, pour inverser la tendance et là, ce sera le début d’une ère nouvelle.
Solène Étienne : Ça peut être donner un vrai sens à cette souveraineté qui est sur toutes les lèvres.
Yann Lechelle : Absolument.
Solène Étienne : Je te propose de décrocher ce téléphone, Yann, de le coller à ton casque. J’envoie.
Voix off : Plein d’incertitudes l’avenir est fait, trouver l’équilibre tu devras. Aujourd’hui te préparer il te faut. Quels nouveaux défis affronter tu devras ?
Solène Étienne : C’est maître Yoda qui te laisse un petit message. Tes nouveaux défis, en une minute trente ?
Yann Lechelle : C’est la voix française dont je n’ai pas l’habitude quand Yoda s’exprime.
Solène Étienne : Pour nous, il a fait un effort !
Yann Lechelle : Absolument. Je l’ai reconnu.
La sagesse. La sagesse d’un Jedi, c’est de reconnaître la posture et l’alignement. Évidemment, la force est avec nous, mais la force est biface, donc nous devons réaligner notre quotidien.
Un acheteur, par exemple, est responsable d’une décision. Il peut tomber dans l’évidence et, finalement, choisir Microsoft qui est une entreprise extraordinaire, il peut choisir Apple qui est une entreprise extraordinaire. Sauf que ces entreprises sont arrivées à un tel point de contrôle que, globalement, elles ne desservent pas non plus l’intérêt américain, il n’y a plus d’innovation là-bas aussi à cause d’elles, mais, chez nous, ça coûte encore plus cher.
Nous sommes tous des décideurs. Il faut, à la fois en tant que dirigeant d’entreprise, en tant qu’employé, en tant que parent, prendre des décisions qui seront peut-être un peu plus coûteuses mais qui vont créer les conditions du bon côté de la force.
Solène Étienne : D’être du bon côté, donner un bon impact.
Yann, mille mercis, je pense qu’on va faire un format plus long pour t’écouter encore plus longuement sur tous ces sujets absolument passionnants. Merci d’avoir pris le temps de passer sur notre studio pour nous parler de ces sujets hyper intéressants autour de l’IA et autour de la souveraineté.
Quant à vous, restez avec nous. Dans quelques instants Pierre Louette sera sur ce plateau avec mon associé Thomas Benzazon.
N’oubliez pas de vous abonner à la chaîne pour ne manquer aucune des épopées entrepreneuriales que nous racontons dans 40 nuances de Next
Salut. À bientôt.