La grande interview : Laure Lucchesi, Etalab

Delphine Sabattier : Améliorer le service public, l’action de l’État, les politiques publiques, nourrir de données l’écosystème tech, c’est une des prouesses dont est capable la donnée numérique, plus exactement le travail sur les jeux de données et leur partage libre et ouvert. On va voir comment dans cette grande interview.
Bonjour Laure Lucchesi.

Laure Lucchesi : Bonjour Delphine.

Delphine Sabattier : Merci beaucoup d’être avec nous. Vous êtes la directrice d’Etalab [1], l’administratrice générale des données de l’État. Est-ce que vous pouvez déjà nous apporter la preuve, par l’exemple, que les données numériques peuvent servir à améliorer l’action de l’État ?

Laure Lucchesi : Elles peuvent servir à de multiples titres à améliorer le service public, mais elles peuvent aussi aider l’État et les décideurs publics à prendre des meilleures décisions.

Delphine Sabattier : C‘est-à-dire ? Par exemple ?

Laure Lucchesi : Un exemple très récent c’est le partage sur la plateforme data.gouv.fr [2], que l’on administre, des données de l’épidémie de covid, de la crise sanitaire. Ces données ont permis d’établir des tableaux de bord que tous les Français peuvent voir.

Delphine Sabattier : On voit la plateforme à l’écran.

Laure Lucchesi : Voilà, c’est la plateforme data.gouv.fr. À partir de cette mise à disposition, mise en ligne de ces données que l’on peut analyser, réutiliser, on peut les mettre en forme et fournir de l’information qui soit compréhensible par tous sur, justement, comment l’épidémie se propage, les politiques de vaccination. L’exploitation de ces données a permis de faire tous ces tableaux de bord qui étaient publiés sur le site du gouvernement. Les données ont aussi été réutilisées par d’autres, typiquement Guillaume Rozier [3] qu’on a beaucoup vu ces derniers temps, qui a pu prendre ces données et faire, à son initiative, sa propre analyse, avec aussi tous les contributeurs, faire CovidTracker [4], faire ViteMaDose [5].

Delphine Sabattier : Tout ça à partir des jeux de données que vous aviez collectées et travaillées déjà au préalable.

Laure Lucchesi : Exactement. Ces données existent déjà dans les systèmes d’information de l’État, les administrations les produisent à l’origine pour leurs propres besoins, elles sont déjà disponibles, donc autant les partager et les rendre disponibles à d’autres pour, en fait, démultiplier leur potentiel d’utilisation et d’intelligence, leur donner une autre vie. Non seulement les administrations les utilisent pour piloter leur action et prendre les meilleures décisions, mais d’autres peuvent aussi venir et croiser les regards, croiser ces analyses. Donc on multiplie les points de vue et les sources et ça c’est aussi au bénéfice de la démocratie puisqu’on a l’État qui rend compte de son action, comment il conduit la politique de vaccination par exemple, mais on peut aussi avoir des journalistes, d’ailleurs beaucoup de journalistes utilisent aujourd’hui ces données, les exploitent justement pour interroger, analyser l’action de l’État.

Delphine Sabattier : Là on parle de jeux de données qui apportent de la transparence ou de l’amélioration des services, c’est important de voir comment vous les préparez. Quel est le travail que vous fournissez en amont. Comment allez-vous collecter les données et comment les préparez-vous ?

Laure Lucchesi : Nous, Etalab, sommes un service interministériel donc nous travaillons avec tous les ministères. À l’origine, les producteurs de données, ceux qui les produisent, ce sont toutes les administrations, les administrations centrales, les établissements publics, les collectivités territoriales aussi. Notre rôle c’est d’abord de mettre à disposition ces données, de les rassembler en un point unique data.gouv.fr.

Delphine Sabattier : Quelle technologie utilisez-vous pour rentrer un peu dans la machinerie, pour réussir à collecter ces données qui viennent de ministères très différents ?

Laure Lucchesi : Déjà on a développé en interne cette plateforme en faisant venir des développeurs, des data scientists, donc elle est opérée par les équipes d’Etalab qui administrent le site au quotidien. C’est une première façon.

Delphine Sabattier : Fait maison.

Laure Lucchesi : Exactement. Ce portail est ouvert à tous, c’est-à-dire que toutes les administrations qui veulent mettre en ligne ces données – c’est une obligation légale pour les administrations – peuvent se créer un compte et partager leurs données, les mettre en ligne sur data.gouv.fr. C’est une première méthode.
L’autre méthode c’est ce qu’on appelle le moissonnage. C’est-à-dire que si une collectivité territoriale, une commune ou un ministère a son propre portail de data, on organise la collecte de ces données et leur référencement automatique dans data.gouv.fr. C’est ce qu’on appelle le moissonnage. Tout ça pour faire en sorte que data.gouv.fr, qui a eu 17 millions de visites l’an dernier, un million par mois – ça veut dire que 2 % des Français viennent chaque mois sur cette plateforme – soit le point d’entrée à partir duquel on a accès à toutes les données des administrations.

Delphine Sabattier : Quand vous dites « référencées automatiquement » avec ce moissonnage, vous utilisez par exemple des algorithmes d’intelligence artificielle ?

Laure Lucchesi : Non, pas sur cette partie-là. Là c’est du code informatique qui va automatiser complètement, aller chercher là où elles se trouvent les données à l’origine.

Delphine Sabattier : C’est du classement.

Laure Lucchesi : Exactement. Ensuite il y a une partie qui est de l’hébergement, il faut les stocker quelque part. Ça peut être fait soit dans les d’administrations d’origine soit, si besoin, sur nos propres serveurs.

Delphine Sabattier : Ce sont des solutions forcément souveraines que vous utilisez.

Laure Lucchesi : Oui. Tout est sur notre propre cloud. Chaque entité qui partage des données a son propre hébergement, mais la collecte et le référencement se font de façon automatique. À ce stade il n’y a pas d’intelligence artificielle.
Ensuite, on travaille aussi sur la standardisation des données, ce qu’on appelle des schémas de données, pour faire en sorte que tous ces jeux de données soient structurés sur les mêmes formats. Ce n’est pas obligatoire aujourd’hui mais plus on peut compiler, consolider les données, plus ça a de la valeur, donc on travaille aussi sur cette standardisation. À ce stade, sur le volet open data, il n’y a pas d’intelligence artificielle. Un des volets de notre action c’est vraiment faire en sorte que les administrations rendent disponibles à tous ces données publiques pour leur donner une nouvelle vie. Dans les missions d’Etalab, on intervient aussi sur d’autres aspects.

Delphine Sabattier : Pour créer vous-mêmes de nouveaux services à partir de ces données ?

Laure Lucchesi : Notre politique c’est de ne pas, ou très rarement, créer nous-mêmes ces données. Notre rôle est vraiment en amont.

Delphine Sabattier : On peut faire appel à vous comme prestataire quand même ?

Laure Lucchesi : Ce n’est pas notre rôle principal, de temps en temps on le fait. C’est là qu’on revient à notre mission qui est aussi de conduire une transformation dans l’administration, faire en sorte que ces données soient aussi la source d’une transformation numérique dans tous les ministères avec lesquels on travaille.

Delphine Sabattier : C’est pour ça que vous êtes au sein de la DINUM, la direction interministérielle du numérique [6].

Laure Lucchesi : Absolument.

Delphine Sabattier : Si on prend un autre exemple, les données de mobilité. C’est intéressant, aujourd’hui ces données permettent au quotidien, à chaque voyageur, de trouver le meilleur trajet, le meilleur mode de transport, etc. Mais ce sont des données qui, finalement, sont disponibles aussi bien pour les transports français que pour les grandes plateformes numériques américaines. Est-ce que ça pose un problème aujourd’hui ? Vous donnez cet accès à la donnée numérique qui est quand même aujourd’hui, je dirais, un bien précieux ; on donne finalement accès à tout le monde, sans exception, à nos données.

Laure Lucchesi : Bien sûr. Un des fondamentaux de l’open data, de cette politique qui est menée par l’État de partager ses données, mais que d’ailleurs n’importe quelle organisation peut mener, une des finalités c’est de créer de la valeur économique, de faire en sorte qu’à partir de ces données qui existent des tiers, y compris des entreprises privées, les utilisent pour améliorer leur propre métier et aussi créer de la valeur, créer de nouveaux services avec ces données.
C’est dans le domaine des transports où l’on voit vraiment un cas très concret, là aussi, de la donnée qui est l’actif stratégique de la révolution numérique. C’est vraiment une infrastructure, c’est-à-dire que toutes les données de transport, du le domaine des transports, que l’on partage aussi sur la plateforme transport.data.gouv.fr, qui rassemble les données à la fois des réseaux de transport en commun, par exemple, les horaires théoriques, les horaires en temps réel, mais aussi les données routières, les données de covoiturage et des aires de covoiturage. Avoir ce point d’accès où toutes données sont mises en commun c’est ce qui crée de la valeur. On voit bien que cet ensemble de données est vraiment un socle pour bâtir des services publics et des services privés.
L’objectif c’est aussi de réduire les asymétries d’information et les barrières à l’entrée. Effectivement transport.data.gouv.fr est utilisé aujourd’hui par Google Maps, mais aussi par Mappy, mais aussi par Blablacar, mais aussi par toute une diversité d’acteurs. L’enjeu avec l’open data c’est de faire en sorte qu’on aide aussi les petits. Google, s’il veut, il a les moyens, les grandes plateformes ont les moyens, globalement, de recréer ces données qui n’existeraient pas. Typiquement les horaires de train en temps réel, s’il veut Google est capable de voir qu‘il y a des centaines de téléphones qui roulent à 300 km/h, donc de reconstituer les horaires d’un TGV. Si on a une petite start-up qui veut innover en la matière, elle n’a pas les moyens de créer ça. L’objectif de l’open data c’est aussi de donner les mêmes ressources à tous, c’est un point important, et, du coup derrière, de réduire les barrières à l’entrée pour l’innovation et de permettre de nouveau, à partir de cette matière première qu’est la donnée, des services innovants, des calculateurs d’itinéraires multimodaux. Si vous arrivez dans une gare, vous voulez vous déplacer dans la banlieue proche, vous faites un calcul d’itinéraire par exemple sur Google Maps et là soit vous avez les données de transport en commun qui ont été ouvertes par l’autorité de transport local et la collectivité, soit vous ne les avez pas et auquel cas on va vous proposer de prendre un taxi.

Delphine Sabattier : Donc si on n’ouvrait pas ces jeux de données, finalement on risquerait de pénaliser les mobilités communes.

Laure Lucchesi : Exactement, on pénalise le service à l’usager. C’est arrivé dans certaines collectivités, qui menaient des politiques de promotion des mobilités douces, de ne pas ouvrir leurs données de réseau de transport en commun. C’est exactement le cas que je vous décrivais : quelqu’un qui arrive, qui vient d’une autre ville et qui cherche à se déplacer, il n’a pas accès au réseau de transport en commun, donc on lui recommande de prendre une voiture avec un chauffeur.

Delphine Sabattier : Ça pénalise les politiques de service public.

Laure Lucchesi : Exactement. C’est même contre-productif par rapport à ce que la collectivité veut promouvoir. Donc c’est vraiment important d’ouvrir un maximum ces données. Je crois que le sujet des plateformes, des grandes plateformes et de la captation de la valeur et de la redistribution de cette valeur est un sujet. Je crois qu’il ne faut pas se tromper non plus de niveau. Il y a effectivement des sujets qui sont traités à l’échelle internationale.

Delphine Sabattier : Et aujourd’hui ce n’est pas un sujet qui fait débat puisqu’on trouve la France en tête des classements sur l’open data. Ça veut dire qu’on a trouvé un consensus quand même.

Laure Lucchesi : Effectivement. Il y a un cadre européen légal, commun aujourd’hui à tous les pays de l’Union européenne, qui impose la mise à disposition libre et gratuite de ces données, notamment les données dites à forte valeur, c’est le cadre pour toute l’Europe. Et la France, depuis plusieurs années maintenant, est en tête des classements mondiaux et l’an dernier elle était effectivement la première de l’Union européenne devant l’Espagne.

Delphine Sabattier : Est-ce que la stratégie sur l’open data, le partage des données a évolué dans le temps ? Etalab ce n’est pas tout récent quand même, quand l’avez-vous créé ? En 2011.

Laure Lucchesi : Nous avons fêté nos dix ans l’an dernier, ça a été créé en 2011. Les missions se sont beaucoup étendues. On est parti effectivement de cette mission d’origine de l’open data, on a fait beaucoup, il y a encore beaucoup à faire.

Delphine Sabattier : Est-ce qu’il y a eu des renoncements ? Des choses sur lesquelles on a dû revenir ?

Laure Lucchesi : Il y a eu plutôt, peut-être, des changements de doctrine. On est passé, à un moment, d’une vision patrimoniale de la donnée, disant que c’est un patrimoine, il faut que les administrations la vende, en fait ce n’est pas non plus leur cœur de métier de faire un pricing, un business modèle ; les études se sont penchées là-dessus, ça a été vraiment prouvé que ce n’était pas un bon modèle, de toutes façons l’Union européenne a convergé. En tout cas on ne peut plus facturer le simple droit d’utiliser des données. On ne peut pas tarifer le droit d’utilisation. Ensuite si les données doivent être retravaillées, qu’il y a un service à valeur ajoutée ou qu’il y a un coût technique important à fournir des gros volumes de données – typiquement dans le domaine des transports la question peut se poser –, là on peut tarifer un coût d’accès ou une prestation spécifique, mais on ne peut pas vendre des données brutes.

Delphine Sabattier : On commence à travailler sur ce partage de la valeur aujourd’hui ? C’est une des prochaines étapes ?

Laure Lucchesi : Exactement, on a des questions d’économie numérique. C’est ce que je disais à l’instant, les modèles où on facture juste une barrière à l’entrée, un coût d’accès initial et, derrière, on fait des tarifs dégressifs par exemple sur l’utilisation de la donnée, c’est complètement contraire à la façon dont l’économie numérique fonctionne. On est plutôt sur une tarification progressive : plus les gros utilisateurs vont consommer des données, plus là on pourra les faire payer.
La réflexion doit être plus globale, c’est-à-dire que les données publiques, dans le cas de l’État, celles qui existent déjà, il n’y a pas de raison de les revendre, elles sont comme ça.
Maintenant si effectivement on reconnaît à la donnée ce rôle d’infrastructure, c’est vraiment l’infrastructure, comme une autoroute en fait, qui est le socle des services numériques publics et privés, là ça nécessite quand même d’investir dans cette infrastructure-là, d’investir dans sa mise à jour. Donc on a beaucoup de réflexions et c’est effectivement un des chantiers qui est toujours en cours sur quels sont les bons modèles pour justement associer aussi les réutilisateurs de cette donnée à son entretien de façon collective pour que ça soit justement un bien commun.

Delphine Sabattier : Donc la discussion est ouverte. Est-ce que ça veut dire que c’est très différent finalement d’être un Chief Data Officer pour l’État par rapport à un CDO qui va être en entreprise ? Ça pose déjà des questions de business modèles très différents.

Laure Lucchesi : Absolument. Il y a certaines prérogatives de la puissance publique qui sont effectivement spécifiques – les modes de financement de la donnée, la façon aussi de rendre compte des traitements algorithmiques qu’on peut faire de certaines données. Là on a parlé uniquement du volet de l’open data et de leur ouverture, mais, comme vous le disiez, au fur et à mesure où l’action publique se transforme aussi, elle fait des traitements sur ses données, elle utilise des algorithmes. C’est un des champs particuliers où l’acteur public doit savoir expliquer s’il y a des traitements algorithmiques qui aboutissent à des décisions individuelles, doit savoir rendre compte de comment l’algorithme a fonctionné, ses règles générales et la façon dont ça s’est appliqué individuellement.

Delphine Sabattier : Donc il y a un travail, une cellule ? Ça fait partie de la transparence des algorithmes ?

Laure Lucchesi : Exactement, ça fait partie des missions d’Etalab. Des dispositions ont été mises dans la loi, des obligations légales : on doit en faire un inventaire de tous les algorithmes publics, donc les administrations doivent lister les algorithmes qu’elles utilisent et doivent savoir décrire de façon générale et, sur demande, de façon individuelle, comment ça a fonctionné. Ça fait partie de nos missions, c’est un peu spécifique à l’État, mais il y a aussi des enjeux de redevabilité dans d’autres organisations.
Nos autres missions, dans le champ de la donnée, c’est aussi de faire en sorte que les administrations s’échangent des données au maximum. C’est vraiment important pour améliorer le service rendu aux usagers et la qualité, globalement, du service public. C’est le deuxième champ.
Le troisième champ c’est effectivement faire en sorte qu’on utilise au maximum tout le potentiel des data sciences, de l’intelligence artificielle pour, là aussi, prendre de meilleures décisions, mieux orienter l’allocation des ressources.
Ces trois chantiers-là sont les mêmes que dans n’importe quelle organisation.

Delphine Sabattier : Il y a d’ailleurs un autre chantier commun c’est celui de la guerre des talents, j’imagine. Comment faites-vous pour attirer aujourd’hui des talents du numérique dans un service de l’État ? Je sais que vous venez, en l‘occurrence, du privé, donc vous avez fait ce chemin d’embrasser le service public, mais il n’est pas forcément évident.

Laure Lucchesi : Bien sûr. On échange beaucoup avec nos pairs, y compris des grands groupes, des grandes entreprises privées. Effectivement les enjeux, les problématiques sont les mêmes. Toute cette transformation par la donnée, c’est en fait une transformation complète, c’est-à-dire que c’est une transformation technologique, une transformation organisationnelle, une transformation juridique aussi parce qu’il y a quand même beaucoup de sujets juridiques, une transformation je dirais culturelle et managériale. Le sujet c’est de décloisonner, de faire collaborer. En fait la donnée est un médium et on sent bien aussi que derrière tous ces usages, ça fait collaborer des métiers différents entre eux, des data scientists, des développeurs, des designers et puis tous les gens qui dans les ministères portent le service public et le fabriquent au quotidien et c’est la même chose dans n’importe quelle organisation.

Delphine Sabattier : Ces data scientists, comment les attirez-vous ? Il y a le programme Entrepreneurs d’intérêt général [7] ? C’est par là ? C’est la voie royale pour les recruter ?

Laure Lucchesi : C’est effectivement un des chemins que l’on a trouvé, parce que toute cette transformation numérique implique d’attirer de nouvelles compétences dans l’administration et dans l’État. On n’a pas un vivier d’origine de fonctionnaires spécialisés justement sur tous ces nouveaux métiers. Il y a toute une réflexion pour reconvertir des agents publics autour de ces métiers-là.

Delphine Sabattier : Former en interne ces futurs agents ?

Laure Lucchesi : Exactement. Former dès la formation initiale des futurs agents publics à tous les niveaux, intégrer ces dispositions-là. Travailler aussi sur la formation continue et, au fond, le sujet n’est pas forcément d’avoir les meilleurs experts, c’est aussi que tous les décideurs soient sensibilisés à ces enjeux de la donnée et sachent s’en saisir pour améliorer leur métier et leur mission. Même chose dans une entreprise.
Par ailleurs, ça veut dire aussi aller chercher à l’extérieur de l’administration tous ces nouveaux talents. Une des pistes qu’on a explorée, effectivement, c’est ce programme Entrepreneurs d’intérêt général. Aujourd’hui on est en train de constituer la sixième promotion.

Delphine Sabattier : C’est le moment pour les jeunes qui ont des projets de postuler.

Laure Lucchesi : Exactement. L’appel à candidatures de cette promotion-là, la sixième, vient juste de se clore, mais il y en a régulièrement tous les ans, même un peu moins. L’idée c’est l’administration publie des défis, identifie des défis numériques à résoudre, et on fait justement appel à ces nouvelles compétences numériques — des développeurs, des data ingineers, des data scientists — pour, par équipes de trois ou quatre, aux côtés des agents publics, venir pendant dix mois résoudre ces défis numériques. On a un effet de promotion.

Delphine Sabattier : C’est la sixième promotion donc vous avez déjà des enseignements. Est-ce que vous arrivez à fidéliser certains de ces entrepreneurs ?

Laure Lucchesi : C’est effectivement aussi une découverte et ça prouve bien qu’un atout qu’on a dans l’État et dans l’administration c’est vraiment le sens de nos missions, le sens de l’intérêt général. Aujourd’hui, vous devez le voir aussi, tous ces jeunes dont les compétences sont très recherchées cherchent le sens et le sens des missions que l’on propose dans l’administration attire énormément. C’est vraiment un atout d’attractivité important parce que dès qu’on travaille sur un service numérique on touche tout de suite des millions de Français et on change vraiment très rapidement la vie des gens.

Delphine Sabattier : Est-ce que vous offrez la même flexibilité pour le travail ? Pas forcément les mêmes salaires j’imagine non plus.

Laure Lucchesi : On travaille sur les conditions d’accueil de ces talents qui sont aussi, justement, très exigeants. On s’assure aussi que les administrations qui vont les recevoir leur offrent des conditions favorables.
On essaye de s’aligner de plus en plus sur les rémunérations qu’il y a dans le privé, toutes proportions gardées, mais on a effectivement fait évoluer, on a justement travaillé sur des grilles de rémunération pour être quand même compétitifs par rapport au privé.

Delphine Sabattier : Merci beaucoup Laure Lucchesi. On arrive à la fin de votre grande interview. Le message est passé : si des jeunes entrepreneurs veulent se lancer pour l’intérêt général, il y a de quoi faire chez Etalab à la DINUM.
Laure Lucchesi, directrice d’Etalab, était avec nous dans Smart Tech aujourd’hui.
À suivre c’est le rendez-vous dans l’espace. Moi je vous retrouve dès lundi, je souhaite un excellent week-end à tous.