Faut-il sauver le Health Data Hub ?

Delphine Sabattier : Le Health Data Hub, c’est cette plateforme technologique d’intérêt général qui a été initiée en 2019 dans le but de faciliter l’accès aux données de santé des Français pour la recherche et l‘innovation. Face à des difficultés opérationnelles qu’on évoquera tout à l’heure, que faut-il faire ? Est-ce que c’est véritablement problématique ? On en parlera, quand elle arrivera, avec Laurence Devillers que vous connaissez bien, la professeure en intelligence artificielle au CNRS. Elle est aussi membre du Conseil scientifique consultatif du Health Data Hub qui a publié une tribune [1] s’inquiétant du retard pris dans le déploiement de cette plateforme. Et puis à mes côtés, déjà en plateau, Christian Babusiaux, président du Cercle de la réforme de l’État. Bonjour.

Christian Babusiaux : Bonjour.

Delphine Sabattier : Vous présidez l’Institut des données de santé qui est le prédécesseur du Health Data Hub et, dans une tribune [2] plus récente encore au Monde, vous avez appelé à sauver le soldat Health Data Hub.
Je vais peut-être refaire un peu de contexte avec vous puisque vous avez l’historique, donc c’est vraiment très précieux pour nous. L’Institut des données de santé qui est devenu l’Institut national des données de santé c’était déjà le point d’entrée unique, finalement, pour tous les organismes qui avaient besoin d’avoir accès à ces data, c’était aussi le garant de l’intérêt public concernant les études, les recherches qui allaient être menées ou les évaluations sur les données de santé. Pourquoi avoir eu besoin de créer une nouvelle méga-structure en repartant presque de zéro ?

Christian Babusiaux : Vous formulez une vraie question à la vérité. Je crois que, effectivement, pour resituer le sujet, il faut dire que pendant longtemps – je m’en suis occupé neuf ans, je l’ai créé et je l’ai dirigé neuf ans – on a réussi à beaucoup progresser avec tous les acteurs, que ce soit le monde médical, l’univers de la santé plus généralement, les complémentaires santé, des industriels, les représentants des associations de patients, les agences sanitaires, etc.

Delphine Sabattier : Il y avait, je me souviens, une certaine effervescence à l’idée de se dire qu’enfin ce trésor français allait pouvoir servir à la recherche et l’innovation.

Christian Babusiaux : On a un atout fondamental. Comme nous avons un système d’assurance maladie centralisé, un ministère centralisé, bien sûr tout cela présente des limites, n’empêche qu’on a toutes les données en tout cas d’assurance maladie, de parcours de soins de l’ensemble des Français, des 67 millions de Français, et maintenant sur une grande profondeur d’historique puisque progressivement nous avons stocké des données anonymisées naturellement, anonymisées.

Delphine Sabattier : On comprend l’enjeu d’en livrer l’accès pour des travaux de recherche. Je reviens à ma question : pourquoi cette nécessité, alors, de créer une nouvelle structure ?

Christian Babusiaux : Ce qui a été souhaité, je pense, c’est d’élargir. C’est-à-dire que ce que nous avions fait c’était, par exemple, de réunir les données de l’hôpital et les données de ville pour avoir tout le parcours de soins des Français et puis nous avions commencé à connecter le fichier des décès pour suivre les choses à la trace. Là l’idée était, au fond, non pas d’avoir un organisme qui soit un incitateur, un garant, un ouvreur des différentes bases existantes. On a voulu tout mettre ensemble et, en plus, mettre ensemble dans ce même endroit des bases par exemple privées, des bases venant des complémentaires santé ou d’autres acteurs du système, donc créer un très grand système avec encore plus de données. C’était apparemment séduisant technologiquement, mais nécessairement ça pose des questions. Plus il y a de données plus il y a de problèmes, par exemple de préservation du secret de la vie des personnes.

Delphine Sabattier : Aujourd’hui on en est là avec ce Health Data Hub qui a donc été créé, ouvert, lancé ; les premiers projets ont pu accéder aux données de santé des Français, pas tous mais enfin !, et pourtant on dit « ça patine ». Pourquoi ?

Christian Babusiaux : Ça patine et, en réalité, il n’y a pas vraiment de projets qui aient démarré. Il y a aujourd’hui 150 projets de recherche qui sont bloqués.

Delphine Sabattier : Ils sont bloqués. J’ai aussi reçu en plateau des startups, des chercheurs qui ont manifesté leur intérêt et qui ont pu rentrer, je dirais, dans le parcours Health Data Hub.

Christian Babusiaux : Il y en a effectivement quelques-uns, mais ce que n’a pas notamment le Health Data Hub c’est justement la grande base de données gérée actuellement, portée, hébergée par l’assurance maladie, qui s’appelle le Système national de données de santé, où il y a des données de ville et d’hôpital et y compris la CNAM hésite à transférer cette base de données. Or cette base de données est essentielle parce que c’est elle qui permet de caler les parcours de soins. Bien sûr vous pouvez faire des petites études à côté, mais il y a cette base qui vous recale sur les données essentielles.

Delphine Sabattier : Donc premier problème, on n‘a pas toutes les données dont on aurait besoin aujourd’hui dans ce Health Data Hub ?

Christian Babusiaux : Non et pas les données essentielles et de recalage.

Delphine Sabattier : Deuxième problème : pourquoi n’a-t-on pas toutes ces données ? Parce que ce projet a peut-être aussi démarré du mauvais pied ?

Christian Babusiaux : Il y a deux problèmes.
Le premier problème c’est de vouloir mettre toutes les données ensemble parce que cette masse de données crée nécessairement un problème d’hébergement, tout le monde, évidemment, ne peut pas le faire, c’est le choix de la concentration, alors que les données de santé c’est très divers. Par exemple collecter les données sur l’alimentation des Français, bien sûr que c’est un déterminant de santé, les conditions de travail, les conditions de vie, les parcours professionnels, tout ça ce sont des données qui peuvent, un jour, intéresser la santé. Donc vous avez besoin, quand vous cherchez, de faire appel à tellement de domaines que, de toute façon, je dirais que ce qui est important c’est de créer l’interopérabilité des bases de données quand on en a besoin et non pas de tout mettre au même endroit.
Et puis justement, il y a quelqu’un qui apparaissait, à tort ou à raison, mais ça pose un problème manifeste, qui pouvait proposer à la fois l’hébergement et les services associés, c’était Microsoft, un géant du numérique.

Delphine Sabattier : Quelqu’un, une entreprise, un géant du numérique, Microsoft, qui s’est imposé comme le fournisseur de services.

Christian Babusiaux : Mais aussi parce qu’on a choisi quelqu’un qui pouvait à la fois avoir la capacité d’hébergement et faire les services. Une autre solution aurait pu être de séparer les deux fonctions et d’autres pouvaient le faire, mais ce n’est pas la voie, d’où les blocages actuels. On reviendra là-dessus.

Delphine Sabattier : On a bien compris qu’on avait deux sources de blocage. On va continuer d’en parler ensemble évidemment, Christian Babusiaux. Laurence Devillers vient de nous rejoindre. Bonjour. Bienvenue.

Laurence Devillers : Bonjour.

Delphine Sabattier : Vous représentez la recherche. J’ai dit que vous étiez au Conseil consultatif scientifique du Health Data Hub et vous êtes une chercheuse qu’on connaît bien en France. Quel est l’intérêt, aujourd’hui, que vous voyez dans ce Health Data Hub pour les chercheurs, pour la recherche, pour l’innovation ?

Laurence Devillers : Je pense qu’il y a énormément d’intérêt pour nous à mutualiser les données de santé et à considérer la santé comme n’étant pas isolée, comme vous l’avez très bien dit, mais dans un environnement. Cet environnement est intéressant à connecter pour comprendre les maladies, la propagation, tout un tas de critères qu’on ne prend pas en compte en ce moment. À ceci près que cette concentration de données au même endroit pose des questions éthiques : quelle architecture ? Comment on encrypte les données ? Qui on choisit ?, sont des sujets extrêmement importants. Vous l’avez très bien dit pour l’instant Microsoft était celui qui répondait le mieux aux problématiques en fait assez élevées demandées par le Health Data Hub.
Il se trouve qu’ils sont encore en train de discuter avec le gouvernement sur d’autres solutions, des solutions qui seraient effectivement de désynchroniser l’hébergement de l’analyse qu’on en fait ensuite et d’autres façons de voir où on aurait aussi Orange ou d’autres industriels dans la boucle qui seraient un peu des comités qui permettraient aussi de garantir, avec des licences Microsoft quand même, que les choses sont faites correctement. Je pense qu’il y a derrière tout cela un autre sujet qui est : qu’est-ce qu’on veut faire vraiment ?

Delphine Sabattier : Quel est l’intérêt pour le collectif finalement ?

Laurence Devillers : En fait il y a deux sujets connexes, un qui intéresse beaucoup l’économie qui est d’être leaders mondiaux, internationaux sur ces sujets, donc de continuer notre Start-up Nation. L’autre qui est de vouloir faire du bien commun à l’intérieur de la France. Je pense que vouloir faire les deux en même temps, sans expliquer mieux, c’est assez compliqué. Nous sommes dans cet écueil. Il est quand même urgent que nos gouvernements se rendent compte qu’on a besoin de compréhension de la technologie lorsqu’on avance ce genre de projet. Il y a des lobbyistes partout autour des gouvernements, on le voit pour des acteurs de la recherche, on le voit pour des acteurs privés. On voit bien Microsoft et Google se battre à travers ces plateformes. Quid d’une plateforme européenne ? On en parle, on en reparle, on ne fait jamais rien !
La Start-up Nation qui essaie à chaque fois de propulser des bonnes idées, parfait ! Mais où vont-elles ces bonnes idées après ? Elles sont rachetées par des grands groupes ! À un moment donné il faut quand même se remonter les manches et dire « on sait faire en France, pourquoi ne fait-on pas ? ». La chose la plus simple c’est d’aller chercher ce qui existe déjà.

Delphine Sabattier : On sait faire. D’ailleurs on a fait justement la plus belle base de données de santé en France. C’est une sorte de trésor que tout le monde nous envie.

Laurence Devillers : Nationale dit-on.

Delphine Sabattier : Ça on a su faire, mais que dit ce choix qui a été fait aujourd’hui autour du Health Data Hub et de l’hébergement chez Microsoft de la politique française en matière de numérique, selon vous ?

Christian Babusiaux : Ça dit d’abord qu’avant de décider il faut bien réfléchir parce que tout cela était prévisible. Vous parliez de ma récente tribune, mais j’en avais fait une [3] dès juin 2020.

Delphine Sabattier : Et la CNIL [4] avait aussi fait part de ses inquiétudes.

Laurence Devillers : La CNIL et les chercheurs. Nous sommes en train, en Comité d’éthique dont vous avez parlé, de produire un document alertant aussi sur différents sujets d’éthique autour de cette plateforme.

Christian Babusiaux : Il y a un vrai problème, a dit la CNIL, de sécurité de la vie privée, parce que Microsoft n’est pas régi par le droit européen, le fameux RGPD [5].

Delphine Sabattier : Il l’est, mais il y a des lois extraterritoriales qui permettent de passer outre.

Laurence Devillers : Et de capturer les données.

Christian Babusiaux : On sait très bien que la loi américaine, dans tous les domaines, est extraterritoriale ; ça a toujours été comme ça nonobstant tous les changements de gouvernement aux États-Unis, donc on savait très bien, dès le départ, qu’il y avait ce sujet.
Or, si on fait héberger les données de santé par Microsoft, ce n’est pas seulement pour aujourd’hui ou pour demain ; tout ça demeurera dans le circuit pour 5/10/15/20/30 ans. Or que seront l’état du monde, l’état de la relation entre les blocs, l’évolution de la législation américaine ? Nous n’en sommes pas maîtres. C’est ça qu’il faut bien comprendre. Il y a un vrai sujet.

Delphine Sabattier : D’où ma question qui est le titre que j’ai choisi pour notre discussion : est-ce qu’il est nécessaire de sauver ce Health Data Hub ou est-ce qu’il faut repenser le projet ?

Laurence Devillers : Il faut sauver la bonne idée. Et puis ils ont commencé à essayer de standardiser, ce qui n’est pas simple, les données sont très hétérogènes. Qu’est-ce que sont les données de santé ? Il y a une grande différence entre les données d’une cohorte que fait un médecin qui a un niveau qualifié, qui cherche quelque chose et puis les données du lit du patient, continues, qu’on va collecter. Comment fait-on pour utiliser ça ? Derrière il y a aussi, finalement, cette histoire de dépenses d’énergie. On doit aussi penser à la fois à utiliser ces données au mieux, mais, en même temps, à réduire l’impact que ça aurait sur l’environnement, c’est-à-dire à réduire aussi la taille des données qui l’on cherche à conserver.
Ces sujets-là sont extrêmement importants à regarder, comme vous l’avez dit, avec suffisamment d’attention. Je pense qu’en France nous sommes beaucoup d’acteurs dans le numérique, dans l’informatique, capables de travailler avec les politiques pour aller sur quelque chose de plus transparent.

Delphine Sabattier : Ça veut dire qu’on peut encore bouger ce projet, on peut encore le transformer.

Laurence Devillers : Il faut être plus transparent sur ce qu’on est en train de faire, en essayant d’allier tous les chercheurs qui sont capables de faire ça. J’ai l’impression que dans ce gouvernement, qui a fait des choses excellentes sur le numérique, il y a quand même cette idée, finalement, que dès que ça touche un peu la technique on donne ça à des techniciens. Non ! En fait la technique cache la politique.

Delphine Sabattier : On manque de confiance peut-être.

Laurence Devillers : Ce n’est pas ça, elle n’est pas neutre, elle enferme, en fait, des décisions politiques. Si l’on ne regarde pas plus, qu’on ne lève pas le capot de la voiture, qu’on ne regarde pas plus ce qui se passe, on se fait complètement avoir, quelque part, parce qu‘on n‘a pas la liberté de penser comment construire autrement.
Pour moi, il faut à la fois sauver le Health Data Hub qui est une excellente initiative, peut-être la penser non pas avec un entrepôt de données qui garde tout mais bien quelque chose de plus hub, de réseau. Et puis construire vraiment quelles sont les dimensions éthiques. À chaque fois ce sont des équilibres. On ne va pas trouver quelque chose d’optimal ou de négatif, on va trouver des équilibres, finalement l’équilibre entre ces données solidaires et puis un pouvoir économique un peu plus fort. Il faut montrer qu’il y a des équilibres.

Delphine Sabattier : Sinon on risque peut-être de retomber dans des travers qu’on a connus autour du cloud. Notamment en France on a eu des grandes politiques cloud au début des années 2010 qui ont été un échec total et un gouffre financier.

Christian Babusiaux : Permettez-moi quand même de réintroduire la dimension humaine du sujet. Chaque jour qui passe ce sont des études qui ne sont pas lancées, qui ne sont pas réalisées, donc ce sont des maladies qui ne sont pas évitées ou prévenues ou soignées, ce sont éventuellement des décès qui ne sont pas prévenus.

Delphine Sabattier : À l’AP-HP [Assistance Publique-Hôpitaux de Paris] il y a quand même des bases de données qui permettent aujourd’hui aux chercheurs de travailler.

Christian Babusiaux : Pas totalement. Pourquoi ? Parce que c’est une base AP-HP, de même qu’il y a aussi des bases dans d’autres CHU, heureusement, mais il n’y a pas justement l’interconnexion entre les données. Par exemple l’AP-HP n’a pas les données de vie réelle des patients. Or comment voulez-vous prévenir les maladies, comment pouvez-vous voir les chaînes d’effets secondaires par exemple des traitements ou des lacunes dans les parcours de soins si vous n’avez pas les données de vie réelle. Donc il faut bien connecter justement ces éléments dont l’AP-HP est une partie naturellement importante, mais seulement une partie. Il faut bien voir ça.
Deuxièmement chaque jour compte. Or là le Health Data Hub est créé en novembre 2019, ça fait plus de deux ans. 30 millions d’euros sont engagés chaque année, donc considérablement plus qu’auparavant, ce qui est d’ailleurs souhaitable, mais qui ne trouvent pas leur utilisation normale.
Donc il y a vrai problème doublé d’un problème industriel.

Delphine Sabattier : Le Health Data Hub va intégrer PariSanté Campus [6], d’ailleurs l’a intégré en janvier, c’est tout récent, donc c’est une nouvelle étape qui s’ouvre, qu’est-ce qu’on peut en attendre ?

Laurence Devillers : Un modèle européen. On a pouvoir, avec cette idée de collecte et d’interopérabilité entre ces données, de construire sur l’Europe, mais il faut s’en donner les moyens.

Delphine Sabattier : On a besoin de la dimension européenne tout de suite ?

Christian Babusiaux : Je pense qu’on a besoin de deux choses, si vous me permettez, qui étaient introduites par Laurence. La première chose c’est de bien affronter et résoudre le problème de protection de la vie privée, c’est fondamental pour les Français et c’est d’ailleurs ce qui provoque l’hésitation du gouvernement. Dans la période actuelle, il se dit « ciel, n’allons pas remuer ce genre de chose », mais il faut s’y affronter. Et vouloir penser que des autorités publiques quelconques pourraient passer je dirais par-dessus la CNIL en lui forçant la main, je pense que c’est que extrêmement dangereux, d’abord en termes institutionnels, en termes de confiance des citoyens dans le système public. C’est le premier élément, il faut prendre le problème de la vie privée dans toutes ses dimensions.

Delphine Sabattier : La protection des données.

Christian Babusiaux : Deuxièmement, il y a évidemment l’enjeu industriel et technologique où il faut que ce soit vraiment des gens qui connaissent la technologie du système et qui connaissent le détail du système pour pouvoir faire évoluer ce qui est sur la table. Il faut faire évoluer le projet. On ne peut sauver le soldat Health Data Hub que si on le fait évoluer.

Delphine Sabattier : Laurence Devillers, quand même un mot sur les projets. Voyez-vous passer aujourd’hui des projets qui peuvent faire avancer la France en matière de santé ?

Laurence Devillers : Oui. On a vu des projets autour des risques cardiaques, on va avoir des projets autour du cancer. En fait il y a énormément de très beaux projets, très utiles, c’est aussi pour ça qu’il y a urgence.

Delphine Sabattier : Est-ce qu’il y a aussi des demandes d’applications étrangères à venir piocher dans ce Health Data Hub ?

Laurence Devillers : Pour l’instant pas vraiment, mais c’est l’idée d’aller sur l’Europe.

Delphine Sabattier : Ça fait partie des risques ?

Laurence Devillers : Non. Dans le Conseil scientifique on commence à intégrer des Européens. C‘est l’idée d’aller sur l’Europe.

Delphine Sabattier : Réservés à l’Europe.

Christian Babusiaux : Force est de dire qu’aujourd’hui, et vous avez pu l’observer si vous regardez ce qui paraît dans la presse, que non seulement les Britanniques ont fait énormément d’études sur la base de leur système national de santé, mais aussi un certain nombre de pays nordiques qui ont quand même des populations beaucoup plus faibles et le Canada, mais qui se sont organisés justement, et qui sont beaucoup plus attractifs en termes de réalisation d’études. Nous avons ce paradoxe, nous avons un véritable trésor, une mine potentielle de données, nous savons énormément de choses, mais il y a un blocage et c’est ce blocage qu’il faut surmonter.

Delphine Sabattier : Et c’est ce fameux passage à l’échelle. Visiblement, en France, on a encore du mal avec ça.
Merci beaucoup Laurence Devillers professeure en IA au CNRS et Christian Babusiaux, président du Cercle de la réforme de l’État pour vos éclairages sur ce Health Data Hub qui patine, on voit pourquoi.
Tout de suite après, dans Smart Tech, on va parler de biomimétisme, on va s’intéresser aux mystérieuses anguilles.