Intelligence artificielle et santé : la connaissance par les données de santé

Une IA ne peut rien faire sans données à traiter. Ces dernières vont lui permettre de créer une base de connaissance puis de l’enrichir.

La valeur des services rendus par une IA dépendra donc de la quantité et de la qualité des données qu’elle peut traiter

Or la question de la source des données est essentielle en matière de santé

En effet, rappelons tout d’abord que le Règlement Général pour la protection des données définit une donnée de santé comme étant « les données à caractère personnel relatives à la santé physique ou mentale d'une personne physique, y compris la prestation de services de soins de santé, qui révèlent des informations sur l'état de santé de cette personne;“

Plus précisément, cette notion recouvre les hypothèses suivantes

- un numéro, un symbole ou un élément spécifique attribué à une personne physique pour l'identifier de manière unique à des fins de santé

- des informations obtenues lors du test ou de l'examen d'une partie du corps ou d'une substance corporelle, y compris à partir de données génétiques et d'échantillons biologiques;

- et toute information concernant, par exemple, une maladie, un handicap, un risque de maladie, les antécédents médicaux, un traitement clinique ou l'état physiologique ou biomédical de la personne concernée, indépendamment de sa source, qu'elle provienne par exemple d'un médecin ou d'un autre professionnel de la santé, d'un hôpital, d'un dispositif médical ou d'un test de diagnostic in vitro

La CNIL au niveau national a précisé que n’entrent pas dans la notion de données de santé celles à partir desquelles aucune conséquence ne peut être tirée au regard de l’état de santé de la personne concernée (ex : une application collectant un nombre de pas au cours d’une promenade sans croisement de ces données avec d’autres). La question de cette collecte de données fait donc face à une double exigence :

- les données doivent être un bien accessible et propre à chaque patient

- les données doivent pouvoir être exploitées librement pour faire avancer la science

la CNIL a adopté des méthodologies de référence MR-001, MR-003, MR-004, MR-005 et MR-006 qui offrent un cadre sécurisé pour la mise en œuvre des traitements de recherche dans le domaine de la santé.

Il reste que doit rester assuré le secret médical (article L 1110-4 du code de la santé publique ) et que la question de l’anonymisation de telles données se pose.

Enfin, cette source de données peut aussi être issue d’entrepôt de données de santé, la plateforme de santé, le Heath data hub ayant été crée sur la base de l’article L. 1462-1 du Code de la santé publique.

Apres avoir initialement créé la polémique en confiant ce marché à Microsoft, le Conseil d’Etat saisi récemment, a rendu une ordonnance en date du 13 octobre 2020 jugeant « qu’on ne peut exclure un risque de transfert des données de santé hébergées dans la plateforme du Health Data Hub aux services de renseignements américains » et enjoignait le Health Data Hub « de renforcer sur certains points le contrat qui le lie à Microsoft et de rechercher des mesures additionnelles pour mieux protéger les données qu’il héberge ».

Si le champ des possibles est extrêmement vaste d’un point de vue technique, les précautions à prendre dans la collecte des données de santé pour alimenter une IA reste très encadré. Rappelons enfin que demeure prohibé (à ce jour mais jusque à quand ?) tout acte de cession à titre onéreux de données de santé identifiantes directement ou indirectement, y compris avec l'accord de la personne concernée.

A suivre…