L’apprentissage machine au service des big data médicales

07 décembre 2017

Dans le monde médical également, l’apprentissage machine s’impose toujours davantage pour dégager de nouvelles analyses au départ de volumes de données en croissance exponentielle et server ainsi les soins de santé au quotidien.

  • Hans De Clercq & Hans Danneels

Désormais, tant les patients que les autres bénéficiaires de soins sont de plus en plus suivis 24 h sur 24 et 7 jours sur 7 grâce à un ou plusieurs équipements. Que ce soit au sein des hôpitaux et autres institutions de soins ou dans leur vie courante à l’aide d’appareils mobiles. Si les avantages sont multiples, le défi consiste à interpréter rapidement et de manière pertinente ces multiples flux de données, tant pour générer des alertes immédiates (notamment en cas de problème cardiaque, d’attaque épileptique, etc.) qu’à des fins de diagnostic. A cet égard, l’apprentissage machine pourrait apporter une réponse intéressante.

Rien de nouveau

Globalement, l’apprentissage machine est une branche de l’informatique qui étudie la manière dont les ordinateurs peuvent apprendre sans être programmés spécifiquement pour cette tâche. Souvent, ce domaine est lié aux études sur l’intelligence artificielle (IA), d’où le terme est d’ailleurs issu, en cours depuis de nombreuses années déjà. En effet, l’apprentissage machine a été mentionné pour la première fois en 1959 par Arthur Lee Samuel, pionnier de l’IA chez IBM, avec son programme de jeu de dames. Concrètement, il s’agit de permettre la création de modèles, sur base de très grands volumes de données, afin d’aider à l’interprétation de jeux de données et de flux de données, puis de les exploiter (par exemple en introduisant dans un ordinateur des milliers de combinaisons et de positions de jeux d’échec concrètes qui serviront de base à un modèle que l’ordinateur pourra ensuite utiliser pour jouer effectivement une partie d’échecs). Au fil des années, l’apprentissage machine s’est également intéressé aux développements tels que le traitement des données (entrepôts de données, data mining, systèmes d’aide à la décision, etc.) et les réseaux neuronaux notamment.

Byteflies et Google

Aujourd’hui, l’apprentissage machine a le vent en poupe grâce à la puissance des infrastructures ICT (dont le cloud) et aux possibilités d’analyse de très gros volumes et flux de données (stockage, traitement en mémoire). Certes, tout le monde songe d’emblée aux Amazon et autres Google de ce monde, sachant que le traitement de données constitue précisément l’ADN de ces géants de l’internet.

Mais il ne faudrait pas oublier les succès d’entreprises comme Byteflies - un spécialiste anversois des capteurs médicaux ayant un siège à Berkeley (CA) - qui participe au Launchpad Studio de Google. « Il s’agit d’un programme dans lequel des startups collaborent durant six mois avec des experts de Google afin de combiner leur expertise en apprentissage machine avec des applications de jeunes pousses », explique Hans De Clercq, CTO et cofondateur de Byteflies.

Le rôle de Byteflies consiste à interpréter les flux de données générés par son produit, le Sensor Dot, lequel offre un vaste éventail de possibilités de capteur (non-invasif). Aujourd’hui, celles-ci concernent déjà la PPG (photopléthysmographie), l’EDA (activité électrodermale), l’ECG (électrocardiogramme), l’EMC (électromyographie), les mouvements et la respiration. Ces flux de données peuvent ensuite être combinés dans le cadre d’applications spécifiques. «Aujourd’hui, Byteflies est active au sein du consortium SeizeIT dans le cadre d’une collaboration avec UCB et la KULeuven en vue de développer un produit contre l’épilepsie. « Le but est d’associer différents indicateurs, comme les arythmies, pour obtenir un système de monitoring efficace. »

Traiter de tels jeux et flux de données dans le cloud afin de trouver des biomarqueurs pertinents représente donc le cœur de métier de Byteflies. « En nous associant à des experts, nous pouvons apprendre les uns des autres. Google recherche de nouveaux débouchés pour sa technologie d’apprentissage machine. Nous assurons le lien vers le monde actuel », pour obtenir des résultats plus rapides et de meilleure qualité.

La collaboration avec Google devrait s’étendre sur six mois, une période durant laquelle quatre sessions de travail d’une semaine sont prévues (dont une est déjà terminée). Au terme de ces six mois, les résultats du partenariat seront évalués. Avant de poursuivre plus avant? « Il est encore trop tôt pour le dire…»

Multiples défis à venir

L’avenir de l’apprentissage machine dans le monde médical semble d’ores et déjà assuré, mais les défis sont nombreux et de taille. C’est ainsi que début 2017, un projet IBM Watson autour de l’oncologie au M.D. Anderson Cancer Center (rattaché à l’U of Texas) a été gelé. Ceci après quatre ans d’efforts et un investissement de plus de 62 millions de dollars. L’ambition était - au-delà du développement de l’apprentissage machine - de mettre au point un Oncology Expert Advisor capable d’assister les médecins.

Les raisons principales de cet échec semblent surtout ‘classiques’ et portent notamment sur les modifications de la portée du projet (les objectifs ont évolué au fil du temps, tandis que l’ampleur et la complexité allaient croissantes), les erreurs de management et certainement aussi un problème de ‘over promising and under delivering’ (le département marketing d’IBM étant mis en cause). Cela dit, la technologie de l’apprentissage machine a également été incriminée. Ainsi, certains jeux de données étaient incompatibles (deux générations de dossiers patient électroniques), d’où un volume de données trop limité. En outre, l’alimentation du système en données nécessitait des efforts trop importants de la part d’experts en raison d’un manque de structure. En outre, Watson ne semblait en mesure de tirer des conclusions que sur base du ‘corpus’ des données utilisées pour former le système, avec impossibilité de travailler sur des corpora différents.

Parmi les autres critères concernant Watson et ses applications en oncologie (Watson on Oncology), on épinglera encore le manque de ‘connaissances nouvelles’, tandis que le système ne permettait de savoir avec suffisamment de précision la genèse de l’analyse/la conclusion/le conseil. Par ailleurs, certains pays se plaignaient de la partialité des conseils qui s’appuyaient sur les travaux du Memorial Sloan Kettering Cancer Center, NY (axé principalement sur les méthodes américaines).

Ces péripéties ne signifient cependant pas la mort de Watson (ne jetons pas le bébé avec l’eau du bain…), mais représente un test grandeur nature sur la voie d’applications à base de données/big data plus réalistes dans le monde médical. Le blog de HealthAffairs en retire quatre leçons. Primo, appliquez l’apprentissage machine à l’automatisation de tâches d’interprétation routinières sur lesquelles les prestataires de soins perdent aujourd’hui beaucoup de temps. Secundo, sensibilisez le personnel médical à l’apprentissage machine en l’impliquant plus étroitement dans le développement (itératif) de produits réels et pas uniquement dans la recherche. Tertio, veillez à la diversité des sources de données et des fournisseurs de solutions d’analytique. Et quarto enfin, vérifiez la pertinence d’applications à base d’apprentissage machine dans l’amélioration des soins (et standardisez les informations sur la définition des objectifs concrets en matière de santé).

La qualité des données est primordiale

Certes, l’aspect apprentissage machine de Watson est d’une autre dimension que celui du traitement de flux de données provenant de capteurs. Mais cela souligne toute l’importance des jeux de données, que ce soit au niveau de leur quantité ou de leur qualité. « GIGO, alias ‘garbage in, garbage out’ », insiste Hans de Clercq qui fait sienne la célèbre expression.

D’ailleurs, la génération de flux de données de qualité représente le cœur de métier de Byteflies, grâce au bagage universitaire de ses fondateurs, Hans De Clercq et Hans Danneels, qui, outre leurs connaissances de l’électronique, ont des affinités étroites avec le monde médical. « Nombre de technologies nouvelles ne se sont pas encore imposées dans le médical. Nous entendons faire le pont entre ces deux mondes avec le développement de notre plateforme, insiste toujours De Clercq. Notre approche répond à environ 80 % des besoins d’une solution médicale, tandis que les clients peuvent apporter 20 % d’expertise spécifique de l’application. Pas besoin donc d’investir énormément de temps et de ressources dans le développement et la validation de leurs propres matériels et logiciels. » Bref, Byteflies ne propose certes pas l’ensemble de la solution, mais se positionne comme partenaire capable de supporter à large éventail d’applications.

Dans ce contexte, il ne faut pas négliger l’importance de la qualité des mesures de capteurs, de même que la fréquence des mesures (même par pas de millisecondes) en fonction du type de modèle que l’on souhaite mettre au point. « Nous sommes à présent dans la dernière phase de conformité au standard ISO 13485 », relatif aux systèmes de management de la qualité des dispositifs médicaux. Par ailleurs, la disponibilité de produits tels que le Sensor Dot permet aux développeurs d’applications pour vêtements médicaux intelligents de ne plus devoir faire appel à des produits grand public douteux.

Byteflies commercialise désormais, outre une combinaison de matériel (Sensor Dot) et de logiciel, un kit d’exploration et divers outils de mise en place et de suivi d’expériences. Ces produits sont actuellement testés par la KU Leuven et la Case Western Reserve University (Cleveland, Ohio), la cible étant les entreprises pharmaceutiques et technologiques ainsi que les organismes de recherche. En associant les mesures du Sensor Dot et le traitement des flux de données opéré par Byteflies, les organisations pourront, audelà des processus de validation classiques, obtenir plus rapidement et plus facilement des résultats de tests en grande quantité – ce qui n’est pas négligeable dans une optique ‘evidence based’. Et inversement, les produits et services – en ce compris les algorithmes d’apprentissage machine – pourront ainsi être validés dans le cadre d’études respectant les standards cliniques. « D’ailleurs, il ne faudrait pas oublier que la Belgique est numéro 3 dans le nombre d’études cliniques, derrière les Etats-Unis et la Suisse », dixit toujours De Clercq. En d’autres termes, notre pays représente non seulement un potentiel élevé de clients, mais renferme aussi de gros volumes de données.

Pour Byteflies, le partenariat avec Google constitue une aide bienvenue pour donner à l’offre une nouvelle dimension. Ainsi, l’année 2018 sera marquée non seulement par le lancement des livraisons du Sensor Dot, mais aussi par la mise en place d’un modèle de revenus basé sur les services (traitement de signaux par patient).

Dans ces développements, la sécurité revêt évidemment une importance capitale. En l’occurrence, les données sont cryptées selon le standard AES, tout en respectant les exigences de sécurité de la législation HIPAA américaine. « Nos flux de données sont d’ailleurs dissociés des informations sur les patients dans la partie de l’application à laquelle accèdent les médecins, hôpitaux et autres, insiste encore De Clercq. Tandis que la nouvelle réglementation européenne sur la vie privée est bien sûr également respectée ‘by design’.

Sans capteur

Clairement donc, le monde des soins de santé connaît des développements rapides et spectaculaires. Outre Byteflies et son Sensor Dot, de nombreuses autres sociétés se concentrent sur le monitoring mobile sans le recours à des capteurs spécialisés. Ainsi, FibriCheck (Hasselt) propose de mesurer le rythme cardiaque des patients à l’aide de la caméra d’un smartphone standard – un appareil désormais monnaie courante. Faut-il y voir une menace pour des produits comme le Sensor Dot ? Absolument pas, estime De Clercq. « FibriCheck propose une solution ponctuelle, alors que nous offrons une plateforme capable de supporter différentes applications, le tout associé à des services. »

En outre, chaque solution est un équilibre entre plusieurs facteurs – précision/qualité des données maximale, coût, confort du patient – sans oublier les différences entre les catégories d’âge (acceptation, ouverture d’esprit), les styles de vie (sport, etc.), la fréquence des mesures, etc. De même, il existe de nombreux types de présentation des capteurs, notamment sous forme de patch (cf. le Sensor Dot) ou de modèle portable (notamment une sorte d’appareil auditif, éventuellement même en intra-auricilaire).

Bref, pas question dans les soins de santé mobiles d’une solution de type ‘one size fits all’, ce qui devrait permettre à chaque fournisseur de trouver sa place.

Guy Kindermans