Impulsions

Discussions sur les soins de santé et la technologie

Tous les articles

Analyse prédictive : identifier des modèles avec les données médicales non structurées ?

Analyse Prédictive avec Données MédicalesEt si vous pouviez déterminer avec précision dans la base de données de patients enregistrées, quels patients ont davantage de risques de contracter, par exemple, l'hépatite C (un virus à l'origine d'une inflammation du foie dont les gens ignorent parfois être infectés) ? Une fantaisie du futur ?

Heureusement pas. À l'heure actuelle, il est déjà possible d'identifier les groupes à risque, mais pas encore de manière suffisamment précise.Dresser une liste des facteurs de risques (toxicomanie ou enzymes hépatiques élevées, par exemple) est un bon point de départ, mais vous écartez alors le groupe de gens qui n'est pas concerné et qui court néanmoins des risques, disons à cause d'un tatouage ou d'un piercing qui se serait infecté.

Une importante source d'information, souvent délaissée à l'heure actuelle, peut toutefois faire la différence. Il s'agit des notes des médecins.


Les notes des médecins : des données non structurées d'une richesse incroyable pour l'analyse prédictive

Entre 10 et 15 % des données médicales sont composées de données structurées. Les résultats de laboratoire d’analyses médicales, les données démographiques des patients, mais aussi les codes CIM-10 : ce sont toutes des données structurées. La majeure partie (80 à 95 %) des données médicales est toutefois non structurée. Les rapports de radiologie, les lettres de sortie, les notes de médecins, etc. Et c'est ici que réside la véritable richesse de données, dans les données non structurées. Grâce à une nouvelle technologie (iKnow), ces grandes quantités de données non structurées peuvent être analysées. Cela permet, par exemple, d'avoir une meilleure compréhension du traitement des patients, mais aussi de faire des prédictions.

 

Qui reste sur la touche ?

Les toxicomanes, les patients porteurs du VIH, les personnes qui viennent de se rendre dans un pays à forte prévalence d'hépatite C, les hommes ayant eu des rapports sexuels avec d'autres hommes : autant de facteurs qui augmentent le risque d'hépatite C. Il s'agit de données relatives à des patients sous traitement qui peuvent être consignées. Mais cela ne suffit pas. Imaginez qu'un patient ait un tatouage et/ou un piercing. Qu'il ait suivi un traitement d'acuponcture, ait séjourné quelque temps en prison, ou ait connu d'autres conditions de vie particulières qui augmentent le risque d'hépatite C ? Des données qui ne se retrouvent pas sur les questionnaires standards, ni ne possèdent de code CMI-10, mais qui peuvent apparaître dans les notes du médecin. Désormais, les textes peuvent également être pris en compte dans l'analyse d'un dossier médical.

 

Approche descendante ou ascendante ?

Avec les outils traditionnels d'analyse de texte, des bases de données sont scannées sur la base de certains mots et groupes de mots qui sont repris dans une ontologie, tels que « VIH », « hépatite C », « sexe », « médicaments ». Mais constituer de bonnes listes terminologiques prend beaucoup de temps et les résultats des analyses sont souvent constitués d'interminables bilans de patients pour lesquels un ou plusieurs de ces facteurs sont vrais. C'est pratique, mais vous passez également à côté de certains résultats, car vous avez recherché de manière très ciblée, à l'aide de mots clés définis, des dossiers médicaux où apparaissent ces éléments : une approche descendante donc.

 

À la recherche de relations

Avec la technologie iKnow, c'est précisément l'inverse. Elle part des données, sans savoir ce qui se trouve dans un domaine particulier. Elle détecte tous les groupes de mots pertinents et les relations entre eux, et les consigne sans objectif préalable. Ce processus porte le nom d'indexation intelligente. La technologie sur laquelle repose ce processus se concentre sur la représentation linguistique des relations. La plupart du temps, il s'agit de formes verbales, parfois d'un nom indépendant, dépendant du contexte dans lequel il se trouve. Dès que les représentations sémantique des relations sont trouvées, tous les autres mots ou groupes de mots deviennent des groupes de mots pertinents faisant référence à des concepts spécifiques. La technologie crée ainsi un index intelligent.

Par exemple dans la phrase suivante : « Deux patients souffrent de douleurs à l'estomac ». La technologie extrait ici les éléments suivants et les enregistre dans l'index intelligent :

  • Le concept « deux patients »
  • La relation « souffrent de »
  • Le concept « douleurs à l'estomac »

Dès que vous appliquez cet index intelligent à un important volume de données, vous pouvez l'utiliser pour effectuer des analyses pratiques à des fins diverses.

 

Identifier des éléments dans le dossier médical électronique

Pour passer en revue le dossier médical électronique par exemple : Il ressort d'une liste établie par l'index intelligent et reprenant les mots les plus récurrents des rapports de médecin d'un patient que le mot « douleur » est par exemple cité de nombreuses fois par le patient, alors que « douleur à l'estomac » apparaît plus souvent dans son dossier que « douleur à la poitrine ». Cela constitue un bon point de départ pour une étude plus approfondie du dossier médical. Ces résultats proviennent des données, et ne résultent pas d'une recherche personnelle spécifique sur le mot « douleur ».


Identifier les patients

Foto_Blog_62Une autre application utile de la technologie est la sélection de patients et de groupes de patients au départ de grands volumes de données structurées et non structurées.

Un institut de radiothérapie aux Pays-Bas souhaitait en savoir plus au sujet de l'effet d'un médicament antidiabétique particulier lors du traitement d'un cancer de la nuque et du cou. Il s'agissait de montrer tous les patients sous metformine, testés pour le diabète et pour lesquels un cancer de la nuque et du cou avait été diagnostiqué.

Si l'on n'avait effectué qu'une recherche sur la prise de médicaments, les résultats auraient également pris en compte les patients ayant arrêté de prendre le médicament. En appliquant l'index intelligent sur l'ensemble des données, la recherche put être affinée. En outre, des informations purent être extraites des notes du médecin, ce qui permit d'établir une vue d'ensemble des patients satisfaisant aux trois critères. Il est ensuite possible de cliquer sur les codes patients qui renvoient vers les passages des notes du médecin où ces éléments apparaissent.

Identifier des modèles

Mais la technique peut également être utilisée afin de construire des modèles prédictifs, à l'image d'un cabinet de médecine générale belge qui voulait analyser quels patients couraient un risque plus élevé de contracter l'hépatite C. Le cabinet voulait pour ce faire utiliser l'intégralité des dossiers médicaux. La majeure partie de la liste des facteurs de risques pour cette inflammation hépatique d'origine virale est composée de données structurées, telles que des enzymes hépatiques élevées. Mais d'autres facteurs tout aussi importants tels que la présence ou non d'un piercing ou d'un tatouage, ou un séjour passé en prison, ne sont pas repris dans la série de données structurées assorties de codes. Toutefois, ils peuvent se retrouver dans la partie non structurée du dossier médical, dans les notes.

En appliquant l'index intelligent sur ces données et en le combinant avec les données structurées des dossiers, plusieurs patients purent être identifiés comme « à risque ». Ces patients purent ensuite être testés pour l'hépatite C. De cette manière, il est possible d'identifier des patients qui, sans l'analyse des données non structurées, n'auraient probablement pas pu être identifiés comme patients « à risque ».

 

Au travail avec ces données !

Vous voulez vous aussi vous mettre au travail avec l'énorme quantité de données médicales (non structurées) que compte votre établissement de soins, votre région de soins ou votre institut de recherche ? Afin d'identifier des modèles au niveau des syndromes et des traitements ? Ou pour pouvoir définir de manière précise des groupes à risque ? Et traiter des patients à temps ? Prenez dans ce cas contact avec nous, nous nous ferons un plaisir d'étudier ensemble les possibilités qui s'offrent à vous.

 

 

Analyse sémantique de données dans le Big Data

 

 

THÈMES: Données non structurées, e-Santé, Analyse prédictive, iKnow

David Majster
David Majster
David Majster a été directeur marketing chez InterSystems Benelux entre 2003 et 2018. Il a combiné son enthousiasme pour les technologies TI avec une approche pragmatique. David est connu pour son bon sens de l'humour et son ingéniosité. Après plus de 40 ans d'expérience au sein d'entreprises informatiques internationales en Belgique, aux Pays-Bas, en Allemagne et en France, il profite aujourd'hui d'une retraite bien méritée.

 


Laissez un commentaire

Vous aimerez peut-être:

Gartner Magic Quadrant 2018 : InterSystems reconnu comme Challenger dans la catégorie « Operational Database Management Systems  »

Cambridge, Mass – 26 octobre 2018 – InterSystems, l’un des leaders mondiaux des technologies de l'informa...
Adeline Icard 29/10/2018

[Communiqué de presse] InterSystems accompagne l’Hôpital Américain de Paris

Paris, le 13 juillet 2018 –InterSystems France, leader mondial en matière de logiciels pour un circuit de...
Adeline Icard 08/10/2018