Impulsions

Discussions sur les soins de santé et la technologie

Tous les articles

L'analyse automatique de données non structurées : études de cas (2/2)

Analyse Données Non Structurées - Etudes de casLes données non structurées sont une mine d'or d'informations. Les nombreux e-mails, rapports de médecins et messages sur les réseaux sociaux par exemple, peuvent vous apporter de nombreuses informations très intéressantes pour vous aider à gérer votre entreprise. Il est possible de collecter ces informations issues de données non structurées via une technologie innovante appelée analyse de texte « ascendante » automatique. Nous vous l'expliquons à l'aide de quatre études de cas et vous présentons les avantages que l'analyse automatique de données non structurées peut représenter pour vous dans la pratique.

 

Différentes fonctions intéressantes

Dans le premier blog, nous avons déjà traité de deux fonctions de base de l'analyse de texte: la « reconnaissance de données » (de quoi parle le texte ?) et la « signalisation » (Qu'est-ce qui caractérise et est pertinent dans le texte ?) Dans cette seconde partie, nous abordons la « Fragmentation de contenu » (quels textes sont liés entre eux ?) et la « Collecte d'informations » (quels éléments peuvent être extraits d'un texte ?) Afin de rendre ces fonctions concrètes, nous décrivons une série d'applications pratiques d'iKnow (la technologie qui permet d'analyser des données non structurées).

 

La fragmentation de contenu : faire des suggestions pertinentes de manière automatique

Fonctionnement Anaylse de textesLa fonction de fragmentation de contenu permet de collecter des (groupes de) documents qui se révèlent pertinents pour un certain profil. Pour conseiller par exemple certains livres à un client d'un magasin de livres en ligne. Ou pour suggérer à un visiteur d'un site Internet des articles sur un thème similaire à celui d'un article de presse déterminé qu'il a lu. Pour ce faire, la plupart des techniques d'analyse de texte font appel à des métadonnées, des informations d'utilisateurs et/ou un comportement de visiteur. La technologie iKnow apporte ici quelque chose de très intéressant : elle scanne les textes au moyen d'algorithmes et identifie les documents qui vont ensemble. Cela peut se faire de manière totalement automatique, ou avec l'input de l'utilisateur.

 

Comment cela fonctionne-t-il pratiquement ?

Koorong Books est le plus important vendeur de livres religieux en Australie. Il utilise la technologie iKnow pour identifier les doublons de livres mis en ligne et pour proposer des suggestions de lecture aux clients. De fait, Koorong Books ne peut pas utiliser l'énorme quantité d'informations d'utilisateurs dont disposent de grandes librairies en ligne telles qu'Amazon. De plus, cette librairie dessert un groupe de niche tel qu'elle n'a pas le budget pour la description détaillée des livres et la répartition en catégories. 

Le secteur des soins de santé a également recours à la fragmentation de contenu automatique afin de collecter rapidement les informations pertinentes : Différents hôpitaux dans le Benelux, en Allemagne et aux États-Unis utilisent un outil avec lequel ils peuvent extraire automatiquement les candidats les plus adaptés à un « essai clinique » d'une grande quantité de rapports de patients. Dans ce cas, la technologie iKnow utilise les propriétés de données structurées déjà présentes et les combine en scannant des champs textuels libres sur certain(e)s (combinaisons de) termes.

 

Collecte d'informations : répartition automatique et collecte d'information supplémentaire

Grâce à cette fonction, il est possible d'extraire des morceaux d'informations structurées ou de métadonnées d'un texte libre. La taille d'une tumeur peut par exemple être extraite automatiquement de phrases telles que « le diamètre de la tumeur est d'1 cm » ou « la dimension estimée de la tumeur est comprise entre 1 et 2 cm ». Les noms et les lieux peuvent également être extraits des textes, après quoi ils sont catalogués. Pour l'identification et le classement des rapports d'opérations (laparoscopiques ou non). La technologie iKnow permet d'identifier des termes pertinents à l'aide de la technique d'analyse de texte automatique.

L'éditeur anglais en ligne PCS utilise par exemple iKnow pour un processus de géolocalisation qui lui permet d'ajouter des coordonnées à des articles d'actualité. Les articles sont ainsi placés automatiquement dans la section de « nouvelles locales » adéquate. Et l'entreprise allemande de logiciels N3 utilise la fonction de collecte d'information automatique pour le site Internet immobilier ImmobilienScout24. Grâce à cette technique, il est possible d'extraire des descriptions textuelles des maisons de morceaux de textes qui ne disposent pas encore de métadonnées, ce qui permet aux personnes à la recherche d'un bien immobilier d'effectuer une recherche plus ciblée.

 

La technologie iKnow

La technologie iKnow décrite dans les cas pratiques est spéciale dans le sens où elle fait appel à une analyse de texte « ascendante » unique qui met l'accent sur ce qui se trouve dans le texte et non sur ce qu'il faut y trouver. Cela permet d'éliminer le processus d'identification de l'objet de la recherche à fort coefficient de travail, comme la création préalable de listes de mots. Vous voulez en savoir plus au sujet du contexte dans lequel s'inscrit la technologie iKnow et le fonctionnement de l'analyse de texte automatique ? Lisez dans ce cas le blog « Analyser le Big Data non structuré ». ou téléchargez le papier blanc ci-après :

 Analyse sémantique de données dans le Big Data

 

 

Crédits Fotos: 
Docteur Digital
Chirurgien

THÈMES: Big Data, Données non structurées, iKnow

David Majster
David Majster
David Majster a été directeur marketing chez InterSystems Benelux entre 2003 et 2018. Il a combiné son enthousiasme pour les technologies TI avec une approche pragmatique. David est connu pour son bon sens de l'humour et son ingéniosité. Après plus de 40 ans d'expérience au sein d'entreprises informatiques internationales en Belgique, aux Pays-Bas, en Allemagne et en France, il profite aujourd'hui d'une retraite bien méritée.

 


Laissez un commentaire

Vous aimerez peut-être:

Gartner Magic Quadrant 2018 : InterSystems reconnu comme Challenger dans la catégorie « Operational Database Management Systems  »

Cambridge, Mass – 26 octobre 2018 – InterSystems, l’un des leaders mondiaux des technologies de l'informa...
Adeline Icard 29/10/2018

[Communiqué de presse] InterSystems accompagne l’Hôpital Américain de Paris

Paris, le 13 juillet 2018 –InterSystems France, leader mondial en matière de logiciels pour un circuit de...
Adeline Icard 08/10/2018