L'analyse automatique de données non structurées : études de cas (2/2)

01/09/2015

Read More

IMPULSIONS

La donnée au cœur de ce qui compte

Tous les articles

L'analyse automatique de données non structurées : études de cas (2/2)

Analyse Données Non Structurées - Etudes de casLes données non structurées sont une mine d'or d'informations. Les nombreux e-mails, rapports de médecins et messages sur les réseaux sociaux par exemple, peuvent vous apporter de nombreuses informations très intéressantes pour vous aider à gérer votre entreprise. Il est possible de collecter ces informations issues de données non structurées via une technologie innovante appelée analyse de texte « ascendante » automatique. Nous vous l'expliquons à l'aide de quatre études de cas et vous présentons les avantages que l'analyse automatique de données non structurées peut représenter pour vous dans la pratique.

 

Différentes fonctions intéressantes

Dans le premier blog, nous avons déjà traité de deux fonctions de base de l'analyse de texte: la « reconnaissance de données » (de quoi parle le texte ?) et la « signalisation » (Qu'est-ce qui caractérise et est pertinent dans le texte ?) Dans cette seconde partie, nous abordons la « Fragmentation de contenu » (quels textes sont liés entre eux ?) et la « Collecte d'informations » (quels éléments peuvent être extraits d'un texte ?) Afin de rendre ces fonctions concrètes, nous décrivons une série d'applications pratiques d'iKnow (la technologie qui permet d'analyser des données non structurées).

 

La fragmentation de contenu : faire des suggestions pertinentes de manière automatique

Fonctionnement Anaylse de textesLa fonction de fragmentation de contenu permet de collecter des (groupes de) documents qui se révèlent pertinents pour un certain profil. Pour conseiller par exemple certains livres à un client d'un magasin de livres en ligne. Ou pour suggérer à un visiteur d'un site Internet des articles sur un thème similaire à celui d'un article de presse déterminé qu'il a lu. Pour ce faire, la plupart des techniques d'analyse de texte font appel à des métadonnées, des informations d'utilisateurs et/ou un comportement de visiteur. La technologie iKnow apporte ici quelque chose de très intéressant : elle scanne les textes au moyen d'algorithmes et identifie les documents qui vont ensemble. Cela peut se faire de manière totalement automatique, ou avec l'input de l'utilisateur.

 

Comment cela fonctionne-t-il pratiquement ?

Koorong Books est le plus important vendeur de livres religieux en Australie. Il utilise la technologie iKnow pour identifier les doublons de livres mis en ligne et pour proposer des suggestions de lecture aux clients. De fait, Koorong Books ne peut pas utiliser l'énorme quantité d'informations d'utilisateurs dont disposent de grandes librairies en ligne telles qu'Amazon. De plus, cette librairie dessert un groupe de niche tel qu'elle n'a pas le budget pour la description détaillée des livres et la répartition en catégories. 

Le secteur des soins de santé a également recours à la fragmentation de contenu automatique afin de collecter rapidement les informations pertinentes : Différents hôpitaux dans le Benelux, en Allemagne et aux États-Unis utilisent un outil avec lequel ils peuvent extraire automatiquement les candidats les plus adaptés à un « essai clinique » d'une grande quantité de rapports de patients. Dans ce cas, la technologie iKnow utilise les propriétés de données structurées déjà présentes et les combine en scannant des champs textuels libres sur certain(e)s (combinaisons de) termes.

 

Collecte d'informations : répartition automatique et collecte d'information supplémentaire

Grâce à cette fonction, il est possible d'extraire des morceaux d'informations structurées ou de métadonnées d'un texte libre. La taille d'une tumeur peut par exemple être extraite automatiquement de phrases telles que « le diamètre de la tumeur est d'1 cm » ou « la dimension estimée de la tumeur est comprise entre 1 et 2 cm ». Les noms et les lieux peuvent également être extraits des textes, après quoi ils sont catalogués. Pour l'identification et le classement des rapports d'opérations (laparoscopiques ou non). La technologie iKnow permet d'identifier des termes pertinents à l'aide de la technique d'analyse de texte automatique.

L'éditeur anglais en ligne PCS utilise par exemple iKnow pour un processus de géolocalisation qui lui permet d'ajouter des coordonnées à des articles d'actualité. Les articles sont ainsi placés automatiquement dans la section de « nouvelles locales » adéquate. Et l'entreprise allemande de logiciels N3 utilise la fonction de collecte d'information automatique pour le site Internet immobilier ImmobilienScout24. Grâce à cette technique, il est possible d'extraire des descriptions textuelles des maisons de morceaux de textes qui ne disposent pas encore de métadonnées, ce qui permet aux personnes à la recherche d'un bien immobilier d'effectuer une recherche plus ciblée.

 

La technologie iKnow

La technologie iKnow décrite dans les cas pratiques est spéciale dans le sens où elle fait appel à une analyse de texte « ascendante » unique qui met l'accent sur ce qui se trouve dans le texte et non sur ce qu'il faut y trouver. Cela permet d'éliminer le processus d'identification de l'objet de la recherche à fort coefficient de travail, comme la création préalable de listes de mots. Vous voulez en savoir plus au sujet du contexte dans lequel s'inscrit la technologie iKnow et le fonctionnement de l'analyse de texte automatique ? Lisez dans ce cas le blog « Analyser le Big Data non structuré ». ou téléchargez le papier blanc ci-après :

 Analyse sémantique de données dans le Big Data

 

 

Crédits Fotos: 
Docteur Digital
Chirurgien

THÈMES: Big Data, Données non structurées, iKnow

David Majster
David Majster
David Majster a été directeur marketing chez InterSystems Benelux entre 2003 et 2018. Il a combiné son enthousiasme pour les technologies TI avec une approche pragmatique. David est connu pour son bon sens de l'humour et son ingéniosité. Après plus de 40 ans d'expérience au sein d'entreprises informatiques internationales en Belgique, aux Pays-Bas, en Allemagne et en France, il profite aujourd'hui d'une retraite bien méritée.

 


Laissez un commentaire

Vous aimerez peut-être:

L’exigence de rapidité

Aujourd’hui, dans le monde de l’entreprise, l’exigence de rapidité est omniprésente. Les clients veulent ...
Joe Lichtenberg 08/01/2020

L’Intelligence Artificielle au service de la Supply Chain: le monitoring de la demande

À l’occasion de la huitième édition du salon Supply Chain Event qui s’ouvre demain, pour deux jours à Par...
Richard Viot Coster 02/12/2019

L’Intelligence Artificielle au service de la Supply Chain: catégoriser les produits et adapter leur mode de gestion, un levier majeur de l’optimisation des stocks

À l’occasion de la huitième édition du salon Supply Chain Event qui se déroulera les 3 et 4 décembre 2019...
Richard Viot Coster 06/11/2019