Traiter et analyser les données texte

En dehors des données structurées (données alphanumériques), Coheris Spad sait aussi traiter de l'information non structurée : du texte libre. Le principe consiste à établir préalablement un certain nombre de métriques, sur la fréquence de mots, leur distance dans le texte, etc. À partir de là, les méthodes statistiques classiques s'appliquent sur ces métriques.

Cette approche purement statistique du texte - il n'y a aucune notion sémantique prise en compte - permet des applications de classification automatique de courrier entrant (lettres de réclamation, demandes d'information, etc.), ainsi que des applications d'analyse du contenu de pages web ou des commentaires postés sur différents blogs, forums, etc.

 

Dans le 1er cas, le système réussit à classer correctement plus de 80 % des courriers, éliminant ainsi une grande partie du travail manuel de tri. Dans le second, il s'agit de mettre en place des observatoires sur le web et la blogosphère, pour savoir ce qui se dit sur un produit, une firme, etc.

 

À noter que ces techniques restent valables, quelle que soit la langue du texte. C'est aussi un avantage de l'approche statistique du text mining.

 

Points forts

  • L'analyse de texte : une approche complémentaire à celle des chiffres.
  • Approche statistique, apportant un taux de réussite significatif.
  • La langue du texte n'est pas un obstacle.
En savoir plus

Téléchargez notre documentation :

 

Coheris Spad

Catalogue des formations


Prendre un rendez-vous pour une web-démo

 

Demande de Rendez-vous


Témoignage

"C’est la seule solution du marché capable de proposer un large choix de méthodes statistiques (AFC, ACP, analyse multidimen-sionnelle...) avec en prime, une grande fidélité par rapport à l’intelligence statistique en France."

Hervé Hayat - Responsable Etudes Marketing - Fnac.com

Lire le témoignage