Journal du Net > Solutions >  Arisem se place au coeur de la gestion sémantique du contenu non structuré
Article
 
09/07/2001

Arisem se place au coeur de la gestion sémantique du contenu non structuré

  Envoyer Imprimer  

Entreprise fondée en 1996, Arisem s'est positionnée d'emblée sur le segment de la gestion des connaissances. Au centre de son offre : un moteur d'analyse sémantique conçu au départ pour le traitement de grosses quantités de données non structurées. Depuis, la société a choisi d'étendre ses solutions aux domaines de la veille et du travail collaboratif, avec à la clef un tarif d'entrée de 53 000 euros.

Un moteur d'analyse sémantique comme socle

Le moteur d'Arisem s'appuie sur un référentiel de concepts, sorte de thésaurus liant termes et expressions, pour recontextualiser le vocabulaire dans un texte. Suite à une demande utilisateur, il commencera par appliquer cette méthode à la requête, ainsi qu'au contenu des documents de la base visée. Puis, il comparera les deux résultats, et donnera une note de pertinence quant au recoupement de leurs réseaux sémantiques respectifs. Ainsi, le mot 'table' dans la demande 'table de calcul' sera associé au domaine des mathématiques, et non à celui du mobilier. Pour l'heure, le module intégre cinq langues (français, anglais, espagnole, italien et anglais) et répertorie près de 500 000 mots et expressions.

En 1997, l'éditeur lance une version de son moteur associée à un agent de récupération. Particulièrement adaptée au domaine de la veille, DigOut4U fouille Internet en fonction d'une demande précise (requêtes, serveurs cibles, etc.), et rapatrie les données Web distantes qu'il juge pertinentes. "Startem, Cybion et Net Intelligence figurent parmi nos principaux clients français dans ce domaine", ajoute Matthieu Lluis, reponsable marketing d'Arisem.


Le classement reste une étape indispensable
En 1998, Arisem choisit de compléter son meta moteur, DigOut4U, d'une application serveur destinée à classer les documents stockés localement. "Cette initiative partait du constat que la fonction d'indexation d'une base de données est beaucoup plus pertinente quand elle s'accompagne d'un travail d'organisation des connaissances en amont", commente le responsable. En effet, si une requête ne contient que le mot 'table', un moteur de recherche linguistique aussi performant soit-il sera incapable de cerner le domaine de recherche du demandeur. D'où l'articulation de la solution autour d'un module de classement. "Comme dans une bibliothèque, on commence par ranger une ressource sur un rayonnage avant de l'indexer."

Ce nouveau produit, baptisé Watch Edition, s'appuie lui aussi sur DigOut4U. Objectif : fournir une méthode de classement des documents en arborescence de thématiques. "Cette opération s'effectue en fonction des noms attribués à chaque catégorie et sous-catégorie, ou de requêtes définies parallèlement ", explique Matthieu Lluis. Principaux avantages mis en avant : la possibilité de filtrer une grosse quantité de sources, et celle de constituer de nombreuses vues logiques de la même base.
Au total, Watch Edition permettra par exemple de créer des intranets de gestion documentaire personnalisés en fonction des spécialités de chaque département au sein d'une entreprise.

Un moteur de recherche plein texte intégré
Une dernière solution (Media Edition), dédiée quant à elle au travail collaboratif, propose des fonctions intranet complémentaires. Au programme : un worflow de publication, l'intégration du moteur Index Server de Microsoft pour effectuer des recherches par catégorie, ainsi qu'un système de structuration par objets (document, catégorie, utilisateur, etc.). "Chacun d'eux se définissant au vu de son corps de texte et/ou de meta données", commente Matthieu Lluis. Ainsi, un utilisateur de Media Edition sera lui-même décrit dans un objet (comparable à son profil), et ceci en fonction des documents qu'il publiera ou qu'il visualisera. Grâce à cette méthode, DigOut4U (également intégré à Media Edition) sera capable d'apporter des informations complémentaires à la réponse du moteur de Microsoft. A savoir : les catégories dans lesquelles apparaissent les termes de la demande, les utilisateurs spécialistes du domaine requêté, etc. Parmi ses principaux clients sur ce dernier segment, Arisem compte notamment Unilog, le CIGREF ou encore L'Usine Nouvelle.

Dans le monde de la gestion des connaissances, Arisem identifie Autonomy et Verity comme principaux concurrents.


JDN Solutions Envoyer Imprimer Haut de page

Sondage

Votre entreprise compte-elle recruter des profils IT en 2017 ?

Tous les sondages