09/07/2001
Arisem
se place au coeur de la gestion sémantique du contenu
non structuré
Entreprise fondée
en 1996, Arisem
s'est positionnée d'emblée sur le segment
de la gestion des connaissances. Au centre de son offre :
un moteur d'analyse sémantique conçu au
départ pour le
traitement de grosses quantités de données
non structurées. Depuis,
la société a choisi d'étendre ses
solutions aux domaines de la veille et du travail collaboratif,
avec à la clef un tarif d'entrée de 53
000 euros.
Un moteur d'analyse sémantique
comme socle
Le moteur d'Arisem s'appuie sur un référentiel de concepts,
sorte de thésaurus liant termes et expressions, pour
recontextualiser le vocabulaire dans un texte. Suite
à une demande utilisateur, il commencera par
appliquer cette méthode à la requête,
ainsi qu'au contenu des documents de la base visée.
Puis, il comparera les deux résultats, et donnera
une note de pertinence quant au recoupement de leurs
réseaux sémantiques respectifs.
Ainsi, le mot 'table' dans la demande 'table de calcul'
sera associé au domaine des mathématiques,
et non à celui du mobilier. Pour l'heure, le
module intégre cinq langues (français,
anglais, espagnole, italien et anglais) et répertorie
près de 500 000 mots et expressions.
En 1997, l'éditeur lance une version de son moteur
associée à un agent de récupération.
Particulièrement adaptée au domaine de
la veille, DigOut4U fouille Internet en fonction d'une
demande précise (requêtes, serveurs cibles,
etc.), et rapatrie les données Web distantes
qu'il juge pertinentes. "Startem, Cybion et Net
Intelligence figurent parmi nos principaux clients français
dans ce domaine", ajoute Matthieu Lluis, reponsable
marketing d'Arisem.
Le
classement reste une étape indispensable
En
1998, Arisem choisit de compléter son meta moteur,
DigOut4U, d'une application serveur destinée
à classer les documents stockés localement.
"Cette initiative partait du constat que la fonction
d'indexation d'une base de données est beaucoup
plus pertinente quand elle s'accompagne d'un travail
d'organisation des connaissances en amont", commente
le responsable. En effet, si une requête ne contient
que le mot 'table', un moteur de recherche linguistique
aussi performant soit-il sera incapable de cerner le
domaine de recherche du demandeur. D'où l'articulation
de la solution autour d'un module de classement. "Comme
dans une bibliothèque, on commence par ranger une ressource
sur un rayonnage avant de l'indexer."
Ce nouveau produit, baptisé Watch Edition, s'appuie
lui aussi sur DigOut4U. Objectif : fournir une
méthode de classement des documents en arborescence
de thématiques. "Cette opération
s'effectue en fonction des noms attribués à
chaque catégorie et sous-catégorie, ou
de requêtes définies parallèlement
", explique Matthieu Lluis. Principaux avantages
mis en avant : la possibilité de filtrer
une grosse quantité de sources, et celle de constituer
de nombreuses vues logiques de la même base. Au
total, Watch Edition permettra par exemple de créer
des intranets de gestion documentaire personnalisés
en fonction des spécialités de chaque
département au sein d'une entreprise.
Un moteur de recherche plein
texte intégré
Une dernière solution (Media
Edition),
dédiée quant à elle au travail
collaboratif,
propose des
fonctions intranet complémentaires. Au programme :
un worflow de publication, l'intégration du moteur
Index Server de Microsoft pour effectuer des recherches
par catégorie, ainsi qu'un
système de structuration par objets (document,
catégorie, utilisateur, etc.). "Chacun d'eux
se définissant au vu de son corps de texte et/ou
de meta données", commente Matthieu Lluis.
Ainsi, un utilisateur de Media
Edition sera
lui-même décrit dans un objet (comparable
à son profil), et ceci en fonction des documents
qu'il publiera ou qu'il visualisera. Grâce à
cette méthode, DigOut4U (également intégré
à Media Edition) sera capable d'apporter des
informations complémentaires à la réponse
du moteur de Microsoft. A savoir : les catégories
dans lesquelles apparaissent les termes de la demande,
les utilisateurs spécialistes du domaine requêté,
etc. Parmi ses principaux clients sur ce dernier segment,
Arisem compte notamment Unilog, le CIGREF ou encore
L'Usine Nouvelle.
Dans le monde de la gestion des connaissances, Arisem
identifie Autonomy et Verity comme principaux concurrents.
|