21/05/01
Moteur
de recherche : pour gagner en précision, Hummingbird compte
sur la recherche "floue"
Face
à d'autres acteurs de poids tels que Verity ou Autonomy,
Hummingbird
propose lui aussi un moteur de recherche documentaire.
Nom de code : Research Server. Au programme, recherche
floue, catégorisation et analyse multilingue.
Une
gestion multilingue grâce à l'Unicode
Applicable à un ou plusieurs serveurs, le robot de Research
Server scanne le contenu de plus de 250 formats de fichier.
Les documents peuvent être stockés dans les répertoires
d'un système d'exploitation traditionnel - Windows NT,
Unix ou Linux. "L'outil indexe également les champs d'une
base de données relationnelle (Oracle, Informix, Microsoft,
etc)", ajoute Marc David, responsable commercial d'Hummingbird.
Inclus dans l'offre de la firme après le rachat de Fulcrum,
le moteur initialement conçu pour gérer 18 langues a été
amélioré depuis pour intégrer l'Unicode. "Ce qui lui permet
d'interpréter tout type de caractères alphabétiques",
souligne Marc David. Grâce à une technologie de recherche
floue, Search Server prend également en charge
la gestion de mots "approchant". Une fonction
utile, notamment en cas de fautes d'orthographes dans
une requête utilisateur.
Autre méthode utilisée : "la sélection de l'information
utile". Ainsi, le moteur fournira ses réponses en
prenant en compte pluriels, singuliers, et synonymes mais
aussi en sachant faire abstraction des mots vides de sens
(le, la, les, etc.). Des procédés d'analyse
automatique de textes, couplés à la possibilité d'associer
un fichier à une thématique contribuent à affiner
encore l'analyse sémantique, et la catégorisation de document.
Au final, on regrettera que le moteur ne puisse gérer
les formats image ou encore audio/vidéo.
Un
support des requêtes SQL
Côté client,
Search Server gère les requêtes en texte intégral. "Etant
compatible avec SQL Group, il prend également en charge
les requêtes SQL et les requêtes booléennes (reposant
sur and, or, etc.)", poursuit Marc David. "Une fonction
intéressante pour les experts ou les juristes qui réalisent
des dossiers triés par dates de parution ou par thèmes".
Quant aux résultats, ils incluent une liste de documents
couplée à leur adresse sur les serveurs
associés. A cela peut s'ajouter, en fonction de la configuration
du moteur, un résumé dont la taille est aussi paramétrable.
"Celui-ci est généré à partir de la vectorisation du
poids des mots liés à la requête, de leur fréquence
d'apparition, et de leur distance dans les textes",
explique Marc David. Autres informations fournies :
le format et la taille des fichiers retrouvés.
Côté administration, la prise en main de l'interface
nécessite trois jours de formation. Celle-ci offre un
certain nombre d'options. L'utilisateur pourra par exemple
choisir de n'indexer que les adresses ou les URL des
documents ou encore les Méta Données (bornes Meta, etc.).
Un solution qui cible tous
les secteurs... ou presque
Parmi
ses clients, Hummingbird affiche les services d'information
du gouvernement français, de la Bibliothèque Nationale,
ainsi que de la Commission Européenne - qui utilise
le
moteur pour gérer des documents dans les 12 langues
de l'Union. Autres
secteurs visés : ceux de la vente en ligne, de la banque
et des cabinets de conseil juridique. Dans ces domaines,
la société compte notamment parmi ses clients : Carrefour,
qui utilise la solution pour sa boutique en ligne, le
CCF et la BNP, ainsi qu'Accenture et PricewaterhouseCoopers.
Bref des sociétés qui ont besoin de manipuler de grosses
quantités de données documentaire. "Ce qui est
également le cas pour l'ensemble de l'industrie, qui
s'appuie sur des dessins techniques pour concevoir les
produits", complète Marc David. Seul secteur hors cible :
celui des services. Le prix de Search Server se situe
entre 20 000 et quelques centaines de milliers de francs,
selon le type de déploiement : Internet ou intranet.
|