Journal du Net > Solutions >  Moteur de recherche : pour gagner en précision, Hummingbird compte sur la recherche "floue"
Article
 
21/05/01

Moteur de recherche : pour gagner en précision, Hummingbird compte sur la recherche "floue"

  Envoyer Imprimer  

Face à d'autres acteurs de poids tels que Verity ou Autonomy, Hummingbird propose lui aussi un moteur de recherche documentaire. Nom de code : Research Server. Au programme, recherche floue, catégorisation et analyse multilingue.

Une gestion multilingue grâce à l'Unicode
Applicable à un ou plusieurs serveurs, le robot de Research Server scanne le contenu de plus de 250 formats de fichier. Les documents peuvent être stockés dans les répertoires d'un système d'exploitation traditionnel - Windows NT, Unix ou Linux. "L'outil indexe également les champs d'une base de données relationnelle (Oracle, Informix, Microsoft, etc)", ajoute Marc David, responsable commercial d'Hummingbird. Inclus dans l'offre de la firme après le rachat de Fulcrum, le moteur initialement conçu pour gérer 18 langues a été amélioré depuis pour intégrer l'Unicode. "Ce qui lui permet d'interpréter tout type de caractères alphabétiques", souligne Marc David. Grâce à une technologie de recherche floue, Search Server prend également en charge la gestion de mots "approchant". Une fonction utile, notamment en cas de fautes d'orthographes dans une requête utilisateur.

Autre méthode utilisée : "la sélection de l'information utile". Ainsi, le moteur fournira ses réponses en prenant en compte pluriels, singuliers, et synonymes mais aussi en sachant faire abstraction des mots vides de sens (le, la, les, etc.). Des procédés d'analyse automatique de textes, couplés à la possibilité d'associer un fichier à une thématique contribuent à affiner encore l'analyse sémantique, et la catégorisation de document. Au final, on regrettera que le moteur ne puisse gérer les formats image ou encore audio/vidéo.

Un support des requêtes SQL
Côté client, Search Server gère les requêtes en texte intégral. "Etant compatible avec SQL Group, il prend également en charge les requêtes SQL et les requêtes booléennes (reposant sur and, or, etc.)", poursuit Marc David. "Une fonction intéressante pour les experts ou les juristes qui réalisent des dossiers triés par dates de parution ou par thèmes". Quant aux résultats, ils incluent une liste de documents couplée à leur adresse sur les serveurs associés. A cela peut s'ajouter, en fonction de la configuration du moteur, un résumé dont la taille est aussi paramétrable. "Celui-ci est généré à partir de la vectorisation du poids des mots liés à la requête, de leur fréquence d'apparition, et de leur distance dans les textes", explique Marc David. Autres informations fournies : le format et la taille des fichiers retrouvés.

Côté administration, la prise en main de l'interface nécessite trois jours de formation. Celle-ci offre un certain nombre d'options. L'utilisateur pourra par exemple choisir de n'indexer que les adresses ou les URL des documents ou encore les Méta Données (bornes Meta, etc.).

Un solution qui cible tous les secteurs... ou presque
Parmi ses clients, Hummingbird affiche les services d'information du gouvernement français, de la Bibliothèque Nationale, ainsi que de la Commission Européenne - qui utilise le moteur pour gérer des documents dans les 12 langues de l'Union. Autres secteurs visés : ceux de la vente en ligne, de la banque et des cabinets de conseil juridique. Dans ces domaines, la société compte notamment parmi ses clients : Carrefour, qui utilise la solution pour sa boutique en ligne, le CCF et la BNP, ainsi qu'Accenture et PricewaterhouseCoopers. Bref des sociétés qui ont besoin de manipuler de grosses quantités de données documentaire. "Ce qui est également le cas pour l'ensemble de l'industrie, qui s'appuie sur des dessins techniques pour concevoir les produits", complète Marc David. Seul secteur hors cible : celui des services. Le prix de Search Server se situe entre 20 000 et quelques centaines de milliers de francs, selon le type de déploiement : Internet ou intranet.


JDN Solutions Envoyer Imprimer Haut de page

Sondage

Recourir à un service cloud comme unique solution de stockage de fichiers, vous y croyez ?

Tous les sondages