Moteurs de recherche: le tableau des solutions
Par le JDNet Solutions (Benchmark Group)
URL : http://www.journaldunet.com/solutions/0108/010829_panoramamoteur.shtml
Mercredi 29 août 2001

(MIS A JOUR LE 26/11/2001)

Elaboré à partir du Livre Blanc de l'agence Web FRA sur les applications de gestion de la connaissance (KM), ce panorama classe les solutions de recherche dans cinq catégories. Notez qu'il a été actualisé suite aux différents entretiens que nous avons menés afin de réaliser notre dossier sur le sujet. Ces modifications sont de notre fait et n'ont pas été revues par FRA. Au fur et à mesure de l'évolution des offres, nous poursuivrons la mise à jour de ce tableau.

Les cinq catégories :

- Les moteurs de recherche sémantiques (généralistes et Web)
Les moteurs dits sémantiques tentent d'intégrer le sens du langage au processus de recherche. A cette fin, ils s'appuient sur des dictionnaires, voire des thésaurus spécialisés pour le traitement de thématiques particulières.

- Les moteurs de recherche statistiques
En s'appuyant sur des méthodes statistiques, ce type de moteur répond à une requête en fonction de la fréquence d'apparition des concepts demandés et de leur répétition au sein de chaque document.

- Les moteurs de recherche multi-dimensionnels
Il s'agit sans doute des produits les plus avancés. Leur technique s'inspire de celle des systèmes d'analyse décisionnels. Objectif : affiner la catégorisation des
documents, ainsi que les procédés de requêtes croisées.

- Les assistants de requêtes
Ces applications apportent une première réponse à la problématique des requêtes en langage naturel. Reposant sur des fonctions d'analyse linguistique, elles interprètent la requête dans des langages propres aux outils de recherche.

- Les moteurs de recherche intégrés
Nous avons classé sous cette appellation les moteurs de recherche livrés au sein d'une solution de gestion de contenu Web ou documentaire.

Les moteurs sémantiques généralistes
Hummingbird
EIP
Capable d'effectuer des recherches internes ou externes en intégrant des fonctions d'analyse linguistique, le moteur EIP, issu du rachat de l'éditeur Fulcrum, indexe données structurées et non-structurées.
Verity
Portal One ou K2 Enterprise
Prenant en charge plus de 225 formats de documents, il s'agit d'un moteur de recherche plein texte offrant nombre d'opérateurs (booléens, de proximité, etc.) et de fonctions sémantiques (synonymie, termes connexes, etc.).
Arisem
OpenPortal4U
Moteur sémantique multilingues, OpenPortal repose sa logique sur un référentiel de concepts. Intégrant des fonctions de personnalisation du processus de recherche, il explore les liens hypertextes associés à une source Web.
Sinequa
Intuition
Intuition repose notamment sur un moteur d'analyse morpho-syntaxique. Fort de fonctions d'analyse sémantique en français, allemand et espagnol, il est capable de contextualiser les termes d'une requête en langage naturel .
Convera
RetrievalWare
Ce moteur multilingues fournit des fonctions de recherche floue reposant sur l'analyse de la valeur binaire des séquences de lettres. Prenant en compte les formats image, il peut être enrichi de thésaurus, et offre la possibilité de restreindre une requête à certains domaines.
Inktomi
Inktomi Search
Prenant en charge 35 langues, Inktomi propose également un analyseur de requêtes en langage naturel. Incluant des thésaurus personnalisables, ce moteur de recherche plein texte gère les termes connexes.
Les moteurs sémantiques Web
Atomz
Atomz

Disponible en mode hébergé, ce moteur de recherche plein texte est particulièrement adapté à une problématique de site Web et à de fortes montées en charge. Intégrant des fonctions sémantiques, il est capable d'indexer jusqu'aux documents au format Flash.
Les moteurs de recherche statistiques
TripleHop
MatchPoint
Nouveau venu sur le segment des moteurs statistiques, MatchPoint génère des réseaux de concepts par le biais de fonctions statistiques. Il couple ce système de listes avec des fonctions vectorielles afin de répondre à des requêtes multicritères.
Autonomy
KnowledgeServer
Ciblant les domaines du Knowledge Management, du commerce électronique et du newsmedia, ce moteur utilise aussi des algorithmes probalistiques indépendants des langues -s'appuyant notamment sur les théories de l'inférence bayésienne et de l'information (Shannon).
Les moteurs de recherche multi-dimensionnels
Instranet
Instranet 2000
Plate-forme de gestion de contenu Web, Instranet 2000 cumule un moteur multidimensionnel, qui permet de manipuler les informations sur plusieurs axes sémantiques, et un moteur de recherche plein texte (Oracle).
Les assistants de requêtes
LexiQuest
LexiQuest
LexiQuest a choisi de venir compléter les solutions existantes. Objectif : enrichir le travail de base des moteurs avec des fonctions d'analyses grammaticales et syntaxiques (anglais et français), des réseaux sémantiques, et un traducteur booléen.
Albert
Albert
Meaning Interpreter(AMI)
S'adaptant à divers outils (Verity, Fast, etc.), AMI analyse la demande de l'utilisateur afin de constituer une requête qui soit compréhensible par les système d'indexation. Pour ce faire, il s'appuie sur une base de connaissances personnalisée qui s'auto alimente au fil des réponses renvoyées.
Alogic
Alcalimm
Grâce à son assistant visuel, Alogic permet d'affiner une demande. Couplant thésaurus et indexation plein texte, ce moteur repère dans ses bases les mots contenus dans les requêtes, ainsi que les expressions débutant par l'un de ces mots. L'utilisateur validant ensuite les concepts qui l'intéressent.
Auracom
Auraweb
Traitant données structurées et non-structurées, Auraweb offre de nombreuses fonctions d'assistance à la recherche: calcul du nombre de réponses disponibles, liste de des expressions de l'index contenant un ou plusieurs mots clés demandés, etc.
Les moteurs de recherche intégrés
Mediapps
Net.Portal
Solution de portails généraliste, Net.Portal intègre son propre moteur. Offrant un mode de recherche plein texte s'appuyant sur des fonctions sémantiques et multiligues, il permet de poser des questions en langage naturel.
Opentext
Livelink
Offre de portails d'informations, Livelink propose également sont propre moteur, incluant un mode de requête en langage naturel. Au programme : recherche par concepts sur le texte intégral ou sur les métadonnées, et opérateurs de comparaison.
Microsoft
Sharepoint Portal Server
S'appuyant sur Microsoft Index Server, ce moteur assure une indexation plein texte des documents contenus sur des serveurs Web, des arborescences de fichiers et des bases Notes. Des algorithmes de classement et des filtres de recherche permettant d'affiner les requêtes.
Reef
Real Knowledge
Le module de recherche de cette solution de gestion documentaire s'articule autour du moteur de Microsoft SQL Server, ou de celui de Verity, et le complète d'une couche d'algorithmes : une requête sera par exemple traitée en fonction de l'audience des documents.


A lire aussi sur ce sujet:
>> Le dossier: gestion de contenus Web, attention terrain mouvant !
>> Le Questions-Réponses consacré aux moteurs de recherche

[Antoine Crochet Damais, JDNet]


Pour tout problème de consultation, écrivez au Webmaster
Copyrights et reproductions . Données personnelles
Copyright 2006 Benchmark Group - 69-71 avenue Pierre Grenier
92517 Boulogne Billancourt Cedex, FRANCE