Intranet/Extranet
Panorama des outils de recherche (3)
 (Jeudi 2 octobre 2003)
     
En savoir plus
Retour à l'introduction

Les moteurs de recherche statistiques répondent à une requête en fonction de la fréquence d'apparition des concepts demandés et de leur répétition au sein de chaque document. Leur principale force : l'autonomie.
Les moteurs de recherche multi-dimensionnels sont les produits les plus avancés. Leur technique s'inspire de celle des systèmes d'analyse décisionnels. Objectif : affiner la catégorisation des documents, ainsi que les procédés de requêtes croisées.
Les assistants de requêtes apportent une première réponse à la problématique des requêtes en langage naturel. Reposant sur des fonctions d'analyse linguistique, elles interprètent la requête dans des langages propres aux outils de recherche (booléen, etc.).
Les moteurs Open Source, enfin, complètent le panorama.

Les moteurs statistiques
Autonomy
KnowledgeServer
Ciblant le domaine de la gestion des connaissances, ce moteur utilise aussi des algorithmes probalistiques indépendants des langues - s'appuyant notamment sur les théories de l'inférence bayésienne et de l'information (Shannon).
Exalead
Exalead
Cette technologie de recherche fait appel à des algorithmes linguistiques, et des méthodes de lemmatisation statistiques - qui permettent d'identifier toutes les déclinaisons d'un même terme. Exalead est basé sur un référentiel de données natif XML.
TripleHop
MatchPoint
MatchPoint génère des réseaux de concepts par le biais de fonctions statistiques. Il couple ce système de listes avec des fonctions vectorielles afin de répondre à des requêtes multicritères.
Les moteurs multi-dimensionnels
Instranet
Instranet
Plate-forme de gestion de contenu marketing, Instranet cumule un moteur multidimensionnel, qui permet de manipuler les informations sur plusieurs axes sémantiques, et un moteur de recherche plein texte (Oracle).
Les assistants de requêtes
Albert
Albert
Meaning Interpreter
(AMI)
S'adaptant à divers outils (Verity, Fast, etc.), AMI analyse la demande de l'utilisateur afin de constituer une requête qui soit compréhensible par les système d'indexation. Pour ce faire, il s'appuie sur une base de connaissances personnalisée qui s'auto alimente au fil des réponses renvoyées.
SPSS
LexiQuest
Racheté par SPSS en février 2002 (voir l'article), LexiQuest vient compléter les solutions existantes. Objectif : enrichir le travail de base des moteurs avec des fonctions d'analyses grammaticales et syntaxiques (anglais et français), des réseaux sémantiques, et un traducteur booléen.
Les moteurs Open Source
Jakarta Lucene Moteur de recherche plein texte écrit en Java, Jakarta Lucene prend en compte les requêtes booléennes. Il supporte en outre les principales langues européennes.
Java Search Engine Module d'indexation en Java couvrant à la fois les contenus structurés (en provenance de bases de données) et non-structurés (documents HTML et PDF).
ht://Dig Application intégrant des fonctions de recherche booléennes. Mais également un système d'alertes par mail conçu pour assurer le suivi des indexations relatives à un domaine donné.
ASPseek Outil écrit en C++ comprenant le langage booléen. Il intègre en outre un mécanisme de classement des résultats.
mnoGoSearch Tournant sous Unix, mnoGoSearch combine des fonctions d'indexation plein texte avec des interfaces (FTP) pour de nombreux formats de fichiers (audio, etc.).

Retour à l'introduction

[Antoine Crochet-Damais, JDNet]
 
Accueil | Haut de page
 
 

  Nouvelles offres d'emploi   sur Emploi Center
Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Toutes nos newsletters