Relation-Client
La catégorisation automatique selon Altavista
Dans sa version 2.0, Altavista Enterprise Search optimise notamment la gestion des droits d'accès au contenu. (Lundi 4 mars 2002)
     
A lire aussi :
 Google met sa technologie de recherche à la portée des intranets

Le célèbre moteur de recherche Web Altavista vient tout juste de dévoiler la version 2.0 de son outil de catégorisation. Ciblant les projets d'intranets documentaires, ce produit (baptisé Altavista Enterprise
Search) se présente sous la forme d'une solution 100% logicielle couplant un module d'indexation à un moteur de classement. Un positionnement produit qui se différencie radicalement de celui de Google sur le terrain des solutions de recherche professionnelle. Rappelons que ce dernier commercialise depuis peu une application de recherche et d'indexation, elle même embarquée dans un serveur matériel équipé d'un système de stockage de contenu.

Un système de catégorisation en mode indexé
Altavista Enterprise Search dispose d'un assistant d'élaboration de plans de classement. Après avoir été définis par l'entreprise en fonction de ses thématiques de spécialisation, les différents éléments de cette taxonomie sont utilisés ensuite par le système d'analyse sous-jacent pour générer automatiquement un mode de catégorisation des contenus -ici ce sont les noms des catégories qui seront utilisés (à la manière de requêtes de recherche) en vue d'effectuer les tris. Pour assurer ce traitement, les contenus sont préalablement filtrés par un module d'indexation intégrant des mécanismes de traitement linguistique. Capable de prendre en charge une trentaine de langues différentes, ce module supporte près de 230 formats de fichiers (HTML, PDF, etc.), sans compter les données structurées -au sein d'une base données relationnelles. Quant à la reprise de contenu distant, elle est assurée par un agent de collecte visant aussi bien les serveur Web que les systèmes de fichiers.

Une gestion des droits d'accès améliorée
Tournant notamment sous Windows, Linux et Unix (dont Solaris), Altavista Enterprise Search est livré avec un kit de développement conçu pour faciliter la mise en oeuvre de fonctions supplémentaires. Pour assurer son intégration à divers systèmes de gestion de contenu tiers, celui-ci s'accompagne d'une bibliothèque d'interfaces de programmation d'applications (API) couvrant divers langages de programmation (C, Java, COM, et Perl). Au final, les fonctions de recherche et de catégorisation sont affichées au sein de pages Web par le biais du langage de scripts ASP (Active Server Page) ou JSP (Java Server Page).

Au chapitre des nouveautés de sa version 2.0, la solution d'Altavista ne limite plus la gestion des droits d'accès au système d'indexation et de catégorisation, mais permet désormais de définir une politique d'autorisation relative aux documents en tant que tels. Une fonction qui s'appuie notamment sur les annuaires de gestion de profils existants et autres applications de sécurité d'entreprise.

A lire aussi :
 Google met sa technologie de recherche à la portée des intranets
[Antoine Crochet Damais, JDNet]
 
Accueil | Haut de page
 
 

  Nouvelles offres d'emploi   sur Emploi Center
Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Toutes nos newsletters