|
Expériences
/ Intranet |
Mercredi
3 avril 2002
|
Comment
l'INIST articule son portail documentaire autour de LexiQuest
Mine Au service des agences du CNRS, l'Institut de l'Information Scientifique et Technique recherchait un assistant de requêtes capable de guider les utilisateurs de son portail dans leurs recherches documentaires. -->
|
|
Créer
un accès mutualisé à l'ensemble de
son fond documentaire, qui soit également personnalisable
en fonction des centres d'intérêts des visiteurs.
Telle est la philosophie du projet de portail lancé
fin 1999 par l'Institut
de l'Information Scientifique et Technique (INIST).
Ciblant les chercheurs du monde académique et privé
(le CNRS
notamment), ce site devait plus précisément permettre
à ses utilisateurs de créer plusieurs dossiers
sur mesure pour classer les articles et autres documents
scientifiques nécessaires à leurs travaux.
Autre objectif : bénéficier d'un chassis
applicatif suffisamment souple pour accueillir des services
tiers -bases de données, moteurs de recherche disponibles
sur le Web, etc. "Et ceci dans le but de pouvoir
réutiliser notre solution par la suite", complète
Laurent Schmitt, chef de projet informatique à
l'INIST.
Un socle applicatif
basé sur le moteur de Verity
D'ores et déjà déployés
par l'institut dans le cadre de projets plus anciens,
la base de données Oracle et le moteur de recherche
de Verity (Topic) s'imposent d'eux-mêmes
comme
socle de la nouvelle application. "Des briques qui
prennent respectivement en charge les données utilisateur
de l'application (profil, etc.) et la gestions des accès
à nos principaux fonds documentaires", commente
le responsable du projet. Côté interfaçage
client, le choix se porte sur le langage de script PHP :
une technologie qui assure la génération
à la volée des pages Web à partir
d'éléments de contenu stockés au
sein de la base de données.
Pourquoi une telle option ? Traduit pour commencer
en français et en anglais, le site a pour vocation
d'intégrer par la suite de nouvelles langues. Or,
une méthode de gestion dynamique de la présentation
semblait la mieux adaptée à la gestion d'un
site multi-lingue. "Sans compter qu'un prototype
devait être présenté quelques mois
après, insiste t-on à l'INIST. Pour l'équipe
technique de l'institut, il est par conséquent
nécessaire d'opter pour une logique applicative
qui soit à la fois rapide à développer
et aisée à corriger.
Un assistant
de requêtes pour aider les chercheurs
Baptisé ConnectSciences,
le portail de l'INIST qui est en ligne depuis septembre
2001 donne accès aux nouveautés des deux
principales bases documentaires de l'institut, soit les
trois derniers mois de Pascal (sciences médicales
et techniques) et la dernière année de production
de Francis (sciences humaines et économiques).
Principale problématique sous-jacente : fournir
un service permettant aux visiteurs de retrouver un ou
plusieurs documents dont il ne connaîtrait pas forcément
le vocabulaire ni les mots clefs utilisés d'indexation.
D'où le besoin d'adjoindre au moteur de recherche
Verity un assistant de requête. "Sans compter
sa capacité à s'adapter à Topic,
LexiQuest Mine nous a paru suffisamment stable et robuste
pour prendre en charge l'ensemble de notre base terminologique,
soit 1 Giga de données", souligne notamment
Laurent Schmitt pour justifier le choix de la solution
de Lexiquest.
Une base de
données terminologique
Un dictionnaire général
associé à sept autres... couvrant l'ensemble
des thématiques traités par les fonds documentaires
Pascal et Francis, le tout traduit dans deux langues.
Le référentiel de concepts mis au point
par l'INIST pour servir de socle à ce thésaurus
représente au total seize bases terminologiques.
Le système de cartes de Lexiquest Mine assurant
la liaison entre ces concepts afin d'engendrer le jeu
des propositions. Au final, l'outil de Lexiquest permet
aux utilisateurs de ConnectSciences d'afficher, à partir
de l'entrée d'un ou plusieurs mots-clés, une liste de
concepts s'y rapportant -et ainsi d'affiner leur demande.
Une fois la requête validée, il la traduit
dans le langage de Topic qui se charge à son tour
d'interroger les différents éléments
d'indexations (mots clef, auteurs, titres, résumés,
etc.) définie pour les différentes bases.
Une intégration
qui demande un mois
Lors
de la phase de déploiement, qui s'étend sur une période
d'un mois, l'INIST demande à Lexiquest d'intervenir sur
deux aspects principaux : l'optimisation des performances
d'exécution des bases terminologiques d'une part, et la
personnalisation de l'interface utilisateur en termes
graphique et fonctionnel d'autre part. "Lexiquest Mine
ne gère pas le XML en natif, ce qui nous a obligé
à reformater et donc dupliquer certaines données terminologiques",
regrette Laurent Schmitt. Hormis ces "quelques adaptations
de détails", la mise en oeuvre du produit est présentée
comme largement concluante. Quant au bilan du projet :
"il est positif. ConnectSciences enregistre 1000 nouveaux
abonnés par mois et plusieurs centaines de visites
par jour", conclut le porte-parole.
|
[Antoine Crochet Damais, JDNet]
|
|
|
|
|