Avec l'arrivée d'Internet,
la gestion des contenus rédactionnels de la presse
traditionnelle se complique. La création d'un site
d'actualité nécessite en effet un traitement
particulier des données, tant en termes de format
que de graphisme.
Courant 2000, le Progrès de Lyon se lance dans le développement
d'un canal d'information en ligne. D'emblée, le
quotidien régional entend se doter d'une solution
automatisant la génération d'une édition
Web à partir des fichiers Quark XPress destinés
à ses parutions papier.
Un
outil de gestion de contenu couplé à une
base XML
"Dans le même
temps, le but était également d'améliorer
notre méthode d'archivage en vue de disposer d'un
fond consultable en interne qui puisse ensuite être
publiable sur le Net", complète Aimé Munoz,
responsable informatique éditoriale du Progrès de Lyon.
Très vite,
le quotidien sélectionne la technologie de gestion
de contenu d'Eurocortex (Intelligent Content Manager -
ICM) : une plate-forme reposant sur un socle Microsoft
(COM, DCOM) adossé à la base SQL Server
du même éditeur.
Principales raisons de ce choix : les fonctions
d'agrégation offertes par ICM et sa capacité
à prendre en compte les systèmes de pré-presse,
tels que les logiciels de publication assistée
par ordinateur en particulier. Mais également ses
possibilités de transformation Web et d'administration
des données dans ce format.
En
vue de faciliter la prise en charge de ses archives par
cet outil, le journal décide dans la foulée
de refondre sa base rédactionnelle. Un entrepôt
de données qui s'adossait jusqu'alors à
la technologie mise au point par la société
canadienne CEDROM-SNi. "Baptisée TEXTML Server,
la base développée par Ixiasoft, une spin-off
de CEDROM-SNi, nous paraissait une bonne alternative.
Sans compter qu'Eurocortex était prêt à
réaliser le travail d'intégration nécessaire
à son déploiement", indique t-on sur
ce point au Progrès de Lyon.
Comptant parmi les quelques bases de données natives
XML du marché, aux côtés de Tamino
(Software AG) et d'Ipedo XML Database (Ipedo), ce produit
est livré avec divers modules complémentaires,
tel qu'un moteur de recherche plein texte par exemple.
De l'extraction
à la génération des pages Web
Mise production
il y a quelques semaines au Progrès de Lyon, la solution
d'Eurocortex couvre l'intégralité des
processus de gestion de contenu relatifs au site du
journal et à son système d'archivage.
Schématiquement, le cheminement en question débute
par l'extraction des textes rédactionnels des
documents Quark XPress
réalisés par les maquettistes et leur
transformation sous forme de fichiers XML et PDF (Portable
Document Format). Il se poursuit avec l'intégration
des premiers et le référencement des seconds
au sein de TEXTML Server.
"Ce cycle s'achève
par la génération des pages Web finales
à partir des données XML et la mise à
jour de l'arborescence du site, ainsi que le référencement
des fichiers PDF des numéros précédents
par la base d'Ixiasoft", termine Aimé Munoz.
Au total, l'ensemble de la
chaîne est donc presque entièrement automatisée.
L'équipe multimédia du quotidien intervenant simplement
pour affiner la granularité de la classification
des articles au sein du rubricage Web, et inclure éventuellement
des visuels (images, etc.).
Quelle pourrait être
la prochaine étape du projet ? "Il s'agira
principalement de publier en ligne l'ensemble des archives
du journal sous forme de service payant", confie
t-on au Progrès de Lyon.
|