Gestion de fichiers et gestion de contenus : la convergence, par Patrice Bertrand (Smile)

BOURSE

TRIBUNE

PAR PATRICE BERTRAND (Smile-Motoristes Internet)

	Gestion de fichiers et gestion de contenus : la convergence *La gestion de fichiers et de répertoires n'a pas beaucoup évolué depuis 30 ans, alors que la gestion de contenus a connu une évolution très rapide. Or, les fichiers sont des contenus...* (13/04/2005)

Directeur des Opérations, Smile - Motoristes Internet

Le site

Smile

La gestion de fichiers et de répertoires n'a pas beaucoup évolué depuis 30 ans. En informatique, c'est beaucoup. De son coté, poussée par la croissance exponentielle du Web, la gestion de contenus a connu une évolution très rapide. Or, les fichiers sont des contenus... Les mêmes problèmes amèneraient-ils les mêmes solutions ? 2005 est l'année de la convergence.

L'un des objectifs de la gestion de contenu est tout simplement d'y voir clair dans l'organisation d'un nombre toujours plus grand d'informations, d'y mettre de la logique, afin de savoir retrouver une information, un contenu, de manière rapide et sûre.

Sur nos ordinateurs personnels et nos serveurs, nous avons un problème semblable : retrouver un fichier au milieu de milliers, de dizaines de milliers d'autres fichiers.

Depuis les années 70 et jusqu'à aujourd'hui, la solution privilégiée est la même : une organisation hiérarchique en répertoires, en arborescence. Bientôt, les nouveaux systèmes d'exploitation vont balayer 30 années de gestion arborescente des contenus fichiers.

Chez Microsoft, c'est WinFS (Windows Future Storage), qui viendra avec la version Longhorn de Windows -mais sera aussi disponible sous XP- , et chez Apple, la technologie s'appelle Spotlight, attendu avec la version Tiger de Mac OS X. D'un côté comme de l'autre, le principe est le même : mettre en place progressivement une gestion du rangement et de la recherche par métadonnées, on pourrait dire par "contenus qualifiés", c'est à dire associant à chaque fichier toutes les informations qui permettront de le ranger et de le retrouver.

Revenons à cette notion. Les métadonnées sont des informations qui décrivent les données, qui qualifient les contenus. En consultant les "propriétés" d'une photo Jpeg téléchargée depuis un appareil numérique, on aperçoit de nombreuses informations attachées à l'image : modèle de l'appareil, dimensions, date de prise de vue, flash, … ce sont des métadonnées.


"Nos documents bureautique ont en général peu de métadonnées, et c'est regrettable"

Nos documents bureautique ont en général peu de métadonnées, et c'est regrettable. C'est finalement en rangeant un document dans un répertoire que je le décris : je définis sans le dire des méta-données, mais hors du fichier lui-même. J'ai fini de taper mon document, je le range dans //Airbus/ProjetERP/Contrats/2005/, c'est ma manière de dire que ce document est un contrat, que je l'ai rédigé en 2005, et qu'il concerne mon client Airbus.

Mais ces informations complémentaires qui caractérisent mon document, ces métadonnées, ne lui sont pas attachées. Si je déplace le document dans le répertoire /Devis/ rien n'indiquera plus qu'il s'agissait d'un contrat. Cette description implicite des fichiers, des contenus, est donc fragile. Mais ce n'est pas tout. Si je dois envoyer le document à un collègue, en pièce jointe d'un e-mail par exemple, je dois lui fournir toutes ces informations séparément : c'est un contrat, il est de 2005, etc. afin que rien ne soit perdu, et qu'il le range lui-même dans le bon répertoire.

La conclusion est claire : toutes les informations qui caractérisent un document, toutes les métadonnées, doivent lui être attachées. Ce n'est pas le cas aujourd'hui.


"Lorsque les fichiers seront pleinement décrits, qualifiés, on pourra définir des répertoires logiques"

Lorsque les fichiers seront pleinement décrits, qualifiés, on pourra définir des répertoires logiques, ou "virtuels", qui réunissent des fichiers en un même ensemble non pas parce qu'ils y ont été placés, mais parce qu'ils possèdent les propriétés attendues. C'est ce que nous apporteront Longhorn et Tiger.

On pourra définir ainsi un répertoire réunissant tous les fichiers tels que {client=Airbus, Année=2005, TypeDoc=Contrat, Etat=Applicable }, qui contient donc les contrats de 2005 avec Airbus qui sont applicables. Lorsqu'un contrat n'est plus applicable, l'attribut correspondant est modifié, et il sort automatiquement du répertoire.

Le répertoire "virtuel" est défini par des règles (rule-based) : l'appartenance au répertoire n'est pas définie a priori, elle résulte des règles qui définissent le répertoire. On pourra utiliser aussi des règles relatives, par exemple "modifié dans les 12 derniers mois".

En d'autres termes, c'est aujourd'hui le répertoire qui définit le fichier, ce sera demain le fichier qui définit le répertoire.

Les répertoires virtuels apporteront sécurité, cohérence et flexibilité dans la gestion de fichiers de nos systèmes d'exploitation. Or ces solutions sont issues de la gestion de contenu, qui elle même englobe de plus en plus la gestion documentaire.

En gestion de contenu aussi, la clé est dans la qualification des contenus, effaçant même souvent la frontière entre données et métadonnées : les contenus sont structurés de la manière la plus précise possible, et cette structure inclut données et métadonnées.

Comme on l'a vu pour les répertoires, qualifier implicitement des contenus simplement en les rangeant dans telle ou telle rubrique n'est pas la meilleure approche. Pour une gestion de contenus haut de gamme, "orientée entreprise", il convient d'inverser la dépendance : ce n'est pas parce qu'il est rangé dans la rubrique "procédures RH" que l'on sait qu'il s'agit d'une procédure applicable aux RH, mais au contraire, c'est parce qu'il porte en lui l'indication {domaine=RH, typeDoc=procédure}, dans ses métadonnées, qu'il doit donc être publié dans cette rubrique.

L'organisation n'est pas la seule bonne idée apportée par la gestion de contenus à la gestion de fichiers. Le future storage de Microsoft ne gèrera plus seulement, comme aujourd'hui, des fichiers en tant que suite d'octets inintelligibles, auxquels seule une application (Word, iTunes…) pourrait trouver un sens. WinFS apportera également la gestion de contenus structurés, comme le font les CMS d'aujourd'hui, c'est à dire la capacité à définir des types de contenus spécifiques.

Comme on l'a vu plus haut, cela recouvre la gestion des métadonnées comme composantes de ces contenus structurés. En somme, on ne gère plus des fichiers, on gère bien des contenus.

Systèmes d'exploitation et outils de gestion de contenus faisaient face à des problèmes très proches : maîtriser l'information dans un contexte de grande volumétrie, et ont trouvé les mêmes solutions : contenus structurés, métadonnées et répertoires virtuels. Longhorn et Tiger sont pour bientôt, mais les meilleurs outils de gestion de contenu, au premier rang desquels figurent ceux issus de l'Open Source, ont déjà ouvert la voie.

Patrice Bertrand

Accueil | Haut de page

Nouvelles offres d'emploi sur Emploi Center

Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY