27/03/01
Xylème
parie sur le "tout XML" pour automatiser les requêtes
Véritable
incubateur
d'innovation technologique, l'Inria
(Institut national de recherche en informatique et en automatique)
a donné naissance l'an dernier à une nouvelle
start-up du nom de Xyleme.
Rappelons que parmi les succès de l'organisme français,
figure l'éditeur O2 Technology qui s'est positionné
comme l'un des inventeurs des bases de données orientées
objet. Fondée en septembre 2000, Xyleme emploie aujourd'hui
25 personnes dont 16 ingénieurs-chercheurs,
en grande partie issus du groupe de travail Verso de l'Inria
constitué au cours de l'été 1999.
"Notre idée consiste à combiner l'émergence
du langage XML et sa forme semi-structurée avec une base
de données", explique Patrick Ferrand, directeur
commercial de Xyleme. "Nous sommes pour cela partis d'un
constat simple. Dans l'entreprise, les bases de données
sont une source d'informations très importante et relativement
structurée, donc facile à réutiliser. En
revanche, la seconde source qui est le web est difficilement
accessible par le système d'information. Dans ce contexte,
nous nous proposons d'offrir à l'entreprise une source
d'informations structurées à partir d'Internet.
Pour cela, il faut comprendre les données issues du web,
et les consolider dans un entrepôt de données XML.
Car sans ce langage, il n'est pas possible aujourd'hui de produire
réellement une vue structurée."
XML bientôt
dans toutes les architectures ?
En attendant, la suite de modules intégrés
qui sera fournie par Xylème ne se limite pas à
un unique entrepôt de données. Tout d'abord, un
agent intelligent (appelé "crawler" en interne)
sillonne le web à la recherche de tous les documents
XML. A cette fin, il surfe à travers des pages HTML,
mais seuls les fichiers au format XML seront stockés
dans la base. A l'heure actuelle, ces documents sont encore
relativement rares face à la très grande majorité
de pages statiques HTML ou dynamiques réalisées
à l'aide des langages de script comme PHP, ASP et JSP.
"Nous formulons le pari que le taux de pénétration
d'XML dans les sites augmentera dans les deux ou trois années
à venir", affirme Patrick Ferran. "Dans les
médias, des agences comme Reuters et l'AFP diffusent
déjà la totalité de leurs informations
au format XML. Les organismes de standardisation, dont celui
responsable du XBRL dédié au reporting financier,
sont aussi le signe de mouvements clairs vers XML. Ceci dit,
il faudra tout de même attendre que la nouvelle génération
de navigateurs supportant cette technologie soit suffisamment
répandue."
Une infrastructure
de 60 serveurs en constitution
Une fois rappatrié, le document doit être
classé selon les rubriques définies par Xyleme.
Au sein de sa propre infrastructure, qui devrait atteindre les
60 serveurs cette année, certains PC sont dédiés
à des rubriques précises pour des raisons de performance.
Puis, l'information est stockée de façon brute,
et le programme de requête ne s'intéresse ensuite
qu'aux balises et aux métadonnées. En lui-même,
le fond ne permet pas de constituer de manière viable
un entrepôt sémantique. La recherche à proprement
parler s'effectue en XQL, un langage maison qui procède
de façon similaire à SQL tout en étant
adapté à l'entrepôt XML. Au final, la requête
sera traitée par un autre module, et les résultats
seront affichés toujours au même format. Le fichier
généré pourra lui-même être
ré-indexé, et les données qu'il contient
seront aussi réutilisables immédiatement par une
tierce application de l'entreprise.
Et ce n'est pas tout. Une autre possibilité est ainsi
offerte par l'entrepôt natif XML développé
par Xylème. D'après Patrick Ferran, "nous
pouvons indexer de la même façon deux fichiers
écrits selon deux spécifications différentes
et nous procédons à leur intégration sémantique."
En clair, la société pourrait aussi, en théorie,
intervenir dans le domaine clef de la traduction des formats
d'échanges b-to-b à la volée. Mais, "ce
n'est pas notre objectif premier", précise-t-il.
Capital-IT :
10 à 11 millions d'Euros attendus !
Bref,
Xyleme se positionne aujourd'hui plutôt comme un concurrent
d'éditeurs tels que Inktomi, Autonomy, Documentum et
Software AG. Et pourtant, la société ne compte
pas vendre ses technologies, du moins dans un premier temps.
D'autre part, elle ne vise pas la fabrication d'une énième
solution de portail d'entreprise. Sa suite intégrée,
hébergée en interne sous Linux, sera surtout vendue
sous forme d'un service en ligne pour soumettre des requêtes
et traiter l'information derrière. La date de lancement
est prévue pour octobre-novembre 2001, après une
bêta version en test auprès de 3-4 clients
en juin. Au niveau facturation, un abonnement mensuel ou annuel
est prévu, ainsi qu'un tarif par requête.
Ceci dit, "nous voulons d'abord tester le marché
avant de valider les prix", indique Patrick Ferran. "Après,
nous allons réfléchir à la possibilité
de développer la couche applicative, soit en fonction
de demandes précises de la part de nos clients, soit
en générisant certaines parties probablement par
secteur." En attendant, Xyleme compte lever la somme de
10 à 11 millions d'Euros lors du salon Capital-IT.
Une somme qui lui permettra d'être rentable à partir
de 2003, et qui viendra compléter les 3,5 millions
d'Euros déjà obtenus en octobre auprès
de SGAM et Viventures.
[François
Morel, JDNet]
|