BOURSE

Journal du Net > Solutions > Xylème parie sur le "tout XML" pour automatiser les requêtes

Article

27/03/01

Xylème parie sur le "tout XML" pour automatiser les requêtes

Véritable incubateur d'innovation technologique, l'Inria (Institut national de recherche en informatique et en automatique) a donné naissance l'an dernier à une nouvelle start-up du nom de Xyleme. Rappelons que parmi les succès de l'organisme français, figure l'éditeur O2 Technology qui s'est positionné comme l'un des inventeurs des bases de données orientées objet. Fondée en septembre 2000, Xyleme emploie aujourd'hui 25 personnes dont 16 ingénieurs-chercheurs, en grande partie issus du groupe de travail Verso de l'Inria constitué au cours de l'été 1999.
"Notre idée consiste à combiner l'émergence du langage XML et sa forme semi-structurée avec une base de données", explique Patrick Ferrand, directeur commercial de Xyleme. "Nous sommes pour cela partis d'un constat simple. Dans l'entreprise, les bases de données sont une source d'informations très importante et relativement structurée, donc facile à réutiliser. En revanche, la seconde source qui est le web est difficilement accessible par le système d'information. Dans ce contexte, nous nous proposons d'offrir à l'entreprise une source d'informations structurées à partir d'Internet. Pour cela, il faut comprendre les données issues du web, et les consolider dans un entrepôt de données XML. Car sans ce langage, il n'est pas possible aujourd'hui de produire réellement une vue structurée."

XML bientôt dans toutes les architectures ?
En attendant, la suite de modules intégrés qui sera fournie par Xylème ne se limite pas à un unique entrepôt de données. Tout d'abord, un agent intelligent (appelé "crawler" en interne) sillonne le web à la recherche de tous les documents XML. A cette fin, il surfe à travers des pages HTML, mais seuls les fichiers au format XML seront stockés dans la base. A l'heure actuelle, ces documents sont encore relativement rares face à la très grande majorité de pages statiques HTML ou dynamiques réalisées à l'aide des langages de script comme PHP, ASP et JSP. "Nous formulons le pari que le taux de pénétration d'XML dans les sites augmentera dans les deux ou trois années à venir", affirme Patrick Ferran. "Dans les médias, des agences comme Reuters et l'AFP diffusent déjà la totalité de leurs informations au format XML. Les organismes de standardisation, dont celui responsable du XBRL dédié au reporting financier, sont aussi le signe de mouvements clairs vers XML. Ceci dit, il faudra tout de même attendre que la nouvelle génération de navigateurs supportant cette technologie soit suffisamment répandue."

Une infrastructure de 60 serveurs en constitution
Une fois rappatrié, le document doit être classé selon les rubriques définies par Xyleme. Au sein de sa propre infrastructure, qui devrait atteindre les 60 serveurs cette année, certains PC sont dédiés à des rubriques précises pour des raisons de performance. Puis, l'information est stockée de façon brute, et le programme de requête ne s'intéresse ensuite qu'aux balises et aux métadonnées. En lui-même, le fond ne permet pas de constituer de manière viable un entrepôt sémantique. La recherche à proprement parler s'effectue en XQL, un langage maison qui procède de façon similaire à SQL tout en étant adapté à l'entrepôt XML. Au final, la requête sera traitée par un autre module, et les résultats seront affichés toujours au même format. Le fichier généré pourra lui-même être ré-indexé, et les données qu'il contient seront aussi réutilisables immédiatement par une tierce application de l'entreprise.
Et ce n'est pas tout. Une autre possibilité est ainsi offerte par l'entrepôt natif XML développé par Xylème. D'après Patrick Ferran, "nous pouvons indexer de la même façon deux fichiers écrits selon deux spécifications différentes et nous procédons à leur intégration sémantique." En clair, la société pourrait aussi, en théorie, intervenir dans le domaine clef de la traduction des formats d'échanges b-to-b à la volée. Mais, "ce n'est pas notre objectif premier", précise-t-il.

Capital-IT : 10 à 11 millions d'Euros attendus !
Bref, Xyleme se positionne aujourd'hui plutôt comme un concurrent d'éditeurs tels que Inktomi, Autonomy, Documentum et Software AG. Et pourtant, la société ne compte pas vendre ses technologies, du moins dans un premier temps. D'autre part, elle ne vise pas la fabrication d'une énième solution de portail d'entreprise. Sa suite intégrée, hébergée en interne sous Linux, sera surtout vendue sous forme d'un service en ligne pour soumettre des requêtes et traiter l'information derrière. La date de lancement est prévue pour octobre-novembre 2001, après une bêta version en test auprès de 3-4 clients en juin. Au niveau facturation, un abonnement mensuel ou annuel est prévu, ainsi qu'un tarif par requête.
Ceci dit, "nous voulons d'abord tester le marché avant de valider les prix", indique Patrick Ferran. "Après, nous allons réfléchir à la possibilité de développer la couche applicative, soit en fonction de demandes précises de la part de nos clients, soit en générisant certaines parties probablement par secteur." En attendant, Xyleme compte lever la somme de 10 à 11 millions d'Euros lors du salon Capital-IT. Une somme qui lui permettra d'être rentable à partir de 2003, et qui viendra compléter les 3,5 millions d'Euros déjà obtenus en octobre auprès de SGAM et Viventures.
[François Morel, JDNet]

Rédaction JDN & JDN Solutions

JDN Solutions

Xylème parie sur le "tout XML" pour automatiser les requêtes

Newsletters

Toutes nos newsletters