INFRASTRUCTURE 
Sommaire Infrastructure
Jean-François Marcotorchino (Thales Communications) : "Nous souhaitons donner des armes technologiques à ceux qui veulent innover"
Le Directeur Scientifique de Thales Communications nous détaille le projet InfoMagic, nouveau moteur de recherche multimédia. Ce dernier a reçu le soutien du pôle de compétitivité IMVN.  (22/12/2005)
  En savoir plus
Dossier Moteurs de Recherche
JDN Solutions. Pourquoi le pôle de compétitivité Image, Multimédia et Vie Numérique soutient InfoMagic ?
Jean-François Marcotorchino.
Ce pôle de compétitivité couvre bon nombre d'applications multimédia : de la production audiovisuelle jusqu'à l'analyse d'information. Ceci constitue l'ingénierie des connaissances. Chez Thales, nous travaillons sur les Nouvelles Technologies d'Analyse de l'Information (NTAI) comme le text mining, le data mining, l'image mining, la fusion et l'extraction de données. Ces technologies sont l'avenir car la quantité d'information numérique évolue constament dans le monde chaque année.

Notre projet InfoMagic est soutenu par l'IMVN pour son domaine d'activité stratégique d'ingénierie des connaissances. Ainsi, le champ d'application est large et peut couvrir la gestion des patrimoines numériques, les enjeux marketing, la recherche et la business intelligence. Ces relations fortes avec les autres domaines ouvrent la voie à plein de projets comme l'analyse et la recherche sur des terminaux mobiles par exemple.

Ce projet a une réelle résonance politico-médiatique. Il associe beaucoup d'acteurs privés (EADS, Safran, Temis...) et publics (CEA, INA, laboratoires de recherche d'universités d'Ile de France...). Ce pôle est aussi un projet technologique dans le domaine de l'analyse de l'information. Nous voulons que des entreprises - nouvelles ou non - réussissent à faire des percées comme Google.


Qu'apporte cette nouvelle plate-forme de recherche, d'extraction, de fusion et d'analyse de données multi-types et multimédia ?
Tout le monde parle de la collecte d'information. Or, les moteurs existants et leurs utilisateurs ont pris l'habitude de travailler avec des mots clés ou des caractères. Cette approche est trop simpliste car la recherche par mots clés (full text) oublie le concept. Nous souhaitons intégrer la sémantique en plus des chaînes de caractères dans le moteur.

Dès lors, l'extraction d'information va s'enrichir : nous allons rechercher dans le texte des phrases qui caractérisent l'évènement. Cette pertinence de recherche doit aussi savoir évaluer un texte lu. C'est pourquoi ce moteur multimédia doit être capable d'analyser des flux de paroles, relatant l'information par exemple. Ceci est possible via le travail sur les fichiers vocaux (push to text), afin de transcoder l'information numérique textuellement. Les images seront traitées identiquement avec une gestion des scripts, associant un texte à un fichier graphique.

"Pour tous ces challenges technologiques, la France est bien placée"

Dans notre stratégie, nous voulons rendre possible l'extraction d'informations comme de nouvelles (AFP, Reuters...) afin de les coupler avec des d'autres données opérationnelles de terrain et un SGBD comme un Intranet. Cette réunion intelligente permet de corroborer les informations sur un évènement précis. Pour tous ces challenges technologiques, la France est bien placée.

Nous avons donc voulu croiser l'information multi-source. Toutes ces analyses doivent converger, pour mélanger des sources externes provenant d'Internet avec des bases de données externes (un datamark par exemple). Ainsi, les possibilités fonctionnelles offertes qui en découleraient sont immenses. La navigation dans les patrimoines numérisés peut profiter à tous les secteurs, qu'il s'agisse de la formation, de la finance, la défense et la sécurité. Cette approche de croisement des données existe déjà aux Etats-Unis.


Ce projet a-t-il vocation à concurrencer Google ou Yahoo ?
Non, bien que ces derniers aient enrichi leur moteur avec des capacités multimédia cet été. Notre approche est différente : nous souhaitons donner des armes technologiques à ceux qui veulent innover. Nous sommes en amont du projet technologique car nous aidons à développer des technologies s'intégrant avec des moteurs existants et d'autres, afin que des compagnies puissent proposer un outil supérieur.

Les stratégies de consultation des grands moteurs américains sont quantitatives, comme le pagerank de Google, qui classe les URL les plus consultées précédemment. Nous pouvons travailler sur l'aspect qualitatif, afin que l'internaute puisse avoir accès à des articles fondamentaux - même anciens - et non plus que les récents, car le contenu ne répond pas toujours à la demande. Dans le domaine commercial, le degré de pertinence est fondamental. C'est pourquoi ce projet - dont le développement démarrera dès janvier 2006 - privilégie la classification et les critères de recherche.
 
 
Christophe COMMEAU, JDN Solutions Sommaire Infrastructure
 
 
Accueil | Haut de page
 
 

  Nouvelles offres d'emploi   sur Emploi Center
Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Toutes nos newsletters