|
Créé il y
an deux ans pour deux anciens chercheurs de l'INRIA
(Institut National de la Recherche en Informatique et
automatique), LTU
Technologies est un éditeur français
qui a développé une offre logicielle plurielle
autour de la gestion de contenu visuel (Visual Asset
Management). Les différentes applications de
LTU (filtrage de mail, indexation de BDD iconographique,
recherche d'images, etc.) reposent toutes sur une technologie
centrale : ce que l'éditeur appelle "l'analyse
sémantique de l'ADN" des images. Une technique
dont se servent déjà iBazar, l'INPI ou
M6 Web, qui est à l'image ce que Google est au
texte, avec quelques possibilités supplémentaires
d'indexation automatisée notamment.
Cinq
applications bâties sur un noyau commun
Aujourd'hui LTU Technlogies a mis au point
cinq logiciels : Image Filter 4.1 (pour le filtrage
des contenus litigieux), Image Indexer 1.0 (pour indexer
et classifier le contenus numériques), Image
Seeker 3.1 (pour la recherche de documents dans des
BDD), Image Shopper 2.2 (qui permet de faire des recherches
dans des catalogues de sites commerciaux) et Image Watcher
1.0 ( pour le scan d'images sur le Web).
Il
s'agit de la déclinaison d'une technologie propriétaire
et brevetée, dont Alexandre Winter, le directeur
technique nous explique le principe.
Un travail d'analyse en deux
temps
"Notre moteur
procède en deux étapes, l'une au niveau
de couches basses, l'autre à celui de couches
plus hautes où se situe notre valeur ajoutée
réelle." Il s'agit dans un premier temps
de segmenter et de traduire
l'image numérique, conçue en tant que
matrice de pixels, en une représentation de zones
différenciées (grosso modo les contours
d'une silhouette, d'un arrière-plan, etc.), tout
comme le fait l'oeil", explique Alexandre Winter.
Une fois cette opération effectuée, le
moteur d'analyse de LTU procède à une
extraction de "l'ADN de l'image", c'est-à-dire
à une prise d'empreinte de celle-ci. Pour ce
faire, les différents paramètres d'une
image donnée (voiture, guitare, etc.) sont analysés
et concaténés puis représentés
sous la forme d'un vecteur qui en figure les éléments
invariants.
Reconnaissance absolue et reconnaissance
relative
"Actuellement,
nous avons constitué un référentiel
de connaissance de plus de 400 ADN, qui est régulièrement
enrichie par nos équipes de R&D", explique
Chahab Nastar, le p-dg et fondateur de la société.
Cette base de données peut-être utilisée
comme base interne de référence qui reconnaît
ou non un objet (reconnaissance absolue) ou agir en
interaction avec une autre base de données, externe,
permettant de réaliser une analyse relative de
contenu." On peut par exemple lancer une recherche
par mot-clef - qu'il s'agisse d'objets très précis,
comme neige, ou de concepts plus généraux
, comme intérieur/extérieur, qui ont été
indexés.
Mais on peut également lancer la recherche via
une simple image sur laquelle on clique, comme dans
un moteur de recherche textuel, avec Image Seeker",
précise le p-dg. Image Indexer 1.0 permet en
outre de réaliser une indexation automatique
d'une base d'images, qui vont être reconnues par
similitude par le logiciel, qui va alors leur attribuer
un mot-clef. Toutes les indexations ne sont cependant
pas automatisables, ainsi que le reconnaît le
directeur technique : "Pour reconnaître le
visage d'une personne nominative parmi d'autre, il faudra
indexer manuellement l'image - photo ou vidéo.
En revanche, pour des objets plus simples, Indexer peut
soulager le travail des iconographes et documentalistes
des tâches les plus répétitives."
Une base de données
tierce
Côté
architecture, le logiciel de LTU Technologies est installé
sur un serveur d'application dédié, et
crée un miroir de la bibliothèque iconographique
de l'entreprise. Ce dernier ne conserve que les ADN
des images, qui sont hébérgées
sur le serveur LTU dans une base de données séparée
de celle de l'entreprise. Lorsqu'un utilisateur lance
une demande depuis son poste de travail, celle-ci est
transmise sous forme de flux HTTP au serveur LTU, qui
va chercher les ADN correspondant à la requête
et leur attribue un identifiant unique. Cet identifiant
est ensuite encapsulé en XML et renvoyé
à l'utilisateur.
En terme de positionement, LTU Technologies se reconnaît
deux rivaux indirects : Clearswift,
l'éditeur de Pornsweeper, un logiciel de filtrage
d'images, et Convera,
acteur de la gestion documentaire également présent
dans le domaine de la gestion vidéo avec son
logiciel RetrievalWare. "Nous sommes cependant
les seuls à couvrir le spectre complet des différentes
applications de l'analyse visuelle", précise
le p-dg de la société.
|