Lancement de Vitalas, un moteur de recherche de nouvelle génération

646

En juin 2009, le moteur de recherche européen Vitalas a fait ses débuts sur le site grand public de l’Institut national de l’audiovisuel (INA).

Avec le développement spectaculaire de la vidéo sur Internet (dix heures de vidéo postées sur YouTube par minute), la bataille des moteurs de recherche vidéo est engagée. Face aux géants américains, Google, Yahoo! et Microsoft, les Européens développent de nombreux projets avec l’aide de la Communauté européenne à travers le Programme-Cadre de Recherche-Développement (PCRD), principal instrument communautaire pour financer la recherche. Ce programme pluriannuel finance des projets associant universités, centres de recherche et entreprises, qui répondent aux appels d’offres en R&D de la Commission. Dans le domaine des technologies de l’information et de la communication (TIC), le budget annuel du programme de recherche d’un montant de 1,1 milliard d’euros pour 2010, devrait passer à 1,7 milliard en 2013.

Le 6e PCRD 2002-2006 a soutenu pas moins de neuf initiatives d’entreprises européennes dans le domaine de l’indexation et la recherche multimédia : Semedia, Tripod, Rushes, Vidi-Video, Sapir, Victory, Divas, Pharos et Vitalas. Ces deux derniers projets ont bénéficié respectivement de 8,5 millions et 4,7 millions d’euros de subventions. Vitalas (Video & image Indexing and reTrievAl in the Large Scale) a pour objectif de fournir des outils d’indexation, de recherche et d’accès dans de grandes bases de don- nées multimédias. A vocation grand public, ce projet s’appuie sur des cas concrets d’utilisation grâce à la collaboration de deux grands détenteurs de contenus audiovisuels, l’Institut national de l’audiovisuel (INA) et l’agence de presse Belga.

Lancé en janvier 2007 avec un budget total de plus de 8 millions d’euros, le projet Vitalas regroupe douze partenaires originaires de cinq pays d’Europe (Allemagne, Belgique, France, Grèce, Espagne, Pays-Bas et Royaume-Uni), établissements publics, industriels, PME, universités, dont l’Institut national de recherche en informatique et en automatique (INRIA) qui en est le coordinateur, l’Institut national de l’audiovisuel (INA), l’agence de presse Belga et le groupe de défense EADS, auxquels s’est jointe l’Agence France-Presse (AFP) en tant que partenaire associé.

Jusqu’ici les moteurs de recherche multimédias reposaient sur un système d’indexation des contenus audiovisuels par mots-clés contenus dans un descriptif textuel (le titre d’une vidéo ou d’une photo par exemple) ajouté par saisie manuelle. Cette technique est encore utilisée aujourd’hui par les géants américains Google ou Yahoo!. L’indexation a ensuite été enrichie par des tags, c’est-à-dire de nouveaux mots-clés associés a posteriori aux images, mais qui ne sont toujours pas générés par un logiciel.

La technologie Vitalas permet de retrouver une image par similarité et de générer automatiquement des annotations pour en faciliter l’indexation. Pour retrouver dans une base de données toutes les vidéos liées à une requête, Vitalas effectue une recherche multicritère comprenant la texture, la forme, les couleurs de l’image ou le thème. Trois phases de tests ont été prévues. Lancé en version bêta sur son site en juin 2009, l’INA inaugurait son nouveau moteur de recherche baptisé Mediagraph utilisant la technologie Vitalas, qui affiche les réponses à une requête sous la forme d’une sélection de vignettes vidéo. Chacune d’entre elles constitue la porte d’entrée pour une nouvelle recherche. En juillet 2009, une deuxième version test, installée sur le site de l’agence de presse Belga, permet d’améliorer l’indexation des vidéos en générant des annotations sur les contenus. Enfin, une troisième version, prévue à la fin de l’année 2009, complétera les résultats obtenus par des recommandations issues d’autres requêtes d’internautes sur le même sujet.

Avec la reconnaissance vocale, grâce à la détection des phonèmes exprimés ou à la transcription de bande-son en texte, il sera bientôt possible, à partir d’un seul mot-clé, d’obtenir des textes, des photos, des vidéos et des sons. Cependant, le projet Vitalas va beaucoup plus loin en proposant comme base de requête, non plus un mot-clé, mais une image ou un extrait audio.

Sources :

  • « Content & Knowledge – Vitalas Integrated Project – FP6 », Informa- tion Society and Media, European Commission, ftp.cordis.europa.eu.
  • « The search goes on for more efficient retrieval methods », interview of Nozha Boujemaa – eStrategies Europe, Vol 2 No 4 pp.84-85, november 2008 – britishpublishers.com, vitalas.ercim.org.
  • « Le moteur de recherche vidéo européen Vitala entre en piste », Emmanuel Paquette, Les Echos, 25 juin 2009.
  • « De nouveaux moteurs de recherche pour ratisser la vidéo », Marie-Catherine Beuth, Le Figaro, 18 août 2009.

LAISSER UN COMMENTAIRE