Peu connu du grand public, le moteur de recherche Exalead a lancé en janvier 2010 une nouvelle application baptisée Voxalead News utilisant une technique de reconnaissance vocale pour retrouver sur le Web des documents d’actualité audio ou vidéo.
Au sein du programme de recherche français, Quaero, consacré au traitement automatique et à l’indexation des contenus multimédias, l’entreprise française Exalead est chargée du développement des technologies de recherche appliquées aux images et aux sons (voir n°6-7 de La revue européenne des médias, printemps-été 2008). Contrairement aux moteurs de recherche les plus connus qui procèdent encore à l’indexation des contenus multimédias en saisissant à la main les mots-clés, Voxalead est capable d’indexer les paroles prononcées dans un commentaire ou dans une interview, en plus des mots-clés, des tags attachés aux documents sonores ou vidéo. Cette application est née d’un partenariat avec le laboratoire du CNRS, Limsi, qui conduit des recherches en sciences et technologies de l’information et de la communication.
Malgré les confusions susceptibles d’être engendrées dans la transcription des paroles recherchées, la technique de reconnaissance vocale parvient à identifier les phrases importantes et le résultat de la recherche ne souffre que d’une faible marge d’erreur de 10 %. Lorsque la bande son elle-même est de moins bonne qualité, en raison d’un enregistrement avec bruit de fond ou encore des propos insuffisamment bien prononcés, la technique se révèle moins performante, avec un taux d’erreur pouvant atteindre les 50 %.
Consacré à l’actualité dans sa version bêta, le service Voxalead News permet de retrouver du texte prononcé dans des émissions de radio et de télévision ou des vidéos provenant de médias nationaux et internationaux, notamment France 24, Euronews, iTélé, LCI, BFM, M6, Europe 1, Le Monde, L’Equipe, la BBC, CCN, ABC, CBS, NHK Al-Jazira, et de l’Agence France-Presse (AFP). Les podcasts (téléchargements) sont également indexés. Cette application intéresse d’ores et déjà les professionnels de la télévision et de la radio pour indexer les contenus sur leurs propres sites.
La page d’accueil de Voxalead News offre, en plus de la traditionnelle barre de recherche, un nuage de tags permettant une sélection préalable des contenus audiovisuels en trois thèmes, « People », « Organization » et « Location », ainsi qu’un tri temporel, « Last day », « Last week », « Last month ». L’application fonctionne en quatre langues, français, anglais, arabe et chinois. De plus, une transcription écrite des sujets accompagne chaque vidéo. Véritable outil de veille sur l’actualité, Voxalead News s’adresse plus particulièrement aux professionnels et aux spécialistes qui peuvent ainsi repérer automatiquement les propos tenus sur un sujet particulier à partir de multiples sources audiovisuelles et, le cas échéant, étudier la couverture d’un événement par différents médias. Voxalead sera à terme développé dans d’autres domaines : l’éducation, la politique ou encore les collectivités.
Sources :
- http://voxaleadnews.labs.exalead.com/
- « Un site Web retrouve des vidéos en fonction des mots prononcés », Didier Sanz, Le Figaro, 18 janvier 2010.
- « Voxalead News : retrouver une vidéo en saisissant les mots qui y sont prononcés », Cédric Depond, techno-science.net, 21 janvier 2010.