Que font les robots dans les agences de presse ?

En Europe, nombre d’agences de presse, d’envergure nationale ou internationale, ont introduit des robots dans leur salle de rédaction. Leurs fonctions restent cependant à ce jour assez limitées.

Alors que la naissance du « robot-journalisme » était annoncée dès 2014 (voir La rem n°32, p.87), l’Associated Press, l’une des trois agences internationales, publie aujourd’hui de façon totalement automatisée des rapports financiers pour environ 3 700 entreprises, ainsi que des informations sportives. Ses concurrentes Reuters et AFP produisent elles aussi, chaque année, des milliers de dépêches rédigées par des algorithmes. Comptant parmi les agences de presse nationales en Europe ayant adopté cette pratique, la NTB en Norvège a totalement automatisé la rédaction de ses comptes rendus de matchs, à partir des données fournies par l’association nationale de football.

La génération automatique de textes par des robots est, pour l’heure, la fonction la plus couramment développée. Cependant, la détection des informations et la production vidéo sont également concernées par le développement des algorithmes. L’outil, baptisé Reuters News Tracer, informe les journalistes des dernières nouvelles circulant sur les médias sociaux. L’agence Reuters est également en train de tester le logiciel Wibbitz qui produit automatiquement une vidéo en analysant n’importe quel texte, de même la BBC développe, de son côté, un logiciel de traduction vidéo automatisé (NDLR : En France, Prisma Media, Le ParisienLe Figaro et LCI sont déjà clients de la plate-forme Wibbitz).

Les raisons qui poussent les agences de presse à franchir le cap de la robotisation sont diverses. Pour l’agence Reuters, spécialisée dans la fourniture d’informations financières, la rapidité d’exécution est un argument majeur. Pour d’autres, l’automatisation est un moyen d’enrichir leur offre de services en élargissant leur couverture de l’information ou, à l’inverse, en se spécialisant dans un domaine particulier, en déclinant des informations au niveau local par exemple.

Une enquête menée auprès des agences de presse généralistes en Europe, y compris Reuters, devenue canadienne (voir La rem n°4, p.9) mais installée à Londres, et Associated Press, dont le siège social est à New York, a été publiée par le Reuters Institute for the Study of Journalism de l’Université d’Oxford. Sur un total de quinze agences qui ont accepté de répondre, trois seulement n’utilisent pas de robots, sous aucune forme : la tchèque CTK, l’espagnole EFE et l’italienne ANSA. Au sein de l’agence de presse portugaise LUSA, on explique n’y avoir eu recours qu’à l’occasion des élections parlementaires de 2015, même si l’on est bien conscient que cette technologie représente l’avenir du journalisme. Neuf agences au total ont recours à des algorithmes pour produire des dépêches, quand deux autres développent des projets de cette nature, comme le montre l’illustration ci-dessous.

La rem n°44 - robots journalisme

Pour les sept agences qui recourent déjà à la robotisation au sein de leur rédaction, la finance ou le sport sont les deux domaines d’information privilégiés pour ce type de traitement, notamment grâce aux données structurées fournies par des tiers comme les agences d’analyse financière et les fédérations sportives. La disponibilité de données, dans les deux cas nombreuses et récurrentes, explique le succès de l’automatisation sur ce type de nouvelles. « En sport, vous avez des règles, vous savez qui est le gagnant, qui est le perdant et ce qui s’est passé. C’est une manière simple de commencer », explique Maija Lappalainen pour l’agence de presse finlandaise STT. Délivrés dans un format facilement exploitable, les résultats des élections et autres données de sources officielles concernant l’éducation, le chômage et l’immobilier peuvent également faire l’objet d’un traitement automatisé.

Cette accessibilité des données est un facteur déterminant pour le développement du traitement automatisé des informations. Dans les pays où l’ouverture des données provenant de sources officielles (open data) n’est pas organisée, les agences de presse se montrent réticentes à les recueillir et à structurer elles-mêmes leurs propres bases de données. Elles ne se considèrent ni comme hébergeur ni comme fournisseur de données. L’étude relève sur ce point qu’au moins quatre agences de presse utilisant des robots sont tributaires de sources externes, et qu’au moins deux paient pour les obtenir. Seule l’agence Reuters dispose de ses propres bases de données financières pour faire fonctionner ses algorithmes.

Si, à court terme, l’argument est économique – éviter des frais de maintenance –, ce choix soulève la question fondamentale de l’autonomie des agences de presse vis-à-vis des fournisseurs de données. En recherchant et en structurant elles-mêmes les données pour explorer certains sujets, les agences de presse pourraient distinguer leurs offres de celles de leurs concurrents, en l’occurrence d’autres producteurs de données qui, aujourd’hui, risquent de devenir de plus en plus nombreux et variés. « Pour être compétitif et faire une offre unique, vous ne pouvez pas utiliser le même ensemble de données que tout le monde », explique Nick Diakopoulos, spécialiste en robot-journalisme à l’université du Maryland.

De cette enquête, ressort également la principale motivation des agences de presse quant à l’automatisation des contenus, qui est la volonté de créer de nouveaux produits. Au moins six d’entre elles expliquent faire appel à des robots dans ce but ou pour élargir leur offre de services dans certains domaines. En revanche, la réduction du coût du travail humain n’a été mentionnée par aucune agence de presse comme facteur décisif. Néanmoins, l’automatisation peut être déterminante dans l’allocation des ressources, comme ce fut le cas au sein de l’Associated Press qui explique avoir muté trois employés à temps plein sur d’autres tâches, à la suite de l’automatisation de la rédaction des comptes rendus financiers. Une des raisons évoquées pour expliquer que la robotisation ne diminuerait pas les effectifs réside dans les investissements nécessaires à son développement.

Cet argument est avancé par plusieurs agences qui, ne disposant pas de l’expertise technique en interne, devraient dépenser des sommes considérables pour faire appel à un développeur extérieur, auxquelles s’ajoutent, selon certaines, des frais de fonctionnement qui se révèlent finalement très élevés. « On croit que l’automatisation est bon marché, mais ce n’est en fait pas si bon marché. Si vous automatisez, cela vous coûte de l’argent. Vous devez maintenir, vous devez suivre, vous devez gérer [le système]. L’objectif, en réalité, n’est pas d’économiser beaucoup d’argent », réagit Reg Chua, responsable de l’innovation chez Reuters. Autre point important : l’automatisation a créé la nouvelle fonction de « maintenance des données ». Concernant les jeux de données utilisés pour écrire les rapports financiers, par exemple, « ce n’est pas un de ces cas de figure où vous créez le processus et puis vous n’y pensez plus. Vous devez constamment gérer ce jeu de données », explique à son tour Lisa Gibbs chez AP.

Au-delà des progrès obtenus avec les logiciels de génération automatique de textes (GAT), la plupart des robots ne sont pas encore capables de réaliser des tâches complexes. Seules deux agences interrogées, Reuters et la norvégienne NTB, disposent d’algorithmes en mesure de comparer des informations récentes aux données historiques et d’en tirer une interprétation. L’agence de presse suédoise TT, quant à elle, a lancé un widget qui réussit à comparer les données sur la performance scolaire ou sur les prix de l’immobilier au niveau local avec la moyenne nationale. La plupart des autres agences se servent en fait des robots uniquement pour signaler de nouvelles informations, fournissant ainsi un instantané sans replacer l’événement dans un contexte historique. Les agences avouent rester prudentes face au risque d’erreurs. « Évidemment, plus vous essayez d’obtenir une réponse sophistiquée, plus vous augmentez les chances d’erreur », constate Lisa Gibbs de l’Associated Press.

Il n’en reste pas moins que, selon les études menées sur l’efficience des logiciels de génération automatique de textes, les lecteurs ne parviennent que très difficilement à discerner les informations rédigées par des robots de celles écrites par des humains. Le processus est d’autant moins transparent, y compris pour les clients des agences de presse, qu’au moins deux agences interrogées produisent des informations partiellement écrites par un robot sans le mentionner en tant que coauteur. Reuters, Associated Press et NTB déclarent marquer habituellement les articles écrits par leurs algorithmes, mais Reuters ne fait pas figurer cette mention sur ses alertes appelées « snaps ».

Enfin, on apprend également dans cette étude que de nombreux contenus automatisés sont publiés directement, sans avoir été relus par des humains. Chez Reuters, 950 alertes et 400 nouvelles par jour sont publiées sans intervention humaine. Quatre autres agences de presse interrogées déclarent aussi publier des contenus fabriqués de manière automatique sans que personne les ait vérifiés au préalable ; les responsables éditoriaux soutiennent que le bénéfice de l’automatisation serait sérieusement limité si les informations devaient passer par un tel examen. L’autre argument étant que les robots, bien entraînés, sont très précis. « Ce qui est magnifique avec les algorithmes, c’est qu’ils ne font pas deux fois la même erreur. Une fois que vous l’avez corrigée, ils ne la referont pas », dit Helen Vogt de l’agence NTB.

Source :

  • Putting Europe’s Robots on the Map : Automated journalism in news agencies, Alexander Fanta, Reuters Institute Fellowship Paper, Google Digital News Initiative (sponsor), The Reuters Institute for the Study of Journalism, University of Oxford,
    reutersinstitute.politics.ox.ac.uk, 1er September 2017.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici