Mauvaise nouvelle pour la lutte contre les fausses informations : Meta met hors service le logiciel CrowdTangle

Utilisé pour traquer les fausses informations sur Facebook et Instagram, le logiciel CrowdTangle ne sera plus utilisable à compter du 14 août 2024, soit trois mois avant les élections présidentielles américaines. Il sera remplacé par une nouvelle technologie ouverte aux seuls chercheurs et organismes à but non lucratif de surveillance électorale.

Cet outil constitue pourtant l’un des fleurons du groupe et une interface particulièrement utile afin de déceler les contenus viraux et de cerner les mécanismes de manipulation de l’information. Sa bibliothèque de contenus est une source de données très riche sur ces phénomènes ; nombreux sont les journalistes, chercheurs et autres organismes de fact-checking à en tirer profit. Surtout, l’outil participe des efforts de transparence auxquels les services du groupe Meta sont tenus au titre du règlement sur les services numériques (DSA, Digital Services Act), en tant que très grandes plateformes en ligne1, et du code de bonnes pratiques contre la désinformation.

Mais il semble que ce soit justement cette trop grande transparence qui gêne ; le logiciel a en effet permis, à plusieurs reprises, de déceler le déficit de modération de contenus erronés, trompeurs, voire haineux, diffusés sur les réseaux sociaux précités. En supprimant l’accès au logiciel, Meta veillerait plus à sauvegarder son image qu’à améliorer ses propres standards. L’équilibre entre la liberté d’expression et la lutte contre la désinformation devrait pourtant rester exempt de toute considération liée à la réputation de l’entreprise. Si un nouveau service devait voir le jour d’ici cet été, cette décision pourrait entamer sérieusement l’efficacité des services de presse dans leurs investigations sur les réseaux sociaux.

Il importe d’en mesurer l’impact au regard des dispositions du DSA comme de celles de la loi française.

CrowdTangle, un logiciel permettant de traquer les fausses informations

À l’origine, le logiciel CrowdTangle avait pour principal objectif de mesurer l’impact des campagnes de communication des entreprises sur les réseaux sociaux.

L’interface permet ainsi d’identifier les contenus les plus partagés, notamment à travers leur nombre de vues, les interactions qu’ils ont pu générer ainsi que les comptes les plus influents qui les relaient2. Racheté par Facebook en 2016, l’outil a rapidement révélé un certain intérêt pour la traque des fausses informations, ce pourquoi des journalistes ainsi que des chercheurs y ont eu volontiers recours. Il a également été employé dans le cadre de campagnes électorales, pour permettre de suivre les publications de candidats avec une très grande précision. Son interface, qui présente la forme d’un tableau de bord3, contient plusieurs banques de données classées par thématiques. Chaque utilisateur peut configurer son compte pour suivre certains contenus en particulier, certains types de contenus, ou bien certains comptes, afin de mesurer leur impact au sein des réseaux sociaux. Les données ainsi collectées peuvent révéler bien des utilités pour cerner des campagnes de manipulation de l’information et autres ingérences d’autorités publiques dans la diffusion de contenus intéressant des sujets d’ordre politique, économique ou social.

La liste des organismes utilisant ou ayant utilisé le logiciel, ainsi que les conclusions de leurs travaux, est édifiante. Un certain nombre de médias et d’entreprises de presse, tels que l’Agence France Presse4, utilisent le logiciel au titre de leur activité de fact-checking, le plus souvent en partenariat même avec Facebook. Les données recueillies ont permis d’identifier nombre de contenus erronés ou trompeurs, diffusés notamment au cours de périodes électorales5. Au-delà, l’outil intéresse aussi la recherche universitaire, Meta ayant ouvert l’accès au logiciel à plusieurs universités et laboratoires de recherche à des fins d’identification et d’études des phénomènes de manipulation de l’information6. L’observatoire de l’internet de l’Université Stanford a, par exemple, publié un livre blanc sur la stratégie d’influence de l’information menée par la Russie dans plusieurs pays africains par l’intermédiaire des réseaux sociaux, en se basant sur les données recueillies par CrowdTangle7.

Ces résultats encourageants sont d’autant plus à saluer qu’ils traduisent une certaine transparence du fonctionnement des algorithmes et autres outils de diffusion des contenus sur les plateformes en ligne. Or, c’est exactement ce à quoi le groupe Meta est tenu sur le fondement de plusieurs textes.

CrowdTangle, un logiciel au service de la transparence des plateformes en ligne au sens du code renforcé de bonnes pratiques contre la désinformation

L’accès au logiciel CrowdTangle, que ce soit pour les journalistes ou pour les chercheurs, constitue depuis l’origine un moyen efficace de concrétiser les engagements figurant dans le code européen de bonnes pratiques contre la désinformation8, dont Meta est signataire.

Dès son premier paragraphe, la première version du code invitait les signataires à « prendre des mesures raisonnables pour permettre un accès aux données qui soit respectueux de la vie privée à des fins d’activités de vérification des faits et de recherche et pour coopérer en fournissant des données pertinentes sur le fonctionnement de leurs services, notamment des données destinées à des études indépendantes réalisées par des chercheurs universitaires et des informations générales sur les algorithmes ». Et il était déjà envisagé que ces mesures soient ouvertes à la fois aux chercheurs et aux journalistes, en particulier ceux qui relèvent d’organismes de vérification.

Cette recommandation a été réitérée et précisée dans le code renforcé de bonnes pratiques contre la désinformation9, adopté le 16 juin 2022 (voir La rem n°63, p.10). C’est ainsi que l’engagement n°32 invite les plateformes à garantir un accès rapide et fiable à ces organismes aux données permettant de quantifier et de qualifier l’impact de contenus partagés dans leurs espaces, par le biais d’interfaces et d’outils dont l’efficacité pourra elle-même être évaluée10. Des recommandations similaires figurent dans l’engagement n°26 pour ce qui concerne l’accès des chercheurs à ces jeux de données à des fins d’études et de recherche11. Ces mesures doivent avoir pour effet de développer une régulation multiple et indépendante des contenus, et sur des durées différentes.

Là où les journalistes sont à même de réagir à court terme pour signaler des fausses informations, les chercheurs sont censés agir sur le long terme, en identifiant les grandes tendances et campagnes de manipulation, à l’image de ce qui a pu être exploité pour dénoncer les tentatives d’ingérence russes.

CrowdTangle, un logiciel au service de la transparence des plateformes en ligne au sens du Digital Services Act

Si le code renforcé n’a pas de valeur contraignante, il participe malgré tout de l’économie générale du DSA pour apprécier les efforts effectués par les très grandes plateformes en ligne et les très grands moteurs de recherche en ligne (voir La rem n°67, p.14), notamment au titre de l’évaluation et de l’atténuation des risques ainsi que des mesures de réaction aux crises12. Le logiciel CrowdTangle apparaît une fois encore comme l’outil idéal à ce niveau, puisque le logiciel a été conçu délibérément pour mesurer la propagation de contenus au jour le jour. Son utilisation semble donc d’autant plus souhaitable dans ce contexte.

L’article 45 du règlement prévoit ainsi l’adoption de codes de conduite volontaires permettant de contribuer à la bonne application de ses dispositions, le paragraphe 106 du préambule renvoyant explicitement au code renforcé pour ce qui concerne la lutte contre la désinformation. De même, l’article 40 comporte plusieurs obligations en termes d’accès aux données à des fins de contrôle et de recherche. Le paragraphe 7 de cet article dispose notamment que : « Les fournisseurs de très grandes plateformes en ligne ou de très grands moteurs de recherche en ligne facilitent et fournissent l’accès aux données […] par l’intermédiaire d’interfaces appropriées spécifiées dans la demande, y compris des bases de données en ligne ou des interfaces de programmation d’application. » De même, les paragraphes 8 à 12 encadrent l’accès des chercheurs aux données détenues par les très grandes plateformes ou par les très grands moteurs de recherche « à des fins de recherches contribuant à la détection, à la détermination et à la compréhension des risques systémiques dans l’Union », cet accès pouvant inclure des « données en temps réel, à condition que ces données soient publiquement accessibles sur leur interface en ligne aux chercheurs ».

Enfin, sans atteindre le degré de précision du DSA, on peut aussi rappeler que la loi du 22 décembre 2018 adoptée en France pour lutter contre la manipulation de l’information prévoit des obligations et recommandations similaires13. Son article 11 dispose que les plateformes doivent mettre en œuvre des mesures complémentaires visant à garantir la transparence de leurs algorithmes et de leurs modalités de diffusion des contenus. L’article 15 les encourage également à nouer des partenariats avec des entreprises et des agences de presse, des entreprises de médias audiovisuels et des syndicats de journalistes, notamment à des fins de fact-checking, ce qui suppose l’accès aux données afférentes aux contenus publiés sur les réseaux sociaux. C’est sur cette base que le Conseil supérieur de l’audiovisuel (CSA), désormais Autorité de régulation de la communication audiovisuelle et numérique (Arcom), a adopté une recommandation à l’attention des plate- formes le 15 mai 201914. Celle-ci encourage entre autres « les opérateurs de plateforme en ligne à soutenir les initiatives indépendantes émanant de journalistes et de chercheurs destinées à mieux comprendre et mesurer le phénomène de la désinformation, notamment en leur donnant accès à leurs données dans le respect des règles en matière de protection des données personnelles, et dans le respect de l’impartialité de ces travaux ».

La décision de retirer le logiciel CrowdTangle est donc d’autant plus incompréhensible au vu de ces dispositions et recommandations. Elle révèle néanmoins les failles de l’entrée en vigueur du DSA.

Meta davantage préoccupé par sa réputation ?

L’abandon du logiciel CrowdTangle semble avoir été préparé de longue date par Meta. Des chercheurs ont pu s’alarmer des défaillances qui affectaient déjà le système en 2022 (restrictions des nouveaux accès, absence de mises à jour afférentes au suivi de certains contenus et autres bugs informatiques), soupçonnant le groupe de vouloir s’en défaire à plus ou moins court terme15.

La faute reviendrait à la « trop grande » efficacité du logiciel, qui aurait mis en lumière des défauts de modération à l’égard de plusieurs catégories contenus, risquant même de révéler un biais partisan sur les sujets politiques. Ce sont là autant de manquements à d’autres obligations que le groupe est pourtant tenu de respecter. Pour autant, Meta a réagi en affirmant qu’un nouvel outil était en préparation, offrant un plus grand nombre de fonctionnalités et de ressources en termes de suivi de contenus. Rien n’a pour l’instant filtré à propos de cette nouvelle interface, si ce n’est qu’elle sera réservée exclusivement aux chercheurs et aux organismes à but non lucratif, notamment ceux qui opèrent au niveau du contrôle des campagnes électorales.

Et c’est là que le bât blesse, car le futur logiciel ne sera plus proposé aux entreprises de presse ni, par conséquent, à leurs journalistes16, y compris ceux qui sont engagés dans les pratiques de fact-checking. Autrement dit, Meta entend différencier les accès pour ne réserver les données les plus complètes qu’aux organismes de recherche, qui sont évidemment moins nombreux et qui œuvrent sur un temps beaucoup plus long que les journalistes. Or, ceux-ci devraient continuer à jouer un rôle dans la lutte contre la manipulation de l’information ne serait-ce, justement, que pour faire une évaluation plus rapide des contenus à risque. Au-delà, ce sont toutes les investigations menées par des organes de presse qui pourraient pâtir du retrait de CrowdTangle.

Pour autant, on ne peut nier que les dispositions du DSA et celles de la loi française sont relativement ambiguës sur ce point. En effet, le règlement ne rend obligatoire que l’accès des chercheurs aux données, celui des journalistes relevant de recommandations non contraignantes et d’encouragements dans le code de conduite renforcé et dans la recommandation du CSA. Meta pourrait donc arguer qu’il respecte le règlement, le retrait du logiciel ne signifiant pas la fin des accords qui ont pu être passés avec des entreprises de presse et des organismes de fact-checking indépendants ayant recours à d’autres outils. On voit mal cependant comment ceux- ci pourraient se passer des données afférentes à la propagation des contenus pour mener à bien leur tâche. On doit malgré tout garder à l’esprit que les recommandations du code de conduite peuvent être prises en considération au titre des mesures d’atténuation des risques que doivent respecter les très grandes plateformes en ligne.

Il faudra donc évaluer concrètement dans quelle mesure le retrait du logiciel CrowdTangle pourrait constituer un manquement aux dispositions du DSA s’il conduit à terme à une dérégulation de la diffusion des contenus et à une baisse du niveau de transparence. C’est ce à quoi appelle la fondation Mozilla dans une lettre ouverte demandant à Meta de maintenir le logiciel jusqu’en janvier 2025 et alertant le groupe sur sa conformité au règlement européen17.

Sources :

  1. Commission européenne, « La Commission désigne une première série de très grandes plateformes en ligne et de très grands moteurs de recherche en ligne », 25 avril 2023.
  2. Roos-Weil Lise, « Expliquez-nous le logiciel CrowdTangle », francetvinfo.fr, 2 avril 2024.
  3. crowdtangle.com
  4. « Agence France-Presse’s Strategy For Using CrowdTangle Search and Meme Search to Report Misinformation », crowdtangle.com
  5. Robinson Olga, Sardarizadeh Shayan, « European elections 2019: Online disinformation themes and tactics – Part one », BBC Monitoring, May 22, 2019.
  6. Funke Daniel, « These researchers are getting access to Facebook data to study misinformation », Poynter, April 30, 2019.
  7. Grossman Shelby, Bush Daniel, DiResta Renee, Evidence of Russia-Linked Inuence Operations in Africa, Stanford Internet Observatory, October 29, 2019, 55 p.
  8. Commission européenne, « Code de bonnes pratiques en matière de désinformation », 26 septembre 2018.
  9. Jacquemart Marie, « Lutte contre la désinformation : l’Union européenne annonce de nouvelles obligations pour les plateformes numériques », Les Surligneurs, 17 juin 2022.
  10. Commission européenne, « Strengthened Code of Practice on Disinformation », commitment 32 – Fact-checkers’ access to relevant information, 2022.
  11. Commission européenne, « Strengthened Code of Practice on Disinformation », commitment 26 – Automated access to non-personal data and anonymised, aggregated or manifestly made public data, 2022.
  12. Règlement (UE) 2022/2065 du Parlement européen et du Conseil du 19 octobre 2022 relatif à un marché unique des services numériques et modifiant la directive 2000/31/CE (règlement sur les services numériques).
  13. Loi n° 2018-1202 du 22 décembre 2018 relative à la lutte contre la manipulation de l’information.
  14. Conseil supérieur de l’audiovisuel, recommandation n° 2019-03 aux opérateurs de plateforme en ligne dans le cadre du devoir de coopération en matière de lutte contre la diffusion de fausses informations, 15 mai 2019.
  15. Albert John, « Facebook’s gutting of CrowdTangle: a step backward for platform transparency », Algorithm Watch, August 3, 2022.
  16. Sémat Chloé, « Désinformation : quelles conséquences après la suppression de CrowdTangle par Meta ? », lexpress.fr, 2 avril 2024.
  17. « Open Letter To Meta – Meta, Support CrowdTangle Through 2024 and Maintain CrowdTangle Approach », foundation.mozilla.org
Maître de conférences HDR en droit privé à Aix-Marseille Université et rattaché au Laboratoire interdisciplinaire de droit des médias et des mutations sociales (LID2MS).