Nous sommes heureux de retrouver notre contributrice fidèle, Joelle Vuille. Joëlle est juriste et criminologue et habite en Suisse.
Il y a quelques années, j’avais rédigé une contribution sur la linguistique forensique, qui permet parfois d’attribuer des écrits à leur auteur à cause des habitudes de langage de ce dernier [1]. Le cas le plus célèbre est celui de Ted Kaczynski, alias Unabomber, identifié grâce à son frère, qui avait reconnu son style d’écriture dans des extraits de documents rendus publics par les forces de l’ordre [2].
L’intelligence artificielle permet aujourd’hui de faire passer la technique à la vitesse supérieure. En effet, deux groupes de chercheurs [3] pensent avoir identifié qui se cache derrière le pseudonyme « Q », à l’origine de la mouvance conspirationniste QAnon [4]. Q a commencé à publier des messages conspirationnistes sur certains sites du « darkweb » en octobre 2017. L’auteur, se présentant comme un agent de la CIA, prétendait savoir qu’un certain nombre de politiciens états-uniens sont des pédophiles adorateurs de Satan [5]. Ses théories se sont répandues comme une trainée de poudre dans la société américaine et aujourd’hui des milliers [6] d’Américains sont convaincus que Donald Trump sauvera bientôt les États-Unis d’une élite malfaisante (le « deep state ») qui contrôle les gouvernements du monde, le système bancaire, l’industrie, les médias, etc. et qui s’active à maintenir le citoyen lambda dans la pauvreté et l’ignorance tout en s’adonnant à un trafic d’enfants de grande ampleur [7].
Avant de nous pencher sur le cas de Q, rappelons en quelques lignes les bases fondamentales de toute identification forensique : une personne ou un objet présente des caractéristiques très variables dans une population donnée (intervariabilité élevée) mais très peu variables à travers le temps (intravariabilité basse), et laisse des traces reproduisant ces caractéristiques. Après avoir observé un certain degré de correspondance entre les caractéristiques de la trace et les caractéristiques de la personne ou de l’objet qui pourrait en être la source, l’expert peut quantifier la probabilité d’observer la correspondance si la trace provienne effectivement de telle source ou si elle ne provient pas de telle source, ce qu’il fait au moyen de bases de données répertoriant la rareté des caractéristiques d’intérêt dans la population en question.
Par exemple, la comparaison de profils d’ADN est fondée sur les présupposés suivants : chaque individu possède une combinaison très variable de caractéristiques génétiques (semblable à une suite de lettres), et laisse des traces ADN (sur les surfaces touchées, par exemple) qui reproduisent cette combinaison. Par ailleurs, le profil ADN est en principe immuable au fil de la vie. Si un expert observe un certain nombre de caractéristiques en commun entre une trace ADN et un profil de référence pris à un suspect, il pourra quantifier la probabilité d’observer cette concordance si le suspect est la source de la trace, ou si un tiers, pris au hasard dans la population d’intérêt, est la source de la trace.
A un niveau fondamental, la fiabilité de la comparaison dépend de la capacité de l’expert à rapprocher des traces et des profils de suspects ayant une apparence différente mais provenant en réalité de la même source [8] et à distinguer des traces et des profils de suspects qui se ressemblent mais proviennent de sources différentes. Dans toute technique forensique, il y a des risques de faux résultat positifs (identifier une personne comme étant la source de la trace alors qu’elle ne l’est pas) et de faux résultats négatifs (exclure une personne comme étant la source de la trace alors qu’elle en est bien la source).
La stylométrie fonctionne selon les mêmes principes : on compare les textes signés par Q avec des textes rédigés par une population de suspects. La technique employée par les chercheurs suisses [9] consiste à identifier des groupes de 3 lettres, et à relever ensuite à quelle fréquence chaque groupe de 3 lettres apparaît dans les écrits de Q, respectivement dans les écrits d’une population de suspects. L’idée sous-jacente est, comme en linguistique forensique « traditionnelle », que nous avons chacun des habitudes de langage qui nous sont propres, et que nous les reproduisons de façon consistante sur une certaine période de temps, ce qui permet de rapprocher nos écrits d’aujourd’hui de ceux de 2017, et de nous distinguer des millions d’autres internautes qui laissent des messages sur les mêmes sites internet que nous. En l’occurrence, les chercheurs ont comparé plus de 100'000 mots écrits par Q avec environ 12'000 mots écrits par chacune des 13 personnes soupçonnées d’être Q (notamment des proches de Donald Trump) [10].
Selon les chercheurs, deux hommes se cacheraient ainsi derrière le pseudonyme Q :
Paul Furber, informaticien sud-africain passionné depuis longtemps par les thèses conspirationnistes et la politique américaine ; il aurait « inventé » Q et aurait posté les premiers messages en 2017;
Ron Watkins, politicien républicain candidat au congrès de l’Etat de l’Arizona, aurait repris le flambeau dès 2018 ; il était pendant plusieurs années l’administrateur du site 8chan [11] sur lesquels de nombreux messages de Q ont été publiés.
Les deux hommes ont nié être Q [12].
Des critiques ont relevé que ce type d’analyses présentent un risque d’erreur. Tout d’abord, le style même de Q se prêterait mal à une analyse stylométrique car il utilise beaucoup de formulations très courtes et plus ou moins cryptiques, ainsi que du jargon militaire [13]. Par ailleurs, le style d’écriture d’une personne pourrait ne pas être si stable que cela à travers le temps (intravariabilité élevée), et plusieurs personnes pourraient, à un moment donné, avoir des écritures qui se ressemblent car elles subissent les mêmes influences extérieures (intervariabilité basse). D’ailleurs, l’un des suspects, Furber, a reconnu que son style d’écriture ressemble à Q, mais a mis en avant le fait que, étant un grand admirateur de Q, il l’avait probablement imité inconsciemment, comme d’autres admirateurs [14]. L’argument ne tient toutefois pas, puisque les scientifiques n’ont pas rapproché les écrits de Q de tous, ou plusieurs, admirateurs, mais seulement de Furber. Et certains écrits de Furber sur lesquels l’analyse a porté ont été rédigés tout au début de l’activité de Q, si bien que le phénomène d’imitation inconsciente avancée par Furber ne tient pas la route [15].
Les chercheurs, quant à eux, estiment que leurs techniques sont extrêmement fiables [16], et le fait que deux équipes soient parvenues au même résultat par le biais de méthodes différentes renforce encore la crédibilité des résultats [17]. Par ailleurs, il semblerait que, avant que les résultats de ces recherches stylométriques aient été rendues publics, des indices indépendants pointaient déjà en direction de Ron Watkins (et de son père) [18].
La question de l’identité de Q reste donc ouverte pour le moment.
Q, quant à lui, semble muet depuis décembre 2020…
[1] La linguistique judiciaire. Analyse de livre
[2] https://www.washingtonpost.com/wp-srv/national/longterm/unabomber/trialstory.htm (dernière consultation le 19.5.2022)
[3] Claude-Alain Roten et Lionel Pousaz de OrphAnalytics, une start-up suisse ; et les Français Florian Cafiero et Jean-Baptiste Camps.
[4] La lettre Q est censée renvoyer à un niveau d’accréditation ultrasecret du département de l’énergie états-unien. Quant à « anon », c’est une aberéviation de « anonymous ». Voir le glossaire de la Anti-Defamation League : https://www.adl.org/blog/qanon-a-glossary
[5] The New York Times, Who is Behind Qanon ? Linguistic Detectives Find Fingerprints, Febuary 19, 2022, consultable ici : https://www.nytimes.com/2022/02/19/technology/qanon-messages-authors.html
[6] Le mouvement étant largement clandestin, il est difficile de savoir combien de personnes y adhèrent idéologiquement. La Anti-Defamation League estime que plusieurs dizaines de milliers de personnes aux Etats-Unis sont des sympathisants de Q.
[7] https://www.adl.org/qanon
[8] Par exemple, parce que la trace est détériorée car elle a été exposée aux éléments pendant une certaine période.
[9] A noter que les deux groupes de chercheurs n’ont pas utilisé exactement la même méthode.
[10] https://www.letemps.ch/monde/createurs-qanon-demasques-une-startup-suisse
[11] idem
[12] https://www.courrierinternational.com/article/theorie-du-complot-les-mysterieux-messagers-de-qanon-enfin-demasques
[13] The New York Times, Who is Behing Qanon ? Linguistic Detectives Find Fingerprints, Febuary 19, 2022, consultable ici : https://www.nytimes.com/2022/02/19/technology/qanon-messages-authors.html
[14] https://www.siliconrepublic.com/business/qanon-authors-identity-paul-furber-ron-watkins-linguistics
[15] The New York Times, Who is Behing Qanon ? Linguistic Detectives Find Fingerprints, Febuary 19, 2022, consultable ici : https://www.nytimes.com/2022/02/19/technology/qanon-messages-authors.html
[16] idem
[17] https://www.siliconrepublic.com/business/qanon-authors-identity-paul-furber-ron-watkins-linguistics
[18] https://www.insider.com/who-is-q-why-people-think-jim-watkins-qanon-8chan-2020-10
Lecture supplémentaire :
QAnon: An Objective Guide to Understand QAnon, The Deep State and Related Conspiracy Theories: The Great Awakening Explained
Michael D. Quinn KRPACEGROUP LLC (November 22, 2021)
Commentaires