Aller au contenu principal

Stylométrie


Stylométrie


La stylométrie est un domaine de la linguistique qui utilise la statistique pour décrire les propriétés stylistiques d'un texte. Elle est utilisée pour identifier le style d'un auteur, par exemple, celui de textes anciens ou un auteur anonyme dans le domaine judiciaire.

Histoire

La stylométrie a traversé les époques et les siècles. Peut-être inspirée par Pythagore (« Tout est nombre »), elle a véritablement débuté avec le logicien anglais Auguste de Morgan, avant de se développer grâce à l'informatique moderne. La première utilisation du terme stylométrie serait due à Lutoslawski,.

La stylométrie prend sa forme moderne en avec Frederick Mosteller de l’université de Harvard et David Wallace, de l’université de Chicago qui publient un article fondateur dans le journal de l’American Statistical Association,.

La stylométrie s'est également développée en France depuis, notamment avec Jean-Paul Benzécri, Charles Bernet, Étienne Brunet, Charles Muller et Jean-Marie Viprey. Elle est enseignée notamment à l'École des Chartes.

Méthodes

La stylométrie suit une approche quantitative. Elle recense les unités objectivées d’un texte. Selon le point de vue linguistique, ces unités varient. Le vocabulaire porteur du sens est naturellement le plus étudié ; il implique un lemmatiseur pour ramener les formes lexicales aux entrées du dictionnaire, et sa richesse limite le nombre des occurrences. Les catégories grammaticales sont examinées à l'aide d'un étiqueteur grammatical. Ponctuation, espacements et lettres véhiculent des structures archaïques et inconscientes du langage, fait de sons et d’émotions ; objectifs et profus, les caractères constituent une ressource non négligeable.

De ces unités, les statistiques textuelles retiennent traditionnellement les fréquences d’apparition : le texte est appréhendé du point de vue du vocabulaire. Pour les structures syntaxiques, une première méthode consiste à segmenter un texte en morceaux, puis à suivre les évolutions des fréquences ; le découpage demande de la finesse, a fortiori la comparaison de deux architectures différentes. Prolongeant la marche vers l’infiniment petit, l'enregistrement de chaque occurrence appréhende un rythme fondateur en matière d'art.

Usages

Les Federalist Papers

En , Frederick Mosteller et David Wallace établissent qui, d'Alexander Hamilton et de James Madison, a précisément écrit les divers articles des Federalist Papers qui promouvaient la constitution américaine, et publiés conjointement sous le pseudonyme de « Publius ». Alors que la recherche sur les mots de contenu (par exemple : « guerre ») est un échec, l'usage de mots outils (tel que « et », « alors », « sur ») est révélateur : Hamilton utilise souvent « upon » (sur), Madison presque jamais, Hamilton se sert beaucoup de « to », Madison de « by », etc.,

QAnon

En , deux équipes mettent en œuvre différents algorithmes de stylométrie pour identifier de manière indépendante les mêmes deux auteurs à l'origine des textes anonymes de QAnon.

Patrimoine bibliographique

La stylométrie a été utilisée pour identifier des textes d'Homère et de Platon, des pièces de Corneille et Molière, des poèmes de Shakespeare, le manuscrit de Voynich.

Les deux chartistes Florian Cafiero et Jean-Baptiste Camps confirment en 2019 la paternité des œuvres de Molière, dont le doute subsistait au profit de Corneille,,.

Petr Plecháč corrobore en 2020 que John Fletcher a aidé Shakespeare à écrire Henri VIII,,.

La stylométrie, en janvier 2023, a permis d'identifier l'Espagnol Lope de Vega comme étant l'auteur de l'œuvre La Francesa Laura à partir d'un manuscrit rédigé des années après sa mort.

Juridique

Dans le cadre de l'Affaire Grégory, les conclusions en d'une expertise en stylométrie commandée par la juge Claire Barbier à la société suisse OrphAnalytics en resserrent les soupçons sur cinq corbeaux et une autrice principale. Les avocats et leurs parties demeurent divisés quant à l'emploi de cette technique.

Aux États-Unis, de telles analyses linguistiques se pratiquent dans les tribunaux depuis les travaux pionniers de Roger Shuy dans l'identification du Unabomber et de Patrick Juola (en) dans l'identification de l'auteur de The Cuckoo's Calling. Les deux chartistes Florian Cafiero et Jean-Baptiste Camps se positionnent en faveur de son usage dans les affaires judiciaires en France rappelant que la technique de la stylométrie n'est ni rare, ni étrangère, ni nouvelle, tout en admettant qu'elle n'est pas infaillible, et que les courts textes étudiés dans le cadre de l'affaire Grégory connus par les médias se prêtent mal à l'analyse statistique en raison de nombreux suspects, raison pour laquelle les résultats doivent en être scrutés avec attention. A contrario, Claude-Alain Rothen et sa société OrphAnalytics adoptent une approche génomique apte à analyser des textes courts.

Bibliographie

  • Paul Tannery, « La stylométrie ses origines et son présent », Revue Philosophique de la France et de l'Étranger, vol. 47,‎ , p. 159–169 (ISSN 0035-3833, lire en ligne, consulté le )
  • Bernard Gicquel, Stylistique littéraire et informatique, Arras, Artois presses université, , 134 p. (ISBN 2-910663-31-0 et 978-2-910663-31-5, OCLC 41302243, lire en ligne)
  • Wincenty Lutosławski, Principes de stylométrie appliqués à la chronologie des œuvres de Platon, E. Leroux,
  • Valérie Beaudouin, « Contribution de la métrique à la stylométrie », JADT 2004 : 7es Journées internationales d’Analyse statistique des Données Textuelles,‎ , p. 12 (lire en ligne)
  • Andrei V. Zenkov, « A Method of Text Attribution Based on the Statistics of Numerals », Journal of Quantitative Linguistics, vol. 25, no 3,‎ , p. 256–270 (ISSN 0929-6174, DOI 10.1080/09296174.2017.1371915, lire en ligne, consulté le )
  • [Tribune] Florian Cafiero et Jean-Baptiste Camps, « L’irruption de la stylométrie dans l’affaire Grégory promet de sérieuses controverses », Le Monde.fr,‎ (lire en ligne, consulté le )

Notes et références

Notes

Références

Voir aussi

  • Paternité des œuvres de Molière
  • Paternité des œuvres de Shakespeare
  • Logométrie
  • Linguistique quantitative
  • Littérométrie

Liens externes

  • « Lexicometrica », Revue électronique de l'Université de Paris
  • Portail de la linguistique
  • Portail des probabilités et de la statistique

Text submitted to CC-BY-SA license. Source: Stylométrie by Wikipedia (Historical)


ghbass