Le logiciel d’analyse du langage d’un chercheur de Grenoble a donné la paternité de certaines pièces de théâtre de Molière à Corneille. Un exemple qui ouvre la voie à d’autres applications.
Révision des oeuvres classiques : Le Tartuffe, Le Misanthrope, Dom Juan, Les Femmes Savantes ou encore L’Avare sont de… Corneille ! Que ceux qui ont répondu Molière ne se vexent pas, un petit tour dans leur bibliothèque leur donnera raison. Et pour cause : Corneille était le nègre de Molière : c’est-à-dire qu’il rédigeait anonymement des pièces pour ce dernier !
C’est en tout cas la conclusion de Dominique Labbé et de son équipe de l’Institut d’études politiques de Grenoble. Pour être aussi affirmatif, l’enseignant-chercheur a employé un logiciel d’attribution d’auteurs qu’il a lui-même développé avec l’aide de son fils, chercheur en informatique. Ils ont ainsi renforcé la thèse, datant du début du siècle, attribuant à Corneille certains textes de Molière.
Le programme dont ils se sont servis fonctionne en langage C et utilise une méthode statistique appliquée au langage. « En superposant le vocabulaire de deux textes, on va alors mesurer le degré de ressemblance entre ces oeuvres », explique Dominique Labbé. « A partir d’une certaine probabilité, on sait qu’ils sont du même auteur. »
De même, le logiciel a parfaitement différencié les styles de Léon Blum, César ou encore Jean-Marie Le Clézio.
Des analyses pour le recrutement
Le chercheur s’est associé avec d’autres universitaires en France et au Canada. Ensemble, ils ont développé des logiciels d’analyse du langage capables de travailler sur tout type de plates-formes (Unix, Windows, Linux…).
Ces automates traitent, par exemple, des milliers d’oeuvres littéraires, mais également des discours politiques ou des retranscriptions d’entretiens. De quoi constituer des aides précieuses auprès des sociologues ou encore des recruteurs.
Car si l’habit ne fait pas le moine, le texte fait indéniablement l’auteur.
[source – 01net.com]