Ce que disent les mots du 13 novembre 2015
Retour sur la présentation des premiers résultats du travail mené à partir des données collectées en phase 1 de l’Étude 1000 du Programme 13-Novembre, soit 934 entretiens, 1431 heures de témoignages filmés, 40 000 pages de transcription et 14 millions de mots.
Un programme hors normes sur la mémoire des attentats de novembre 2015
Le Programme 13-Novembre est un vaste programme transdisciplinaire, transprofessionnel et longitudinal initié par l’historien Denis Peschanski et le neuropsychologue Francis Eustache au lendemain des attentats de Paris et Saint-Denis de novembre 2015. Il a comme objectif premier d’étudier la construction et l’évolution de la mémoire après les attentats et en particulier l’articulation entre mémoire individuelle et mémoire collective. Il vise également à mieux comprendre le trouble de stress post-traumatique (TSPT) et à améliorer la prise en charge des civils et intervenants professionnels. Porté par le CNRS et l'Inserm pour le volet scientifique et par l'université Paris 1 Panthéon-Sorbonne pour le volet administratif, le programme est financé par l'ANR dans le cadre du Programme Investissements d'Avenir, pour une durée de 12 ans. Il s’articule autour de deux protocoles de recherche principaux, l’Étude 1000 et l’Étude REMEMBER, associés à plusieurs études complémentaires.
L’Étude 1000 est consacrée au recueil, à la conservation et à l’analyse des témoignages de mille personnes touchées directement ou indirectement par les attentats. Les mille volontaires sont invités à livrer leur récit selon un même protocole d’entretien répété lors de quatre campagnes d’enregistrements audiovisuels en 2016, 2018, 2021 et 2026. La répartition des volontaires se fait sur la base de leur proximité avec les événements ou les lieux des attentats, selon quatre cercles : Cercle 1 : personnes directement exposées aux attentats ; Cercle 2 : habitants et usagers non exposés des quartiers visés ; Cercle 3 : habitants du reste de la métropole parisienne ; Cercle 4 : habitants de Caen, Metz, Montpellier.
L’étude biomédicale en imagerie cérébrale REMEMBER (REsilience and Modification of brain control network following novEMBER 13) s’attache à évaluer les conséquences d’un événement traumatique et du stress qui en découle sur l’évolution des fonctions mentales, psychologiques et cérébrales. L’enjeu ici est d’analyser les troubles de stress post-traumatique (TSPT). Les deux cents volontaires du protocole sont majoritairement issus de la cohorte de l’Étude 1000. Ils sont répartis en deux groupes : l’un composé de personnes non exposées aux attentats, et l’autre composé de personnes exposées, principalement des rescapés. Ce dernier groupe formant deux sous-groupes de même taille : les exposés présentant un TSPT et ceux qui n’en présentent pas, ou plus. Le protocole est répété sur trois périodes : 2016-2017, 2018-2019 et 2023-2024. Il inclut un examen en Imagerie par Résonance Magnétique (IRM) réalisé au Centre Cyceron de Caen, ainsi que diverses évaluations neuropsychologiques et psychopathologiques complémentaires.
Un défi à l’interface des sciences humaines et sociales et des sciences biomédicales
Pour Denis Peschanski, la conférence organisée le 28 juin 2024 à Paris 1 Panthéon-Sorbonne constitue une étape très importante pour le Programme 13-Novembre, puisqu’elle permet d’aborder les premiers résultats du travail mené dans le cadre de l’Étude 1000, « les entretiens ont été menés en 2016 (phase 1), 2018 (phase 2), 2021 (phase 3). Aujourd’hui, nous pouvons envisager de faire des études, non seulement sur chacune des phases, mais aussi en longitudinale, dans la comparaison, puisque 60% des volontaires qui sont venus témoigner en phase 1, sont revenus en phase 2, puis en phase 3. Ce qui fait qu’à ce stade du programme, nous avons déjà trois témoignages, en 5 ans, de ces même personnes ».
La phase 1 de l’Étude 1000 constitue à elle seule un corpus de 934 entretiens, soit 1431 heures de témoignages filmés entre 2016 et 2017. Afin de traiter ce gigantesque corpus, un premier travail de transcription automatique a été opéré par des machines, suivi d’une correction effectuée par les équipes du programme. Pour l’exploitation des données, les chercheurs et chercheuses effectuent une analyse statistique du vocabulaire avec des outils de textométrie, ainsi que des analyses linguistiques des textes. Le défi scientifique se situe à l’interface entre ces entretiens, qui relèvent des sciences humaines et sociales, et le travail effectué à Caen autour du trouble de stress post-traumatique, « pour les 200 personnes passées par l’Étude 1000 et l’Étude REMEMBER nous avons à la fois leur témoignage et des résultats neuropsychologiques ainsi que des IRM. L’une des questions que nous nous posons est : peut-on, à partir du discours tenu dans un témoignage trouver des traces du diagnostic biomédical posé à l’arrivée », explique Denis Peschanski. C’est pour tenter d’apporter des réponses à cette question, que Charlotte Lacoste et Robin Quillivic ont entrepris d’analyser ces données.
Les mots du 13 novembre
Charlotte Lacoste est maîtresse de conférences et chercheuse en littérature et linguistique à l’université de Lorraine. Elle a intégré le Programme 13-Novembre en 2016 pour travailler sur le recueil des entretiens lors des trois phases de l’Étude 1000 (2016, 2018 et 2021). Elle est aujourd’hui chercheuse affectée au traitement des données. Elle analyse les datas collectées lors des 934 entretiens réalisés en phase 1. Le cercle 1, composé des personnes directement exposées aux attentats, est celui qui compte le plus d’entretiens avec 360 participants, dont 112 rescapés ; 42 proches endeuillés et 138 intervenants professionnels. C’est aussi le cercle où les entretiens sont les plus longs.
L’objectif de son analyse est de dégager les éléments les plus saillants du corpus sur le plan linguistique. Son travail va permettre également d’ouvrir des pistes de recherche tant à la sociologie de la mémoire (qui parle et comment, selon la position qu’il ou elle occupe dans l’espace social et selon le rôle qu’il ou elle a joué ce soir-là ?), qu’à la neuropsychologie (aller vers une identification de marqueurs linguistiques des patients TSPT) et à l’historiographie (poser les jalons d’une histoire des représentations de ces attentats).
Pour traiter ce corpus, la chercheuse a entrepris un travail quantitatif d’exploration linguistique de l’ensemble du corpus, avec une équipe de l’ENS Lyon. Pour traiter ces 40 000 pages de texte, les scientifiques ont utilisé un logiciel textométrique, TXM, qui décompte des occurrences de formes et permet, à l’aide de calculs statistiques, de travailler sur les caractéristiques lexicales et morphosyntaxiques d’un corpus. Pour Charlotte Lacoste, « cet outil permet de faire apparaître des éléments dont la plupart auraient été indécelables sans un logiciel de text mining ».
À titre d’exemple, et afin d’illustrer ce que cet outil est en mesure de faire et du type d’exploration qu’il est possible d’effectuer, le graphique ci-dessus montre de manière synthétique la structure lexicale globale du corpus. Charlotte Lacoste explique : « Sur ce graphique, chaque cercle de témoignage est représenté vectoriellement par les mots les plus fréquemment utilisés par les personnes. Nous voyons que les quatre cercles (identifiés par les numéros rouges sur le schéma) se répartissent de gauche à droite de l’axe 1. Nous voyons surtout que, parmi les mots les plus utilisés en cercle 1 (donc situés plutôt dans le cadran en bas à gauche), nous trouvons des pronoms personnels « nous », « vous », « il », « lui » et des termes plutôt concrets, qui ont trait au champ lexical de la temporalité : « heures », « moment ». Alors que ceux du cercle 4 (à droite), donc les personnes qui se trouvent à distance de la capitale, correspondent au cadrage général de l’événement « France », « Paris », « attentats ». Nous pouvons également observer des répulsions lexicales statistiquement significatives. Nous voyons par exemple que le mot « peur » est situé en haut à droite, donc dans le cadran opposé au cercle 1. C’est intéressant pour nous, cela veut dire que c’est en cercle 1 que le mot « peur » est le moins utilisé, et que c’est en cercle 4 qu’il est le plus utilisé, donc par les personnes les plus éloignées des lieux des attentats ».
Pour la chercheuse, les perspectives d’analyse vont se démultiplier, « quand nous passerons, et c’est imminent, aux analyses en diachronie, nous pourrons mesurer l’évolution quantitative de l’usage individuel d’une forme lexicale. Étudier par exemple la fréquence de telle forme pronominale chez un patient TSPT sur 10 ans, mais aussi l’évolution de l’usage global de ces formes et observer le matériel lexical que la mémoire collective retient et celui qu’elle évacue, ou oublie ».
Le langage, marqueur du TPST
Robin Quillivic est data scientist, doctorant EPHE rattaché au Centre européen de sociologie et de science politique - CESSP (UMR 8209). Il travaille dans le cadre de sa thèse sur des données issues de l’Étude 1000 et des 200 volontaires ayant suivi le protocole biomédical REMEMBER. Ses travaux s’inscrivent dans le domaine de la psycholinguistique et plus particulièrement de la psycholinguistique automatique. Il explore le lien entre le langage et le TSPT en privilégiant les outils de l’intelligence artificielle. Un travail collaboratif qu’il mène avec deux psychiatres, Yann Auxéméry et Jacques Dayan. Ce dernier codirige sa thèse avec Salma Mesmoudi, ingénieur de recherche en intelligence artificielle à Paris 1 Panthéon-Sorbonne.
Robin Quillivic développe une approche très pratique pour essayer de créer de nouveaux indicateurs sur le TSPT, afin d’améliorer le soin à un niveau clinique, « nos travaux se placent du côté de la psychopathologie voire de la santé publique. Car dans le cas d’événements comme les attentats du 13 novembre ou une catastrophe naturelle générant soudainement des milliers de personnes traumatisées, il est impossible de trouver des milliers de psychiatres pour les prendre en charge. Il y a donc forcément un ordonnancement, un tri à effectuer. C’est sur la manière d’effectuer ce tri, en respectant au maximum la dignité des personnes, que nous travaillons ».
L’objet de la recherche de Robin Quillivic est de voir s’il est possible de faire du langage, un marqueur pour détecter ou suivre le développement du TPST. « Aujourd’hui, en santé mentale, il manque un outil qui serait en quelque sorte l’équivalent d’une prise de sang en santé traditionnelle. Il n’existe pas de dossier que pourrait se transmettre des psychiatres, avec des informations objectives permettant de suivre et d’évaluer les symptômes d’un patient. Lorsqu’un patient change de praticien, on constate beaucoup de pertes d’informations. Cet équivalent de la prise de sang est un rêve de beaucoup de psychiatres, il n’est pas encore créé et nous pensons qu’avec le langage il est possible de le créer. C’est le point de départ de notre recherche ». Pour le doctorant, le corpus de données issu des témoignages de l’Étude 1000 correspond parfaitement au besoin de cette recherche, « dans la littérature psycholinguistique, l’Étude 1000 n’a pas d’équivalent. C’est l’étude la plus importante car elle porte le récit d’un événement traumatisant caractérisé à la fois par une homogénéité temporelle (le récit est centré sur une période donnée), une homogénéité sur la source du traumatisme (les attentats) et si on focalise sur les personnes les plus exposées (celles du cercle 1), une homogénéité sur les données sociodémographiques. Le langage est un signal très bruité, très flou, qui dépend par exemple de l’éducation ou de la culture de chacun. Là, dans le cas des attentats du 13 novembre, cette homogénéité nous permet de proposer des caractéristiques de langage qui ne seront pas associées à ces caractéristiques sociodémographiques ».
Au niveau des résultats, les chercheurs ont notamment réussi à classer, selon quatre grandes catégories, le profil psycholinguistique du trouble de stress post-traumatique. Celles-ci sont présentées dans le schéma ci-dessous.
Pour en savoir davantage
Les résultats des recherches de Charlotte Lacoste sont présentés et détaillés dans la revue « Questions de communication ». Une première publication vient de paraître dans le numéro 45 : Charlotte L., Pincemin B., Heiden S., Klein-Peschanski C., Peschanski D. et Eustache F., Les mots du 13-Novembre, Questions de communication [En ligne], 45 | 2024. Elle sera complétée dans la prochaine livraison de la revue au 1er semestre 2025.
Les résultats des recherches de Robin Quillivic sont parus récemment dans la revue « Scientific reports » présentés publications parues récemment : Quillivic R., Gayraud F., Auxéméry Y., Vanni L., Peschanski D., Eustache F., Dayan J. et Mesmoudi S., Interdisciplinary approach to identify language markers for post-traumatic stress disorder using machine learning and deep learning. Scientific reports 14, 12468 (2024).
Site web du Programme 13-Novembre :
https://www.memoire13novembre.fr/