Serge Heiden

Research Officer / Ingénieur de recherche

Institution ou organisme de rattachement : ENS de Lyon

Équipe de site : ENS de Lyon

Statut : Ingénieurs, techniciens et administratifs

Coordonnées professionnelles :

slh ens-lyon.fr

Office phone : +33 4 37 37 63 12
Mobile phone : +33 6 22 00 38 83

Page personnelle : CV Serge Heiden HAL-SHS

Activités

[version française plus bas]

Serge Heiden is a research officer at the IHRIM laboratory, École normale supérieure de Lyon (France), and head of the Cactus research group.

He holds a PhD in Computer Science from the Pierre et Marie CURIE Paris 6 University. He has developed for two decades the methodology of textual corpus analysis called ’textometry’ through its implementation in several application software. He is involved in the activities of several digital humanities related national (CORLI - TGIR Huma-Num) and international (TEI) consortiums as well as conferences (JADT) and summer schools (MISAT). He regularly gives professional or university training courses.

Since 2007, thanks to the initial funding of an ANR project called ’Textométrie’, which lasted four years, he leads the development of the TXM platform for textual corpus analysis intended for both personal computers and web servers.

This platform combines classical qualitative (such as concordancers, word lists or hypertextual reading of texts) and quantitative (statistical cooccurrents, clustering, factorial analysis...) text analysis tools with rich representations of texts (encoded according to different idioms of the TEI) and enriched by natural language processing tools (lemmatizers, syntactic parsers ...).

This platform is also the place of prototyping of numerous experiments in the field of rich, multimodal and multimedia digital philology, quantitative analysis of complex textual planes and automatic linguistic enrichment for text corpora in many ancient and contemporary languages (from transcriptions of cuneiform tablets from the second millennium BC to tweets of social networks).

Current developments in the platform are carried out in the following ANR projects :
#ANR-14-FRAL-0006 PaLaFra (2015 - 2018) : open-source lemmatization of medieval French ;
#ANR-15-CE38-0008 Democrat (2016 - 2019) : assisted annotation of co-reference chains ;
#ANR-16-CE38-0010 Profiterole (2017 - 2020) : open-source syntactic parsing of old French.

More information on the Textométrie research project web site : www.textometrie.org.

Serge Heiden est ingénieur de recherche au laboratoire IHRIM <http://ihrim.ens-lyon.fr> , École normale supérieure de Lyon (France), et responsable du groupe de recherche Cactus.

Il est titulaire d’un doctorat en Informatique de l’Université Pierre et Marie CURIE Paris 6. Il a développé pendant deux décennies la méthodologie d’analyse de corpus textuels appelée ‘textométrie’ à travers son implémentation dans plusieurs logiciels d’application. Il est impliqué dans les activités de plusieurs consortium d’humanités numériques nationaux (CORLI - TGIR Huma-Num) et internationaux (TEI) ainsi que de conférences (JADT) et écoles d’été (MISAT). Il donne régulièrement des cours de formation professionnelle ou universitaire.

Depuis 2007, grâce au financement initial d’un projet ANR appelé ‘Textométrie’ et qui a duré quatre ans, il anime le développement de la plateforme TXM d’analyse de corpus textuels destinée à la fois aux ordinateurs personnels de chercheurs et à des serveurs web.

Cette plateforme combine des outils d’analyse de textes classiques qualitatifs (comme les concordanciers, les listes de mots ou la lecture hypertextuelle d’éditions de textes) et quantitatifs (cooccurrents statistiques, classification, analyse factorielle...) avec des représentations riches des textes (encodés selon différents idiomes de la TEI) et enrichis par des outils de traitement automatique de la langue (lemmatiseurs, analyseurs syntaxiques...).

Cette plateforme est également le lieu de prototypage de nombreuses expérimentations dans le domaine de la philologie numérique riche, multimodale et multimédia, l’analyse quantitative de plans textuels complexes et l’enrichissement linguistique automatique pour des corpus de textes en de nombreuses langues anciennes et contemporaines (de transcriptions de tablettes cunéiformes du II^e mil. av. J.-C. aux tweets des réseaux sociaux).

Les développements en cours dans la plateforme sont notamment réalisés au sein des projets ANR suivants :
#ANR-14-FRAL-0006 PaLaFra (2015 – 2018) : lemmatisation open-source du français médiéval ;
#ANR-15-CE38-0008 Democrat (2016 – 2019) : annotation assistée de chaînes de co-références ;
#ANR-16-CE38-0010 Profiterole (2017 – 2020) : analyse syntaxique open-source de l’ancien français.

Plus d’informations sur le site web du projet de recherche Textométrie : www.textometrie.org.

Dernières publications

CLS INFRA: Leveraging Literary Methods for FAIR(er) Science

Julie M. Birkholz , Ingo Börner , Floor Buschenhenke , Joanna Byszuk , Sally Chambers , Vera Maria Charvat , Silvie Cinková , Tess Dejaeghere , Anna Dijkstra , Julia Dudar , Matej Ďurčo , Maciej Eder , Jennifer Edmond , Evgeniia Fileva , Frank Fischer , Vicky Garnett , Françoise Gouzi , Serge Heiden , Sarah Hoover , Michal Kren , Bartłomiej Kunda , Els Lefever , Michal Mrugalski , Ciara L. Murphy , Carolin Odebrecht , Eliza Papaki , Marco Raciti , Emily Ridge , Salvador Ros , Christof Schöch , Artjoms Šeļa , Toma Tasovac , Justin Tonra , Erzsébet Tóth-Czifra , Peer Trilcke , Karina van Dalen-Oskam , Vera Yakupova , Joris J. van Zundert

Digital Humanities Conference 2025, Jul 2025, Lisbon, Portugal. 2025

Poster de conférence

hal-05098718

TXM

Serge Heiden , Matthieu Decorde , Sébastien Jacquot

2025, ⟨swh:1:dir:b403a2d6d7b7dd3b5d4fbdabe0d1930a58ee485e;origin=https://gitlab.huma-num.fr/txm/txm-src.git;visit=swh:1:snp:89fd060865ce5b7e9c629af765b408beebf759bd;anchor=swh:1:rev:f1918b6d36d2dd0657e9cbe1dd431bba4d067035⟩

Logiciel

halshs-05034904

Table ronde : Analyse automatique du discours, Tal et Textométrie

Virginie Lethier , Serge Heiden , Jacqueline Léon , Damon Mayaffre

Colloque international « Actualité de Michel Pêcheux », Université Paris Nanterre; Université Paris-Est Créteil, Feb 2025, Nanterre, France

Communication dans un congrès

hal-05012024

Les mots du 13-Novembre (2). La mémoire collective à l’épreuve de la textométrie

Charlotte Lacoste , Bénédicte Pincemin , Serge Heiden , Denis Peschanski , Carine Klein-Peschanski , Francis Eustache

Questions de communication, 2024, Le fandom, côté obscur, 46, pp.277-298. ⟨10.4000/12yg1⟩

Article dans une revue

hal-04858960

Cracking the trauma narratives. A semi-automated approach

Lucie Quibeuf , Amaury Mengin , Pierre Orselli , Bénédicte Pincemin , Serge Heiden , Fabrice Berna , Denis Peschanski , Francis Eustache , Peggy Quinette

Meeting The Normandy Landings Revisited: 80 Years of Traumatic Stress Studies, and Counting, May 2024, Caen, France.

Poster de conférence

hal-04868049

Analyse transdisciplinaire d'un corpus d'actualités filmées

Jean Carrive , Abdelkrim Beloued , Pascale Goetschel , Serge Heiden , Steffen Lalande , Pasquale Lisena , Franck Mazuet , Sylvain Meignier , Bénédicte Pincemin , Raphaël Troncy

Scopsi, Claire; Roullier, Clothilde; Sin Blima-Barru, Martine; Vasseur, Édouard. Les nouveaux paradigmes de l’archive, Publications des Archives nationales, pp.40-67, 2024, Actes, 978-2-86000-390-2. ⟨10.4000/books.pan.7194⟩

Chapitre d'ouvrage

hal-04875186

Profiterole : un corpus morpho-syntaxique et syntaxique de français médiéval

Sophie Prévost , Loïc Grobol , Mathieu Dehouck , Alexei Lavrentiev , Serge Heiden

Corpus, 2024, La constitution de corpus en diachronie longue. Méthodologies, objectifs et exploitations linguistiques et stylistiques, 25, pp.8538. ⟨10.4000/corpus.8538⟩

Article dans une revue

hal-04681591

Collective memories and social roles: the case of the Paris terrorist attacks of 13 November 2015

Jean-François Orianne , Serge Heiden , Carine Klein-Peschanski , Francis Eustache , Denis Peschanski

Frontiers in Sociology, 2024, 9, pp.1388380. ⟨10.3389/fsoc.2024.1388380⟩

Article dans une revue

hal-04586206

Les mots du 13-Novembre. Une première approche textométrique de l'« Étude-1000 »

Charlotte Lacoste , Bénédicte Pincemin , Serge Heiden , Denis Peschanski , Carine Klein-Peschanski , Francis Eustache

Questions de communication, 2024, Journalisme culturel en mutation, 45, pp.221-244. ⟨10.4000/11wxe⟩

Article dans une revue

hal-04690853

Mémoires des attentats terroristes du 13-Novembre 2015 : ce que peut nous apprendre l’analyse de discours

Denis Peschanski , Bénédicte Pincemin , Serge Heiden , Charlotte Lacoste

Biologie Aujourd'hui, 2023, 217 (1-2), pp.113-121. ⟨10.1051/jbio/2023017⟩

Article dans une revue

hal-04154303

How the traumatic event is integrated into the narrative self? Adapted and Semiautomatic Coding Systems of Trauma Narrative

Lucie Quibeuf , Amaury Mengin , Denis Peschanski , Carine Klein-Peschanski , Serge Heiden , Fabrice Berna , Francis Eustache , Peggy Quinette

Congrés international de Lille : "Narrative identity", Jun 2023, Lille, France

Poster de conférence

hal-04538225

The textometric concept of active corpus

Bénédicte Pincemin , Serge Heiden , Franck Mazuet

16th International Conference on Statistical Analysis of Textual Data JADT 2022, VADISTAT - Per Simona Balbi, Univ. of Naples Federico II, Jul 2022, Naples, Italy. pp.691-698

Communication dans un congrès

halshs-03667319

Transdisciplinary Analysis of a Corpus of French Newsreels: The ANTRACT Project

Jean Carrive , Abdelkrim Beloued , Pascale Goetschel , Serge Heiden , Antoine Laurent , Pasquale Lisena , Franck Mazuet , Sylvain Meignier , Bénédicte Pincemin , Géraldine Poels , Raphaël Troncy

Digital Humanities Quarterly, 2021, Special Issue on AudioVisual Data in DH, 15 (1)

Article dans une revue

hal-03166755

Enjeux philologiques, linguistiques et informatiques de la philologie numérique : l’exemple de la segmentation des mots

Alexei Lavrentiev , Céline Guillot-Barbance , Serge Heiden

Diachroniques. Revue de Linguistique française diachronique, 2021, 8, pp.77-102

Article dans une revue

halshs-03243774

Changes over 10 years in the retelling of the flashbulb memories of the attack of 11 September 2001

Fanny Dégeilh , Grégory Lecouvey , William Hirst , Serge Heiden , Bénédicte Pincemin , Matthieu Decorde , Robert Meksin , Francis Eustache , Denis Peschanski

Memory, 2021, 29 (8), pp.1006-1016. ⟨10.1080/09658211.2021.1955934⟩

Article dans une revue

hal-03455509

Textometry on Audiovisual Corpora

Bénédicte Pincemin , Serge Heiden , Matthieu Decorde

15th International Conference on Statistical Analysis of Textual Data JADT 2020, Laboratoire d’Etudes et Recherches Appliquées en Sciences Sociales (Lerass), EA827, Université de Toulouse 3 - Paul Sabatier, Jun 2020, Toulouse, France

Communication dans un congrès

halshs-02779055

Introduction historique et méthodologique à la textométrie et au logiciel TXM

Serge Heiden

Semaine Data-SHS, PUDD; PROGEDO, Dec 2020, Dijon, France

Communication dans un congrès

hal-04006307

Collective memory shapes the organization of individual memories in the medial prefrontal cortex

Pierre Gagnepain , Thomas Vallée , Serge Heiden , Matthieu Decorde , Jean-Luc Gauvain , Antoine Laurent , Carine Klein-Peschanski , Fausto Viader , Denis Peschanski , Francis Eustache

Nature Human Behaviour, 2019, 4 (2), pp.189-200. ⟨10.1038/s41562-019-0779-z⟩

Article dans une revue

halshs-02416130

L'évolution de la mémoire de la Shoah au prisme de la statistique textuelle

Damon Mayaffre , Bénédicte Pincemin , Serge Heiden , Philippe Weyl

Denis Peschanski; Brigitte Sion. La vérité du témoin, 2, Hermann Éditeurs; Institut National de l’Audiovisuel, pp.93-124, 2018, Mémoire et mémorialisation, 9782705697365

Chapitre d'ouvrage

hal-01890536

XML-TEI-URS: using a TEI format for annotated linguistic resources

Loïc Grobol , Frédéric Landragin , Serge Heiden

CLARIN Annual Conference 2018, Oct 2018, Pisa, Italy

Communication dans un congrès

hal-01827563

Métopes + TXM: Integrating Text Publishing and Text Analysis Tools Based on TEI Encoding

Alexei Lavrentiev , Serge Heiden , Charles Bourdot

18th Annual TEI Conference and Memberrs' Meeting, Sep 2018, Tokyo, Japan. pp.255-256

Communication dans un congrès

halshs-03363491

Textometric Exploitation of Coreference-annotated Corpora with TXM: Methodological Choices and First Outcomes

Matthieu Quignard , Serge Heiden , Frédéric Landragin , Matthieu Decorde

Fourteenth International Conference on the Statistical Analysis of Textual Data, Jun 2018, Rome, Italy. pp.610-615

Communication dans un congrès

hal-01814858

Annotation-based Digital Text Corpora Analysis within the TXM Platform

Serge Heiden

14th International Conference on the Statistical Analysis of Textual Data / 14es Journées internationales d'Analyse statistique des Données Textuelles (JADT 2018), DII– Department of Enterprise Engineering “Mario Lucertini” Tor Vergata University; DSS– Department of Statistical Sciences, Sapienza University, Rome, Jun 2018, Rome, Italy. pp.367-374

Communication dans un congrès

hal-02015898

Base de français médiéval : une base de référence de sources médiévales ouverte et libre au service de la communauté scientifique

Céline Guillot-Barbance , Serge Heiden , Alexei Lavrentiev

Diachroniques. Revue de Linguistique française diachronique, 2018, Les états anciens des langues à l’heure du numérique, 7, pp.168-184

Article dans une revue

halshs-01809581

Diachronie de l'oral représenté

Céline Guillot-Barbance , Alexei Lavrentiev , Serge Heiden , Bénédicte Pincemin

Wendy Ayres-Benett; Anne Carlier; Julie Glikman; Thomas Rainsford; Gilles Siouffi; Carine Skupien Dekens. Nouvelles voies d’accès au changement linguistique. Actes du colloque de la SIDF, Classiques Garnier, pp.279-296, 2018, Nouvelles voies d’accès au changement linguistique. Actes du colloque de la SIDF, ⟨10.15122/isbn.978-2-406-06946-1.p.0279⟩

Chapitre d'ouvrage

halshs-01313822

Chaînes de référence, structuration textuelle et genres textuels en diachronie : premières explorations du corpus Democrat

Matthieu Decorde , Céline Guillot-Barbance , Serge Heiden , Matthieu Quignard

Journée d’étude « Référence, coréférence et structure textuelle », Nov 2017, Lyon, France

Communication dans un congrès

hal-01680577

Interoperable annotation of (co)references in the Democrat project

Loïc Grobol , Frédéric Landragin , Serge Heiden

Thirteenth Joint ISO-ACL Workshop on Interoperable Semantic Annotation, ACL Special Interest Group on Computational Semantics (SIGSEM); ISO TC 37/SC 4 (Language Resources) WG 2, Sep 2017, Montpellier, France

Communication dans un congrès

hal-01583527

Building an Open Morphological Lexicon and Lemmatizing Old French Texts with the TXM Platform

Alexei Lavrentiev , Serge Heiden , Matthieu Decorde

Corpus linguistics - 2017, St-Petersburg State University; Institute for Linguistic Studies (RAS); Herzen State Pedagogical University of Russia, Jun 2017, St-Pétersbourg, Russia. pp.48-52

Communication dans un congrès

halshs-01591122

La " philologie numérique " : tentative de définition d'un nouvel objet éditorial

Céline Guillot-Barbance , Alexei Lavrentiev , Thomas Rainsford , Christiane Marchello-Nizia , Serge Heiden

Richard Trachsler; Frédéric Duval; Lino Leonardi. Actes du XXVIIe Congrès international de linguistique et de philologie romanes (Nancy, 15-20 juillet 2013). Section 13 : Philologie textuelle et éditoriale, ATILF/SLR, pp.143-154, 2017, 979-10-91460-29-3

Chapitre d'ouvrage

halshs-00846767

Retour de pêche

Yves-François Le Lay , Serge Heiden , Luc Merchez , Bénédicte Pincemin

Corpus de textes : composer, mesurer, interpréter, ENS Editions, pp.117-134, 2016, 978-2-84788-827-0. ⟨10.4000/books.enseditions.7360⟩

Chapitre d'ouvrage

halshs-01423605

Serge Heiden

Research Officer / Ingénieur de recherche

Activités

Dernières publications

CLS INFRA: Leveraging Literary Methods for FAIR(er) Science

TXM

Table ronde : Analyse automatique du discours, Tal et Textométrie

Les mots du 13-Novembre (2). La mémoire collective à l’épreuve de la textométrie

Cracking the trauma narratives. A semi-automated approach

Analyse transdisciplinaire d'un corpus d'actualités filmées

Profiterole : un corpus morpho-syntaxique et syntaxique de français médiéval

Collective memories and social roles: the case of the Paris terrorist attacks of 13 November 2015

Les mots du 13-Novembre. Une première approche textométrique de l'« Étude-1000 »

Mémoires des attentats terroristes du 13-Novembre 2015 : ce que peut nous apprendre l’analyse de discours

How the traumatic event is integrated into the narrative self? Adapted and Semiautomatic Coding Systems of Trauma Narrative

The textometric concept of active corpus

Transdisciplinary Analysis of a Corpus of French Newsreels: The ANTRACT Project

Enjeux philologiques, linguistiques et informatiques de la philologie numérique : l’exemple de la segmentation des mots

Changes over 10 years in the retelling of the flashbulb memories of the attack of 11 September 2001

Textometry on Audiovisual Corpora

Introduction historique et méthodologique à la textométrie et au logiciel TXM

Collective memory shapes the organization of individual memories in the medial prefrontal cortex

L'évolution de la mémoire de la Shoah au prisme de la statistique textuelle

XML-TEI-URS: using a TEI format for annotated linguistic resources

Métopes + TXM: Integrating Text Publishing and Text Analysis Tools Based on TEI Encoding

Textometric Exploitation of Coreference-annotated Corpora with TXM: Methodological Choices and First Outcomes

Annotation-based Digital Text Corpora Analysis within the TXM Platform

Base de français médiéval : une base de référence de sources médiévales ouverte et libre au service de la communauté scientifique

Diachronie de l'oral représenté

Chaînes de référence, structuration textuelle et genres textuels en diachronie : premières explorations du corpus Democrat

Interoperable annotation of (co)references in the Democrat project

Building an Open Morphological Lexicon and Lemmatizing Old French Texts with the TXM Platform

La " philologie numérique " : tentative de définition d'un nouvel objet éditorial

Retour de pêche

Nous contacter

Tutelles

Accès direct