TXM

Logiciel d’analyse de textes

Responsable scientifique : Serge HEIDEN
Tarif : gratuit
Licence : diffusé sous licence open-source GNU GPL V3
Téléchargement : https://www.textometrie.org
Contact : textometrie groupes.renater.fr

Le logiciel TXM permet l’analyse de grands corpus de textes par l’usage combiné d’outils qualitatifs et quantitatifs. Il a été conçu pour reprendre la tradition lexicométrique dans un contexte nouveau : textes structurés et enrichis ; développement ouvert et communautaire.

En pratique

TXM existe en deux versions :

  • pour installation sur un ordinateur personnel (Windows, MacOS ou Linux)
  • ou bien sur un serveur Web (version portail).

Types de textes analysables

TXM permet l’analyse de textes dans tous types de format, du simple texte brut (.txt) aux textes encodés en XML selon les recommandations de la TEI, en passant par les textes synchronisés avec des enregistrements audio ou vidéo et les textes en plusieurs langues alignés au niveau d’une structure textuelles comme le paragraphe.

Portails TXM de l’IHRIM

Plusieurs projets de l’IHRIM ont des corpus sur des portails TXM :

Portails TXM au delà de l’IHRIM

Publications de recherche en lien avec TXM

Les données dans la recherche en sciences humaines et sociales

XVIIIèmes Rencontres du Réseau international francophone de recherche en éducation et formation, Colloque scientifique « Abondance, pertinence, éthique : Questionnement sur les données en recherche, en enseignement-apprentissage, en formation et dans les politiques éducatives », Réseau international francophone de recherche en éducation et formation; Université de Fribourg, Jul 2024, Fribourg, Suisse
Communication dans un congrès

Les mots du discours dans les textes légaux. Parcours de l'ancien français au français moderne

DIACHRO XI: le français en diachronie, DIACHRO, May 2024, Madrid, Espagne
Communication dans un congrès

Lexicométrie et militantisme : la résistance du mouvement activiste écologiste allemand Letzte Generation

Séminaire doctoral de linguistique, CeLiSo, Université de la Sorbonne, Mar 2024, Paris, France
Communication dans un congrès

Profiterole : un corpus morpho-syntaxique et syntaxique de français médiéval

Corpus, 2024, La constitution de corpus en diachronie longue. Méthodologies, objectifs et exploitations linguistiques et stylistiques, 25, pp.8538. ⟨10.4000/corpus.8538⟩
Article dans une revue

Voir en ligne : Site du projet