TXM

Logiciel d’analyse de textes

Responsable scientifique : Serge HEIDEN
Tarif : gratuit
Licence : diffusé sous licence open-source GNU GPL V3
Téléchargement : https://www.textometrie.org
Contact : textometrie groupes.renater.fr

Le logiciel TXM permet l’analyse de grands corpus de textes par l’usage combiné d’outils qualitatifs et quantitatifs. Il a été conçu pour reprendre la tradition lexicométrique dans un contexte nouveau : textes structurés et enrichis ; développement ouvert et communautaire.

En pratique

TXM existe en deux versions :

  • pour installation sur un ordinateur personnel (Windows, MacOS ou Linux)
  • ou bien sur un serveur Web (version portail).

Types de textes analysables

TXM permet l’analyse de textes dans tous types de format, du simple texte brut (.txt) aux textes encodés en XML selon les recommandations de la TEI, en passant par les textes synchronisés avec des enregistrements audio ou vidéo et les textes en plusieurs langues alignés au niveau d’une structure textuelles comme le paragraphe.

Portails TXM de l’IHRIM

Plusieurs projets de l’IHRIM ont des corpus sur des portails TXM :

Portails TXM au delà de l’IHRIM

Publications de recherche en lien avec TXM

TXM, un logiciel de textométrie open-source pour l'analyse de données textuelles en sciences humaines et sociales

Semaine DataSHS 2024 : Traiter et analyser des données en sciences humaines et sociales, MSH Lyon Saint-Étienne; IR* Progedo UAR2506, Dec 2024, Saint-Étienne et Lyon, France
Communication dans un congrès

“Espèce de has been” : violences verbales et stratégies de remédiation sur un chat de prévention du suicide

Discours institutionnels : entre extrémisation et réparation, Università di Genova; R2DIP; DORIF; ARENAS, Dec 2024, Genova (online), Italie
Communication dans un congrès

L'interdiscursivité au service d'un ethos militant écologistes dans les collectifs français et allemands

Contester le pouvoir, contester le savoir, Laboratoire IMAGER, Université Paris Créteil, Nov 2024, Créteil, France
Communication dans un congrès

Outil de textométrie dans la préparation lexicographique bilingue : élaboration d’un dictionnaire français-chinois prototypique des expressions figées utilisées dans des situations de communication économiques

Lsp-Num : langues de spécialité et numérique, ILCEA4 (Université Grenoble Alpes); UR 1162 - CRINI (Nantes Université); FoAP (CNAM Paris), Oct 2024, Grenoble, France
Communication dans un congrès

Modèles de cooccurrences collostructionnels pour l'étude des expressions préfabriquées de l'oral

Langues & Langage à la croisée des Disciplines 1ère Rencontre annuelle LLcD, Sep 2024, Paris, France
Communication dans un congrès

Les données dans la recherche en sciences humaines et sociales

XVIIIèmes Rencontres du Réseau international francophone de recherche en éducation et formation, Colloque scientifique « Abondance, pertinence, éthique : Questionnement sur les données en recherche, en enseignement-apprentissage, en formation et dans les politiques éducatives », Réseau international francophone de recherche en éducation et formation; Université de Fribourg, Jul 2024, Fribourg, Suisse
Communication dans un congrès

Les mots du discours dans les textes légaux. Parcours de l'ancien français au français moderne

DIACHRO XI: le français en diachronie, DIACHRO, May 2024, Madrid, Espagne
Communication dans un congrès

Voir en ligne : Site du projet