L’outil
  • Type : Logiciel
  • Licence : Logiciel open source/libre
Porteurs et partenaires
Domaines concernés
Accueil > Outils > TXM

TXM

TXM est un logiciel libre d’analyse statistique et linguistique de corpus textuels. Il offre une interface conviviale et des outils puissants pour explorer, analyser et visualiser des textes dans différents formats.

Caractéristiques

TXM permet de réaliser des enquêtes textométriques et statistiques, comme les logiciels Hyperbase et Annis, en privilégiant l’étude textométrique de corpus structurés avec des métadonnées?. Il est complémentaire à IRaMuTeQ, application spécialisée dans l’analyse statistique et quantitative de textes.
Le logiciel est disponible pour Windows, Mac OS X et Linux et fonctionne aussi comme plateforme web, hébergée par Huma-Num.

Fonctionnement

Importation et préparation des corpus
TXM permet d’importer des corpus textuels dans différents formats (TXT, XML?-TEI, Word, etc.). Une fois les données importées, elles sont préparées et indexées pour faciliter les analyses ultérieures. Les utilisateurs peuvent structurer leurs corpus en définissant des métadonnées (auteur, date, genre, etc.) pour des analyses plus ciblées.

Exploration des données
TXM propose plusieurs outils pour explorer les textes et leurs métadonnées. Les utilisateurs peuvent naviguer dans les corpus, effectuer des recherches par mots ou expressions, et visualiser les occurrences dans leur contexte.

Analyse statistique des textes
Le logiciel intègre plusieurs méthodes statistiques avancées, telles que :

  • l’analyse de fréquences pour identifier les mots les plus fréquents ou les plus spécifiques,
  • la recherche de cooccurrences pour repérer les associations lexicales,
  • l’analyse factorielle pour découvrir des relations entre les textes ou des groupes de textes.

Visualisation des résultats
TXM propose des outils de visualisation comme

  • les graphes de cooccurrences pour représenter les relations entre les mots,
  • les nuages de mots pour illustrer les termes dominants,
  • les cartes ou graphiques issus d’analyses statistiques.

Personnalisation et scripts
TXM prend en charge des personnalisations via des scripts en langage R? ou en Python? pour effectuer des analyses spécifiques ou développer de nouvelles fonctionnalités.
Les utilisateurs avancés peuvent ainsi adapter le logiciel à leurs besoins et augmenter ses capacités.

Exportation des résultats
Les résultats des analyses (données brutes, graphiques et tableaux) peuvent être exportés dans divers formats courants (CSV, PNG, PDF, etc.). Cette flexibilité facilite leur intégration dans des rapports de recherche ou des publications.

Collaboration et publication en ligne
Un portail TXM permet de mettre en ligne des corpus préparés avec la version bureau du logiciel. Il donne accès aux données ou à leur analyse au moyen d’un navigateur web.

Aide et tutoriels

Documentation officielle
Manuels et tutoriels vidéo
Démonstration du logiciel et portail TXM hébergé à Huma-num
Ateliers TXM

Forums et entreaide
Liste de discussion
Wiki d’utilisateurs

Vidéos
Bénédicte Pincemin : Atelier d’initiation à TXM

Porteurs et partenaires

Développé initialement par l’ENS de Lyon dans le cadre de l’ANR Textométrie pour le corpus de la Base de Français médiéval, TXM a été mis à disposition de la recherche en tant que logiciel open source. La plateforme web de TXM est hébergée par Huma-Num.

Article publié le 24 janvier 2025
Dernière mise à jour : 8 septembre 2025

Les logos et marques mentionnés sont la propriété de leurs titulaires respectifs. Leur utilisation sur ce site est uniquement à des fins d’information.