CorTexT
La plateforme CorText propose des outils pour l’analyse et l’exploitation de données volumineuses générées par les nouvelles technologies de l’information et de la communication. La plateforme est capable de traiter des données non structurées pour identifier et visualiser les relations entre concepts et acteurs.
Caractéristiques
CorText est une application créée pour la recherche qui permet l’analyse numérique, relationnelle et géographique de données dans une dimension donnée (sujet, région, débat, controverse, discipline). Elle permet de fournir des données pour procéder à leur analyse en employant des outils pour la visualisation et la cartographie de la recherche, de controverses et de sujets particuliers.
Les outils les plus importants sont regroupés dans le CorText Manager qui permet de soumettre un corpus à différents types d’exploitations et d’exploitations.
L’utilisation de CorTexT nécessite la création d’un compte utilisateur.
Fonctionnement
Créer un projet
Une fois identifié, la première étape consiste à créer un ou plusieurs projets (dossiers). Ces projets peuvent être partagés pour un travail collaboratif, archivés, téléchargés et supprimés. Chaque projet sert de cadre organisationnel pour structurer les corpus et les analyses associées.
Importer les données à analyser
La création d’un corpus se fait par le téléchargement de fichiers CSV ou de fichiers bruts issus de diverses bases de données bibliographiques scientifiques (ISI Thomson Web of Science, PubMed, etc.). Les fichiers doivent être compressés au format ZIP avant l’importation. Une fois importées, les données sont automatiquement converties par CorText dans un format exploitable par ses outils.
Analyse textuelle des données
Après la transformation des fichiers texte en base de données standardisée, il est possible d’effectuer une série d’analyses reposant sur des techniques variées, telles que le distant reading, Word2Vec, HDBScan, l’analyse de réseaux sémantiques et d’autres méthodes d’exploration textuelle.
Statistiques, chronologies et représentations
CorText permet de produire des analyses statistiques avancées, des représentations graphiques d’entités ainsi que des chronologies basées sur la reconstruction de phylogénies. Ces visualisations facilitent l’exploration des tendances et des dynamiques d’évolution des concepts ou des acteurs étudiés.
Exporter les résultats
Les résultats obtenus peuvent être exportés dans différents formats compatibles avec des logiciels tiers, facilitant ainsi leur réutilisation et leur intégration dans d’autres environnements d’analyse ou de visualisation.
Aide et tutoriels
Documentation officielle
CorTexT Documentation (en)
Comment utiliser CorText Manager (fr)
Tutoriels & FAQ
Vidéos
Marc Barbier : CorText Manager : l’extraction d’information et l’analyse socio-sémantique en SHS
CorTexT : Corpus Explorer Tutorial (en)
Lionard Villard : Présentation de CorteTexT
Porteurs et partenaires
Développé à partir de 2008 par des chercheurs et ingénieurs de l’IFRIS et l’INRA, CorTexT est maintenu depuis 2015 par le laboratoire LISIS et l’INRA.
Article publié le 13 mars 2025 Dernière mise à jour : 10 septembre 2025
