Accueil > Domaines > Analyse de textes

Analyse de textes

L’analyse de données textuelles est autant qualitative que quantitative.

Elle voit le jour en 1949, quand le jésuite Roberto Busa entreprend en collaboration avec IBM d’informatiser la génération de l’index de l’œuvre de Thomas d’Aquin. La lexicométrie évolue ensuite en intégrant l’analyse de données linguistiques. Avec les méthodes de la statistique textuelle, ces différents volets forment aujourd’hui la textométrie.

Les outils du domaine permettent de qualifier les éléments des textes à l’aide de catégories, puis de les quantifier en analysant leur répartition statistique. Certains excellent dans la gestion de corpus complexes, d’autres sont dotés de fonctionnalités mobilisant l’intelligence artificielle et de visualisation de données.

Sous-domaines

Gestion de corpus de textes

  • Hyperbase

    Faire des analyses de lexicométrie en profitant de fonctionnalités IA

    Logiciel, Application web | Logiciel open source/libre

    Hyperbase est une application dédiée à la textométrie, permettant l’analyse de corpus et la visualisation des données. Elle donne accès à des corpus déjà constitués, permet le travail avec de nouveaux corpus et combine des outils d’exploration avec une interface ergonomique. Des algorithmes de deep learning sont disponibles dans l’application web. Ils étendent les possibilités d’explorations des textes, dont le repérage automatique de motifs linguistiques profonds.

Textométrie

  • ANNIS

    Explorer et annoter des corpus linguistiques

    Logiciel, Application web | Logiciel open source/libre

    ANNIS (ANNotation of Information Structure) est une application permettant d’explorer des corpus linguistiques complexes. Elle répond au besoin d’interroger, de visualiser et d’annoter simultanément des données provenant de domaines aussi variés que la syntaxe, la sémantique, la morphologie, la prosodie, la référentialité, le lexique, etc. Pour les projets travaillant avec la langue parlée, le support des annotations audio / vidéo est également disponible.

  • CorTexT

    Analyser et visualiser des corpus et ensembles de données complexes

    Application web | Logiciel open source/libre

    La plateforme CorText propose des outils pour l’analyse et l’exploitation de données volumineuses générées par les nouvelles technologies de l’information et de la communication. La plateforme est capable de traiter des données non structurées pour identifier et visualiser les relations entre concepts et acteurs.

  • Geovistory

    Collecter, analyser, visualiser et publier des données de recherche

    Application web | Logiciel open source/libre

    Geovistory est une plateforme numérique conçue pour les historiens et chercheurs en sciences humaines. Elle permet de collecter, organiser, analyser et visualiser des données historiques et culturelles. La plateforme met l’accent sur la gestion des données relationnelles et spatiales traitées dans le cadre de projets de recherche.

  • Hyperbase

    Faire des analyses de lexicométrie en profitant de fonctionnalités IA

    Logiciel, Application web | Logiciel open source/libre

    Hyperbase est une application dédiée à la textométrie, permettant l’analyse de corpus et la visualisation des données. Elle donne accès à des corpus déjà constitués, permet le travail avec de nouveaux corpus et combine des outils d’exploration avec une interface ergonomique. Des algorithmes de deep learning sont disponibles dans l’application web. Ils étendent les possibilités d’explorations des textes, dont le repérage automatique de motifs linguistiques profonds.

  • IRaMuTeQ

    Analyser de manière statistique et quantitative des corpus textuels

    Logiciel | Logiciel open source/libre

    IRaMuTeQ est un logiciel de textométrié spécialisé dans l’analyse quantitative et statistique de corpus. Il privilégie l’analyse à réponses ouvertes de textes non-structurés et permet de faire des classifications thématiques.

  • TXM

    Analyser des corpus textuels dotés de métadonnées

    Logiciel | Logiciel open source/libre

    TXM est un logiciel libre d’analyse statistique et linguistique de corpus textuels. Il offre une interface conviviale et des outils puissants pour explorer, analyser et visualiser des textes dans différents formats.

Traduction

  • DeepL

    Traduire des textes en plus de 30 langues

    Logiciel, Application web | Freemium/Shareware

    DeepL est un service de traduction en ligne qui prend en charge plus de 30 langues, dont l’anglais, le français, l’espagnol, l’allemand, le japonais, l’arabe et le chinois. Il s’est imposé comme un outil de référence en raison de la qualité des traductions.

Illustration : Martin Grandjean, Wikimedia Commons, CC BY-SA 4.0.