Analyse de textes
L’analyse de données textuelles est autant qualitative que quantitative.
Elle voit le jour en 1949, quand le jésuite Roberto Busa entreprend en collaboration avec IBM d’informatiser la génération de l’index de l’œuvre de Thomas d’Aquin. La lexicométrie évolue ensuite en intégrant l’analyse de données linguistiques. Avec les méthodes de la statistique textuelle, ces différents volets forment aujourd’hui la textométrie.
Les outils du domaine permettent de qualifier les éléments des textes à l’aide de catégories, puis de les quantifier en analysant leur répartition statistique. Certains excellent dans la gestion de corpus complexes, d’autres sont dotés de fonctionnalités mobilisant l’intelligence artificielle et de visualisation de données.
Sous-domaines
- Gestion de corpus de textes /BOUCLE_verif_articles1>
- Textométrie /BOUCLE_verif_articles1>
- Traduction /BOUCLE_verif_articles1>
Gestion de corpus de textes
-
Hyperbase
Faire des analyses de lexicométrie en profitant de fonctionnalités IA
Logiciel, Application web | Logiciel open source/libre
Hyperbase est une application dédiée à la textométrie, permettant l’analyse de corpus et la visualisation des données. Elle donne accès à des corpus déjà constitués, permet le travail avec de nouveaux corpus et combine des outils d’exploration avec une interface ergonomique. Des algorithmes de deep learning sont disponibles dans l’application web. Ils étendent les possibilités d’explorations des textes, dont le repérage automatique de motifs linguistiques profonds.
Textométrie
-
ANNIS
Explorer et annoter des corpus linguistiques
Logiciel, Application web | Logiciel open source/libre
ANNIS (ANNotation of Information Structure) est une application permettant d’explorer des corpus linguistiques complexes. Elle répond au besoin d’interroger, de visualiser et d’annoter simultanément des données provenant de domaines aussi variés que la syntaxe, la sémantique, la morphologie, la prosodie, la référentialité, le lexique, etc. Pour les projets travaillant avec la langue parlée, le support des annotations audio / vidéo est également disponible.
-
CorTexT
Analyser et visualiser des corpus et ensembles de données complexes
Application web | Logiciel open source/libre
La plateforme CorText propose des outils pour l’analyse et l’exploitation de données volumineuses générées par les nouvelles technologies de l’information et de la communication. La plateforme est capable de traiter des données non structurées pour identifier et visualiser les relations entre concepts et acteurs.
-
Geovistory
Collecter, analyser, visualiser et publier des données de recherche
Application web | Logiciel open source/libre
Geovistory est une plateforme numérique conçue pour les historiens et chercheurs en sciences humaines. Elle permet de collecter, organiser, analyser et visualiser des données historiques et culturelles. La plateforme met l’accent sur la gestion des données relationnelles et spatiales traitées dans le cadre de projets de recherche.
-
Hyperbase
Faire des analyses de lexicométrie en profitant de fonctionnalités IA
Logiciel, Application web | Logiciel open source/libre
Hyperbase est une application dédiée à la textométrie, permettant l’analyse de corpus et la visualisation des données. Elle donne accès à des corpus déjà constitués, permet le travail avec de nouveaux corpus et combine des outils d’exploration avec une interface ergonomique. Des algorithmes de deep learning sont disponibles dans l’application web. Ils étendent les possibilités d’explorations des textes, dont le repérage automatique de motifs linguistiques profonds.
-
IRaMuTeQ
Analyser de manière statistique et quantitative des corpus textuels
Logiciel | Logiciel open source/libre
IRaMuTeQ est un logiciel de textométrié spécialisé dans l’analyse quantitative et statistique de corpus. Il privilégie l’analyse à réponses ouvertes de textes non-structurés et permet de faire des classifications thématiques.
-
TXM
Analyser des corpus textuels dotés de métadonnées
Logiciel | Logiciel open source/libre
TXM est un logiciel libre d’analyse statistique et linguistique de corpus textuels. Il offre une interface conviviale et des outils puissants pour explorer, analyser et visualiser des textes dans différents formats.
Traduction
-
DeepL
Traduire des textes en plus de 30 langues
Logiciel, Application web | Freemium/Shareware
DeepL est un service de traduction en ligne qui prend en charge plus de 30 langues, dont l’anglais, le français, l’espagnol, l’allemand, le japonais, l’arabe et le chinois. Il s’est imposé comme un outil de référence en raison de la qualité des traductions.