Pandoræ
Pandoræ, une plateforme utilisable exclusivement à la BnF, permet la constitution et l’exploration de corpus web français en partant d’un mot clé ou d’une expression. L’application parcourt des catalogues et bases de données et importe les résultats dans Zotero. Le résultat peut être exploré à l’aide d’outils de visualisation.
Caractéristiques
Pandoræ, utilisable au BnF DataLab, offre une gamme de connexions préétablies avec des services et bases de données, tels que :
- services scientométriques comme Scopus, Web of Science ou ISTEX ;
- des dépôts institutionnels tels que les Archives Web de la Bibliothèque de France ou les données sur les débats parlementaires français ;
- des médias sociaux tels que Twitter ;
- des données d’essais cliniques ;
- des données de recherche en ligne.
Contrairement à Hyphe qui explore les archives du web entier, Pandoræ a été conçu spécifiquement pour les corpus du web français.
Les données Zotero, les visualisations et statistiques produites peuvent être exportées hors de la BnF et être publiées.
Fonctionnement
Lancer une requête
Pandoræ permet de lancer une requête à partir d’un mot clé, d’une expression, ou de requêtes plus complexes en déterminant une période, un type de collection, les sources à explorer et le format des fichiers recherchés. Un clic sur une source dans l’arbre permet de la sélectionner. Pandoræ n’est pas capable de traiter des requêtes qui renvoient plus de 50 000 résultats.
Récupérer et normaliser les résultats
Les résultats peuvent être importés dans Zotero par un simple clic sur l’étiquette "Zotero" de l’arbre. Les données sont alors normalisées, c’est-à-dire configurées pour correspondre aux champs présents dans ce logiciel. Ce processus peut prendre un certain temps. Pandoræ importe uniquement les métadonnées? et les résumés, pas les contenus des publications.
Analyse et visualisation du résultat
Pandoræ permet de créer différents types de visualisations (chronotype, anthrotype, archotype) permettant de mettre en évidence des relations, l’évolution dans le temps, la fréquence, les sujets associés, etc.
Aide et tutoriels
Présentation
Dorothée Benhamou-Suesser, BNF : PANDORÆ, un logiciel pour récupérer, normaliser et explorer des corpus
Vidéos
Guillaume Levrier : Outils pour la constitution et l’exploration de corpus issus des archives du web à destination des chercheurs : PANDORÆ
Porteurs et partenaires
Pandoræ a été développé en 2018 par Guillaume Levrier, chercheur associé au CEVIPOF et à la BnF. Il a été publié sous licence MIT.
Article publié le 2 avril 2025 Dernière mise à jour : 11 septembre 2025