BnF DataLab
Le DataLab de la BnF est un pôle de référence pour les chercheurs souhaitant exploiter les collections numériques de la BnF avec des outils et méthodes avancées d’analyse et de traitement des données.
La constitution du DataLab a été initiée en 2019 et officialisée en 2021 dans le cadre du programme national CollEx-Persée. Il répond à une demande croissante des chercheurs pour un accès facilité aux données issues des collections de la BnF.
Le DataLab soutient des recherches en :
- Humanités numériques : exploration et analyse de corpus textuels, iconographiques et audiovisuels.
- Science des données : exploitation des métadonnées? des catalogues et des bases de données de la BnF.
- Intelligence artificielle : reconnaissance d’images et de texte, analyse automatique de contenus numérisés.
- Dépôt légal du web : étude des archives du web français collectées par la BnF.
Il met à disposition des corpus de recherche, avec extraction et fourniture de collections issues de Gallica, du dépôt légal du web, des catalogues de la BnF et d’autres bases de données.
Il propose une infrastructure dotée de serveurs et d’outils spécialisés pour le traitement des données et un accompagnement scientifique pour la modélisation de données, la fouille de textes et l’analyse d’images. Le DataLab organise des formations et séminaires. Il soutient le développement d’outils numériques permettant d’explorer des plateformes et d’analyser de grands corpus.
Le DataLab publie des appels à projets en collaboration avec Huma-Num.
Porteurs et partenaires
Le DataLab est un service de la BnF qui travaille en collaboration avec des institutions de recherche et des projets nationaux et européens en science ouverte et en numérisation du patrimoine (dont Huma-Num et OPERAS).
Des collaborations ont été engagées avec des bibliothèques et centres d’archives pour la valorisation des données culturelles.
Article publié le 2 avril 2025