Recherche Data Gouv, la plateforme nationale des données de la recherche française

Carole Tisserand-Barthole
Bases no
407
publié en
2022.10
987
Acheter ce no
Tags
information scientifique et technique | open data
Recherche Data Gouv, la plateforme nationale des données de ... Image 1

Cela fait des années que le mouvement de l’open dans le monde scientifique et académique ne cesse de prendre de l’ampleur : l’open access d’abord puis l’open citations, mais aussi l’ouverture des données de la recherche,

Pour rappel, les données de la recherche correspondent à « l’ensemble des informations collectées, observées ou créées sous une forme numérique ou non, par les chercheurs dans le cadre d’un projet de recherche et à partir desquelles ils bâtissent leurs hypothèses. » (source : https://bu.univ-amu.libguides.com/donneesrecherche/definition-DR).

Il n’existait pas jusqu’ici d’initiative nationale pour la diffusion et la recherche des données de la recherche française (alors qu’il existe depuis des années un portail national pour les données publiques issues des collectivités et de l’État appelé data.gouv.fr). C’est désormais chose faite avec le lancement le 8 juillet dernier de la plateforme Recherche Data Gouv (https://entrepot.recherche.data.gouv.fr/).

À la découverte de Recherche Data Gouv

Pour les chercheurs et acteurs de la recherche française, la plateforme a plusieurs buts : donner une meilleure visibilité aux données de la recherche française et plus largement à la recherche française en général, mais aussi proposer « une solution souveraine permettant à la recherche française de conserver la maîtrise des données qu’elle produit ».

Pour les professionnels de l’information et de la veille, cela ouvre surtout la possibilité de retrouver en un seul et même endroit des données qui n’étaient par le passé pas diffusées ou bien dispersées dans différents entrepôts de données.

À ce jour, Recherche Data Gouv contient un peu plus de 400 dataverses (c’est-à-dire des entrepôts thématiques qui peuvent être spécialisés sur un thème bien précis, correspondre aux données produites par un laboratoire de recherche ou bien à toutes les données produites par un organisme ou une université) et plus de 1 600 datasets (les fameux jeux de données).

Le plus gros fournisseur de la plateforme est aujourd’hui l’INRAE, mais on trouve également quelques autres acteurs comme le CIRAD, l’Institut de recherche pour le développement, l’Université Grenoble Alpes, l’Université de Lille ou encore l’Université de Nanterre, de Lorraine, etc.

Quelles fonctionnalités de recherche ?

La plateforme offre de multiples fonctionnalités de recherche efficaces : un moteur de recherche simple qui permet ensuite de filtrer les résultats par type de données de la recherche (dataverse, dataset ou fichier), source de métadonnées, année de publication, origine des données, type de données (dataset, modèle, etc.), affiliations, langue, etc., ainsi qu’une recherche avancée pour rechercher sur la centaine de champs existants.

Figure 1. Interface de Recherche Data Gouv

On signalera qu’un internaute a même créé un flux RSS pour suivre les derniers dépôts sur la plateforme (https://rss-bridge.lamop.fr/?action=display&bridge=RechercheDataGouvFrBridge&format=Atom).

On ne peut pas dire à ce jour que Recherche Data Gouv permette d’accéder à la majorité des données de la recherche française. Mais le but est bien de faire grandir la plateforme et d’arriver à terme à une vraie représentativité de la recherche française, un peu à l’image de la plateforme data.gouv.fr pour les données publiques.

Compléter sa recherche sur les données de la recherche

Pour réaliser une recherche la plus exhaustive possible sur les données de la recherche, nous conseillerons de regarder du côté de plusieurs sources spécialisées sur les données de la recherche.

Les moteurs spécialisés sur les données de la recherche :

▶ Data Mendeley (https://data.mendeley.com/) ;

▶ DataCite (https://search.datacite.org/) ;

▶ Google Datasets Search qui mixe données de la recherche et données publiques (https://datasetsearch.research.google.com/).

Les moteurs académiques qui proposent un filtre « datasets » : BASE (https://www.base-search.net/), Dimensions (https://app.dimensions.ai/discover/publication) ou encore Lens (https://www.lens.org/).

Enfin, on n’oubliera pas les répertoires d’entrepôts de données qui vont permettre d’identifier des entrepôts de données thématiques et très spécialisés:

▶ RE3data (https://www.re3data.org/) ;

▶ Open Access Directory (https://oad.simmons.edu/oadwiki/Data_repositories).