Étape 5 | Décrire et diffuser ses données

Véritable enjeu de la recherche, la valorisation des données passe par leur documentation et leur diffusion selon les principes FAIR (Faciles à trouver, Accessibles, Interopérables et Réutilisables).

La mise en œuvre de ces principes repose sur plusieurs actions :
  1. Recourir à l’usage des standards de métadonnées génériques (Dublin Core, par exemple) ou disciplinaires pour la description des données ou jeux de données produits. Toutes les disciplines ne disposent pas de standards de métadonnées formalisés mais il est toujours préférable avant d’envisager une réflexion inédite. Il existe pour cela des répertoires consultables (cf. infra).
  2. Privilégier le dépôt dans des entrepôts de données publics - disciplinaires, institutionnels, nationaux ou internationaux - proposant des conditions de conservation, de partage et de référencement conformes aux principes FAIR. Depuis le 8 juillet 2022, le France dispose d’une plateforme nationale fédérée de dépôt et de diffusion des données pour lesquelles les entrepôts disciplinaires existants ne constitueraient pas une solution adaptée. Le World Data System of the International Science Council (WDS) et le Data Seal of Approval (DSA) proposent par ailleurs une certification de qualité, le "CoreTrustSeal" pour labelliser les entrepôts de données engagés dans la mise en œuvre des principes FAIR.
  3. S’assurer de l’attribution aux jeux de données diffusés d’un identifiant pérenne permettant l’identification unique d’un objet physique ou numérique (DOI ou équivalent). L’obtention du DOI s’effectue le plus souvent au moment du dépôt des données dans l’entrepôt de diffusion qui les attribue. C’est en général un gage de qualité et de sérieux de ce dernier. Il est également possible, dans le cadre d’une démarche propre de diffusion, d’attribuer soi-même des DOI en passant, par des agences d’attribution comme le DataCite (pour les jeux de données) ou CrossRef (pour les publications) moyennant paiement et souscription.
  4. Privilégier le choix de formats ouverts et de licences de diffusion libres permettant le partage et la réutilisation des données (licence Ouverte, Etalab, Creative Commons, etc.).

Ces enjeux de partage et d’ouverture des données, appelés de leurs vœux par de plus en plus de financeurs de la recherche, ne peuvent s’envisager que dans le respect du principe "aussi ouvert que possible, aussi fermé que nécessaire" renvoyant aux nécessités de protection des données sensibles et personnelles (cf. Étape 3 | Intégrer les exigences en matière d’éthique et de protection des données personnelles).