• Recherche,
  • Archivage,

Archiver ses données ou les stocker dans un entrepôt : quelle différence ?

Publié le 7 novembre 2025 Mis à jour le 25 novembre 2025

Archivage et stockage en entrepôt, comment ne plus les confondre ?

À la fin du cycle de vie des données de recherche, deux pratiques distinctes mais complémentaires jouent un rôle clé : le stockage dans des entrepôts de données et l’archivage. Chacune répond à des besoins spécifiques, et leur combinaison permet d’assurer à la fois l’accessibilité immédiate et la préservation durable des résultats scientifiques.

Différence entre stockage chaud et stockage froid

On parle de stockage chaud lorsque les données stockées sont susceptibles d'être sollicitées dans un délai court. Le stockage chaud met l'accent sur l'accessibilité des données, leur visibilité, leur réutilisation facile et le suivi de leur versionnage.

À l'inverse, le stockage froid est la solution privilégiée pour sécuriser les données. L'objectif principal est de préserver l'authenticité des données sur le temps long : l'accès est donc plus restreint, la réutilisation est plus difficile, mais les données peuvent ainsi être sauvegardées en l'état pendant des décennies.

Les entrepôts de données : un stockage chaud pour partager et valoriser

Les entrepôts de données sont des services de stockage et de diffusion des données, conçus pour faciliter l’accès, le partage et la réutilisation des données.

On appelle jeu de données un ensemble de données cohérent déposé dans un entrepôt. Cette cohérence est définie par la thématique de recherche. Par exemple, un jeu de données sur la démographie peut contenir différents tableurs de statistiques démographiques, des fichiers textuels sur l'analyse démographique

Le dépôt d'un jeu de données dans un entrepôt de données peut avoir lieu en cours de projet ou après qu'il soit terminé. Un jeu de données peut donc être mis à jour, ce qui aboutit à différentes versions.

Un bon entrepôt de données répond aux exigences de la science ouverte, en alignement avec les principes FAIR : les données y sont faciles à trouver, accessibles, interopérables et réutilisables. Les jeux de données déposés s'en trouve valorisés. Ces plateformes sont idéales pour les chercheurs qui souhaitent diffuser leurs résultats, collaborer avec des pairs, ou se conformer aux attentes des financeurs.

On distingue souvent les entrepôts généralistes des entrepôts disciplinaires (ou thématiques), la deuxième catégorie recouvrant des champs d'étude plus précis que la première. L'intérêt de déposer dans un entrepôt disciplinaire est de cibler directement le public qui sera intéressé par le jeu de données : elles y gagnent ainsi en visibilité et en propension à être réutilisées. D'autre part, un entrepôt généraliste peut s'avérer une meilleure solution si le jeu de données recouvre des thématiques trop larges, si les données sont pertinentes à croiser avec d'autres disciplines ou s'il n'existe pas d'entrepôt thématique assez complet pour les valoriser.

Des entrepôts généralistes

Recherche Data Gouv est l'entrepôt de données généraliste déployé par le Ministère de l'Enseignement supérieur et de la Recherche et fait ainsi office de référence nationale. Zenodo est son équivalent mis en avant par la Commission européenne.

Quelques entrepôts disciplinaires

Le site web recherche.data.gouv.fr dispose d'un espace dédié où sont référencés des dizaines d'entrepôts thématiques filtrables par discipline. Pour en citer quelques-uns, évoquons Nakala, déployé au sein de l'infrastructure de recherche Huma-Num et qui recouvre les SHS en général, ainsi que d'autres au périmètre plus spécifique comme l'entrepôt du CDSP pour les sciences politiques, ArkeOpen pour l'archéologie, Ortolang pour les sciences du langage et Laudatio pour les sciences historiques.

L'archivage : un stockage froid pour préserver et sécuriser

L’archivage des données vise à garantir leur conservation à long terme, c'est-à-dire bien au-delà de la durée d’un projet. Que ce soit au sein des services d’archives universitaires, des centres nationaux, ou d’autres structures dédiées, son rôle est de :

  • Protéger les données contre la perte, l’obsolescence technologique ou les altérations.
  • Respecter les cadres légaux (comme le Code du patrimoine ou le RGPD), notamment pour les données sensibles ou publiques.
  • Assurer la traçabilité des données, même des décennies après leur création.
  • Offrir un cadre normatif idéal pour préparer les données à une conservation optimale (métadonnées, formats pérennes, etc.).

L’archivage est ainsi essentiel pour les chercheurs qui souhaitent pérenniser leurs résultats, répondre à des obligations légales particulières et prendre soin de transmettre un patrimoine scientifique de qualité aux générations futures.

Enfin, rappelons que l'archivage des données n'est pas contradictoire avec leur stockage dans un entrepôt : puisque les deux pratiques ne couvrent pas les mêmes objectifs, il est tout à fait commode de les réaliser toutes les deux en même temps.

Liens utiles :