Want to make creations as awesome as this one?

Infographie revenant sur l'enquête réalisée en 2022 auprès des chercheurs et chercheuses de l'établissement par la DBD du Cnam

More creations to inspire you

Transcript

Les données de la recherche, c'est quoi ?

Les données de la recherche sont l’ensemble des informations collectées, produites et utilisées par la recherche scientifique.

+ info

Stockage

83% des répondant/es cumulent plusieurs lieux de stockage.63% stockent leurs données “en local, sur un disque dur externe ou un autre support (clé USB, CD, DVD, etc.)"

science.ouverte@cnam.fr

La bibliothèque reste à votre disposition, contactez-nous !

39%

des personnes faisant de la recherche au Cnam gèrent des données personnelles.

Avez-vous déjà partagé des données en libre accès sur le web ?

Jamais

Plus d'une fois

Principaux moteurs à l'ouverture des données

En savoir plus...

Une question ?Un besoin de formation ?

Lire

Vous pouvez consulter le rapport complet issu de l'enquête.

Quelques besoins qui ressortent de l'enquête...

68%

des personnes faisant de la recherche au Cnam se disent prêtes à partager leurs données de recherche avec d'autres.

Principaux freins à l'ouverture des données

Freins juridiques

Manque de temps

Manque de connaissances

Crainte du plagiat

Le sentiment d'aider la communauté

Gain de visibilité

L'occasion de contacts

Le souhait de réutilisations

Non

Oui

Une offre de formation générale

Des conseils sur les entrepôts de données

Des infrastructures de stockage

3 lieux et plus

2 lieux

1 lieu

20% de l'effectif cible a répondu

152 réponses exploitables au questionnaire

100% des laboratoires représentés

Quelques chiffres

Objectifs de l'enquête

Les données de la recherche au Cnam

Retour sur l'enquête réalisée en 2022 par la Direction des bibliothèques et de la documentation

- Dresser un état des lieux des pratiques et représentations des chercheur/euses en termes de gestion et d'ouverture des données ;- Recueillir leurs besoins ;- Proposer des pistes de travail pour l'établissement.

Types de données

Code informatique

Données de simulation numérique

Données expérimentales

Données d'observation

Données dérivées ou compilées

Pour chaque champ disciplinaire représenté, chaque type de donnée a été cité au moins une fois. Certaines disciplines se spécialisent fortement dans un type de données (chimie et matériaux par exemple) quand d'autres sont plus polyvalentes (sciences de l'ingénieur).

La définition la plus communément utilisée pour définir les données de la recherche est la suivante, révisée par l'OCDE en 2021 :« Enregistrements factuels (tels que les chiffres, textes, images et sons) issus de la recherche financée tout ou partie sur fonds publics, qui sont utilisés comme source principale pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche. ». Le terme donnée désigne une réalité extrêmement multiple, variant avec la discipline et la recherche effectuée.

60% des répondant/es

24% des répondant/es

17% des répondant/es

Toute information se rapportant à une personne physique identifiée ou identifiable est une donnée à caractère personnel. La publication de données personnelles est soumise à des conditions juridiques spécifiques.

« Comme je n'y connais pas grand-chose je ne sais pas si j'ai des besoins de formation. Je ne peux pas appréhender ce qu'il y a à apprendre. J'ai besoin d'une sensibilisation générale : qu'est-ce que la science ouverte peut-être déjà, qu'est-ce que les données personnelles, qu'est-ce qu'il y a à protéger, pourquoi ? Pourquoi la politique de science ouverte aussi, qu'est-ce qui se cache derrière, est-ce que c'est parce qu'il y a cette idée de "contribuons tous, mettons tous à contribution pour progresser ensemble" ou est-ce que c'est qu'il y a plein de recherches publiques qui bénéficient ensuite au secteur privé ? Ce serait intéressant aussi de voir quels enjeux il y a derrière. »

« Typiquement, quand j'ai cherché à rendre ces données publiques, j'ai passé un certain temps à chercher les bases de données possibles. [...] J'aurais bien aimé avoir déjà un benchmark des différents services et domaines possibles pour rendre des données publiques. » « Nous, on est prêts à faire le passage. Mais il faut qu'on trouve les bons outils, c'est à dire qu'on trouve les bon dépôts. »

« Il faut qu'on achète des serveurs, qu'on fasse des sauvegardes, etc. Ça représente un coût assez significatif. Je ne sais pas si de ce point de vue là le Cnam a une politique de soutien ou de gestion qui peut faciliter ça. » « C'est un gros investissement, à chaque fois, les serveurs de données. »

Le choix a été fait de proposer une typologie de données assez large, afin d'éviter le risque de non-exhaustivité. Le code informatique, même s’il n’est pas à proprement parler une donnée, a été inclus en raison de sa proximité avec les données et de sa mise en avant dans les plans nationaux pour la science ouverte. Les types de données ont été définis comme suit :

  • Données d'observation (données non reproductibles, par exemple : relevés de température ou de précipitations, données de télédétection, photos d’un événement, données d’enquêtes...) ;
  • Données expérimentales (données censées être reproductibles, par exemple : générées par un équipement en laboratoire, mesures de performance d’une machine...) ;
  • Données de simulation numérique (données reproductibles produites par des logiciels, par exemple : modèles climatiques ou économiques...) ;
  • Données dérivées ou compilées (données brutes qui ont fait l'objet de traitements et d'analyses successifs, par exemple : données obtenues par de la fouille de textes ou de données d’une base...).