Les données de la recherche au Cnam
Marie-Liesse Bertram
Created on June 4, 2022
Infographie revenant sur l'enquête réalisée en 2022 auprès des chercheurs et chercheuses de l'établissement par la DBD du Cnam
Over 30 million people build interactive content in Genially.
Check out what others have designed:
HOW TO CREATE THE PERFECT VIRTUAL WORKSPACE
Vertical infographics
BOOKFLIX
Vertical infographics
12 PRINCIPLES OF ANIMATION
Vertical infographics
WHY WE LIKE INFOGRAPHICS
Vertical infographics
Transcript
Les données de la recherche, c'est quoi ?
Les données de la recherche sont l’ensemble des informations collectées, produites et utilisées par la recherche scientifique.
+ info
Stockage
83% des répondant/es cumulent plusieurs lieux de stockage.63% stockent leurs données “en local, sur un disque dur externe ou un autre support (clé USB, CD, DVD, etc.)"
science.ouverte@cnam.fr
La bibliothèque reste à votre disposition, contactez-nous !
39%
des personnes faisant de la recherche au Cnam gèrent des données personnelles.
Avez-vous déjà partagé des données en libre accès sur le web ?
Jamais
Plus d'une fois
Principaux moteurs à l'ouverture des données
En savoir plus...
Une question ?Un besoin de formation ?
Lire
Vous pouvez consulter le rapport complet issu de l'enquête.
Quelques besoins qui ressortent de l'enquête...
68%
des personnes faisant de la recherche au Cnam se disent prêtes à partager leurs données de recherche avec d'autres.
Principaux freins à l'ouverture des données
Freins juridiques
Manque de temps
Manque de connaissances
Crainte du plagiat
Le sentiment d'aider la communauté
Gain de visibilité
L'occasion de contacts
Le souhait de réutilisations
Non
Oui
Une offre de formation générale
Des conseils sur les entrepôts de données
Des infrastructures de stockage
3 lieux et plus
2 lieux
1 lieu
20% de l'effectif cible a répondu
152 réponses exploitables au questionnaire
100% des laboratoires représentés
Quelques chiffres
Objectifs de l'enquête
Les données de la recherche au Cnam
Retour sur l'enquête réalisée en 2022 par la Direction des bibliothèques et de la documentation
- Dresser un état des lieux des pratiques et représentations des chercheur/euses en termes de gestion et d'ouverture des données ;- Recueillir leurs besoins ;- Proposer des pistes de travail pour l'établissement.
Types de données
Code informatique
Données de simulation numérique
Données expérimentales
Données d'observation
Données dérivées ou compilées
Pour chaque champ disciplinaire représenté, chaque type de donnée a été cité au moins une fois. Certaines disciplines se spécialisent fortement dans un type de données (chimie et matériaux par exemple) quand d'autres sont plus polyvalentes (sciences de l'ingénieur).
La définition la plus communément utilisée pour définir les données de la recherche est la suivante, révisée par l'OCDE en 2021 :« Enregistrements factuels (tels que les chiffres, textes, images et sons) issus de la recherche financée tout ou partie sur fonds publics, qui sont utilisés comme source principale pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche. ». Le terme donnée désigne une réalité extrêmement multiple, variant avec la discipline et la recherche effectuée.
60% des répondant/es
24% des répondant/es
17% des répondant/es
Toute information se rapportant à une personne physique identifiée ou identifiable est une donnée à caractère personnel. La publication de données personnelles est soumise à des conditions juridiques spécifiques.
« Comme je n'y connais pas grand-chose je ne sais pas si j'ai des besoins de formation. Je ne peux pas appréhender ce qu'il y a à apprendre. J'ai besoin d'une sensibilisation générale : qu'est-ce que la science ouverte peut-être déjà, qu'est-ce que les données personnelles, qu'est-ce qu'il y a à protéger, pourquoi ? Pourquoi la politique de science ouverte aussi, qu'est-ce qui se cache derrière, est-ce que c'est parce qu'il y a cette idée de "contribuons tous, mettons tous à contribution pour progresser ensemble" ou est-ce que c'est qu'il y a plein de recherches publiques qui bénéficient ensuite au secteur privé ? Ce serait intéressant aussi de voir quels enjeux il y a derrière. »
« Typiquement, quand j'ai cherché à rendre ces données publiques, j'ai passé un certain temps à chercher les bases de données possibles. [...] J'aurais bien aimé avoir déjà un benchmark des différents services et domaines possibles pour rendre des données publiques. » « Nous, on est prêts à faire le passage. Mais il faut qu'on trouve les bons outils, c'est à dire qu'on trouve les bon dépôts. »
« Il faut qu'on achète des serveurs, qu'on fasse des sauvegardes, etc. Ça représente un coût assez significatif. Je ne sais pas si de ce point de vue là le Cnam a une politique de soutien ou de gestion qui peut faciliter ça. » « C'est un gros investissement, à chaque fois, les serveurs de données. »
Le choix a été fait de proposer une typologie de données assez large, afin d'éviter le risque de non-exhaustivité. Le code informatique, même s’il n’est pas à proprement parler une donnée, a été inclus en raison de sa proximité avec les données et de sa mise en avant dans les plans nationaux pour la science ouverte. Les types de données ont été définis comme suit :
- Données d'observation (données non reproductibles, par exemple : relevés de température ou de précipitations, données de télédétection, photos d’un événement, données d’enquêtes...) ;
- Données expérimentales (données censées être reproductibles, par exemple : générées par un équipement en laboratoire, mesures de performance d’une machine...) ;
- Données de simulation numérique (données reproductibles produites par des logiciels, par exemple : modèles climatiques ou économiques...) ;
- Données dérivées ou compilées (données brutes qui ont fait l'objet de traitements et d'analyses successifs, par exemple : données obtenues par de la fouille de textes ou de données d’une base...).