Want to make creations as awesome as this one?

Transcript

Guide proposé par le GTSO Données Couperinavril 2022mise à jour juillet 2022

Quel(s) outil(s) de rédaction de plan de gestion de données utiliser ?

Démarrer

1. Enjeux

Les équipes de recherche sont de plus en plus incitées à rédiger des plans de gestion des données (PGD). Cela a conduit les professionnels de l'information scientifique à proposer des services de conseil, relecture ou encore formation sur ce thème. Après une fiche pratique pour organiser un atelier plan de gestion de données (PGD)[1], le GTSO Données de Couperin vous propose un comparatif des outils de rédaction de PGD. En effet, dans une logique de travail collaboratif, de gestion des versions, de facilité de complétion, utiliser un outil en ligne peut rendre la rédaction plus facile.De nombreux outils existent. Nous avons sélectionné certains d’entre eux et nous vous en livrons une analyse de leurs atouts et de leurs limites.

1. Enjeux

2. Questions de chercheur·e·s

3. Présentation des outils

4. Comparaison des outils

5. Conclusion

6. Liens utiles

[1] https://doi.org/10.5281/zenodo.4719277

2. Exemples de questions de chercheur·e·s

1. Enjeux

2. Questions de chercheur·e·s

3. Présentations des outils

4. Comparaison des outils

5. Conclusion

6. Liens utiles

Les équipes de recherche qui sont amenées à rédiger des PGD peuvent se poser plusieurs questions sur le choix de l’outil - ou ne s’en poser aucune - et considérer qu’un document texte sur un cloud est suffisant. Voici quelques questions que vous pouvez rencontrer :

  • Je ne sais pas quels outils existent.
  • Je travaille avec des collègues d’autres pays : vont-ils avoir accès à mon PGD ?
  • J’ai un projet européen, quel est le meilleur outil ?
  • Pourquoi ne pas tout simplement utiliser un fichier Word ?
  • Comment gérer les versions de mon PGD ?
Au travers d’un comparatif entre trois outils, nous vous proposons des clefs pour évaluer au mieux la pertinence des plateformes existantes, en mettant l’accent sur les avantages de ces outils par rapport à un simple traitement de texte. À noter que cette liste n’est pas exhaustive, mais a pour ambition de présenter les outils les plus utilisés.

3. Présentation des outils /1

1. Enjeux

2. Questions de chercheur·e·s

3. Présentation des outils

4. Comparaison des outils

5. Conclusion

6. Liens utiles

DMP OPIDoR (France – Inist-CNRS, recommandé par l’ANR), DMP Online (Royaume-Uni, DCC – Digital Curation Centre) et DMPTool[2] (Etats-Unis – University of California) sont basés sur DMP Roadmap, un logiciel développé par le DCC et l’Université de Californie. DMP OPIDoR a été personnalisé par l’Inist-CNRS pour les équipes de recherche françaises et est sans conteste l’outil de rédaction de PGD le plus utilisé en France. Dans l’enquête[3] menée en 2020/2021 par le GTSO Données sur les services d’accompagnement aux données, 77% des répondants conseillent DMP OPIDoR[4]. En décembre 2021, la plateforme a évolué vers une version machine-actionable du DMP. Le modèle de DMP structuré permet d’importer en un clic des informations concernant les projets financés par l’ANR (pour les projets ayant commencé). En savoir plus

L’avis du GTSO DonnéesDMP OPIDoR est un outil fiable, robuste, facile à prendre en main et complet. Il est la référence en France et peut être utilisé dans la plupart des projets. DMP OPIDoR permet en outre de réaliser un plan de gestion de logiciel en utilisant le modèle PRESOFT.

[2] https://dmp.opidor.fr/ - https://dmponline.dcc.ac.uk/ - https://dmptool.org/[3] https://doi.org/10.5281/zenodo.5078504[4] Voir partie 6. Liens utiles

crédit : Freepik

https://fr.freepik.com/vecteurs/voyage. Voyage vecteur créé par macrovector

Quels avantages à l’utilisation de cette plateforme ?

  • Une interface en français et en anglais ;
  • Des modèles (ANR, Horizon Europe…) directement disponibles dans l’interface ;
  • La possibilité pour les établissements de recherche d’avoir un espace institutionnel, de créer des modèles institutionnels et d’intégrer des recommandations personnalisées ;
  • La fonctionnalité de partage du plan et le travail collaboratif possible partout dans le monde ;
  • Les possibilités induites par la nouvelle version du logiciel telles que le remplissage automatique de champs liés au projet ANR ;
  • La présence d’un modèle structuré amorçant la mise en œuvre de PGD lisibles par des machines (machine-actionable) et donc réutilisables dans d’autres contextes, tels que des data papers ou des entrepôts de données ;
  • Le code source de DMP Roadmap est ouvert et disponible sur GitHub, ce qui permet son appropriation par différentes institutions ;
  • Enfin, DMP OPIDoR est soutenu et géré par l’Inist-CNRS et bénéficie de maintenances régulières et d’une assistance personnalisée.

Quelles limites ?

  • Les recommandations et commentaires sont peu visibles dans le champ des réponses ;
  • Il n’est pas possible d’attribuer une question ou un commentaire à un collaborateur en particulier, les modifications du plan génèrent des notifications pour tous ;
  • Il n’y a pour le moment pas de gestion des versions automatisée (mais on peut dupliquer un plan et lui donner un nouveau nom pour contourner cette limite) ;
  • Les données ANR ne sont pas toujours disponibles au moment du démarrage du projet (actuellement les mises à jour des données ANR ne sont ni automatiques ni instantanées, cependant une mise à jour mensuelle est à l’étude).

CLIQUER SUR LES POUCES

3. Présentation des outils /2

1. Enjeux

2. Questions de chercheur·e·s

3. Présentation des outils

4. Comparaison des outils

5. Conclusion

6. Liens utiles

Argos est l’outil de rédaction de PGD proposé par OpenAIRE. Souvent présentée comme la plateforme de rédaction de PGD la plus adaptée pour les projets européens, elle n’est malheureusement pas disponible en français (bien que traduite par ailleurs en grec, espagnol, allemand, turc, slovaque, serbe et portugais).

L’avis du GTSO DonnéesArgos est à réserver pour les projets de très grande envergure, plutôt européens, avec de multiples partenaires. La complexité importante de l’outil est en effet de nature à rebuter les chercheurs dont le projet ne comprend que peu de jeux de données différents. Cet outil est utile pour les projets nécessitant de décrire avec plus de finesse les différents jeux de données produits par de nombreux acteurs.

[5] https://argos.openaire.eu/splash/

Quels avantages à l’utilisation de cette plateforme ?

  • La structuration du DMP est directement orientée par jeu de données (équivalent des « produits de recherche » sur DMP OPIDoR), qui peut avoir ses propres mots-clefs ;
  • Les noms des contributeurs peuvent être ajoutés via leur ORCID ;
  • Dans la description du jeu de données, de nombreux champs sont à remplir avec des listes contrôlées : but de la production/collecte, types de données, format, origine des données, standards de métadonnées, vocabulaires contrôlés… Ce qui permet d’avoir un menu déroulant pour la plupart des questions et les rend plus simples à remplir (sachant qu’on peut les compléter avec un champ libre) ;
  • Un système de contrôle de versions du PGD est disponible ;
  • Les jeux de données décrits peuvent être décorrélés du PGD initial et ainsi réutilisés dans d’autres PGD ;
  • Le plan peut être rédigé de manière collaborative, avec une aide contextuelle pour chaque question.

Quelles limites ?

  • Il ne peut pas être utilisé hors financement, car il faut obligatoirement remplir les champs « financeur » et « type de financement » ;
  • Les données de financement proviennent essentiellement de projets européens, peu de projets ANR y sont présents ;
  • Les modèles de PGD sont limités (Science Europe, UK Research Innovation, Horizon 2020…) ;
  • Le questionnaire pour chaque jeu de données est extrêmement long à remplir ;
  • Les mises à jour sont parfois difficiles à mettre en œuvre en raison de temps de chargement importants.

CLIQUER SUR LES POUCES

3. Présentation des outils /3

1. Enjeux

2. Questions de chercheur·e·s

3. Présentation des outils

4. Comparaison des outils

5. Conclusion

6. Liens utiles

Data Stewardship Wizard[6] est une initiative du Dutch Techcentre for Lifesciences (Pays-Bas). Ouvert en 2016, il a pour ambition de proposer un outil de rédaction de PGD adapté à toutes les disciplines. DSW est un logiciel libre[7] qui vise à automatiser et à simplifier la rédaction de PGD. Il combine des QCM, des “yes/no questions” et des champs libres structurés en chapitres et sous la forme d’un arbre de décisions détaillé dont la mind map est disponible sur Zenodo.

L’avis du GTSO DonnéesL’outil est intuitif, monitoré, pédagogique sur les logiques FAIR qui sous-tendent l’élaboration d’un PGD. Mais il demeure très complexe, conçu pour des projets européens en sciences, techniques et médecine à l’origine, donc pas toujours adapté à tous les projets.

[6] https://ds-wizard.org/[7] https://github.com/ds-wizard

Quels avantages à l’utilisation de cette plateforme ?

  • Le formulaire est conçu à l’aide de questions conditionnelles dont la réponse induit l’apparition ou non d’autres questions grâce au modèle des “Smart questionnaires”. Le nombre et le gabarit des réponses diffèrent selon la phase du projet cochée en amont (avant, au début, au milieu ou à la fin du projet).
  • Le travail collaboratif en simultané est possible avec des partenaires de différents pays, à condition d’avoir un compte : droits de lecture, rédaction, commentaires, propriété…;
  • La fonction “TODOs” permet de retrouver les champs qu’il reste à remplir ;
  • Le versionnage permet de savoir quel changement a été apporté, par qui et quand ;
  • Le modèle maDMP (modèle machine actionable), recommandé dans les standards RDA, est présent parmi les modèles par défaut ;
  • La fonction de “FAIR metrics” mesure automatiquement le degré de FAIRisation en fonction des réponses cochées. Chaque réponse à choix multiples est taguée selon le principe FAIR sous-entendu, pour faire comprendre les principes FAIR par la pratique.
  • Les commentaires sont très fouillés : renvoi vers des ressources, contenus multimédia, “community help”, lien vers la plateforme FAIR sharing sur les normes, les entrepôts et les politiques en matière de données ;
  • La charte graphique de l’établissement est intégrable ;
  • En ajoutant l’affiliation, l’identifiant ROR de l’établissement est automatiquement intégré ;
  • L’interface en 4 colonnes permet d’avoir une vue d’ensemble sur le PGD et les projets en cours : un volet rétractable renvoie aux modèles disponibles et aux projets créés ; un menu déroulant à gauche indique la phase du projet et la structure du plan afférente ; au centre, le déroulé du questionnaire ; à droite, les commentaires, les TODOs, l’historique des versions ;
  • Le “Zen Mode” permet d’afficher uniquement les parties du questionnaire sur lesquelles on souhaite travailler ;
  • Le bouton de suppression du projet est signalé dans un espace appelé la “Danger zone”.

Quelles limites ?

  • Les modèles de financeurs disponibles sont les modèles européens uniquement ;
  • Le seul modèle disciplinaire disponible est orienté Sciences de la vie ;
  • L’interface est disponible en anglais uniquement ;
  • L’outil “Storage cost evaluator” permet d’estimer les coûts de stockage des données en fonction des informations cochées : https://storage-costs-evaluator.ds-wizard.org/. Cette méthode d’estimation, qui au début apparait comme un atout, n’est finalement pas claire car nous ne connaissons pas la méthode de calcul.
  • L’arborescence de questions est trop complexe pour certains projets et le coût d’entrée, élevé : prise en main de l’interface longue, en particulier pour les PGD ne nécessitant pas de réflexion approfondie ;
  • Attention aux codes couleurs à double signification : le vert signifie soit que la question a été traitée, soit qu’elle est “FAIR compatible”. Le rouge signifie soit que la question n’a pas été traitée soit que la réponse est “non FAIR compatible” ;
  • Les questions d’un PGD peuvent-elles se résumer à des yes/no questions et des QCM ?

CLIQUER SUR LES POUCES

4. Comparaison des 3 outils

1. Enjeux

2. Questions de chercheur·e·s

3. Présentation des outils

4. Comparaison des outils

5. Conclusion

6. Liens utiles

= non

= oui

= partiellement

5. Conclusion

1. Enjeux

2. Questions de chercheur·e·s

3. Présentation des outils

4. Comparaison des outils

5. Conclusion

6. Liens utiles

Ces différents outils et leurs fonctionnalités variées apportent une réelle plus-value par rapport à l’utilisation d’un simple document Word, même si de nombreux chercheurs font ce choix. Il n’y a pas un outil adapté à tel ou tel projet. L’objectif est de produire un PGD de qualité, collaboratif, grâce à un outil avec lequel le chercheur est à l’aise.

6. Liens utiles

1. Enjeux

2. Questions de chercheur·e·s

3. Présentation des outils

4. Comparaison des outils

6. Liens utiles

↪ Féret Romain, Bracco Laetitia, Lehoux Elise & Augouvernaire Martine (2021), Enquête sur l’appui à la gestion des données de la recherche en service de documentation et d’information scientifique et technique. https://doi.org/10.5281/zenodo.5078504, p. 31.↪ Rubrique « Aide » complète et synthétique de DMP OPIDoR : https://dmp.opidor.fr/help ↪ Présentation détaillée d’Argos : https://argos.openaire.eu/splash/assets/presentations/argos.pdf ↪ Tutoriels pour Data Stewardship Wizard : https://ds-wizard.org/video-tutorials↪ Pour aller plus loin, nous vous proposons la Mindmap (carte heuristique) de Data Stewardship Wizard (DSW) : https://doi.org/10.5281/zenodo.2614820

crédit : Freepik

https://fr.freepik.com/vecteurs/voyage. Voyage vecteur créé par macrovector

5. Conclusion