Want to make creations as awesome as this one?

Transcript

Cycle de Vie des Données

Commencer

accès / partage

réutilisation

préservation

traitement / analyse

création / collecte

planification

Il comporte globalement 6 étapes

Cycle de Vie des Données

A chaque phase du cycle, des actions de gestion des données doivent être entreprises.

Préservation

CollecteCréation

Planification

Traitement Analyse

Passez la souris sur chaque étape pour un bref résumé oucliquez sur pour en savoir plus

Les étapes

Réutilisation

AccèsPartage

CollecteCréation

Planification

Traitement Analyse

Réutilisation

Préservation

AccèsPartage

Passez la souris sur chaque étape pour un bref résumé oucliquez sur pour en savoir plus

Les étapes

Planification

+ info

+ info

DMP OPIDoR est un outil d’aide à la création en ligne de plans de gestion de données mis à disposition de l’Enseignement Supérieur et de la Recherche.Il est hébergé et géré par l’Inist-CNRS. Basé sur le code open source DMPRoadmap, il a été adapté aux besoins de la communauté scientifique française.

Dans votre PGD, vous devez préciser l’origine de vos données. S’agit-il de collecter des données ? D’en créer de nouvelles ? Ou de réutiliser des données existantes ? Dans tous les cas, vous devez détailler la méthodologie de travail utilisée, et décrire le plus précisément possible vos données.

Réflexion, organisation en amont du projet de recherche Plan de gestion de données (PGD)

Le plan de gestion des données est un outil de gestion de projet. Il se présente sous forme d’un document structuré en rubriques. Il a pour objectif de synthétiser la description et l’évolution des jeux de données de votre projet de recherche. Il prépare le partage, la réutilisation et la pérennisation des données.

CollecteCréation

+ info

+ info

+ info

+ info

A partir de cette étape et pendant tout le cycle de vie des données, respecter les aspects éthiques et juridiquesmettre à jour le plan de gestion de données

Décrire les données ou les jeux de données (privilégier les systèmes utilisant des standards de métadonnées, et à défaut documenter ses descriptions).Privilégier les formats de fichiers non propriétaires, d’un usage très répandu au sein d’une communauté de recherche pour prévenir l’obsolescence des fichiers.

Dans votre PGD, vous devez préciser l’origine de vos données. S’agit-il de données collectées ? D’en créer de nouvelles ? Ou de réutiliser des données existantes ? Dans tous les cas, vous devez détailler la méthodologie de travail utilisée, et décrire le plus précisément possible vos données.

Préciser l'origine des données Décrire les données et les métadonnées

TraitementAnalyse

Pendant tout le cycle de vie des données, respecter les aspects éthiques et juridiquesmettre à jour le plan de gestion de données

Sauvegarder les données (3 copies sur 2 supports différents, dont 1 copie à distance).Sécuriser l’accès aux données confidentielles ou sensibles.

Vérifier, nettoyer et valider les données Interpréter les données Gérer et stocker les données

Vérifier les erreurs dans les données présentes comme des erreurs de frappe, des informations manquantes, des imprécisions etc. Définir une convention de nommage des fichiers.

+ info

+ info

+ info

AccèsPartage

Pendant tout le cycle de vie des données, respecter les aspects éthiques et juridiquesmettre à jour le plan de gestion de données

Entrepôt : pour stocker les données de recherche, y accéder et les réutiliser. Il en existe plusieurs types : disciplinaires, multidisciplinaires, propres à un éditeur, institutionnels, spécifiques d’un projet de recherche.

Licence : contrat par lequel le ou les auteur(s) autorise(nt) l'exploitation par un tiers d’utiliser les données et précise(nt) dans quels buts elles peuvent être utilisées. Favoriser la réutilisation des données : privilégier les licences ouvertes.

Data paper : publication qui décrit un jeu de données scientifiques avec les métadonnées. Il doit être accessible, soit sous forme de fichier annexé, soit par un lien pérenne (URL, DOI) vers l’entrepôt de données.

Publier les articles et lier les data papersAppliquer une licence d'utilisation Choisir un entrepôt dans une logique de partage

+ info

+ info

+ info

+ info

Pendant tout le cycle de vie des données, respecter les aspects éthiques et juridiquesmettre à jour le plan de gestion de données

Préservation

Archiver à long terme

A long terme...L’archivage pérenne a 3 objectifs principaux : conserver le document, le rendre accessible, et en préserver l’intelligibilité.Ces trois services sont conçus sur le très long terme (plus de 30 ans).Il ne faut pas confondre stockage sécurisé (pour assurer la continuité de l’exploitation durant le projet) et archivage pérenne (conservation à moyen et long terme).

+ info

+ info

+ info

Réutilisation

Les données collectées, observées, créées ou compilées dansle cadre de projets de recherche sont précieuses : elles valident ou invalident des hypothèses de recherche,elles détaillent les résultats de recherche présents dans une publication,elles sont le point de départ de nouvelles recherches,elles constituent un complément à d’autres travaux.

Permettre de nouvelles recherches Réexaminer les résultats / données Enseigner et apprendreRespecter la licence d'utilisation

Trouver des jeux de données susceptibles d’enrichir les connaissances dans un domaine est essentiel à l’avancée des sciences. Réutiliser des jeux de données est un facteur d’efficience en recherche.

+ info

+ info