43
Filatre Annabelle Responsable IST AgroParisTech Montpellier Membre du groupe OALR [email protected] Hensens Hanka Responsable IST IRD Montpellier Membre du groupe OALR h [email protected]

Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Filatre AnnabelleResponsable ISTAgroParisTech MontpellierMembre du groupe OALRannabellefilatreagroparistechfr

Hensens HankaResponsable ISTIRD MontpellierMembre du groupe OALRhankahensensirdfr

Points Techniques Preacutealables

bull Pensez agrave bull Couper vos microsbull Ouvrir un minimum dapplications (qualiteacute de connexion)bull Choisir si possible une connexion filaire

bull Signaler votre preacutesence par un bref message dans le chat (Nom et preacutenom)

bull Poser vos questions via le chat bull Le confeacuterencier y reacutepondra lors des plages de questions preacutevues durant

le webinairebull Les reacuteponses aux questions non traiteacutees en direct seront accessibles sur

le site OALR

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees 2 Geacuterer des donneacutees 3 Publier des donneacutees

Conclusion

Introduction aux donneacutees de la recherche Plan

Deacutefinitions des Donneacutees de la recherche

bull Pour lrsquoOCDE laquo Enregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sourcesprincipales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacutescientifique comme neacutecessaires pour valider les reacutesultats de la recherche raquo(Principes et lignes directrices de lrsquoOCDE pour lrsquoaccegraves aux donneacutees de la recherche financeacutee sur fondspublics ndash 2006 reprise par le Plan National pour Science Ouverte - 2018)

bull Pour la Royal Society de Londres laquo Informations qualitatives ou quantitatives [hellip] qui sont factuelles Ces donneacutees peuvent ecirctre brutesou primaires (directement issue drsquoune mesure) ou deacuteriveacutee de donneacutees primaires mais ne sont pasencore le produit drsquoanalyse ou drsquointerpreacutetation autres que le calculs raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Typologie des donneacutees de la recherche

bull Deacutefinition de la Commission europeacuteenne pour Horizon 2020

1 Les donneacutees sous-jacente (les donneacutees neacutecessaires pour valider les reacutesultats preacutesenteacutes dans les publications scientifiques) incluant les meacutetadonneacutees associeacutees (crsquoest-agrave-dire les meacutetadonneacutees deacutecrivant les donneacutees de recherche deacuteposeacutees)

2Toute autre donneacutee (par exemple les donneacutees conserveacutees qui ne sont pas directement attribuables agrave une publication ou les donneacutees brutes) y compris les meacutetadonneacutees associeacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Donneacutees dobservations

denquecircte

Donneacutees de simulation

Donneacutees expeacuterimentales

Donneacutees deacuteriveacutees

Carnets de terrainQuestionnaires enquecirctesPhotographies films fichiers audiohellip

ModegravelesAlgorithmesScriptshellip

EchantillonsPhotos de microscopeSpectroscopiehellip

Fichiers de donneacuteesDocuments texte Feuilles de calculsBases de donneacuteeshellip

Typologie par meacutethode dobtention11 Deacutefinitions et typologie

OALR Deacutecembre 2019 Filatre A - Hensens H

Cycle de vie de la donneacutee

[IST Agropolis 2016]OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Creacuteation Collecte

Traitement et analyse

Conservation

Accegraves et reacuteutilisation

bull Donneacutees traiteacuteesbull Donneacutees analyseacuteesbull Donneacutees enrichies

bull Donneacutees deacuteposeacuteesbull Donneacutees publieacuteesbull Donneacutees archiveacutees

bull Donneacutees reacuteutiliseacuteesbull Donneacutees partageacuteesbull Ethique et proprieacuteteacute

intellectuelle

bull Donneacutees brutesbull Donneacutees sourcesbull Donneacutees recueillies

Ne relevant pas des donneacutees de la recherche

Selon lOCDE Les documents non acheveacutes

bull les carnets de laboratoirebull les analyses preacuteliminaires les projets de documents scientifiques et

les programmes de travaux futursbull les examens par les pairsbull les communications personnelles avec des collegravegues hellip

Les objets mateacuteriels bull les souches bacteacuteriennesbull les animaux de laboratoirehellip

Les productions scientifiquesbull les publications scientifiques communications agrave congregravesbull les supports de formation hellip

Les donneacutees administratives non inteacutegreacutees dans un corpus de recherche

Image de PixabayOALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Deacutefinition des jeux de donneacutees (Dataset)

bull laquo Agreacutegation sous une forme lisible de donneacutees brutes ou deacuteriveacutees preacutesentant une certaine uniteacute rassembleacutees pour former un ensemble coheacuterent raquo (Gaillard 2014)

bull Uniteacute de deacutepocirct dans un entrepocirct sa granulariteacute ne doit ecirctre ni trop petite ni trop grande pour faciliter la citation

bull Compleacuteteacute par des meacutetadonneacutees neacutecessaires agrave leur reacuteutilisation et agrave leur validation meacutethodes drsquoobtention logiciels neacutecessaires auteurs couverture temporelle et spatiale etchellip

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Les enjeux de louverture des donneacutees de la recherche scientifique

Enjeux scientifiques bull Deacutefis scientifiques complexes

bull Accroicirctre limpact de la science

bull Faire eacutevoluer les systegravemes deacutedition

bull Eviter la perte de donneacutees

Enjeux eacuteconomiquesbull Valeur eacuteconomique de la donneacuteebull Conditions de financement des

bailleursbull Continuiteacute de la recherchebull Big Data et data science

Enjeux socieacutetauxbull Seacutecurisation des donneacuteesbull Interopeacuterabiliteacute des donneacuteesbull Participation citoyennebull Transparence du processus

scientifique

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la perte des donneacutees

20 ans apregraves publication 80 des donneacutees scientifiques sont perdueshellip

bull Causes bull Destruction des supports virus

bull Obsolescence mateacuterielle ou logicielle

bull Lieu de stockage indeacutefini

bull Erreur humaine deacutepart de personnelhellip

bull Conseacutequences bull Perte de temps drsquoargent (fonds publicshellip)

bull Pas de veacuterification des reacutesultats possible

bull Pas de comparaison des reacutesultats dans le temps ou lrsquoespace

bull Pas de reacuteutilisations par drsquoautres publics pour drsquoautres fins

VINES Timothy H et al The Availability of Research Data Declines Rapidly with Article Age Current Biology 2014

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la reproductibiliteacute de la science

ldquoMore than 70 of researchershave tried and failed to reproduceanother scientists experimentsand more than half have failed toreproduce their ownexperimentsrdquo ()

Nature mai 2016 httpswwwnaturecomnews1-500-scientists-lift-the-lid-on-reproducibility-119970

Les effets neacutegatifs du laquo Publish or Perish raquohellip

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 2: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Points Techniques Preacutealables

bull Pensez agrave bull Couper vos microsbull Ouvrir un minimum dapplications (qualiteacute de connexion)bull Choisir si possible une connexion filaire

bull Signaler votre preacutesence par un bref message dans le chat (Nom et preacutenom)

bull Poser vos questions via le chat bull Le confeacuterencier y reacutepondra lors des plages de questions preacutevues durant

le webinairebull Les reacuteponses aux questions non traiteacutees en direct seront accessibles sur

le site OALR

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees 2 Geacuterer des donneacutees 3 Publier des donneacutees

Conclusion

Introduction aux donneacutees de la recherche Plan

Deacutefinitions des Donneacutees de la recherche

bull Pour lrsquoOCDE laquo Enregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sourcesprincipales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacutescientifique comme neacutecessaires pour valider les reacutesultats de la recherche raquo(Principes et lignes directrices de lrsquoOCDE pour lrsquoaccegraves aux donneacutees de la recherche financeacutee sur fondspublics ndash 2006 reprise par le Plan National pour Science Ouverte - 2018)

bull Pour la Royal Society de Londres laquo Informations qualitatives ou quantitatives [hellip] qui sont factuelles Ces donneacutees peuvent ecirctre brutesou primaires (directement issue drsquoune mesure) ou deacuteriveacutee de donneacutees primaires mais ne sont pasencore le produit drsquoanalyse ou drsquointerpreacutetation autres que le calculs raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Typologie des donneacutees de la recherche

bull Deacutefinition de la Commission europeacuteenne pour Horizon 2020

1 Les donneacutees sous-jacente (les donneacutees neacutecessaires pour valider les reacutesultats preacutesenteacutes dans les publications scientifiques) incluant les meacutetadonneacutees associeacutees (crsquoest-agrave-dire les meacutetadonneacutees deacutecrivant les donneacutees de recherche deacuteposeacutees)

2Toute autre donneacutee (par exemple les donneacutees conserveacutees qui ne sont pas directement attribuables agrave une publication ou les donneacutees brutes) y compris les meacutetadonneacutees associeacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Donneacutees dobservations

denquecircte

Donneacutees de simulation

Donneacutees expeacuterimentales

Donneacutees deacuteriveacutees

Carnets de terrainQuestionnaires enquecirctesPhotographies films fichiers audiohellip

ModegravelesAlgorithmesScriptshellip

EchantillonsPhotos de microscopeSpectroscopiehellip

Fichiers de donneacuteesDocuments texte Feuilles de calculsBases de donneacuteeshellip

Typologie par meacutethode dobtention11 Deacutefinitions et typologie

OALR Deacutecembre 2019 Filatre A - Hensens H

Cycle de vie de la donneacutee

[IST Agropolis 2016]OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Creacuteation Collecte

Traitement et analyse

Conservation

Accegraves et reacuteutilisation

bull Donneacutees traiteacuteesbull Donneacutees analyseacuteesbull Donneacutees enrichies

bull Donneacutees deacuteposeacuteesbull Donneacutees publieacuteesbull Donneacutees archiveacutees

bull Donneacutees reacuteutiliseacuteesbull Donneacutees partageacuteesbull Ethique et proprieacuteteacute

intellectuelle

bull Donneacutees brutesbull Donneacutees sourcesbull Donneacutees recueillies

Ne relevant pas des donneacutees de la recherche

Selon lOCDE Les documents non acheveacutes

bull les carnets de laboratoirebull les analyses preacuteliminaires les projets de documents scientifiques et

les programmes de travaux futursbull les examens par les pairsbull les communications personnelles avec des collegravegues hellip

Les objets mateacuteriels bull les souches bacteacuteriennesbull les animaux de laboratoirehellip

Les productions scientifiquesbull les publications scientifiques communications agrave congregravesbull les supports de formation hellip

Les donneacutees administratives non inteacutegreacutees dans un corpus de recherche

Image de PixabayOALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Deacutefinition des jeux de donneacutees (Dataset)

bull laquo Agreacutegation sous une forme lisible de donneacutees brutes ou deacuteriveacutees preacutesentant une certaine uniteacute rassembleacutees pour former un ensemble coheacuterent raquo (Gaillard 2014)

bull Uniteacute de deacutepocirct dans un entrepocirct sa granulariteacute ne doit ecirctre ni trop petite ni trop grande pour faciliter la citation

bull Compleacuteteacute par des meacutetadonneacutees neacutecessaires agrave leur reacuteutilisation et agrave leur validation meacutethodes drsquoobtention logiciels neacutecessaires auteurs couverture temporelle et spatiale etchellip

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Les enjeux de louverture des donneacutees de la recherche scientifique

Enjeux scientifiques bull Deacutefis scientifiques complexes

bull Accroicirctre limpact de la science

bull Faire eacutevoluer les systegravemes deacutedition

bull Eviter la perte de donneacutees

Enjeux eacuteconomiquesbull Valeur eacuteconomique de la donneacuteebull Conditions de financement des

bailleursbull Continuiteacute de la recherchebull Big Data et data science

Enjeux socieacutetauxbull Seacutecurisation des donneacuteesbull Interopeacuterabiliteacute des donneacuteesbull Participation citoyennebull Transparence du processus

scientifique

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la perte des donneacutees

20 ans apregraves publication 80 des donneacutees scientifiques sont perdueshellip

bull Causes bull Destruction des supports virus

bull Obsolescence mateacuterielle ou logicielle

bull Lieu de stockage indeacutefini

bull Erreur humaine deacutepart de personnelhellip

bull Conseacutequences bull Perte de temps drsquoargent (fonds publicshellip)

bull Pas de veacuterification des reacutesultats possible

bull Pas de comparaison des reacutesultats dans le temps ou lrsquoespace

bull Pas de reacuteutilisations par drsquoautres publics pour drsquoautres fins

VINES Timothy H et al The Availability of Research Data Declines Rapidly with Article Age Current Biology 2014

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la reproductibiliteacute de la science

ldquoMore than 70 of researchershave tried and failed to reproduceanother scientists experimentsand more than half have failed toreproduce their ownexperimentsrdquo ()

Nature mai 2016 httpswwwnaturecomnews1-500-scientists-lift-the-lid-on-reproducibility-119970

Les effets neacutegatifs du laquo Publish or Perish raquohellip

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 3: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

1 Contours et contexte1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees 2 Geacuterer des donneacutees 3 Publier des donneacutees

Conclusion

Introduction aux donneacutees de la recherche Plan

Deacutefinitions des Donneacutees de la recherche

bull Pour lrsquoOCDE laquo Enregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sourcesprincipales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacutescientifique comme neacutecessaires pour valider les reacutesultats de la recherche raquo(Principes et lignes directrices de lrsquoOCDE pour lrsquoaccegraves aux donneacutees de la recherche financeacutee sur fondspublics ndash 2006 reprise par le Plan National pour Science Ouverte - 2018)

bull Pour la Royal Society de Londres laquo Informations qualitatives ou quantitatives [hellip] qui sont factuelles Ces donneacutees peuvent ecirctre brutesou primaires (directement issue drsquoune mesure) ou deacuteriveacutee de donneacutees primaires mais ne sont pasencore le produit drsquoanalyse ou drsquointerpreacutetation autres que le calculs raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Typologie des donneacutees de la recherche

bull Deacutefinition de la Commission europeacuteenne pour Horizon 2020

1 Les donneacutees sous-jacente (les donneacutees neacutecessaires pour valider les reacutesultats preacutesenteacutes dans les publications scientifiques) incluant les meacutetadonneacutees associeacutees (crsquoest-agrave-dire les meacutetadonneacutees deacutecrivant les donneacutees de recherche deacuteposeacutees)

2Toute autre donneacutee (par exemple les donneacutees conserveacutees qui ne sont pas directement attribuables agrave une publication ou les donneacutees brutes) y compris les meacutetadonneacutees associeacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Donneacutees dobservations

denquecircte

Donneacutees de simulation

Donneacutees expeacuterimentales

Donneacutees deacuteriveacutees

Carnets de terrainQuestionnaires enquecirctesPhotographies films fichiers audiohellip

ModegravelesAlgorithmesScriptshellip

EchantillonsPhotos de microscopeSpectroscopiehellip

Fichiers de donneacuteesDocuments texte Feuilles de calculsBases de donneacuteeshellip

Typologie par meacutethode dobtention11 Deacutefinitions et typologie

OALR Deacutecembre 2019 Filatre A - Hensens H

Cycle de vie de la donneacutee

[IST Agropolis 2016]OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Creacuteation Collecte

Traitement et analyse

Conservation

Accegraves et reacuteutilisation

bull Donneacutees traiteacuteesbull Donneacutees analyseacuteesbull Donneacutees enrichies

bull Donneacutees deacuteposeacuteesbull Donneacutees publieacuteesbull Donneacutees archiveacutees

bull Donneacutees reacuteutiliseacuteesbull Donneacutees partageacuteesbull Ethique et proprieacuteteacute

intellectuelle

bull Donneacutees brutesbull Donneacutees sourcesbull Donneacutees recueillies

Ne relevant pas des donneacutees de la recherche

Selon lOCDE Les documents non acheveacutes

bull les carnets de laboratoirebull les analyses preacuteliminaires les projets de documents scientifiques et

les programmes de travaux futursbull les examens par les pairsbull les communications personnelles avec des collegravegues hellip

Les objets mateacuteriels bull les souches bacteacuteriennesbull les animaux de laboratoirehellip

Les productions scientifiquesbull les publications scientifiques communications agrave congregravesbull les supports de formation hellip

Les donneacutees administratives non inteacutegreacutees dans un corpus de recherche

Image de PixabayOALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Deacutefinition des jeux de donneacutees (Dataset)

bull laquo Agreacutegation sous une forme lisible de donneacutees brutes ou deacuteriveacutees preacutesentant une certaine uniteacute rassembleacutees pour former un ensemble coheacuterent raquo (Gaillard 2014)

bull Uniteacute de deacutepocirct dans un entrepocirct sa granulariteacute ne doit ecirctre ni trop petite ni trop grande pour faciliter la citation

bull Compleacuteteacute par des meacutetadonneacutees neacutecessaires agrave leur reacuteutilisation et agrave leur validation meacutethodes drsquoobtention logiciels neacutecessaires auteurs couverture temporelle et spatiale etchellip

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Les enjeux de louverture des donneacutees de la recherche scientifique

Enjeux scientifiques bull Deacutefis scientifiques complexes

bull Accroicirctre limpact de la science

bull Faire eacutevoluer les systegravemes deacutedition

bull Eviter la perte de donneacutees

Enjeux eacuteconomiquesbull Valeur eacuteconomique de la donneacuteebull Conditions de financement des

bailleursbull Continuiteacute de la recherchebull Big Data et data science

Enjeux socieacutetauxbull Seacutecurisation des donneacuteesbull Interopeacuterabiliteacute des donneacuteesbull Participation citoyennebull Transparence du processus

scientifique

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la perte des donneacutees

20 ans apregraves publication 80 des donneacutees scientifiques sont perdueshellip

bull Causes bull Destruction des supports virus

bull Obsolescence mateacuterielle ou logicielle

bull Lieu de stockage indeacutefini

bull Erreur humaine deacutepart de personnelhellip

bull Conseacutequences bull Perte de temps drsquoargent (fonds publicshellip)

bull Pas de veacuterification des reacutesultats possible

bull Pas de comparaison des reacutesultats dans le temps ou lrsquoespace

bull Pas de reacuteutilisations par drsquoautres publics pour drsquoautres fins

VINES Timothy H et al The Availability of Research Data Declines Rapidly with Article Age Current Biology 2014

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la reproductibiliteacute de la science

ldquoMore than 70 of researchershave tried and failed to reproduceanother scientists experimentsand more than half have failed toreproduce their ownexperimentsrdquo ()

Nature mai 2016 httpswwwnaturecomnews1-500-scientists-lift-the-lid-on-reproducibility-119970

Les effets neacutegatifs du laquo Publish or Perish raquohellip

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 4: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Deacutefinitions des Donneacutees de la recherche

bull Pour lrsquoOCDE laquo Enregistrements factuels (chiffres textes images et sons) qui sont utiliseacutes comme sourcesprincipales pour la recherche scientifique et sont geacuteneacuteralement reconnus par la communauteacutescientifique comme neacutecessaires pour valider les reacutesultats de la recherche raquo(Principes et lignes directrices de lrsquoOCDE pour lrsquoaccegraves aux donneacutees de la recherche financeacutee sur fondspublics ndash 2006 reprise par le Plan National pour Science Ouverte - 2018)

bull Pour la Royal Society de Londres laquo Informations qualitatives ou quantitatives [hellip] qui sont factuelles Ces donneacutees peuvent ecirctre brutesou primaires (directement issue drsquoune mesure) ou deacuteriveacutee de donneacutees primaires mais ne sont pasencore le produit drsquoanalyse ou drsquointerpreacutetation autres que le calculs raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Typologie des donneacutees de la recherche

bull Deacutefinition de la Commission europeacuteenne pour Horizon 2020

1 Les donneacutees sous-jacente (les donneacutees neacutecessaires pour valider les reacutesultats preacutesenteacutes dans les publications scientifiques) incluant les meacutetadonneacutees associeacutees (crsquoest-agrave-dire les meacutetadonneacutees deacutecrivant les donneacutees de recherche deacuteposeacutees)

2Toute autre donneacutee (par exemple les donneacutees conserveacutees qui ne sont pas directement attribuables agrave une publication ou les donneacutees brutes) y compris les meacutetadonneacutees associeacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Donneacutees dobservations

denquecircte

Donneacutees de simulation

Donneacutees expeacuterimentales

Donneacutees deacuteriveacutees

Carnets de terrainQuestionnaires enquecirctesPhotographies films fichiers audiohellip

ModegravelesAlgorithmesScriptshellip

EchantillonsPhotos de microscopeSpectroscopiehellip

Fichiers de donneacuteesDocuments texte Feuilles de calculsBases de donneacuteeshellip

Typologie par meacutethode dobtention11 Deacutefinitions et typologie

OALR Deacutecembre 2019 Filatre A - Hensens H

Cycle de vie de la donneacutee

[IST Agropolis 2016]OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Creacuteation Collecte

Traitement et analyse

Conservation

Accegraves et reacuteutilisation

bull Donneacutees traiteacuteesbull Donneacutees analyseacuteesbull Donneacutees enrichies

bull Donneacutees deacuteposeacuteesbull Donneacutees publieacuteesbull Donneacutees archiveacutees

bull Donneacutees reacuteutiliseacuteesbull Donneacutees partageacuteesbull Ethique et proprieacuteteacute

intellectuelle

bull Donneacutees brutesbull Donneacutees sourcesbull Donneacutees recueillies

Ne relevant pas des donneacutees de la recherche

Selon lOCDE Les documents non acheveacutes

bull les carnets de laboratoirebull les analyses preacuteliminaires les projets de documents scientifiques et

les programmes de travaux futursbull les examens par les pairsbull les communications personnelles avec des collegravegues hellip

Les objets mateacuteriels bull les souches bacteacuteriennesbull les animaux de laboratoirehellip

Les productions scientifiquesbull les publications scientifiques communications agrave congregravesbull les supports de formation hellip

Les donneacutees administratives non inteacutegreacutees dans un corpus de recherche

Image de PixabayOALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Deacutefinition des jeux de donneacutees (Dataset)

bull laquo Agreacutegation sous une forme lisible de donneacutees brutes ou deacuteriveacutees preacutesentant une certaine uniteacute rassembleacutees pour former un ensemble coheacuterent raquo (Gaillard 2014)

bull Uniteacute de deacutepocirct dans un entrepocirct sa granulariteacute ne doit ecirctre ni trop petite ni trop grande pour faciliter la citation

bull Compleacuteteacute par des meacutetadonneacutees neacutecessaires agrave leur reacuteutilisation et agrave leur validation meacutethodes drsquoobtention logiciels neacutecessaires auteurs couverture temporelle et spatiale etchellip

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Les enjeux de louverture des donneacutees de la recherche scientifique

Enjeux scientifiques bull Deacutefis scientifiques complexes

bull Accroicirctre limpact de la science

bull Faire eacutevoluer les systegravemes deacutedition

bull Eviter la perte de donneacutees

Enjeux eacuteconomiquesbull Valeur eacuteconomique de la donneacuteebull Conditions de financement des

bailleursbull Continuiteacute de la recherchebull Big Data et data science

Enjeux socieacutetauxbull Seacutecurisation des donneacuteesbull Interopeacuterabiliteacute des donneacuteesbull Participation citoyennebull Transparence du processus

scientifique

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la perte des donneacutees

20 ans apregraves publication 80 des donneacutees scientifiques sont perdueshellip

bull Causes bull Destruction des supports virus

bull Obsolescence mateacuterielle ou logicielle

bull Lieu de stockage indeacutefini

bull Erreur humaine deacutepart de personnelhellip

bull Conseacutequences bull Perte de temps drsquoargent (fonds publicshellip)

bull Pas de veacuterification des reacutesultats possible

bull Pas de comparaison des reacutesultats dans le temps ou lrsquoespace

bull Pas de reacuteutilisations par drsquoautres publics pour drsquoautres fins

VINES Timothy H et al The Availability of Research Data Declines Rapidly with Article Age Current Biology 2014

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la reproductibiliteacute de la science

ldquoMore than 70 of researchershave tried and failed to reproduceanother scientists experimentsand more than half have failed toreproduce their ownexperimentsrdquo ()

Nature mai 2016 httpswwwnaturecomnews1-500-scientists-lift-the-lid-on-reproducibility-119970

Les effets neacutegatifs du laquo Publish or Perish raquohellip

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 5: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Typologie des donneacutees de la recherche

bull Deacutefinition de la Commission europeacuteenne pour Horizon 2020

1 Les donneacutees sous-jacente (les donneacutees neacutecessaires pour valider les reacutesultats preacutesenteacutes dans les publications scientifiques) incluant les meacutetadonneacutees associeacutees (crsquoest-agrave-dire les meacutetadonneacutees deacutecrivant les donneacutees de recherche deacuteposeacutees)

2Toute autre donneacutee (par exemple les donneacutees conserveacutees qui ne sont pas directement attribuables agrave une publication ou les donneacutees brutes) y compris les meacutetadonneacutees associeacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Donneacutees dobservations

denquecircte

Donneacutees de simulation

Donneacutees expeacuterimentales

Donneacutees deacuteriveacutees

Carnets de terrainQuestionnaires enquecirctesPhotographies films fichiers audiohellip

ModegravelesAlgorithmesScriptshellip

EchantillonsPhotos de microscopeSpectroscopiehellip

Fichiers de donneacuteesDocuments texte Feuilles de calculsBases de donneacuteeshellip

Typologie par meacutethode dobtention11 Deacutefinitions et typologie

OALR Deacutecembre 2019 Filatre A - Hensens H

Cycle de vie de la donneacutee

[IST Agropolis 2016]OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Creacuteation Collecte

Traitement et analyse

Conservation

Accegraves et reacuteutilisation

bull Donneacutees traiteacuteesbull Donneacutees analyseacuteesbull Donneacutees enrichies

bull Donneacutees deacuteposeacuteesbull Donneacutees publieacuteesbull Donneacutees archiveacutees

bull Donneacutees reacuteutiliseacuteesbull Donneacutees partageacuteesbull Ethique et proprieacuteteacute

intellectuelle

bull Donneacutees brutesbull Donneacutees sourcesbull Donneacutees recueillies

Ne relevant pas des donneacutees de la recherche

Selon lOCDE Les documents non acheveacutes

bull les carnets de laboratoirebull les analyses preacuteliminaires les projets de documents scientifiques et

les programmes de travaux futursbull les examens par les pairsbull les communications personnelles avec des collegravegues hellip

Les objets mateacuteriels bull les souches bacteacuteriennesbull les animaux de laboratoirehellip

Les productions scientifiquesbull les publications scientifiques communications agrave congregravesbull les supports de formation hellip

Les donneacutees administratives non inteacutegreacutees dans un corpus de recherche

Image de PixabayOALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Deacutefinition des jeux de donneacutees (Dataset)

bull laquo Agreacutegation sous une forme lisible de donneacutees brutes ou deacuteriveacutees preacutesentant une certaine uniteacute rassembleacutees pour former un ensemble coheacuterent raquo (Gaillard 2014)

bull Uniteacute de deacutepocirct dans un entrepocirct sa granulariteacute ne doit ecirctre ni trop petite ni trop grande pour faciliter la citation

bull Compleacuteteacute par des meacutetadonneacutees neacutecessaires agrave leur reacuteutilisation et agrave leur validation meacutethodes drsquoobtention logiciels neacutecessaires auteurs couverture temporelle et spatiale etchellip

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Les enjeux de louverture des donneacutees de la recherche scientifique

Enjeux scientifiques bull Deacutefis scientifiques complexes

bull Accroicirctre limpact de la science

bull Faire eacutevoluer les systegravemes deacutedition

bull Eviter la perte de donneacutees

Enjeux eacuteconomiquesbull Valeur eacuteconomique de la donneacuteebull Conditions de financement des

bailleursbull Continuiteacute de la recherchebull Big Data et data science

Enjeux socieacutetauxbull Seacutecurisation des donneacuteesbull Interopeacuterabiliteacute des donneacuteesbull Participation citoyennebull Transparence du processus

scientifique

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la perte des donneacutees

20 ans apregraves publication 80 des donneacutees scientifiques sont perdueshellip

bull Causes bull Destruction des supports virus

bull Obsolescence mateacuterielle ou logicielle

bull Lieu de stockage indeacutefini

bull Erreur humaine deacutepart de personnelhellip

bull Conseacutequences bull Perte de temps drsquoargent (fonds publicshellip)

bull Pas de veacuterification des reacutesultats possible

bull Pas de comparaison des reacutesultats dans le temps ou lrsquoespace

bull Pas de reacuteutilisations par drsquoautres publics pour drsquoautres fins

VINES Timothy H et al The Availability of Research Data Declines Rapidly with Article Age Current Biology 2014

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la reproductibiliteacute de la science

ldquoMore than 70 of researchershave tried and failed to reproduceanother scientists experimentsand more than half have failed toreproduce their ownexperimentsrdquo ()

Nature mai 2016 httpswwwnaturecomnews1-500-scientists-lift-the-lid-on-reproducibility-119970

Les effets neacutegatifs du laquo Publish or Perish raquohellip

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 6: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Donneacutees dobservations

denquecircte

Donneacutees de simulation

Donneacutees expeacuterimentales

Donneacutees deacuteriveacutees

Carnets de terrainQuestionnaires enquecirctesPhotographies films fichiers audiohellip

ModegravelesAlgorithmesScriptshellip

EchantillonsPhotos de microscopeSpectroscopiehellip

Fichiers de donneacuteesDocuments texte Feuilles de calculsBases de donneacuteeshellip

Typologie par meacutethode dobtention11 Deacutefinitions et typologie

OALR Deacutecembre 2019 Filatre A - Hensens H

Cycle de vie de la donneacutee

[IST Agropolis 2016]OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Creacuteation Collecte

Traitement et analyse

Conservation

Accegraves et reacuteutilisation

bull Donneacutees traiteacuteesbull Donneacutees analyseacuteesbull Donneacutees enrichies

bull Donneacutees deacuteposeacuteesbull Donneacutees publieacuteesbull Donneacutees archiveacutees

bull Donneacutees reacuteutiliseacuteesbull Donneacutees partageacuteesbull Ethique et proprieacuteteacute

intellectuelle

bull Donneacutees brutesbull Donneacutees sourcesbull Donneacutees recueillies

Ne relevant pas des donneacutees de la recherche

Selon lOCDE Les documents non acheveacutes

bull les carnets de laboratoirebull les analyses preacuteliminaires les projets de documents scientifiques et

les programmes de travaux futursbull les examens par les pairsbull les communications personnelles avec des collegravegues hellip

Les objets mateacuteriels bull les souches bacteacuteriennesbull les animaux de laboratoirehellip

Les productions scientifiquesbull les publications scientifiques communications agrave congregravesbull les supports de formation hellip

Les donneacutees administratives non inteacutegreacutees dans un corpus de recherche

Image de PixabayOALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Deacutefinition des jeux de donneacutees (Dataset)

bull laquo Agreacutegation sous une forme lisible de donneacutees brutes ou deacuteriveacutees preacutesentant une certaine uniteacute rassembleacutees pour former un ensemble coheacuterent raquo (Gaillard 2014)

bull Uniteacute de deacutepocirct dans un entrepocirct sa granulariteacute ne doit ecirctre ni trop petite ni trop grande pour faciliter la citation

bull Compleacuteteacute par des meacutetadonneacutees neacutecessaires agrave leur reacuteutilisation et agrave leur validation meacutethodes drsquoobtention logiciels neacutecessaires auteurs couverture temporelle et spatiale etchellip

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Les enjeux de louverture des donneacutees de la recherche scientifique

Enjeux scientifiques bull Deacutefis scientifiques complexes

bull Accroicirctre limpact de la science

bull Faire eacutevoluer les systegravemes deacutedition

bull Eviter la perte de donneacutees

Enjeux eacuteconomiquesbull Valeur eacuteconomique de la donneacuteebull Conditions de financement des

bailleursbull Continuiteacute de la recherchebull Big Data et data science

Enjeux socieacutetauxbull Seacutecurisation des donneacuteesbull Interopeacuterabiliteacute des donneacuteesbull Participation citoyennebull Transparence du processus

scientifique

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la perte des donneacutees

20 ans apregraves publication 80 des donneacutees scientifiques sont perdueshellip

bull Causes bull Destruction des supports virus

bull Obsolescence mateacuterielle ou logicielle

bull Lieu de stockage indeacutefini

bull Erreur humaine deacutepart de personnelhellip

bull Conseacutequences bull Perte de temps drsquoargent (fonds publicshellip)

bull Pas de veacuterification des reacutesultats possible

bull Pas de comparaison des reacutesultats dans le temps ou lrsquoespace

bull Pas de reacuteutilisations par drsquoautres publics pour drsquoautres fins

VINES Timothy H et al The Availability of Research Data Declines Rapidly with Article Age Current Biology 2014

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la reproductibiliteacute de la science

ldquoMore than 70 of researchershave tried and failed to reproduceanother scientists experimentsand more than half have failed toreproduce their ownexperimentsrdquo ()

Nature mai 2016 httpswwwnaturecomnews1-500-scientists-lift-the-lid-on-reproducibility-119970

Les effets neacutegatifs du laquo Publish or Perish raquohellip

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 7: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Cycle de vie de la donneacutee

[IST Agropolis 2016]OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Creacuteation Collecte

Traitement et analyse

Conservation

Accegraves et reacuteutilisation

bull Donneacutees traiteacuteesbull Donneacutees analyseacuteesbull Donneacutees enrichies

bull Donneacutees deacuteposeacuteesbull Donneacutees publieacuteesbull Donneacutees archiveacutees

bull Donneacutees reacuteutiliseacuteesbull Donneacutees partageacuteesbull Ethique et proprieacuteteacute

intellectuelle

bull Donneacutees brutesbull Donneacutees sourcesbull Donneacutees recueillies

Ne relevant pas des donneacutees de la recherche

Selon lOCDE Les documents non acheveacutes

bull les carnets de laboratoirebull les analyses preacuteliminaires les projets de documents scientifiques et

les programmes de travaux futursbull les examens par les pairsbull les communications personnelles avec des collegravegues hellip

Les objets mateacuteriels bull les souches bacteacuteriennesbull les animaux de laboratoirehellip

Les productions scientifiquesbull les publications scientifiques communications agrave congregravesbull les supports de formation hellip

Les donneacutees administratives non inteacutegreacutees dans un corpus de recherche

Image de PixabayOALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Deacutefinition des jeux de donneacutees (Dataset)

bull laquo Agreacutegation sous une forme lisible de donneacutees brutes ou deacuteriveacutees preacutesentant une certaine uniteacute rassembleacutees pour former un ensemble coheacuterent raquo (Gaillard 2014)

bull Uniteacute de deacutepocirct dans un entrepocirct sa granulariteacute ne doit ecirctre ni trop petite ni trop grande pour faciliter la citation

bull Compleacuteteacute par des meacutetadonneacutees neacutecessaires agrave leur reacuteutilisation et agrave leur validation meacutethodes drsquoobtention logiciels neacutecessaires auteurs couverture temporelle et spatiale etchellip

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Les enjeux de louverture des donneacutees de la recherche scientifique

Enjeux scientifiques bull Deacutefis scientifiques complexes

bull Accroicirctre limpact de la science

bull Faire eacutevoluer les systegravemes deacutedition

bull Eviter la perte de donneacutees

Enjeux eacuteconomiquesbull Valeur eacuteconomique de la donneacuteebull Conditions de financement des

bailleursbull Continuiteacute de la recherchebull Big Data et data science

Enjeux socieacutetauxbull Seacutecurisation des donneacuteesbull Interopeacuterabiliteacute des donneacuteesbull Participation citoyennebull Transparence du processus

scientifique

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la perte des donneacutees

20 ans apregraves publication 80 des donneacutees scientifiques sont perdueshellip

bull Causes bull Destruction des supports virus

bull Obsolescence mateacuterielle ou logicielle

bull Lieu de stockage indeacutefini

bull Erreur humaine deacutepart de personnelhellip

bull Conseacutequences bull Perte de temps drsquoargent (fonds publicshellip)

bull Pas de veacuterification des reacutesultats possible

bull Pas de comparaison des reacutesultats dans le temps ou lrsquoespace

bull Pas de reacuteutilisations par drsquoautres publics pour drsquoautres fins

VINES Timothy H et al The Availability of Research Data Declines Rapidly with Article Age Current Biology 2014

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la reproductibiliteacute de la science

ldquoMore than 70 of researchershave tried and failed to reproduceanother scientists experimentsand more than half have failed toreproduce their ownexperimentsrdquo ()

Nature mai 2016 httpswwwnaturecomnews1-500-scientists-lift-the-lid-on-reproducibility-119970

Les effets neacutegatifs du laquo Publish or Perish raquohellip

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 8: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Ne relevant pas des donneacutees de la recherche

Selon lOCDE Les documents non acheveacutes

bull les carnets de laboratoirebull les analyses preacuteliminaires les projets de documents scientifiques et

les programmes de travaux futursbull les examens par les pairsbull les communications personnelles avec des collegravegues hellip

Les objets mateacuteriels bull les souches bacteacuteriennesbull les animaux de laboratoirehellip

Les productions scientifiquesbull les publications scientifiques communications agrave congregravesbull les supports de formation hellip

Les donneacutees administratives non inteacutegreacutees dans un corpus de recherche

Image de PixabayOALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Deacutefinition des jeux de donneacutees (Dataset)

bull laquo Agreacutegation sous une forme lisible de donneacutees brutes ou deacuteriveacutees preacutesentant une certaine uniteacute rassembleacutees pour former un ensemble coheacuterent raquo (Gaillard 2014)

bull Uniteacute de deacutepocirct dans un entrepocirct sa granulariteacute ne doit ecirctre ni trop petite ni trop grande pour faciliter la citation

bull Compleacuteteacute par des meacutetadonneacutees neacutecessaires agrave leur reacuteutilisation et agrave leur validation meacutethodes drsquoobtention logiciels neacutecessaires auteurs couverture temporelle et spatiale etchellip

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Les enjeux de louverture des donneacutees de la recherche scientifique

Enjeux scientifiques bull Deacutefis scientifiques complexes

bull Accroicirctre limpact de la science

bull Faire eacutevoluer les systegravemes deacutedition

bull Eviter la perte de donneacutees

Enjeux eacuteconomiquesbull Valeur eacuteconomique de la donneacuteebull Conditions de financement des

bailleursbull Continuiteacute de la recherchebull Big Data et data science

Enjeux socieacutetauxbull Seacutecurisation des donneacuteesbull Interopeacuterabiliteacute des donneacuteesbull Participation citoyennebull Transparence du processus

scientifique

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la perte des donneacutees

20 ans apregraves publication 80 des donneacutees scientifiques sont perdueshellip

bull Causes bull Destruction des supports virus

bull Obsolescence mateacuterielle ou logicielle

bull Lieu de stockage indeacutefini

bull Erreur humaine deacutepart de personnelhellip

bull Conseacutequences bull Perte de temps drsquoargent (fonds publicshellip)

bull Pas de veacuterification des reacutesultats possible

bull Pas de comparaison des reacutesultats dans le temps ou lrsquoespace

bull Pas de reacuteutilisations par drsquoautres publics pour drsquoautres fins

VINES Timothy H et al The Availability of Research Data Declines Rapidly with Article Age Current Biology 2014

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la reproductibiliteacute de la science

ldquoMore than 70 of researchershave tried and failed to reproduceanother scientists experimentsand more than half have failed toreproduce their ownexperimentsrdquo ()

Nature mai 2016 httpswwwnaturecomnews1-500-scientists-lift-the-lid-on-reproducibility-119970

Les effets neacutegatifs du laquo Publish or Perish raquohellip

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 9: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Deacutefinition des jeux de donneacutees (Dataset)

bull laquo Agreacutegation sous une forme lisible de donneacutees brutes ou deacuteriveacutees preacutesentant une certaine uniteacute rassembleacutees pour former un ensemble coheacuterent raquo (Gaillard 2014)

bull Uniteacute de deacutepocirct dans un entrepocirct sa granulariteacute ne doit ecirctre ni trop petite ni trop grande pour faciliter la citation

bull Compleacuteteacute par des meacutetadonneacutees neacutecessaires agrave leur reacuteutilisation et agrave leur validation meacutethodes drsquoobtention logiciels neacutecessaires auteurs couverture temporelle et spatiale etchellip

OALR Deacutecembre 2019 Filatre A - Hensens H

11 Deacutefinitions et typologie

Les enjeux de louverture des donneacutees de la recherche scientifique

Enjeux scientifiques bull Deacutefis scientifiques complexes

bull Accroicirctre limpact de la science

bull Faire eacutevoluer les systegravemes deacutedition

bull Eviter la perte de donneacutees

Enjeux eacuteconomiquesbull Valeur eacuteconomique de la donneacuteebull Conditions de financement des

bailleursbull Continuiteacute de la recherchebull Big Data et data science

Enjeux socieacutetauxbull Seacutecurisation des donneacuteesbull Interopeacuterabiliteacute des donneacuteesbull Participation citoyennebull Transparence du processus

scientifique

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la perte des donneacutees

20 ans apregraves publication 80 des donneacutees scientifiques sont perdueshellip

bull Causes bull Destruction des supports virus

bull Obsolescence mateacuterielle ou logicielle

bull Lieu de stockage indeacutefini

bull Erreur humaine deacutepart de personnelhellip

bull Conseacutequences bull Perte de temps drsquoargent (fonds publicshellip)

bull Pas de veacuterification des reacutesultats possible

bull Pas de comparaison des reacutesultats dans le temps ou lrsquoespace

bull Pas de reacuteutilisations par drsquoautres publics pour drsquoautres fins

VINES Timothy H et al The Availability of Research Data Declines Rapidly with Article Age Current Biology 2014

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la reproductibiliteacute de la science

ldquoMore than 70 of researchershave tried and failed to reproduceanother scientists experimentsand more than half have failed toreproduce their ownexperimentsrdquo ()

Nature mai 2016 httpswwwnaturecomnews1-500-scientists-lift-the-lid-on-reproducibility-119970

Les effets neacutegatifs du laquo Publish or Perish raquohellip

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 10: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Les enjeux de louverture des donneacutees de la recherche scientifique

Enjeux scientifiques bull Deacutefis scientifiques complexes

bull Accroicirctre limpact de la science

bull Faire eacutevoluer les systegravemes deacutedition

bull Eviter la perte de donneacutees

Enjeux eacuteconomiquesbull Valeur eacuteconomique de la donneacuteebull Conditions de financement des

bailleursbull Continuiteacute de la recherchebull Big Data et data science

Enjeux socieacutetauxbull Seacutecurisation des donneacuteesbull Interopeacuterabiliteacute des donneacuteesbull Participation citoyennebull Transparence du processus

scientifique

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la perte des donneacutees

20 ans apregraves publication 80 des donneacutees scientifiques sont perdueshellip

bull Causes bull Destruction des supports virus

bull Obsolescence mateacuterielle ou logicielle

bull Lieu de stockage indeacutefini

bull Erreur humaine deacutepart de personnelhellip

bull Conseacutequences bull Perte de temps drsquoargent (fonds publicshellip)

bull Pas de veacuterification des reacutesultats possible

bull Pas de comparaison des reacutesultats dans le temps ou lrsquoespace

bull Pas de reacuteutilisations par drsquoautres publics pour drsquoautres fins

VINES Timothy H et al The Availability of Research Data Declines Rapidly with Article Age Current Biology 2014

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la reproductibiliteacute de la science

ldquoMore than 70 of researchershave tried and failed to reproduceanother scientists experimentsand more than half have failed toreproduce their ownexperimentsrdquo ()

Nature mai 2016 httpswwwnaturecomnews1-500-scientists-lift-the-lid-on-reproducibility-119970

Les effets neacutegatifs du laquo Publish or Perish raquohellip

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 11: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Contexte scientifique la perte des donneacutees

20 ans apregraves publication 80 des donneacutees scientifiques sont perdueshellip

bull Causes bull Destruction des supports virus

bull Obsolescence mateacuterielle ou logicielle

bull Lieu de stockage indeacutefini

bull Erreur humaine deacutepart de personnelhellip

bull Conseacutequences bull Perte de temps drsquoargent (fonds publicshellip)

bull Pas de veacuterification des reacutesultats possible

bull Pas de comparaison des reacutesultats dans le temps ou lrsquoespace

bull Pas de reacuteutilisations par drsquoautres publics pour drsquoautres fins

VINES Timothy H et al The Availability of Research Data Declines Rapidly with Article Age Current Biology 2014

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte scientifique la reproductibiliteacute de la science

ldquoMore than 70 of researchershave tried and failed to reproduceanother scientists experimentsand more than half have failed toreproduce their ownexperimentsrdquo ()

Nature mai 2016 httpswwwnaturecomnews1-500-scientists-lift-the-lid-on-reproducibility-119970

Les effets neacutegatifs du laquo Publish or Perish raquohellip

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 12: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Contexte scientifique la reproductibiliteacute de la science

ldquoMore than 70 of researchershave tried and failed to reproduceanother scientists experimentsand more than half have failed toreproduce their ownexperimentsrdquo ()

Nature mai 2016 httpswwwnaturecomnews1-500-scientists-lift-the-lid-on-reproducibility-119970

Les effets neacutegatifs du laquo Publish or Perish raquohellip

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 13: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Contexte international la Science Ouverte

OALR Deacutecembre 2019 Filatre A - Hensens H

Loi Cada (1978)Directive PSI

(2003)

Directive Inspire (2007)

Charte du G8 (2013)

Loi Valter(2015)

Initiative de Budapest (2002)

Initiative de Berlin(2003)

Directive Inspire (2003)

Deacuteclaration de lOCDE

(2006)

Plan S (2018)

Horizon 2020

(2013-2016)

Loi pour une Reacutepublique Numeacuterique

(2016)

Plan National pour la Science Ouverte (2018)

ANR politique Science Ouverte

(2019)

Open Data

Open Access

Open Science

12 Enjeux et politiques

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 14: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Focus Plan National pour la Science Ouverte

Juillet 2018

bull Axe 1 Geacuteneacuteraliser lrsquoaccegraves ouvert aux publications

bull Axe 2 Structurer et ouvrir les donneacutees de la recherche

bull Axe 3 srsquoinscrire dans une dynamique durable europeacuteenne et internationale

laquoLa France sengage pour que les reacutesultats de la recherche scientifique soient ouverts agrave tous chercheurs entreprises et citoyens sans entrave sans deacutelai sans payementraquo (httpswwwouvrirlasciencefr)

OALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 15: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Focus Politique science ouverte de lrsquoANR

bull Favoriser le libre accegraves aux publications (Open Access)

bull Contribuer agrave lrsquoouverture des donneacutees quand cela est possible (Open ResearchData)

bull Coordonner les actions aux niveaux europeacuteen et international

httpsanrfrfrlanr-et-la-rechercheengagements-et-valeursla-science-ouverteOALR Deacutecembre 2019 Filatre A - Hensens H

12 Enjeux et politiques

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 16: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Le cadre juridique franccedilais

bull Drsquoune maniegravere geacuteneacuterale les donneacutees sont reacuteputeacutees laquo de libre parcours raquo elles ne sont pas proteacutegeacutees par le droit drsquoauteur

bull Les donneacutees issues de la recherche sont consideacutereacutees comme des documents administratifs si elles ont eacuteteacute produites dans le cadre dune mission de service public ou majoritairement gracircce agrave des fonds publics

bull Elles sont donc communicables agrave la demande (sauf exceptions leacutegales) si elles sont acheveacutees

bull Depuis la Loi pour une Reacutepublique Numeacuterique (2016) elles sont mecircme soumises agrave un principe drsquoouverture par deacutefaut

bull Ces donneacutees publiques doivent ecirctre diffuseacutees gratuitement et librement reacuteutilisables

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 17: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Les exceptions publication sous conditions

bull Les donneacutees personnelles (RGPD) en particulier les donneacutees sensibles (CNIL)

bull Les donneacutees proteacutegeacutees par le droit drsquoauteur (œuvres originales)

bull Les donneacutees qui impliquent un partenaire eacutetranger ou priveacute (Droit sui generis des bases de

donneacutees)

bull Les donneacutees concernant les ressources geacuteneacutetiques et laquo connaissances traditionnelles raquo

associeacutees Protocole de Nagoya

bull Les informations pouvant avoir un impact sur la conservation de la biodiversiteacute Code de

lrsquoEnvironnement

bull Les donneacutees preacutesentant des risques pour la protection du potentiel scientifique et technique

de la nation produites dans des laboratoires classeacutes laquo zones agrave reacutegime restrictif raquo (ZRR)

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 18: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Les exceptions Publication interdite

bull Donneacutees relatives agrave la seacutecuriteacute publique sureteacute de lrsquoEtat et seacutecuriteacute des lrsquoeacutetablissements biens personnes informatique hellip

bull Secret professionnel secret des proceacutedeacutes secret meacutedical secret de lrsquoinstruction secret bancaire hellip

bull Secret deacutefenseOALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 19: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Les licences preacutecisent les droits de diffusion

Deacutecret ndeg 2017-638 du 27 avril 2017 relatif aux licences de reacuteutilisation agrave titre gratuit des informations publiques et aux modaliteacutes de leur homologation

bull lrsquoODbL (Open Database License version 10) pour controcircler les redistributions et les travaux deacuteriveacutes ou pour une diffusion internationale (~CC-BY-SA)

bull la Licence Ouverte Etalab si le suivi du devenir des donneacutees nrsquoest pas rechercheacute et si les donneacutees sont essentiellement distribueacutees en France (~CC-BY)

Les licences Creative Commons alternative internationale possiblebull Pour choisir httpscreativecommonsorgchooselang=frbull Pour comprendre httpscreativecommonsorglicenseslang=fr-FR

OALR Deacutecembre 2019 Filatre A - Hensens H

13 Cadre juridique

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 20: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Des Questions

OALR Deacutecembre 2019 Filatre A - Hensens H

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 21: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

1 Contours et contexte

1 Deacutefinition et typologie

2 Enjeux et politiques

3 Cadre juridique

OALR Deacutecembre 2019 Filatre A - Hensens H

2 En pratique1 Rechercher et utiliser des donneacutees

2 Geacuterer des donneacutees

3 Publier des donneacutees

Introduction aux donneacutees de la recherche Plan

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 22: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Rechercher des donneacutees les entrepocircts de donneacutees

bull Un entrepocirct est un service en ligne permettant le deacutepocirct la description la conservation la recherche et la diffusiondes jeux de donneacutees

bull Les entrepocircts peuvent ecirctre geacuteneacuteralistes ou theacutematiques publics ou proprieacutetaires gratuits ou payants reacuteserveacutes agrave un organisme ou ouvert agrave tous

bull Leurs interfaces de recherche peuvent ecirctre plus ou moins avanceacutees moteurs de recherche interne vocabulaires filtres facettes hellip

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 23: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Rechercher des donneacutees les reacutepertoires et annuaires

Les annuaires et reacutepertoires classent les entrepocircts par critegraveres geacuteographiques theacutematiques hellip

Annuaires multidisciplinairesbull Re3databull OAD (Open Access Directory)Annuaires speacutecialiseacutes

bull FAIRsharing (sciences de la vie et biomeacutedecine)bull NIH Data Sharing Repositories (Biomeacutedecine)bull CAT Opidor (Entrepocircts de donneacutees franccedilais)Annuaires mixtesbull OpenDOARbull ROARAnnuaires d rsquoentrepocircts certifieacutesbull CoreTrustSeal

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 24: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Rechercher des donneacutees les moteurs de recherche

bull Recherche feacutedeacutereacutee sur plusieurs entrepocircts

bull Donneacutees de tous types et de tous les domaines

bull Filtres puissants

Moteurs de recherche de donneacutees

bull Datacite (DOI)

bull DataSearch (Elsevier v Beta)

bull Google Dataset Search (v Beta)bull BASE (ressources laquo acadeacutemiques raquo)

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 25: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Droits drsquoutilisation

bull Si une licence est associeacutee au jeu de donneacutees cela clarifie les droits drsquoutilisation mecircme si ccedila peut les restreindre

bull En lrsquoabsence de licence un jeu de donneacutees peut ecirctre proteacutegeacute par le code de la proprieacuteteacute intellectuelle (œuvres originales bases de donneacutees priveacutees ayant neacutecessiteacute des investissements substantiels) mieux vaut alors demander lrsquoautorisation du titulaire du droithellip

bull Dans tous les cas sauf dans le cadre de la licence CCO lrsquoutilisateur de donneacutees est obligeacute de citer sa source car le droit de paterniteacute en tant que droit moral est inalieacutenable

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 26: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Citer un jeu de donneacutees

Le format minimal drsquoune reacutefeacuterence bibliographique drsquoun jeu de donneacutees comporte 5 eacuteleacutements selon la recommandation de DataCite

Auteur (Anneacutee de publication) Titre Editeur (=organisme responsable) Identifiant

Ce format minimal peut ecirctre compleacuteteacute par la version et le type de ressource Auteur (Anneacutee de publication) Titre Version Editeur Type de ressource Identifiant

Lrsquooutil en ligne DOI Citation Formatter deacuteveloppeacute par DataCiteet CrossRef geacutenegravere agrave partir du DOI la reacutefeacuterence bibliographique du jeu de donneacutees dans plus de 500 formats au choix

OALR Deacutecembre 2019 Filatre A - Hensens H

21 Rechercher et utiliser

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 27: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Changer les pratiques de gestion des donneacutees

Conception projet

Conception meacutethode(s)

Deacutemarrage projet

Analyse donneacutees

Fin du projet

PUBLICATION

Description Deacutepocirct

Stockage

DeacutecouvertePartageNouvelles recherches publications citations

PGD

ENTREPOT

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Acquisition donneacutees

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 28: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Un PGDDMP Qursquoest-ce que crsquoest

Deacutefinition

Un document formaliseacute (type formulaire)

Liste toutes les questions agrave se poser

A toutes les eacutetapes du cycle de vie des donneacutees

A commencer le plus tocirct possible (au deacutemarrage dun projet)

Objectifs

Aide agrave la mise en place de bonnes pratiques de gestion des donneacutees

Pour des donneacutees plus fiables compreacutehensibles disponibles tout au long du projet

Preacuteserveacutees si elles le meacuteritent pour une reacuteutilisation future

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 29: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Les PGD ont toujours les mecircmes rubriques

1 Description du projet de recherche but partenaires responsabiliteacutes leadershiphellip

2 Inventaire et Description des donneacutees type taille meacutethode de collecte et traitementhellip

3 Documentation meacutetadonneacutees documents compleacutementaires logiciel neacutecessairehellip

4 Sauvegarde et seacutecuriteacute mateacuteriel et meacutethode peacuteriodiciteacute et nombre de copies versioning nommagehellip

5 Droit et eacutethique selon le type de donneacutees (personnelles santeacute vivant) les loishellip

6 Conservation quelles donneacutees agrave long terme combien de temps agrave quel endroit

7 Partage (pendant et apregraves le projet) accegraves licences embargo confidentialiteacutehellip

8 Ressources mateacuterielles financiegraveres humaines hellip

Fiche syntheacutetique Doranum

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 30: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

LE PGD est eacutevolutif

Un PGD nrsquoest pas figeacute

bull il doit ecirctre mis agrave jour tout au long du projet

bull Il doit comporter des versions successives

bull Exemple H2020 3 versions minimum (pas de maximum)

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 31: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Le PGD est un travail de groupe

Participent agrave la gestion des donneacutees et donc agrave la reacutedaction du PGD bull Scientifiques description validationbull Ingeacutenieurs-donneacutees sauvegarde qualiteacutebull Informaticiens seacutecurisation infrastructurebull Speacutecialistes IST modegraveles de PGD standards

de meacutetadonneacutees bull Archivistes donneacutees agrave conserver dureacutees et

solutions techniquesbull Juristes proprieacuteteacute intellectuelle leacutegislation

donneacutees personnelles sensibleshellipbull Chargeacutes de valorisation reacutedaction des

conventions agrave signer Reymonet N Moysan M Cartier A amp Deacuteleacutemontez R (2018) Reacutealiser un plan de gestion de donneacutees laquo FAIR raquo

OALR Deacutecembre 2019 Filatre A - Hensens H

22 Geacuterer des donneacutees

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 32: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Diffusion des donneacutees dans le respect des principes FAIR

OALR Deacutecembre 2019 Filatre A - Hensens H

bull Licence drsquoutilisation approprieacutee

bull Formats ouverts

bull Vocabulaire partageacute

bull Standards de meacutetadonneacutees communs

bull Accegraves peacuterenne aux donneacutees

bull Accord des producteurs

bull Identifiant

peacuterenne

bull Meacutetadonneacutees

Facile agrave trouver

Accessible

ReacuteutilisableInter-opeacuterable

Aussi ouvert que possible aussi fermeacute que neacutecessaire

23 Publier des donneacutees

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 33: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Entrepocircts de donneacutees critegraveres de choix

Caracteacuteristiques Fonctionnaliteacutes Limites

Peacuterenniteacute de lrsquoentrepocirctPreacuteservation et archivage des donneacutees garanti

Discipline(s)

Faciliteacute de deacutepocirct Identifiant peacuterenne (DOI) Coucircts

Faciliteacute de recherche deacutecouverte des donneacutees

Controcircle drsquoaccegraves aux donneacutees Types de donneacutees

Localisation du serveur Gestion des droits Formats accepteacutes

Description des donneacutees _meacutetadonneacutees_ (adaptationdisciplinaire utilisation de standards controcircleshellip)

Statistiques drsquousage (consultation teacuteleacutechargement traccedilabiliteacute provenancehellip)

Volumes maximaux (fichier jeu de donneacutees)

Production de citation Versionning Licences proposeacutees

Organisation (arborescencehellip)Interopeacuterabiliteacute moissonnage

Deacuteposants autoriseacutes (pays organismehellip)

Preacutepublication (lien priveacute pour reviewershellip)

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 34: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Principe du Data paperData paper

Deacutecrire un jeu de donneacutees

en vue de sa reacuteutilisation

Jeu de donneacutees

Informer la communauteacute

scientifiqueMettre agrave dispositiondrsquoune

communauteacute scientifique

Entrepocirct de donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

23 Publier des donneacutees

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 35: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Contenu et Objectif du Data Paper

Un article scientifiquehellip pas comme les autres

bull Deacutecrit un jeu de donneacutees pour permettre leur reacuteutilisation et leur identification

bull Deacutetaille les meacutethodes drsquoobtention pour permettre de reproduire lrsquoeacutetude

pour montrer rigueur scientifiquequaliteacute donneacutees

bull Montre le potentiel de reacuteutilisation des donneacutees

originaliteacute des donneacutees

pour qui et pour quoi elles peuvent ecirctre utiles

bull Donne accegraves aux donneacutees

Ni reacutesultats ni analyses ni discussion

OALR Deacutecembre 2019 Filatre A - Hensens H

Rubriques types

23 Publier des donneacutees

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 36: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Partage de donneacutees entre injonctions hellip

Incitation ou obligation de partage de PGDhellip des bailleurs des politiques des eacutediteurs des eacutetablissementshellip

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 37: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

hellip et beacuteneacutefices

Augmenter sa visibiliteacute et ses citationsLe partage des donneacutees augmente

lrsquoattractiviteacute de lrsquoarticle

Eacutetendre son reacuteseaunouvelles opportuniteacutes pour

eacutechangercollaborer

Ameacuteliorer sa reacuteputationet attirer sur son profil chercheur

Renforcer ses possibiliteacutes de recevoir des financements

(compatibiliteacute avec les exigences des financeurs)

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 38: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Lever les freins agrave louverture des donneacutees

ndash Cest agrave moi ndash Les donneacutees de la recherche ne relegravevent pas du champs de la

proprieacuteteacute intellectuelle hellip

ndash Crsquoest compliqueacute hellipndash Utiliser les standards de votre discipline un modegravele de PGDDMP

les sites de reacutefeacuterence les services drsquoappui travailler en eacutequipehellip

ndash Crsquoest cher hellipndash Les frais (de stockage dorganisation de deacutepocirct dans un entrepocirct -

la plupart sont gratuits - ) sont eacuteligibles dans les appels agrave projets

ndash Crsquoest risqueacute hellipndash Des sites vous aident agrave repeacuterer les exceptions agrave la regravegle geacuteneacuterale

douverture des donneacuteeshellip et les services drsquoappui peuvent ecirctre contacteacutes au moindre doute

OALR Deacutecembre 2019 Filatre A - Hensens H

Conclusion

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 39: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Sourcesbull Ateliers du Colloque Science Ouverte au Sud Dakar (Seacuteneacutegal) 23-25112019

httpsopensciencesudsciencesconforgresourcepageid6

bull Ciolek-Figiel A et Cosserat F 2016 Gestion et diffusion des donneacutees de la recherche Vandoeuvre-legraves-Nancy Inist ndash CNRS Disponible agrave httpsdrivegooglecomfiled0BxKZLWq08xX-TW5VOEUtd2FSRE0view

bull CoSO httpswwwouvrirlasciencefrcollege-donnees-de-la-recherche Livrables amp productions (en particulier cadre juridique ndash2017)

bull CoopIST CIRAD httpscoop-istciradfrgerer-des-donnees

bull Datapartage INRA httpwww6inrafrdatapartage

bull Fabre C 2019 Gestion et diffusion des donneacutees de la recherche ndash Urfist Toulouse ndash 17 amp 18 juin 2019 82 p

bull Fiches pratiques CIST Agropolis httpwwwistagropolisfrles-ressourcesfiches-pratiques

bull IRD Data httpsdatairdfr

bull Lafosse 2018 Initiation aux donneacutees de la recherche ndash URFIST Paris ndash 27 amp 28 mars 2019

bull Maurel L 2018 La reacuteutilisation des donneacutees de la recherche apregraves la loi pour une Reacutepublique numeacuterique La diffusion numeacuterique des donneacutees en SHS - Guide de bonnes pratiques eacutethiques et juridiques Presses Universitaires de Provence 9791032001790 ⟨hal-01908766⟩

bull Seacuteminaire de lancement de DataSuds Montpellier (en particulier intervention de Lionel Maurel sur la cadre juridique des donneacutees de la recherche) httpsdatairdfrseminaire-de-lancement-de-lentrepot-datasuds

bull Serres httpsguides-formadoctubretagneloirefrdonnees_recherche

bull Slide Share IST IRD httpsfrslidesharenetIST_IRDpresentations

bull Sites drsquoaide agrave la deacutecision pour le partage des donneacutees questionnaire INRA logigramme de lrsquoENPC

OALR Deacutecembre 2019 Filatre A - Hensens H

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 40: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Des Questions

Merci agrave toutes et agrave tous

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 41: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Questions reacuteponses (1)bull Pourquoi les cahiers de laboratoire ne sont-ils pas consideacutereacutes comme des donneacutees Essentiellement parce qursquoils sont consideacutereacutes comme des documents laquo non acheveacutes raquo cf Diapo 8

bull Comment partager les donneacutees conformeacutement au cadre leacutegal et quels sont les points drsquoattention particuliers Vous avez une premiegravere reacuteponse agrave ces questions sur les diapos 16 agrave 18 Pour aller plus loin explorez nos sources Diapo 39

bull Que signifie versioning Le laquo versioning raquo (pardon pour le franglais) est la gestion manuelle semi-automatiseacutee ou automatiseacutee des versions successives drsquoun fichier quand creacutee-t-on une nouvelle version (majeuremineure) comment elles sont nommeacutees combien on en conserve combien de tempshellip

bull Dans le cas des donneacutees qui ne peuvent ecirctre rendues publiques quel sont les moyens de les conserver de maniegravere durable et pas dans un coin du disque dur

Mandateacute par le Ministegravere de lEnseignement Supeacuterieur et de la Recherche le CINES propose des solutions darchivage numeacuterique Pour en savoir plus httpswwwcinesfrarchivage

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 42: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Questions reacuteponses (2)bull Comment formaliser un PGD pour un projet europeacuteen Il existe plusieurs modegraveles de PGDDMP pour les projets H2020 ECShellip (en franccedilais en anglais FAIR ou pashellip)Vous les trouverez entre autres sur les sites drsquoaide agrave la gestion de PGD comme DMP Opidor (onglet Modegraveles de DMPPublic Templates)

bull Les PGD sont ils publics (accessibles par tous) Les PGD sont publics si leurs reacutedacteurs les rendent publics sur le site ougrave ils ont eacuteteacute reacutedigeacutes comme DMP Opidorou DMP Tool (onglet Public Plans) ou les publient dans un journal comme RIO (Research Ideas and Outcomes) qui a une section DMP

bull Ougrave peut-on conserver les PGD Les outils en ligne drsquoaide agrave la reacutedaction (et notamment DMP Opidor) ne conservent que 5 ans apregraves la derniegravere modification les PGD non publics Pour conserver un PGD plus longtemps vous pouvez le publier (cf ci-dessus) ou le joindre aux jeux de donneacutees que vous deacuteposez dans un entrepocirct comme un fichier de meacutetadonneacutees suppleacutementaire

bull Le PGD est-t-il inclus dans la norme ISO9001 PGD et Deacutemarche qualiteacute se complegravetent reacutediger un Plan de Gestion de Donneacutees est un gage de qualiteacute de la recherche et les deacutemarchescertifications qualiteacute sont agrave signaler dans le Plan de Gestion de Donneacutees

OALR Deacutecembre 2019 Filatre A - Hensens H

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H

Page 43: Hensens Hanka Filatre Annabelle IRD Montpellier ......Cycle de vie de la donnée [IST Agropolis, 2016] OALR / Décembre 2019 / Filatre A. - Hensens H. 1.1. Définitions et typologie

Questions reacuteponses (3)bull Y a -t-il des formations speacutecifiques pour mettre en place des PGD (profil IST) Il existe de nombreuses formations pour reacutediger ou aider agrave la reacutedaction de Plans de Gestion de Donneacutees LrsquoURFIST par exemple en organise reacuteguliegraverement

bull Ougrave deacuteposer un data paper Le data paper est un article soumis pour publication dans une revue qui publie uniquement des data papers appeleacutee data journal ou dans une revue qui a une section Data Papers (cf la liste mise agrave jour sur le site du CiradCoopIST) httpscoop-istciradfractualitesrediger-et-publier-un-data-paper2)Le processus de reviewing par les pairs est identique agrave celui drsquoun article scientifique laquo classique raquo

bull Les publications dans les data papers comptent-elles pour la qualification CNU Le CNU est le Conseil National des Universiteacute qui donne la qualification neacutecessaire pour preacutetendre agrave un poste de Maitre de confeacuterence La liste des critegraveres neacutecessaires deacutepend des domaines Il faut donc vous rapprocher de votre section pour savoir si les data papers font partie des types de publication pris en compte

bull Est-ce quon peut encrypter les donneacutees sensibles pour les proteacuteger Les donneacutees personnelles en geacuteneacuteral et les donneacutees sensibles en particulier doivent leacutegalement ecirctre anonymiseacutees soigneusement avant toute publication pour eacuteviter que les personnes puissent ecirctre reconnues Avant anonymisation des mesures (agrave deacutetailler dans la partie juridique et eacutethique des PGD) doivent ecirctre mises en place durant le projet pour les proteacuteger lrsquoencryptage (en particulier lors des transferts) peut en faire partie

OALR Deacutecembre 2019 Filatre A - Hensens H