62
Aspects juridiques de l'archivage pérenne de l'information scientifique DAM – 20-21 mars 2014 Pierre Naegelen Responsable du Service des Ressources Électroniques & Administrateur de contenus site web Service Commun de la Documentation Université Paul Sabatier Toulouse III Les propos tenus ici n’engagent que moi

Aspects juridiques de l'archivage pérenne de l'information scientifique

Embed Size (px)

DESCRIPTION

Typologie des différents dépôts de documents scientifiques

Citation preview

Page 1: Aspects juridiques de l'archivage pérenne de l'information scientifique

Aspects juridiques de l'archivage pérenne de l'information

scientifiqueDAM – 20-21 mars 2014Pierre Naegelen Responsable du Service des Ressources Électroniques & Administrateur de contenus site web Service Commun de la DocumentationUniversité Paul Sabatier Toulouse III 

Les propos tenus ici n’engagent que moi

Page 2: Aspects juridiques de l'archivage pérenne de l'information scientifique

Information payante ?

En fait la frontière payant/gratuit est poreuse :

- Archives ouvertes

- Réseaux sociaux scientifiques

- EoD (E-books on Demand)

- Knowledge Unlatched

Page 3: Aspects juridiques de l'archivage pérenne de l'information scientifique

D’autant que certains éditeurs recommercialisent des articles qui pourraient être gratuits …

Page 4: Aspects juridiques de l'archivage pérenne de l'information scientifique

Source : Bernard Bel. Journées OAIS 23-24 octobre 2012. Centre de calcul de l’IN2P3, Lyon

Page 5: Aspects juridiques de l'archivage pérenne de l'information scientifique

Les « réseaux sociaux scientifiques »

Page 6: Aspects juridiques de l'archivage pérenne de l'information scientifique

Les « réseaux sociaux scientifiques »…

Source : « Protection et propriété des données sur Academia.edu et ResearchGate ». Par Christophe Benech. Archéo- Orient, le blog.

Source : « Protection et propriété des données sur Academia.edu et ResearchGate ». Par Christophe Benech. Archéo- Orient, le blog.

Instabilité juridique ! Elsevier a récemment sommé Academia de retirer des articles

Page 7: Aspects juridiques de l'archivage pérenne de l'information scientifique

Les abonnements institutionnels courants

Page 8: Aspects juridiques de l'archivage pérenne de l'information scientifique

Cas général :

Les abonnements ne procurent l’accès  que pour la période la plus récente, en général : de 1997 au présent

• L’accès aux numéros antérieurs est soumis à un surcoût• L’éditeur propose en général l’achat pérenne des

archives• En cas de désabonnement à une revue, le plus souvent,

on perd l’accès aux numéros antérieurement souscrits

Les abonnements institutionnels courants aux revues en ligne : quid de l'accès aux archives ?

Page 9: Aspects juridiques de l'archivage pérenne de l'information scientifique

Cas particulier de la « barrière mobile » (on parle aussi d’ « années roulantes »)

Source : « Pas de petits profits pour les éditeurs scientifiques

». Numeribib

Source : « Pas de petits profits pour les éditeurs scientifiques

». Numeribib

Dans le cas où le modèle tarifaire prévoit un accès aux 4 dernières "années roulantes" pour les archives, voici comment les choses se passent:

-à l'année n du premier abonnement, l'établissement a accès aux années n-4, n-3, n-2, n-1, n; soit, si l'on prend par exemple l'année 2011 comme année de référence (date à laquelle l'établissement aurait souscrit pour la première fois un abonnement à la revue): accès aux années 2007, 2008, 2009, 2010, 2011

- à l'année n+1, l'établissement  a accès aux années n-3, n -2, n-1, n, n+1  soit en 2012: accès aux années 2008, 2009, 2010, 2011, 2012

- à l'année n+ 2, l'établissement  a accès aux années n-2, n-1, n, n+1, n+2 soit en 2013: accès aux années 2009, 2010, 2011, 2012, 2013

-  à l'année n+ 3, l'établissement  a accès aux années n-1, n, n+1, n+2, n+3 soit en 2014: accès aux années 2010, 2011, 2012, 2013, 2014

- à l'année n+ 4, l'établissement a accès aux années n, n+1, n+2, n+3, n+4soit en 2015: accès aux années 2011, 2012, 2013, 2014, 2015.

Page 10: Aspects juridiques de l'archivage pérenne de l'information scientifique

Agrégateurs d’archives

Page 11: Aspects juridiques de l'archivage pérenne de l'information scientifique

Le cas de JSTORJSTOR est un organisme à but non lucratif fondé en 1995 par la Fondation Andrew W. Mellon dans le but de numériser et de diffuser des revues académiques. JSTOR dessert actuellement plus de 7000 institutions dans 153 pays. Depuis 1995, JSTOR a numérisé près de 1400revues académiques de plus de 800 éditeurs. 

JSTOR ne propose qu'un abonnement perpétuel. Et toute rupture momentanée d'abonnement fait perdre à l'institution le bénéfice de l'antériorité des contenus. Au plan économique, dans le cas où une institution est contrainte par sa situation budgétaire de se désabonner temporairement puis de se réabonner, elle devra repayer son ticket d'entrée sous forme d'un montant forfaitaire assez élevé.

Question des œuvres du domaine public. L’agrégateur JSTOR a annoncé les 6 et 7 septembre 2011 qu'il avait pris la décision de rendre librement accessibles les articles de journaux antérieurs à 1923  pour les Etats-Unis et à 1870 pour le reste du monde. Dans la Foire aux Questions, JSTOR précise que cette décision avait été prévue avant les affaires Swartz et Maxwell.

Source : « JSTOR, l'édition scientifique, le politique et les "hacktivists": le quatuor impossible? ». Numeribib

Source : « JSTOR, l'édition scientifique, le politique et les "hacktivists": le quatuor impossible? ». Numeribib

Page 12: Aspects juridiques de l'archivage pérenne de l'information scientifique

Les Initiatives nationales françaises

Page 13: Aspects juridiques de l'archivage pérenne de l'information scientifique

PANIST

Plateforme d'Archivage National de l'Information Scientifique et Technique des membres du consortium Couperin

Actuellement : accès aux archives de l’éditeur Elsevier pour l'ensemble des membres du groupement de commande

• La collection Freedom : 2001 à 2012 2013 disponible courant 2014

• La collection Cell Press : 1995 à 2012, pour les membres abonnés lors du groupement de commande 2013 disponible courant 2014

Page 14: Aspects juridiques de l'archivage pérenne de l'information scientifique

Le projet ISAAC (l’Information Scientifique Archivée Au CINES)

Ce projet a pour ambition d’offrir à la communauté de l’enseignement supérieur et de la recherche un service d’archivage électronique spécifique aux données scientifiques. La durée de conservation sera de 3 à 5 ans (conservation à moyen terme).

Page 15: Aspects juridiques de l'archivage pérenne de l'information scientifique

Source : « La gazette du CINES ». Février 2013.

Source : « La gazette du CINES ». Février 2013.

Page 16: Aspects juridiques de l'archivage pérenne de l'information scientifique

ISTEX et l'achat d'archives par le biais de licences nationales

Page 17: Aspects juridiques de l'archivage pérenne de l'information scientifique

BSN

La Bibliothèque scientifique numérique fait partie des Très Grandes Infrastructures de Recherche (TGIR) portées par le Ministère de l'Enseignement Supérieur et de la Recherche (MESR).

• Les segments d'activité de la BSN sont les suivants :

BSN1 - Acquisition des revues (courant) et des archives BSN2 - Dispositif d'accès et d'hébergement BSN3 - Dispositifs de signalement BSN4 - Archives ouvertes BSN5 – Numérisation BSN6 - Archivage pérenne BSN7 - Éditions numériques BSN8 - Fourniture de documents, prêt BSN9 - Formations, compétences, usages

Page 18: Aspects juridiques de l'archivage pérenne de l'information scientifique

Projet ISTEX

• Initiative d’excellence de l’Information Scientifique et Technique.

• Le projet ISTEX s’inscrit dans le programme « Investissements d’Avenir », initié par le Ministère de l’Enseignement Supérieur et de la Recherche, dont l’ambition est de renforcer la recherche et l’enseignement supérieur français sur la scène mondiale.

• Ce projet est porté par quatre partenaires : le CNRS, l’ABES, Couperin et l’Université de Lorraine agissant pour le compte de la Conférence des Présidents d’Université (CPU).

• Signée le 19 avril 2012 par l’ANR (Agence Nationale pour la Recherche), l’Etat et le CNRS, la convention d’attribution d’aide au projet s’élève à 60 millions d’euros sur trois ans dont 55 millions d’euros consacrés aux acquisitions des ressources documentaires et 5 millions d’euros alloués à la création de la plateforme destinée à héberger les données.

Page 19: Aspects juridiques de l'archivage pérenne de l'information scientifique
Page 20: Aspects juridiques de l'archivage pérenne de l'information scientifique

Question connexe à l’archivage : la question du domaine public (au sens du droit d’auteur)

Page 21: Aspects juridiques de l'archivage pérenne de l'information scientifique

Un copyfraud est une fausse déclaration de possession de droit d'auteur faite dans le but d'acquérir le contrôle d'une œuvre quelconque1. La définition a été proposée par Jason Mazzone, un professeur associé en droit à la Brooklyn Law School,

Mazzone identifie quatre cas types de copyfraud :

• déclarer posséder des droits d'auteur sur du matériel du domaine public2 ;

• imposer des restrictions d'utilisation allant au-delà de ce que la loi permet3 ;

• déclarer posséder des droits d'auteur sur la base de possession de copies ou d'archives du matériel4 ;

• déclarer posséder des droits d'auteur en publiant un travail du domaine public sous un support différent5.

Le copyfraud

Source : « Copyfraud» . Wikipedia. CC-BY-SASource : « Copyfraud» . Wikipedia. CC-BY-SA

Page 22: Aspects juridiques de l'archivage pérenne de l'information scientifique

Idée centrale :

La numérisation ne fait pas naître de nouveaux droits sur l'oeuvre !

Le copyfraud

Source : Ministère de la Culture et de la Communication

Source : Ministère de la Culture et de la Communication

Page 23: Aspects juridiques de l'archivage pérenne de l'information scientifique

Proposition 74 du rapport Lescure :

Renforcer la protection du domaine public dans l’univers numérique : établir dans le code de la propriété intellectuelle une définition positive du domaine public ; indiquer que les reproductions fidèles d’œuvres du domaine public appartiennent aussi au domaine public, et affirmer la prééminence du domaine public sur les droits connexes.

Le copyfraud

Source : Rapport de la Mission « Acte II de l’exception culturelle » : Contribution aux politiques culturelles à l’ère numérique (Tome 1)

Source : Rapport de la Mission « Acte II de l’exception culturelle » : Contribution aux politiques culturelles à l’ère numérique (Tome 1)

Page 24: Aspects juridiques de l'archivage pérenne de l'information scientifique

BVMM

A lire: « Des manuscrits médiévaux placés sous droits d'auteur» . Guillaume Champeau. Numérama

A lire: « Des manuscrits médiévaux placés sous droits d'auteur» . Guillaume Champeau. Numérama

Page 25: Aspects juridiques de l'archivage pérenne de l'information scientifique

Les Accords BnF

Page 27: Aspects juridiques de l'archivage pérenne de l'information scientifique

Les accords BnF

Source: « Numérisation à la BnF : comment la France est en train de se faire rouler… » . S.I.Lex. Blog de Lionel Maurel. CC0

Source: « Numérisation à la BnF : comment la France est en train de se faire rouler… » . S.I.Lex. Blog de Lionel Maurel. CC0

• “available for free throughout the U.K. and the developing world”

Page 28: Aspects juridiques de l'archivage pérenne de l'information scientifique

Les accords BnF

Page 29: Aspects juridiques de l'archivage pérenne de l'information scientifique

Question parlementaire de la députée Françoise Guégot

Réponse de la Ministre de la Culture :

« Les accords signés par la BnF ne concèdent d'exclusivité que sur les documents issus de la numérisation et qui, par définition, ne relèvent pas du domaine public puisqu'ils sont aussi le produit de l'activité du partenaire privé.

En revanche, les documents physiques, qui sont la source de la numérisation et qui relèvent du domaine public, ne sont grevés d'aucune exclusivité : ils peuvent toujours être numérisés ou communiqués à qui en fera la demande, dans le cadre ordinaire des missions de la Bibliothèque nationale de France. »

Accords BnF

Copyfraud !Copyfraud !

Confusion de deux types de

domaines publics…

Confusion de deux types de

domaines publics…

A lire: « Copyfraud : le ministère de la Culture privatise le domaine public » . Hôtel Wikipedia. Blog de Pierre-Carl Langlais. CC0

A lire: « Copyfraud : le ministère de la Culture privatise le domaine public » . Hôtel Wikipedia. Blog de Pierre-Carl Langlais. CC0

Page 30: Aspects juridiques de l'archivage pérenne de l'information scientifique

Bientôt la presse, mais sans embargo…

Page 31: Aspects juridiques de l'archivage pérenne de l'information scientifique

Un aperçu du cadre européen

Page 32: Aspects juridiques de l'archivage pérenne de l'information scientifique

Définition des œuvres orphelines:

Une œuvre ou un phonogramme sont considérés comme des œuvres orphelines si aucun des titulaires de droits sur cette œuvre ou ce phonogramme n'a été identifié ou, même si l'un ou plusieurs d'entre eux a été identifié, aucun d'entre eux n'a pu être localisé bien qu'une recherche diligente des titulaires de droits ait été effectuée et enregistrée conformément à l'article 3.

Les œuvres orphelines

Bundesarchiv, Bild 102-12256 / CC-BY-SA [CC-BY-SA-3.0-de (http://creativecommons.org/licenses/by-sa/3.0/de/deed.en)], via Wikimedia

Commons

Source : « DIRECTIVE 2012/28/UE DU PARLEMENT EUROPÉEN ET DU CONSEIL du 25 octobre 2012 sur certaines utilisations autorisées des œuvres orphelines »

Source : « DIRECTIVE 2012/28/UE DU PARLEMENT EUROPÉEN ET DU CONSEIL du 25 octobre 2012 sur certaines utilisations autorisées des œuvres orphelines »

Page 33: Aspects juridiques de l'archivage pérenne de l'information scientifique

• Directive 2012/28/UE du Parlement Européen et du Conseil du 25 octobre 2012 sur certaines utilisations autorisées des œuvres orphelines (doit être transposée avant octobre 2014)

La directive autorise certains établissements, notamment les bibliothèques accessibles au public, à numériser et à mettre à la disposition du public des œuvres qualifiées d’orphelines après une recherche sérieuse, mais infructueuse, des titulaires de droits.

• Des marges d’application étroites– La loi de transposition ne s’appliquera pas en France aux livres orphelins puisque la loi sur les livres indisponibles,

qui couvre aussi ceux qui sont orphelins de droit, aura préséance sur la directive, comme l’indique le considérant 4 de la directive.

– La directive n’aura effectivement aucune incidence sur toute autre disposition déjà existante, comme la gestion collective étendue des pays scandinaves

• Une recherche diligente à très haut risqueUne recherche approfondie des titulaires de droit avant toute utilisation d’une œuvre s’avérera complexe à assurer,

surtout pour celles, comme les œuvres audiovisuelles ou les périodiques, comprenant un grand nombre d’auteurs

• Des dispositions inadaptées à la numérisation de masse• Des implications financières floues

L’utilisation commerciale des œuvres orphelines n’est pas interdite ; elle permet de couvrir les frais de la numérisation.

Les œuvres orphelines

Source : « Œuvres orphelines, une directive européenne pour rien ? » Paralipomènes. Par Michèle Battisti. CC BY-ND 2.0 [Blog]

Source : « Œuvres orphelines, une directive européenne pour rien ? » Paralipomènes. Par Michèle Battisti. CC BY-ND 2.0 [Blog]

Page 34: Aspects juridiques de l'archivage pérenne de l'information scientifique

• La directive exclut de son champ d’application les universités mais inclut les ibliothèques universitaires !

• La réutilisation des informations publiques peut être soumise à des restrictions Comme dans la précédente directive de 2003, les organismes du secteur public peuvent "autoriser la réutilisation sans conditions ou peuvent imposer des conditions, le cas échéant par le biais d'une licence" (article 8). Par exemple : imposer une clause contractuelle interdisant la réutilisation commerciale.

• Œuvres du domaine public : la directive considère-t-elle les œuvres du domaine public numérisées comme des informations publiques ?

Il semble bien que l'esprit du texte aille dans le sens de l'assimilation des œuvres du domaine public numérisées à des informations publiques. Le considérant 31 est libellé ainsi :

Lorsqu'un droit d’exclusivité concerne la numérisation de ressources culturelles, une certaine période d’exclusivité pourrait s’avérer nécessaire afin de donner au partenaire privé la possibilité d’amortir son investissement. Cette période devrait, toutefois, être limitée dans le temps et être aussi courte que possible afin de respecter le principe selon lequel le matériel relevant du domaine public doit rester dans le domaine public une fois numérisé.

La directive PSI (Public Sector Information) de 2013

Source : « Avatars du domaine public numérisé : de la directive PSI 2013 à la proposition de loi Attard

». Numeribib

Source : « Avatars du domaine public numérisé : de la directive PSI 2013 à la proposition de loi Attard

». Numeribib

A lire : « Réutilisation des informations du secteur public : quand l’Union Européenne oublie la recherche… ». Par Pierre-Carl Langlais

A lire : « Réutilisation des informations du secteur public : quand l’Union Européenne oublie la recherche… ». Par Pierre-Carl Langlais

Page 35: Aspects juridiques de l'archivage pérenne de l'information scientifique

Europeana

• métadonnées placées sous licence CC0• licences Creative Commons et la Public Domain Mark pour les contenus numérisés• soutien apporté au « Manifeste du Domaine Public »

Source : « L’architecture juridique ouverte d’Europeana ».

S.I.Lex. Par Lionel Maurel«

Source : « L’architecture juridique ouverte d’Europeana ».

S.I.Lex. Par Lionel Maurel«

Page 36: Aspects juridiques de l'archivage pérenne de l'information scientifique

Le programme EoD (Ebooks on Demand)

Principe :   Un eBook EOD est un document libre de droits qui a été numérisé (fichier pdf, mode texte) à la demande d’un lecteur.  Corpus : tout livre publié entre1500 et 1900.

Page 37: Aspects juridiques de l'archivage pérenne de l'information scientifique
Page 38: Aspects juridiques de l'archivage pérenne de l'information scientifique

Tout dépend ensuite de la licence apposée par les bibliothèques…

Mauvais exemple….

La Bibliothèque Universitaire de Bratislava impose aux usagers que la réutilisation des fichiers numérisés soit personnelle et non commerciale 

http://www.books2ebooks.eu/csp/en/ukb/en/paymentanddelivery.html

Bon exemple…

La Bibliothèque Interuniversitaire de Santé (BIUS) précise que les contenus numérisés se voient apposer la Licence Ouverte/open Licence élaborée par la mission Etalab

http://books2ebooks.eu/csp/fr/bium/fr/agb.html

Page 39: Aspects juridiques de l'archivage pérenne de l'information scientifique

Initiatives décentralisées d’archivage (décentralisées au sens politique)

But principal ou secondaire: obtention de droits d’accès perpétuels après cessation des abonnements

Page 40: Aspects juridiques de l'archivage pérenne de l'information scientifique

LOCKSS (Lots of Copies Keep Stuff Safe)

Approche répartie.

Programme amorcé en 1998 par Stanford University Libraries. Lancement en 2004.

« Préservation numérique décentralisée »

Manque de communication autour du projet : «  Il serait bon de publier davantage d’information sur l’initiative, et ce, gratuitement : les documents sur le nombre de bibliothèques participantes, sur les membres de l’Alliance, etc.). »

Source : « Gestion de nos ressources savantes : Le rapport du Groupe de travail sur l’accès perpétuel (GTAP) au RCDR »

Page 41: Aspects juridiques de l'archivage pérenne de l'information scientifique

CLOCKSS (Controlled LOCKSS)

« archive fermée » (ou dark archive)

4 événements déclencheurs sont mentionnés sur le site Web de CLOCKSS :

1. L’éditeur n’est plus en activité

2. Le titre n’est plus offert

3. Les anciens numéros ne sont plus disponibles

4. Défaillance irrémédiable

Lors du déclenchement d’un événement, l’accès est octroyé à tous et non pas seulement aux participants de CLOCKSS.

Source : « Gestion de nos ressources savantes : Le rapport du Groupe de travail sur l’accès perpétuel (GTAP) au RCDR »

Page 42: Aspects juridiques de l'archivage pérenne de l'information scientifique

Portico

« archive fermée » qui donne accès aux établissements participants en vertu d’« événements déclencheurs »

cessation des activités d’un éditeur

abandon d’un titre par un éditeur

anciens numéros qui ne sont plus offerts par un éditeur

défaillance catastrophique et continue d’une plateforme d’accès d’un éditeur

Les documents ainsi déclenchés sont mis à la disposition de tous les participants de Portico, qu’ils se soient abonnés au contenu par le passé ou non. Cinq titres ont été déclenchés à des fins d’accès au moment de la rédaction du présent rapport. Toutefois, les éditeurs peuvent aussi définir Portico comme un moyen de répondre aux besoins après annulation

Source : « Gestion de nos ressources savantes : Le rapport du Groupe de travail sur l’accès perpétuel (GTAP) au RCDR »

Page 43: Aspects juridiques de l'archivage pérenne de l'information scientifique

OhioLink

Scholars Portal (Ontario)

Electronic Collections Online (OCLC)

Page 44: Aspects juridiques de l'archivage pérenne de l'information scientifique

Hathi Trust

2008, HathiTrust a été lancé dans le cadre d’un effort collaboratif par le Committee on Institutional Cooperation (CIC), un consortium des dix Grandes universités plus l’University of Chicago, et les University of California Libraries. Hathi Trust inclut notamment des doubles des copies de livres réalisées par Google remises aux bibliothèques partenaires

Page 45: Aspects juridiques de l'archivage pérenne de l'information scientifique

HathiTrust octroie un accès général aux œuvres dans le domaine public et un accès aux œuvres orphelines qui satisfont aux critères suivants :

• Les volumes doivent avoir été reconnus comme des œuvres orphelines

• L’utilisateur doit être un membre authentifié d’un établissement partenaire qui a accepté d’offrir un accès à ces œuvres orphelines conservées par HathiTrust, ou un particulier utilisant un ordinateur dans les locaux dudit établissement partenaire.

• Les utilisateurs doivent résider aux États-Unis.

• Les copies imprimées des volumes qui sont consultés doivent être la propriété actuelle ou avoir été détenues par un système de bibliothèque d’un établissement partenaire.

Source : « Gestion de nos ressources savantes : Le rapport du Groupe de travail sur l’accès perpétuel (GTAP) au RCDR »

Page 46: Aspects juridiques de l'archivage pérenne de l'information scientifique

HathiTrust, un projet plus généreux que la loi française sur les œuvres indisponibles…

Loi de mars 2012 sur les œuvres indisponibles

Objectif de la loi : numériser 500 000 ouvrages « indisponibles » sur 10 ans (50 000 par an)

On parle d’œuvres indisponibles et pas « d’œuvres épuisées »

Or la notion d’œuvre indisponible englobe les œuvres orphelines…

A lire : « Numérisation : la grande manoeuvre des indisporphelines ». S.I.Lex. Blog de Lionel Maurel. CC0

A lire : « Numérisation : la grande manoeuvre des indisporphelines ». S.I.Lex. Blog de Lionel Maurel. CC0

Page 47: Aspects juridiques de l'archivage pérenne de l'information scientifique

Les Archives Ouvertes

Page 48: Aspects juridiques de l'archivage pérenne de l'information scientifique

Première faiblesse des archives ouvertes françaises : l’absence de mandat entraînant le

dépôt systématiqueContre-exemple : l’Université d’Angers

Page 49: Aspects juridiques de l'archivage pérenne de l'information scientifique

Deuxième faiblesse : les conditions de réutilisation ne sont pas prévues…

Page 50: Aspects juridiques de l'archivage pérenne de l'information scientifique

En revanche, MediHAL propose aux déposants d’apposer une licence Creative

Commons

Page 51: Aspects juridiques de l'archivage pérenne de l'information scientifique

Les cours de l'école d'ingénieurs Telecom Bretagne sont tous proposés sous licence CC-BY-NC-SA.

Il s'agit d'une licence par défaut. 

Page 52: Aspects juridiques de l'archivage pérenne de l'information scientifique

Réutilisation : le Text and Data Mining

Page 53: Aspects juridiques de l'archivage pérenne de l'information scientifique

Raymond Bérard à propos de la future plate-forme ISTEX :

« L’intérêt de disposer de tels corpus en texte intégral permet d’offrir des services allant largement au-delà de la simple consultation d’items unitaires sélectionnés après interrogation d’un moteur de recherche indexant des métadonnées de type Google. En effet, la mise en ligne de ces informations en texte intégral structuré permet de développer des fonctionnalités modernes d’extraction de connaissances basées sur les technologies de la fouille de texte (Text Mining, Data Mining). »

Réutilisation: le Text and Data Mining

Source : « ISTEX : Vers des services innovants d’accès à la connaissance ». Arabesques n°66, p. 7

Source : « ISTEX : Vers des services innovants d’accès à la connaissance ». Arabesques n°66, p. 7

Page 54: Aspects juridiques de l'archivage pérenne de l'information scientifique

La seconde étape du projet ISTEX consiste en la création de la plateforme ISTEX qui hébergera l’ensemble des données. L’accès aux ressources documentaires se fera dans un premier temps via les sites Internet des éditeurs dès début 2014, puis courant 2015 via la plateforme ISTEX gérée par l’INIST – CNRS. Riche de plusieurs millions de documents numériques (articles de revues, livres, corpus de textes…) dans toutes les disciplines, elle offrira divers bénéfices aux utilisateurs :

• Une ouverture sur un corpus unique et exceptionnel ;

• Un accès systématique vers le texte intégral du document ;

• Un moteur de recherche puissant adapté aux besoins des scientifiques avec des facilités d’interrogation et de téléchargement… ;

• Des services de traitement des données : extraction de données, fouille de textes, production de synthèses documentaires et de corpus terminologiques… ;

• Une intégration à l’environnement numérique local permettant un confort de navigation entre les ressources courantes et les collections rétrospectives ;

• Un accès à distance par tous les membres des établissements de l’enseignement supérieur et de la recherche ;

• Un accès pérenne aux données rétrospectives acquises…

Présentation sur le site d’ISTEX :

Source : ISTEXSource : ISTEX

Page 55: Aspects juridiques de l'archivage pérenne de l'information scientifique

Mais en pratique…

Cas de la Freedom Collection : que ce soit PANIST (pour l’archivage) ou la licence nationale (abonnement courant) le TDM n’est pas réellement prévu

• Elsevier oblige les chercheurs à recourir à son API• son utilisation est soumise aux règles fixées par l’éditeur. Non

seulement le nombre de requêtes hebdomadaires via l’API est limité à 10 000 articles (ce qui est trop peu), mais le nombre de caractères extraits du texte original ne peut pas être supérieur à 200

A lifre : « Data Mining : Quand Elsevier écrit sa propre loi… ». Par Pierre Carl-Langlais. Sciences communes [Blog]

A lifre : « Data Mining : Quand Elsevier écrit sa propre loi… ». Par Pierre Carl-Langlais. Sciences communes [Blog]

Page 56: Aspects juridiques de l'archivage pérenne de l'information scientifique

• Royaume-Uni : inclut une exception spécifique pour le content-mining dans le cadre de son projet de modernisation du copyright.

• Irlande : un rapport similaire publié en 2013 préconise la mise en place d’un « fair dealing », soit une forme plus restrictive du « fair use » américain.

Mais ces exceptions n’auront aucune valeur sans une modification du droit européen : la liste des exceptions apportée par la directive sur la société de l’information est limitative 

Deux exemples européens…

Source : « Protocole d’accord Elsevier : vers le maintien de la rente et la confirmation d’un contrôle hégémonique des données de la recherche ». Collectif SavoirsCom1

Source : « Protocole d’accord Elsevier : vers le maintien de la rente et la confirmation d’un contrôle hégémonique des données de la recherche ». Collectif SavoirsCom1

Page 57: Aspects juridiques de l'archivage pérenne de l'information scientifique

Le consortium Couperin demande une révision du droit européen sur le TDM

Page 58: Aspects juridiques de l'archivage pérenne de l'information scientifique
Page 59: Aspects juridiques de l'archivage pérenne de l'information scientifique

Ne pas simplement penser aux CGU mais élaborer des « CGR » : Conditions Générales de Réutilisation

Page 60: Aspects juridiques de l'archivage pérenne de l'information scientifique

Vers un « domaine public de l’information »…?

Page 61: Aspects juridiques de l'archivage pérenne de l'information scientifique

Des questions ?

Question Mark. Par Winged Wolf. CC BY-NC-ND 2.0. Source: Flickr

Page 62: Aspects juridiques de l'archivage pérenne de l'information scientifique

Merci de votre attention !

Pierre Naegelen

Blog : Numeribib

Membre du Collectif SavoirsCom1