65
Le Web de données nouvelles pratiques de publication et nouveaux services? Muriel Foulonneau [email protected]

Le Web de données - nouvelles pratiques de publication et nouveaux services?

  • Upload
    chessmu

  • View
    113

  • Download
    0

Embed Size (px)

DESCRIPTION

Biennale du numérique, 2013, Lyon

Citation preview

Page 1: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Le Web de données

nouvelles pratiques de publication et

nouveaux services?

Muriel [email protected]

Page 2: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Une couche du Web où les données sont

structurées sémantiquement

24/10/2014 2

“In the coming years, we will see a revolution in

the ability of machines to access, process, and

apply information. This revolution will emerge

from three distinct areas of activity connected to

the Semantic Web: the Web of Data, the Web of

Services, and the Web of Identity providers.

These webs aim to make semantic knowledge of

data accessible…”

Alexander Korth April 18, 2009http://readwrite.com/2009/04/18/web_of_data_machine_accessible_information

Page 3: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Publier sur le Web

24/10/2014 Presentation Tudor 3

Page 4: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Modèles de publication Web 1.0

24/10/2014 4

Page 5: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Modèles de publication Web 2.0 (social)

24/10/2014 5

http://www.lemonde.fr/politique/article/2013/10/10/a-l-assemblee-le-

sexisme-en-accusation_3492868_823448.html

http://www.imdb.com/title/tt1454468/ratings?ref_=tt_ov_rt

http://trignacechecs.blogspot.com/

Page 6: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Modèles de publication Web 3.0 (lisible

par des machines)

24/10/2014 6

http://en.wikipedia.org/wiki/JSON

http://fr.wikipedia.org/wiki/Resource_Description_Framework

Page 7: Le Web de données - nouvelles pratiques de publication et nouveaux services?

L’accès à un layer du Web qui contient

des données structurées

Une version lisible par les machines et une version lisible par les

humains

24/10/2014 7

Albert Einstein

Page 8: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Le Web de données: des liens entre les

données

24/10/2014 8

http://commons.wikimedia.org/wiki/File:Web.jpg

Page 9: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Des données au Web de données

24/10/2014 Presentation Tudor 9

Page 10: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Différents niveaux de structuration

Bases de données

CSV / Excel

XML

JSON

Micro-formats

RDF

RDFa

Linked Data

24/10/2014 10

Des liens entre les données

Page 11: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Les principes des Linked Data

1- Use URIs as names for things

2- Use HTTP URIs so that people can look up those names.

3- When someone looks up a URI, provide useful information,

using the standards (RDF*, SPARQL)

4- Include links to other URIs. so that they

can discover more things.

24/10/2014 11

Page 13: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Vocabulaires et modèles de données

Des formats de métadonnées aux ontologies

=> définir et identifier les ressources

=> définir et identifier les relations entre les ressources

24/10/2014 13

E7 Activity

“Crimea Conference”

E65 Creation

Event

E38 Image

P86 falls within

February 1945

P82 at some time

within

E39 Actor

E39 Actor

E53 Place

7012124

http://cidoc.ics.forth.gr/docs/crm_for_imperial_2009.ppt

Page 14: Le Web de données - nouvelles pratiques de publication et nouveaux services?

RDF et modélisation sémantique des

données

RDF

Classes and instances

14

Einstein Ulm

Einstein Ulmhttp://me/hasBirthPlace

Me:Scientist

Me:Location

Me:Cityrdf:type

rdf:type

rdfs:subclass_of

http://me/hasBirthPlace

Page 15: Le Web de données - nouvelles pratiques de publication et nouveaux services?

La capacité à raisonner sur des données

Mécanismes d’inférence liés au langage

ex. Ulm est un lieu

Mécanismes d’inférence liés à

des règles

24/10/2014 15

Ulm

Me:Location

Me:City

rdf:type

rdfs:subclass_of

Page 16: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Représentation sémantique des données

Des données en RDF

• Sujet – Prédicat - Objet

Des modèles

• Des classes de ressources

Des URIs (identifiants) pour des ressources abstraites ou

concrètes

• Plus d’ambiguités

Des mécanismes d’inférence

• permettre aux ordinateurs de raisonner sur les contenus

16

Page 17: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Existence de jeux de données différents

24/10/2014 17

Page 18: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Fusion de graphes: les liens (linked data)

24/10/2014 18

Page 19: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Liens entre les jeux de données (Linked

Data)

19

Me:

EinsteinDbpedia:Ulm

http://me/hasBirthPlace

Me:

EinsteinMe:Ulm

http://me/hasBirthPlace

Dbpedia:Ulm

Owl:sameAs

Page 20: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Exemple de page de Wikipedia

24/10/2014 Presentation Tudor 20

Page 21: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Représentation sur DBpedia

24/10/2014 Presentation Tudor 21

dbpedia.org/resource/Albert_Einstein

Page 22: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Version RDF de la page DBpedia

24/10/2014 Presentation Tudor 22

Page 23: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Références externes et description des

propriétés

Page 24: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Identité: Owl:sameAs

“links an individual to an individual. Such an owl:sameAs

statement indicates that two URI references actually refer to the

same thing: the individuals have the same ‘identity’ ”.

24/10/2014 24

24

http://www.w3.org/TR/owl-ref/#sameAs-def

Page 25: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Quels liens?

y rdf:type foaf:Person

y foaf:name James Bond

y foaf:nickname 007

24/10/2014 25

x rdf:type skos:concept

x skos:prefLabel James Bond

x skos:altLabel 007

?

Page 26: Le Web de données - nouvelles pratiques de publication et nouveaux services?

La modélisation des concepts

24/10/2014 26

[…]

[…]

[…]

Page 27: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Propriétés et valeurs

24/10/2014 27

Page 28: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Le Linked Data Cloud

24/10/2014 ESWC 2011 28

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

Page 29: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Quelques statistiques sur le nuage

24/10/2014 29http://lod-cloud.net/state/

Page 30: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Réutiliser des vocabulaires

24/10/2014 30

Page 31: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Retrouver des informations sur le Web de

données

SPARQL

24/10/2014 31

Mots-clefs

Page 32: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Enrichir le Web de données: créer des

liens

24/10/2014 32

Page 33: Le Web de données - nouvelles pratiques de publication et nouveaux services?

La qualité des données

24/10/2014 33

Page 34: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Wikidata: rendre le Web de données

social

24/10/2014 34

Page 35: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Réutiliser le Web de données

Exemple de génération de questions

de tests en éducation

24/10/2014 Presentation Tudor 35

Page 36: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Objectifs de l’expérimentation

Quelles sont les limitations à l’utilisation des Linked

open Data comme modèle de connaissance dans un

contexte éducationnel ?

• Est-ce faisable?

• Est-ce que les données sont pertinentes?

• Quel niveau de contrôle qualité est nécessaire?

Test sur des données factuelles pour créer des

questions de test à choix multiples

24/10/2014 Presentation Tudor 36

Page 37: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Un template avec des variables

24/10/2014 ESWC 2011 37

Variable de

la question

Options:

réponse

correcte +

distracteurs

Clef

Information

auxiliaire

Item extrait de Gierl, M.J., Zhou, J., Alves, C. (2008).

Developing a Taxonomy of Item Model Types to Promote

Assessment Engineering. Journal of Technology, Learning, and

Assessment, 7(2).

Page 38: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Le processus de génération d’items

(questions) de test

24/10/2014 Presentation Tudor 38

Page 39: Le Web de données - nouvelles pratiques de publication et nouveaux services?

La génération des items à partir de

différentes sources de données

Dbpedia

Sindice

OpenLink

24/10/2014 Presentation Tudor 39

Page 40: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Requêtes SPARQL pour retrouver les

données

SELECT ?country ?capitalWHERE {?c <http://dbpedia.org/property/commonName> ?country .?c <http://dbpedia.org/property/capital> ?capital}LIMIT 30

24/10/2014 ESWC 2011 40

Label

Page 41: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Génération d’items IMS-QTI

24/10/2014 ESWC 2011 41

Page 42: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Test avec des données de DBpedia

Who succeeded to {Charles VII the Victorious} as ruler of France ?

1 variable était inexacte (The three Musketeers)

Des labels multiples pour la même ressource

Louis IX, Saint Louis, Saint Louis IX

Un item généré avec des options aux labels incohérents:

Charles VII the Victorious, Charles 09 Of France, Louis VII

24/10/2014 ESWC 2011 42

Page 43: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Problèmes liés aux données

• Les ontologies utilisées

• Le manque de persistence des URLs

• Fermetures transitives

• Fiabilité des sources d’informations

• Cohérence syntaxique des labels

• Liens entre les données

24/10/2014 43

Page 44: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Calcul de la similarité sémantique entre

la réponse correcte et les distracteurs

Ulan Bator

Libreville

Manila

24/10/2014 44

Quelle est la capitale du Gabon?

Maputo

Port Louis

Libreville

Sans SemSimAvec SemSim

Page 45: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Résultats sur les tests utilisateurs

Baisse claire de performance en tenant compte de la

similarité sémantique

24/10/2014 45

Page 46: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Et les usages?

D’une logique de production à une

logique de services

24/10/2014 Presentation Tudor 46

Page 47: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Quelques early adopters

Ex. BBC

24/10/2014 47

http://www.bbc.co.uk/blogs/internet/posts/Linked-Data-Connecting-

together-the-BBCs-Online-Content

http://www.bbc.co.uk/blogs/internet/posts/olympic_data_xml_latency

Page 48: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Démarche pour l’éducation: sélection

des données

24/10/2014 48

Page 49: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Compétitions

24/10/2014 49

Page 50: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Créer une communauté

24/10/2014 50

Page 51: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Lier ses propres données: Exemples

d’infrastructure

24/10/2014 51http://stefandietze.files.wordpress.com/2011/05/20110529_linkedlearni

ng2_eswc_fouad_zablith_etal.pdf

Page 52: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Exemples d’applications

24/10/2014 52http://stefandietze.files.wordpress.com/2011/05/20110529_linkedlearni

ng2_eswc_fouad_zablith_etal.pdf

Page 53: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Europeana hackhatons

http://paths.sheffield.ac.uk/storyana

24/10/2014 53

Page 54: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Problèmes de l’utilisation des données

dans les services: Le mélange des

licencesPlusieurs stratégies

- Europeana pour CC0

- Portail Open Data de Singapour pour la documentation des

conditions de propriété intellectuelle

24/10/2014 54

Page 55: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Problèmes de l’utilisation des données

dans les services: Les données

- Les mises à jour

- La qualité (fiabilité, complétude, …)

- Provenance

- Les processus de maintenance

- Les droits de propriété intellectuelle et conditions d’usage

- Interopérabilité: modèles sémantiques

- Documentation

- …. etc

24/10/2014 55

Page 56: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Leçons des Open Data: Services et

applications développés à partir de

données

Construire 1 service

• avec 1 seul jeu de données

• avec plusieurs jeux de données

• avec un mashup avec des sources de données sous licence

Utilisation des données

• Uniquement pour enrichir des données existantes

• Uniquement pour améliorer la qualité des données existantes (ex.

exactitude des informations)

=> Pour le Web de données, l’utilisation conjointe de plusieurs datasets

requiert de passer par un service tiers ou de naviguer

24/10/2014 56

Page 57: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Conclusion:

Le Web de données est en cours

Existe-t-il un modèle pour le Web of

Services?

24/10/2014 Presentation Tudor 57

Page 58: Le Web de données - nouvelles pratiques de publication et nouveaux services?

La fin du rêve d’un Web intelligent?

Des problèmes de qualité des données

Ex. Louis XIII

Problèmes de modélisation

Ex. VIAF et les noms vs.

Les personnes

Problèmes de pérennité

Le Web n’a pas (ou

presque) de mémoire

Les liens impliquent

la confiance

Jeux de données pivot,

généralistes24/10/2014 58

www.data.gov/ [14/10/2013]

Page 59: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Des modèles de création de données

dans le Future Internet

Données de capteurs et Internet of Things

24/10/2014 59

http://www.gpsreview.net/pigeonblog-gps-pigeons-monitor-air-quality/

Page 60: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Les moteurs de recherche et la

sémantique

Bing, Google, Yahoo!, Yandex

Microdata

24/10/2014 60

Page 61: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Tracer les usages des données

24/10/2014 61

Page 62: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Data scientists, data engineers, data

analysts: de nouvelles compétences

24/10/2014 Presentation Tudor 62

http://www.biginnovationcentre.com/Assets/Docs/Reports/Hackday%2

0Lessons%20Learnt_final.pdf

http://www.technologyreview.com/news/513866/in-a-data-deluge-companies-seek-to-fill-a-new-

role/?utm_campaign=newsletters&utm_source=newsletter-daily-all&utm_medium=email&utm_content=20130523

Page 63: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Quelques références

Tutoriel Linked Data

http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/

Chan, C. M. (2013, January). From Open Data to Open Innovation Strategies: Creating E-

Services Using Open Government Data. In System Sciences (HICSS), 2013 46th Hawaii

International Conference on (pp. 1890-1899). IEEE.

Martin, S., Foulonneau, M., Turki, S. (2013). 1-5 stars: Metadata on the Openness Level of Open

Data Sets in Europe. In Metadata and Semantics Research 2013. Communications in

Computer and Information Science, Springer Verlag, Heidelberg

Martin, S., Foulonneau, M., Turki, S., Ihadjadene, M. (2013). Open Data: Barriers, Risks, and

Opportunities. European Conference on eGovernment, Como, Italy, 13-14th June, 2013.

Foulonneau, M. Generating Educational Assessment Items from Linked Open Data: the Case of

DBpedia. In R. Garcia-Castro et al. (Eds.): ESWC 2011 Workshops, LNCS 7117, pp. 16--27.

Springer, Heidelberg (2012)

Foulonneau, M., Grouès, V. Common vs. Expert knowledge: making the Semantic Web an

educational model. In Proceedings of the 2nd International Workshop on Learning and

Education with the Web of Data (LiLe-2012 at WWW-2012). Stefan Dietze, Mathieu d'Aquin,

Dragan Gasevic (eds.). CEUR workshop proceedings, vol. 840. http://www.ceur-ws.org/Vol-

840/

24/10/2014 63

Page 64: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Quelques questions

Comment construire des services sur le Web de données?

Quels freins à la réutilisation?

Quelle intervention humaine?

24/10/2014 64

Page 65: Le Web de données - nouvelles pratiques de publication et nouveaux services?

Note: des éléments de cette présentation ont été repris de

ressources créées par des tiers. Une attribution est fournie

sous la forme d’un lien.

24/10/2014 65