85
some tech & social challenges Linked Data michele barbera <[email protected]> @barbz79it

Linked Data: some social challenges

Embed Size (px)

DESCRIPTION

Presentation given at "Global Interoperability and Linked Data in Libraries", University of Florence, 18 Jun 2012

Citation preview

Page 1: Linked Data: some social challenges

some tech & social challenges

Linked Data

michele barbera<[email protected]> @barbz79it

Page 2: Linked Data: some social challenges

1����������� ������������������  TECH����������� ������������������  CHALLENGES

2����������� ������������������  SOCIAL����������� ������������������  CHALLENGES

3����������� ������������������  LINKED����������� ������������������  DATA����������� ������������������  ECONOMY

Page 3: Linked Data: some social challenges

Unità Web of Datasmart data now!

<spaziodati.eu> <netseven.it> <fbk.eu>

Page 4: Linked Data: some social challenges

Is����������� ������������������  the����������� ������������������  Semantic����������� ������������������  Web����������� ������������������  real?

Page 5: Linked Data: some social challenges

no*.*����������� ������������������  I’m����������� ������������������  provocative

Page 6: Linked Data: some social challenges

we����������� ������������������  aimed����������� ������������������  at����������� ������������������  this:

Page 7: Linked Data: some social challenges
Page 8: Linked Data: some social challenges

and����������� ������������������  failed*.

*����������� ������������������  But����������� ������������������  produced����������� ������������������  ~170k����������� ������������������  research����������� ������������������  papers����������� ������������������  in����������� ������������������  11����������� ������������������  years,����������� ������������������  not����������� ������������������  bad!

Page 9: Linked Data: some social challenges

Pizza����������� ������������������  ontology?!

Page 10: Linked Data: some social challenges

well,����������� ������������������  not����������� ������������������  really����������� ������������������  failed...

Page 11: Linked Data: some social challenges

we’re����������� ������������������  still����������� ������������������  working����������� ������������������  on����������� ������������������  it

Page 12: Linked Data: some social challenges

less����������� ������������������  pizza����������� ������������������  more����������� ������������������  engineering

Page 13: Linked Data: some social challenges

A����������� ������������������  little����������� ������������������  semantics����������� ������������������  goesa����������� ������������������  long����������� ������������������  way...

Linked����������� ������������������  Data

Semantic����������� ������������������  Web

Page 14: Linked Data: some social challenges

Semantic����������� ������������������  Web

Linked����������� ������������������  Data

Web����������� ������������������  of����������� ������������������  Data

Page 15: Linked Data: some social challenges

it’s����������� ������������������  not����������� ������������������  just����������� ������������������  technology

Page 16: Linked Data: some social challenges

it’s����������� ������������������  definetely����������� ������������������  not����������� ������������������  AI

Page 17: Linked Data: some social challenges

it’s����������� ������������������   just����������� ������������������   about����������� ������������������   linking����������� ������������������  things����������� ������������������  together

Page 18: Linked Data: some social challenges

DATA IS LESS VALUABLE WHEN SILOED

your web site

Page 19: Linked Data: some social challenges

because����������� ������������������  value����������� ������������������  is����������� ������������������  in����������� ������������������  context

Page 20: Linked Data: some social challenges
Page 21: Linked Data: some social challenges

content����������� ������������������  is����������� ������������������  king

Page 22: Linked Data: some social challenges

content����������� ������������������  is����������� ������������������  kingx

Page 23: Linked Data: some social challenges

linking

Page 24: Linked Data: some social challenges

issuessome����������� ������������������  tec

h

Page 25: Linked Data: some social challenges

1����������� ������������������  SCALABILITY

Page 26: Linked Data: some social challenges

Flexibility,����������� ������������������  dinamicity,����������� ������������������  scalability

by Giovanni Tummarello

is����������� ������������������  it����������� ������������������  all����������� ������������������  about����������� ������������������  size?

Page 27: Linked Data: some social challenges

by Giovanni Tummarello

dataspaces

Page 28: Linked Data: some social challenges

by Giovanni Tummarello

Large����������� ������������������  Scale����������� ������������������  RDF����������� ������������������  summaries

Class Level

12M����������� ������������������  relationships

http://test01.sindice.net/szydan/dataset-view/dataset/default/www.bbc.co.uk

Page 29: Linked Data: some social challenges

by Giovanni Tummarello

Large����������� ������������������  Scale����������� ������������������  RDF����������� ������������������  summaries

10B����������� ������������������  relationships

Class Level

12M����������� ������������������  relationships

http://test01.sindice.net/szydan/dataset-view/dataset/default/www.bbc.co.uk

Page 30: Linked Data: some social challenges

2����������� ������������������  -����������� ������������������  streaming����������� ������������������  linked����������� ������������������  data

Page 31: Linked Data: some social challenges

moved

deleted

SPOT����������� ������������������  THE����������� ������������������  DIFFERENCE

3����������� ������������������  -����������� ������������������  versioning

Page 32: Linked Data: some social challenges

<self_promotion>

Page 33: Linked Data: some social challenges
Page 35: Linked Data: some social challenges

SIREnData Collection

500M web data documents (RDF, RDFa, Microformat, etc.)

200K datasets 50B triples

Settings Cluster of 4 nodes

2 nodes for indexing 2 nodes for querying

Replication

Indexing Performance Full index construction takes

approx 24 hours 436K triples / second

Services Keyword and structured queries Dataset search >> 99% uptime

Page 36: Linked Data: some social challenges

SIREnData Collection

500M web data documents (RDF, RDFa, Microformat, etc.)

200K datasets 50B triples

Settings Cluster of 4 nodes

2 nodes for indexing 2 nodes for querying

Replication

Indexing Performance Full index construction takes

approx 24 hours 436K triples / second

Services Keyword and structured queries Dataset search >> 99% uptime

Page 37: Linked Data: some social challenges

SIREnData Collection

500M web data documents (RDF, RDFa, Microformat, etc.)

200K datasets 50B triples

Settings Cluster of 4 nodes

2 nodes for indexing 2 nodes for querying

Replication

Indexing Performance Full index construction takes

approx 24 hours 436K triples / second

Services Keyword and structured queries Dataset search >> 99% uptime

Page 38: Linked Data: some social challenges

SIREnData Collection

500M web data documents (RDF, RDFa, Microformat, etc.)

200K datasets 50B triples

Settings Cluster of 4 nodes

2 nodes for indexing 2 nodes for querying

Replication

Indexing Performance Full index construction takes

approx 24 hours 436K triples / second

Services Keyword and structured queries Dataset search >> 99% uptime

Page 39: Linked Data: some social challenges

SIREnData Collection

500M web data documents (RDF, RDFa, Microformat, etc.)

200K datasets 50B triples

Settings Cluster of 4 nodes

2 nodes for indexing 2 nodes for querying

Replication

Indexing Performance Full index construction takes

approx 24 hours 436K triples / second

Services Keyword and structured queries Dataset search >> 99% uptime

spaziodati.3scale.net

Page 40: Linked Data: some social challenges

SIREnData Collection

500M web data documents (RDF, RDFa, Microformat, etc.)

200K datasets 50B triples

Settings Cluster of 4 nodes

2 nodes for indexing 2 nodes for querying

Replication

Indexing Performance Full index construction takes

approx 24 hours 436K triples / second

Services Keyword and structured queries Dataset search >> 99% uptime

spaziodati.3scale.net

Page 41: Linked Data: some social challenges

SIREnData Collection

500M web data documents (RDF, RDFa, Microformat, etc.)

200K datasets 50B triples

Settings Cluster of 4 nodes

2 nodes for indexing 2 nodes for querying

Replication

Indexing Performance Full index construction takes

approx 24 hours 436K triples / second

Services Keyword and structured queries Dataset search >> 99% uptime

spaziodati.3scale.net

Page 42: Linked Data: some social challenges

</self_promotion>

Page 43: Linked Data: some social challenges

issuessome����������� ������������������  social

Page 44: Linked Data: some social challenges

1����������� ������������������  THINKING����������� ������������������  IN����������� ������������������  THE����������� ������������������  GRAPH

Page 45: Linked Data: some social challenges

1����������� ������������������  -����������� ������������������  thinking����������� ������������������  in����������� ������������������  tables

Page 46: Linked Data: some social challenges

1����������� ������������������  -����������� ������������������  thinking����������� ������������������  in����������� ������������������  tables

Page 47: Linked Data: some social challenges

1����������� ������������������  -����������� ������������������  thinking����������� ������������������  in����������� ������������������  tables

Page 48: Linked Data: some social challenges

1����������� ������������������  -����������� ������������������  thinking����������� ������������������  in����������� ������������������  tables

Page 49: Linked Data: some social challenges

1����������� ������������������  -����������� ������������������  thinking����������� ������������������  in����������� ������������������  tables

Page 50: Linked Data: some social challenges

1����������� ������������������  -����������� ������������������  thinking����������� ������������������  in����������� ������������������  tables

Page 51: Linked Data: some social challenges

1����������� ������������������  -����������� ������������������  thinking����������� ������������������  in����������� ������������������  tables

Page 52: Linked Data: some social challenges

1����������� ������������������  -����������� ������������������  thinking����������� ������������������  in����������� ������������������  tables

Page 53: Linked Data: some social challenges

1����������� ������������������  -����������� ������������������  thinking����������� ������������������  in����������� ������������������  tables

Page 54: Linked Data: some social challenges

id name age affiliation

1 Michele 33 net7

2 Mario 32 unipi

3 Silvia 28 unifi

4 Irene 27 unitn Institution City

net7 pisa

unipi pisa

unifi firenze

unitn trento

u_id f_id

1 2

1 3

3 4

4 3

thinking����������� ������������������  in����������� ������������������  tables

Page 55: Linked Data: some social challenges

michele����������� ������������������  (33)

mario����������� ������������������  (32)

silvia����������� ������������������  (28)

irene����������� ������������������  (27)

friend

friend

friend

friend

works

works

works

net7unipi

unifi

unitn

place

plac

e

pisa Firenze

Trento

place

place

thinking����������� ������������������  in����������� ������������������  graphs?

Page 56: Linked Data: some social challenges

Mario����������� ������������������  342-2345672,����������� ������������������  12����������� ������������������  Apr,����������� ������������������  Via����������� ������������������  san����������� ������������������  Giuseeppe����������� ������������������  34Giovanni����������� ������������������  333-2313450,����������� ������������������  Bologna,����������� ������������������  via����������� ������������������  Ugo����������� ������������������  Bassi����������� ������������������  12Anna����������� ������������������  328-3422345,����������� ������������������  Trento,����������� ������������������  p.zza����������� ������������������  Verdi����������� ������������������  11Mamma����������� ������������������  050-3422124,����������� ������������������  PisaAntonio����������� ������������������  051-342456,����������� ������������������  Bologna

e.g.social����������� ������������������  graphs

Page 57: Linked Data: some social challenges

2����������� ������������������  -����������� ������������������  A.A.A.*

*����������� ������������������  “you����������� ������������������  don’t����������� ������������������  know����������� ������������������  what����������� ������������������  you’re����������� ������������������  talking����������� ������������������  about”

Page 58: Linked Data: some social challenges

AAAlibrary wikidb

scholarly����������� ������������������  community

Page 59: Linked Data: some social challenges

It����������� ������������������   is����������� ������������������   about����������� ������������������   getting����������� ������������������   excited����������� ������������������   about����������� ������������������  connections,����������� ������������������  rather����������� ������������������  than����������� ������������������  nervous”“

“The����������� ������������������   less����������� ������������������   inviting����������� ������������������   side����������� ������������������  of����������� ������������������  sharing����������� ������������������   is����������� ������������������   losing����������� ������������������  some����������� ������������������   control.����������� ������������������   Indeed,����������� ������������������   at����������� ������������������   each����������� ������������������   layer����������� ������������������   ---����������� ������������������  Net,����������� ������������������   Web,����������� ������������������   or����������� ������������������   Graph����������� ������������������   ---����������� ������������������   we����������� ������������������   have����������� ������������������   ceded����������� ������������������  some����������� ������������������  control����������� ������������������  for����������� ������������������  greater����������� ������������������  benefits”

“ “

tbl

Page 60: Linked Data: some social challenges

3)info����������� ������������������  vs.����������� ������������������  non-info

Page 61: Linked Data: some social challenges

http://example.com/resource/CNR

http://example.com/page/CNR

http://example.com/data/CNR

http://www.cnr.it/homepage#CNR

303����������� ������������������  redirection?

hash����������� ������������������  uri?http://www.cnr.it/homepage

http-range-14

Page 62: Linked Data: some social challenges

ns:creator <jonnhy����������� ������������������  web����������� ������������������  developer>

ns:date 12����������� ������������������  Jun����������� ������������������  2011

ns:name “The����������� ������������������  Website”

ns:president <a_person>

ns:department <some_department>

ns:department <some_department>

owl:sameAs

http://www.example.com/cnr

http://universities.org/italy#cnr

caution!

Page 63: Linked Data: some social challenges

4)Open����������� ������������������  World����������� ������������������  Assumption

Page 64: Linked Data: some social challenges

Seat����������� ������������������  14����������� ������������������  is����������� ������������������  reservedSeat����������� ������������������  27����������� ������������������  is����������� ������������������  reserved

Kbase

OWA CWA

is����������� ������������������  seat����������� ������������������  28����������� ������������������  reserved?

UNKNOWN NO

Page 65: Linked Data: some social challenges

-����������� ������������������  We’re����������� ������������������  more����������� ������������������  familiar����������� ������������������  with����������� ������������������  CW����������� ������������������  reasoning-����������� ������������������  many����������� ������������������  existing����������� ������������������  tools����������� ������������������  are����������� ������������������  CW

-����������� ������������������  OWA����������� ������������������  is����������� ������������������  not����������� ������������������  difficult����������� ������������������  to����������� ������������������  understand-����������� ������������������  OWA����������� ������������������  is����������� ������������������  good����������� ������������������  to����������� ������������������  deal����������� ������������������  with����������� ������������������  inconsistencies����������� ������������������  anduniversal����������� ������������������  systems

Page 66: Linked Data: some social challenges

economy?a����������� ������������������  Lin

ked����������� ������������������  Data

Page 67: Linked Data: some social challenges

-����������� ������������������  ~����������� ������������������  300����������� ������������������  datasets-����������� ������������������  not����������� ������������������  frequently����������� ������������������  updated-����������� ������������������  0,1����������� ������������������  %����������� ������������������  of����������� ������������������  the����������� ������������������  Web����������� ������������������  of����������� ������������������  Data

Linked����������� ������������������  Data

Page 68: Linked Data: some social challenges

Web����������� ������������������  of����������� ������������������  Data

Page 69: Linked Data: some social challenges
Page 70: Linked Data: some social challenges

<h1 id="name"><span class="fn n"> <span class="given-name">Michele </span> <span class="family-name">Barbera</span> </span></h1>

Page 72: Linked Data: some social challenges
Page 73: Linked Data: some social challenges
Page 74: Linked Data: some social challenges
Page 76: Linked Data: some social challenges
Page 77: Linked Data: some social challenges

G����������� ������������������  knowledge����������� ������������������  graph

Page 78: Linked Data: some social challenges
Page 79: Linked Data: some social challenges

Freebase����������� ������������������  +����������� ������������������  Geonames����������� ������������������  +����������� ������������������  DBpedia����������� ������������������  +����������� ������������������  schema.org����������� ������������������  +����������� ������������������  search����������� ������������������  statistics?

opaque/hidden����������� ������������������  identifiers����������� ������������������  =����������� ������������������  not����������� ������������������  reusable

Page 80: Linked Data: some social challenges

BIG DATA AND INFO OVERLOAD IN USE IN 2010:

250$ billion potential annual value

to Europe’s public sector administration - more

than GDP of Greece

5 billionmobile phones 30 billion

pieces of content shared on facebook every month

40% projected growth in global datagenerated per year vs 5%

235terabytes

data collected by US library of Congress in april 2011

60% potential increas in retailers’ operating margins possible

with big data

15 out of 17 sectors in US have more data stored

per company than the US Library

of Congress

300$billion

potential annual value to US health care

(more than double the total annual

health care spending in Spain)

600$ billion potential annual consumer

surplus from using personal location data globally

60%potential increase

in retailers’ operating margins possible wiith big dat

140.000-190.000 more deep analytical talent positions

and 1,5 million more data-savvy managers need to take full advantage of big data

only in United Stateswith big data

Page 81: Linked Data: some social challenges

Paul����������� ������������������  Houle,����������� ������������������  http://lists.w3.org/Archives/Public/public-lod/2012Jun/0038.html

The����������� ������������������  real����������� ������������������  value����������� ������������������  of����������� ������������������  the����������� ������������������  GKG����������� ������������������  may����������� ������������������  be����������� ������������������  in����������� ������������������  what����������� ������������������  gets����������� ������������������  deleted����������� ������������������  instead����������� ������������������  of����������� ������������������  what����������� ������������������  gets����������� ������������������  added.“ “

Page 82: Linked Data: some social challenges

Open����������� ������������������   Data����������� ������������������   (and����������� ������������������   digital����������� ������������������   public����������� ������������������   goods)����������� ������������������  r e p r e s e n t s����������� ������������������   a n����������� ������������������   u n p r e c e d e n t e d����������� ������������������  opportunity����������� ������������������   to����������� ������������������   build����������� ������������������   a����������� ������������������   (local?����������� ������������������  vertical?)����������� ������������������   data����������� ������������������   economy����������� ������������������   and����������� ������������������   to����������� ������������������  preserve����������� ������������������  our����������� ������������������  cultural����������� ������������������  diversity

Page 83: Linked Data: some social challenges

The����������� ������������������  gist����������� ������������������  of����������� ������������������  the����������� ������������������  matter����������� ������������������  is����������� ������������������  to����������� ������������������  turn����������� ������������������   large����������� ������������������  streams����������� ������������������  of����������� ������������������  data����������� ������������������  into����������� ������������������  added����������� ������������������  value����������� ������������������  for����������� ������������������  the����������� ������������������  public����������� ������������������  and����������� ������������������  private����������� ������������������  sector����������� ������������������  [...]Clearly,����������� ������������������   research,����������� ������������������   engineering,����������� ������������������   policy����������� ������������������   making����������� ������������������   for����������� ������������������   the����������� ������������������   Data����������� ������������������  Economy����������� ������������������  and����������� ������������������  the����������� ������������������  exploitation����������� ������������������  of����������� ������������������  the����������� ������������������  unprecedented����������� ������������������  wealth����������� ������������������  of����������� ������������������  data����������� ������������������  have����������� ������������������  become����������� ������������������  keys����������� ������������������  to����������� ������������������  the����������� ������������������  Future����������� ������������������  of����������� ������������������  Europe.

“ “

Page 84: Linked Data: some social challenges

WE CAN DO IT!!!

Page 85: Linked Data: some social challenges

Thank����������� ������������������  you.

@barbz79it