18
<is web> Information Systems & Semantic Web University of Koblenz Landau, Germany Metawissen in RDF http://isweb.uni-koblenz.de/Research/MetaKnowledge <is web> Steffen Staab [email protected] Semantic Web 2 of 35 ISWeb - Information Systems & Semantic Web Szenario – Wissensintegration Annotierte Resourcen Automatische Wissens- extraktion RDF Store Manuelle Eingaben Query ? Kann ich mich darauf verlassen? Wer sagt das? Wie neu ist die Info? Wie wahrscheinlich ist es, dass die Tripel korrekt sind? MetaWissen •Quellen •Autor •Zeitangabe •Sicherheit •…

- Institute WeST · Steffen Staab [email protected] Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

  • Upload
    vumien

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Page 1: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web> Information Systems & Semantic Web

University of Koblenz ▪ Landau, Germany

Metawissen in RDF

http://isweb.uni-koblenz.de/Research/MetaKnowledge

<is web>

Steffen [email protected]

Semantic Web2 of 35

ISWeb - Information Systems & Semantic Web

Szenario – Wissensintegration

AnnotierteResourcen

AutomatischeWissens-extraktion

RDFStore

ManuelleEingaben

Query

?� Kann ich mich darauf

verlassen?� Wer sagt das?� Wie neu ist die Info?� Wie wahrscheinlich ist es,

dass die Tripel korrekt sind?

MetaWissen•Quellen•Autor•Zeitangabe•Sicherheit•…

Page 2: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web3 of 35

ISWeb - Information Systems & Semantic Web

Wie lösen Sie das Problem?

� Staab sagt am Montag� „Dellschaft ist mit Possibilität

0.80 Kollege von Abbasi“� „Saqib Mir ist mit Possibilität

0.30 Kollege von Abbasi“

� Schüler sagt am Dienstag� „Abbasi arbeitet für ISWeb“

Anfrage: Gib mir Leute, die mit jemandem aus ISWeb zusammenarbeiten.

Ergebnis

Wessen Aussagen haben zu dem Ergebnis

beigetragen?

Was ist die Gesamtpossibilitätder Ergebnisse?

Wann erfolgte die früheste und wann

die späteste Aussage hierzu?

<is web>

Steffen [email protected]

Semantic Web4 of 35

ISWeb - Information Systems & Semantic Web

Entwurfsentscheidungen

� Reifikation� Wahl: RDF Named Graphs (NG)� Anders als RDF reification, welche existierende Triple dekomponiert

und das Repräsentationsmodell komplett ändert

� Speichern und Serialisieren� Metawissen ist nicht separat von “normalem” Wissen� Entsprechend der allgemeinen RDF Philosophie

� Dimensionen von Metawissen� anwendungsabhängig, vom Systemadministrator gewählt

• Herkunft• Sicherheit• Zugriffsrechte• …

� Syntaktische Erweiterungen� system-unabhängig, in Übereinstimmung mit SPARQL Syntax und

Semantik

Page 3: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web5 of 35

ISWeb - Information Systems & Semantic Web

Ansatz

�Ziele� Problemunabhängige Lösung mit vertretbarer Komplexität� Passend zu Standards (RDF, SPARQL)

�Zutaten� Die Begriffe why/where/how provenance (Buneman01)� Provenance semirings (Green07)� Probabilistic relational algebra (Fuhr97)� SPARQL semantics (Perez06)

�Methodologie� Konstruieren symbolische boolsche Ausdrücke von Fakten (das sind Tupel

oder, stellvertretend, Tupel-Identifier) um Variablenzuweisungen mit SPARQL-Semantik zu annotieren

� Evaluiere symbolische boolsche Ausdrücke anwendungsabhängig für verschiedene Dimensionen

� Konstruiere die „herkunft-bewusste“ Ergebnismenge

<is web>

Steffen [email protected]

Semantic Web6 of 35

ISWeb - Information Systems & Semantic Web

Beispiel – Zusammenarbeit unter Wissenschaftlern

@prefix rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns

@baseURI http://www.problem.com/sampleDocument

:G1 {

Bob collaboratesWith Mary.

Mary worksInProjectProvenanceChallenge

}

:G2 {

Hugo collaboratesWith John.

John publishedAt ISWC.

Mary publishedAt ISWC

}

:G3 {

:G1 source

http://example/researchReport.doc .

:G1 agent Hugo.

:G1 extractor wordAnalyzer.

:G1 certainty "0.9".

:G1 timestamp "5/5/2007"

}

:G4 {

:G2 source

http://example/provenanceSurvey.pdf .

:G2 agent Betty.

:G2 extractor pdfAnalyzer.

:G2 certainty "0.6" .

:G2 timestamp "6/6/2006"

}

Wissen Metawissen

Page 4: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web7 of 35

ISWeb - Information Systems & Semantic Web

Eine Sparql-Anfrage

:G1 {

Bob collaboratesWith Mary.

Mary worksInProject

ProvenanceChallenge

}

:G2 {

Hugo collaboratesWith John.

John publishedAt ISWC.

Mary publishedAt ISWC

}

Result::G11 {

Bob recommendedFor

ProvenanceWorkshopPC .

Hugo recommendedFor

ProvenanceWorkshopPC

}

Anfrage:Finde Personen, die miteiner Person zusammenarbeiten, die auf der ISWC publizierthaben!

CONSTRUCT

{?X recommendedFor

ProvenanceWorkshopPC}

FROM NAMED G1, G2

WHERE GRAPH ?H1 {

{?X collaboratesWith ?Y}}

GRAPH ?H2 {

{?Y publishedAt ?Z}}

FILTER (?Z = "ISWC“)

Wie kann man die Verbindungen

herstellen?

?

<is web>

Steffen [email protected]

Semantic Web8 of 35

ISWeb - Information Systems & Semantic Web

Algebraische SPARQL Semantik

{ ?X collaboratesWith ?Y }

VA1

MaryBob

JohnHugo

?Y?X

{ ?Y publishedAt ?Z }

VA2

ISWCJohn

ISWCMary

?Z?Y

= VA1 VA2

VA3

John

Mary

?Y

ISWC

ISWC

?Z

Hugo

Bob

?X

∪UNION

OPT

Fast

unverändert

FILTER

AlgebraSPARQL

Mengen von Variablen-zuweisungen(VA1, VA2)

“AND”

CONSTRUCT

{?X recommendedFor

ProvenanceWorkshopPC}

FROM NAMED G1, G2

WHERE

GRAPH ?H1 {?X collaboratesWith ?Y}

GRAPH ?H2 {?Y publishedAt ?Z}

FILTER (?Z = "ISWC“)

?H1, ?H

2 zwecks

Vereinfachung

weggelassen

Page 5: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web9 of 35

ISWeb - Information Systems & Semantic Web

How Provenance für SPARQL

{ ?X collaboratesWith ?Y }

VA1

MaryBob

JohnHugo

?Y?X

{ ?Y publishedAt ?Z }

VA2

ISWCJohn

ISWCMary

?Z?Y

VA3

John

Mary

?Y

ISWC

ISWC

?Z

Hugo

Bob

?X

t3

t1

Annot.

t5

t4

Annot.

t3 ���� t4

t1 ���� t5

Annot.

����

Algebra

(t1 ���� t2) ����(t1 ���� ⌐t2)

Annot.

UNION

OPT

SPARQL

0.6

0.9

Prob.

Betty

Hugo

Agent

0.6

0.6

Prob.

Betty

Betty

Agent

.6*.6

.9*.6

Prob.

{Betty}

{Hugo,Betty}

Agent

<is web>

Steffen [email protected]

Semantic Web10 of 35

ISWeb - Information Systems & Semantic Web

Result as RDF

VA3

John

Mary

?Y

ISWC

ISWC

?Z

Hugo

Bob

?X

t3 ���� t4

t1 ���� t5

Annot.

.6*.6

.9*.6

Prob.

{Betty}

{Hugo,Betty}

Agent

CONSTRUCT

{?X recommendedFor

ProvenanceWorkshopPC}

FROM NAMED G1, G2

WHERE

GRAPH ?H1 {?X collaboratesWith ?Y}

GRAPH ?H2 {?Y publishedAt ?Z}

FILTER (?Z = "ISWC“)

?

?

:G11Meta {

:G11 source

http://example/researchReport.doc ,

http://example/provenanceSurvey.pdf.

:G11 agent Hugo, Betty .

:G11 extractor wordAnalyzer, pdfAnalyzer.

:G11 certainty "0.71" .

:G11 timestamp "6/6/2006" }

:G11 {

Bob recommendedFor

ProvenanceWorkshopPC .

Hugo recommendedFor

ProvenanceWorkshopPC }

Page 6: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web11 of 35

ISWeb - Information Systems & Semantic Web

Zusammenfassung

AnnotierteResourcen

AutomatischeWissens-extraktion

RDFStore

ManuelleEingaben

Query

!� Gewusst:

� Autor� Zeitstempel� Wahrscheinlichkeit� …

� Kann ich daraufvertrauen…

<is web>

Steffen [email protected]

Semantic Web12 of 35

ISWeb - Information Systems & Semantic Web

Formalisierung

Page 7: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web13 of 35

ISWeb - Information Systems & Semantic Web

Anderes Szenario

Sample scenario: CS AKTive Space (Shadbolt et al)

<is web>

Steffen [email protected]

Semantic Web14 of 35

ISWeb - Information Systems & Semantic Web

Anderes Szenario

� RDF Ergebnisse sind serialisierbarVorteil: reibungsloser Austausch und

Nutzen von Wissen im Semantik Web

U Koblenz

U Karlsruhe

ISWC chair SAMT chairhttp://www.uni-koblenz.de/~staab/foaf.rdf

http://www.aifb.uni-karlsruhe.de/Personen/viewPersonOWL/id6.owl

Page 8: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web15 of 35

ISWeb - Information Systems & Semantic Web

Semantic Web: Weshalb glaubst Du das?

WESHALB glaubst Du das?

Q: "find affiliations of Semantic Web experts"

RDF Repository

SPARQL Query

SPARQL Results

Provenance

NAMED ?G

<is web>

Steffen [email protected]

Semantic Web16 of 35

ISWeb - Information Systems & Semantic Web

Modelle

� RDF Model

� RDF+ Model

� Interpretation

Wissen

Meta-wissen

Theorie

Alles RDF

Page 9: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web17 of 35

ISWeb - Information Systems & Semantic Web

Schritt 1: From RDF to RDF+

<is web>

Steffen [email protected]

Semantic Web18 of 35

ISWeb - Information Systems & Semantic Web

Von RDF nach RDF +

Wissen

Meta-wissen

Page 10: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web19 of 35

ISWeb - Information Systems & Semantic Web

RDF+ Syntax

� Basiert auf den Bausteinen wie RDF

Wissen

Meta-

wissen

Theorie

<is web>

Steffen [email protected]

Semantic Web20 of 35

ISWeb - Information Systems & Semantic Web

RDF+ Interpretations: Standard Interpretation

Page 11: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web21 of 35

ISWeb - Information Systems & Semantic Web

RDF+ Interpretations: PI-Interpretations

� Beispiel: Icertainty(θ1)=0.9

Oder

Icertainty(θ1)=0.7

<is web>

Steffen [email protected]

Semantic Web22 of 35

ISWeb - Information Systems & Semantic Web

RDF Interpretationen und Modelle

Page 12: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web23 of 35

ISWeb - Information Systems & Semantic Web

Schritt 2: Anfrage evaluieren mit RDF+

<is web>

Steffen [email protected]

Semantic Web24 of 35

ISWeb - Information Systems & Semantic Web

CONSTRUCT (?X worksAt ?Y)WHERE{

{{?X researchTopic ?Y }

AND{?X affiliatedWith ?Z }

}FILTER {?Y = SemanticWeb}

}

{?X researchTopic ?Y .}

AND

{?X affiliatedWith ?Z .}

Algebraic SPARQL semantics

Pattern: { ?X researchTopic ?Y }

Variable assignment VA1

SemanticWebSteffenStaab

OntoLearningRudiStuder

?Y?X

Pattern: { ?Y affiliatedWith ?Z }

Variable assignment VA2

UnivKoblenzSteffenStaab

UnivKarlsruheRudiStuder

?Z?X

Variable assignment 3

OntoLearning

SemanticWeb

?Y

UnivKarlsruhe

UnivKoblenz

?Z

RudiStuder

SteffenStaab

?X

t5

t4

ID

t3

t1

ID

t3 ���� t5

t1 ���� t4

IDs

����

Algebra

(t1�t2)�(t1 � ⌐t2)

Annot.

UNION

OPT

SPARQL

Page 13: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web25 of 35

ISWeb - Information Systems & Semantic Web

Schritt 3: Metawissen interpretieren mit RDF+

<is web>

Steffen [email protected]

Semantic Web26 of 35

ISWeb - Information Systems & Semantic Web

RDF+ Semantics

� Wieso Semantik?

.. Disjunction? Konjunction? collective reading?

Model layer: individuelle Interpretationen für Metawissen:

Page 14: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web27 of 35

ISWeb - Information Systems & Semantic Web

Zwischen RDF und RDF +

collective

interpretation

distributive

interp.

Wird abgebildet auf

<is web>

Steffen [email protected]

Semantic Web28 of 35

ISWeb - Information Systems & Semantic Web

Complexity

Page 15: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web29 of 35

ISWeb - Information Systems & Semantic Web

Komplexität

Beweise: http://isweb.uni-koblenz.de/Research/MetaKnowledge

Betrachte Eval+ : Anfrageauswertung in RDF+

• Query re-writing (almost no cost)

• Query execution, keeping associations between knowledge and metaknowledge through boolean expressions

• Retrieving meta knowledge and constructing collective interpretation for theresult set

same complexityclass as for Eval: query evaluation forRDF

<is web>

Steffen [email protected]

Semantic Web30 of 35

ISWeb - Information Systems & Semantic Web

Sample scenario

Page 16: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web31 of 35

ISWeb - Information Systems & Semantic Web

Advanced SPARQL scenario

Inputs:

<is web>

Steffen [email protected]

Semantic Web32 of 35

ISWeb - Information Systems & Semantic Web

Advanced SPARQL Scenario (2)

where-provenance

how-provenance

Page 17: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web33 of 35

ISWeb - Information Systems & Semantic Web

Advanced SPARQL Scenario (3)

<is web>

Steffen [email protected]

Semantic Web34 of 35

ISWeb - Information Systems & Semantic Web

Conclusions

Page 18: - Institute WeST ·  Steffen Staab staab@uni-koblenz.de Semantic Web 5 of 35 ISWeb - Information Systems & Semantic Web Ansatz Ziele Problemunabhängige

<is web>

Steffen [email protected]

Semantic Web35 of 35

ISWeb - Information Systems & Semantic Web

Meta knowledge layer: state of play

� Related work

� [McGuinness et al]: proof layer of the Semantic Web• different language model (RDF) • our domain: retrieval with SPARQL, not proof traces for OWL

� [Buneman et al]: extensions of relational data model• our domain: RDF graph models, not metadata models for RA• (different querying language, SPARQL vs SQL)

� Current status

� Motivation, first examples• [Schueler,Sizov,Staab@ICSC2007]

� Formal model and analysis• U Koblenz, Technical report 28/2007

at http://www.uni-koblenz.de/FB4/Publications/Reports• submitted for publication

� Fully implemented prototype with demo data• open source, public domain implementation (with Sesame RDF store)• available at: http://isweb.uni-koblenz.de/Research