68
Vorlesung Dr. Harald Sack Hasso-Plattner-Institut für Softwaresystemtechnik Universität Potsdam Wintersemester 2009/10 Semantic Web Blog zur Vorlesung: http://sewe0910.blogspot.com / Die nichtkommerzielle Vervielfältigung, Verbreitung und Bearbeitung dieser Folien ist zulässig (Lizenzbestimmungen CC-BY-NC ).

20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Embed Size (px)

DESCRIPTION

01 Vom WWW zum Semantic Web1.Einführung 1.1 Das WWW - eine historisch orientierte Einführung 1.2 Die Grenzen des WWW1.3 Die Vision des Semantic Web1.4 Wie das Semantic Web die Welt verändert

Citation preview

Page 1: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung

Dr. Harald Sack

Hasso-Plattner-Institut für Softwaresystemtechnik

Universität Potsdam

Wintersemester 2009/10

Semantic Web

Blog zur Vorlesung: http://sewe0910.blogspot.com/Die nichtkommerzielle Vervielfältigung, Verbreitung und Bearbeitung dieser Folien ist zulässig (Lizenzbestimmungen CC-BY-NC).

Page 2: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

1. Einführung

2. Semantic Web BasisarchitekturDie Sprachen des Semantic Web - Teil 1

3. Wissensrepräsentation und LogikDie Sprachen des Semantic Web - Teil 2

4. Ontology Engineering

5. Semantic Web Applications

2

Semantic Web - Vorlesungsinhalt

Page 3: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

320.10.2009 – Vorlesung Nr. 1 2 3 4 5 6 7 8 9 1110 12

13

1. Einführung

1.1.Das WWW - eine historisch orientierte Einführung

1.2. Die Grenzen des WWW

1.3. Die Vision des Semantic Web

1.4. Wie das Semantic Web die Welt verändert

14

Semantic Web - Vorlesungsinhalt

Page 4: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

4 Es war einmal....das Internet

ARPANET, 29. Oktober 1969

J.C.R. LickliderARPA IPTO Director

(1962-1966)

Robert TaylorARPA IPTO Director

(1966-1969)

Larry RobertsDirector ARPAnet Project

(1966-1973)

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

Page 5: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

5

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

Das Internet - Rechnerzentrierte Verarbeitung

• Wie gelangte der Benutzer zu Informationen?

1.Terminal öffnen2.Verbindung zu entfernten Rechner

herstellen3.Dateien des entfernten Rechners

durchsuchen4.Datei von entfernten Rechner auf

lokalen Rechner übertragen5.Datei auf lokalem Rechner lesen

Problem:• Expertenwissen zum Informationszugriff notwendig• Informationszugriff sehr aufwändig• Informationsrecherche sehr aufwändig

Page 6: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

6

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

Das World Wide Web• Das WWW wurde 1990 am europäischen Kernforschungszentrum CERN

geboren

Robert Cailliau Sir Tim Berners-Lee

Page 7: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

7

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

Das WWW - Dokumentenzentrierte Verarbeitung • Wie gelangt der Benutzer zu Informationen?

1.Browser öffnen2.Dokument laden3.Hyperlink zum nächsten Dokument

anklicken

Vorteile:•Informationszugriff ohne Expertenwissen•Informationszugriff sehr leicht•Informationsrecherche über Suchmaschinen

Page 8: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

8

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

• Aber die ursprüngliche Idee hinter dem WWW reicht viel, viel weiter zurück.....

Encyclopédie ou Dictionnaire raisonné des sciences, des arts et des métiers

(1772)

Denis Diderot(1713-1784)

Jean-Baptiste le Rondd'Alembert (1717-1783)

Agostino Ramelli (1588), Le diverse et artificiose machine;

composte in lingua Italiana et Francese

Page 9: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

9

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

• Aber die ursprüngliche Idee hinter dem WWW reicht viel, viel weiter zurück.....

Vannevar Bush schlägt 1945 das erste Hypertext-System „MEMEX“ vor

Vannevar Bush(1890-1974)

vgl. Vannevar Bush, As we may think ,The Atlantic Monthly, 1945, July

Page 10: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

10

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

• Warum das WWW so erfolgreich werden konnte...

Lynx 1993

Page 11: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

11

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

• Warum das WWW so erfolgreich werden konnte...

NCSA Mosaic1994

Page 12: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

12

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

• Die Grenzen des Wachstums sind noch nicht abzusehen...

http://www.isc.org/(Stand: 10/2008)

Page 13: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

13

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

• Die Grenzen des Wachstums sind noch nicht abzusehen...http://www.internetworldstats.com/

(Stand: 10/2008)

Page 14: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

14

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

• Die Grenzen des Wachstums sind noch nicht abzusehen...

http://www.internetworldstats.com/(Stand: 10/2008)

Page 15: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

15

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

Vom Web 1.0 zum Web 2.0• Webinhalte und Anwendungen verändern sich

Informationskonsumption

Informationsproduktion

interaktive Partizipation

Page 16: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

16

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

• Die Inhalte und die Rollenverteilung verändern sich über die Jahre...

Web 2.0 is thebusiness revolution inthe computer industrycaused by the move tothe Internet asplatform, and anattempt to understandthe rules for successon that new platform " -- Tim O'Reilly, 2003

Page 17: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

17

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

Das WWW ist ,ziemlich groß`•ca. 25 x 109 in Suchmaschinenindizierte Dokumente (TNL Blog: Google has 24 billion items index, considers MSN search nearest competitor, September 2005)

•Web Crawler: > 1012 Dokumente(The Official Google Blog: We knew the Web was Big....., Juli 25, 2008)

•DeepWeb (Darkweb) schätzungsweise bis zu 550 mal größer als das Surface Web (Bergman, 2001)

Probleme:• Aktualität des Suchmaschinenindex• syntaktische / semantische Inkonsistenzen im Suchmaschinenindex• Skalierbarkeit der Suchmaschinenanwendung• Kann man der Information tatsächlich trauen...?

Page 18: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

18

Semantic Web - Einführung1.1. Das WWW - Eine historisch orientierte Einführung

War das alles?

Page 19: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

1920.10.2009 – Vorlesung Nr. 1 2 3 4 5 6 7 8 9 1110 12

13

1. Einführung

1.1. Das WWW - eine historisch orientierte Einführung

1.2.Die Grenzen des WWW

1.3. Die Vision des Semantic Web

1.4. Wie das Semantic Web die Welt verändert

14

Semantic Web - Vorlesungsinhalt

Page 20: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

20

Semantic Web - Einführung1.2. Die Grenzen des WWW

Noch mehr Probleme...•Informationskonsument

•Wie finde ich die richtigen Informationen?

•Was ist wichtig, was nicht?

•Ist die Information vollständig?

•Informationsproduzent

•Wie sorge ich dafür, dass jemand die von mir angebotenen Informationen tatsächlich findet?

•Kann die Informationssuche (zuverlässig) automatisiert werden?

•Kann ich der angebotenen Information auch tatsächlich vertrauen?

Page 21: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

21

Semantic Web - Einführung1.2. Die Grenzen des WWW

•was ist wichtig, was nicht?

•was ist Information, was ist Werbung?

•was bedeutet die Information?

•wie glaubhaft ist die Information?

•was gehört zusammen?•was ist redundant?

Mensch verfügt über Kontextwissen /

Weltwissen und kann daher Information (meist)

richtig deuten…

Information im WWW

Page 22: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

22

Semantic Web - Einführung1.2. Die Grenzen des WWW

Information im WWW•Das WWW ist für die Nutzung durch den Menschen bestimmt

•Das WWW basiert auf der Markupsprache HTML

•HTML beschreibt

•wie Informationen dargestellt werden sollen (XHMLT + CSS),

•wie Informationen miteinander verknüpft werden können,

•aber nicht, was diese Informationen bedeuten….

Semantik

Page 23: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

23

Semantic Web - Einführung1.2. Die Grenzen des WWW

Semantik

Die Semantik (griech. σεµαντικος = zum Zeichen gehörend, Bedeutungslehre) ist das Teilgebiet der Sprachwissenschaft (Linguistik), das sich mit

•Sinn und •Bedeutung

von Sprache beziehungsweise sprachlichen Zeichen befasst.

Die Semantik kümmert sich um die Frage, wie Sinn und Bedeutung von komplexen Begriffen aus denen von einfachen Begriffen abgeleitet werden können und stützt sich dabei in der Regel auf die Syntax (griech. σψνταξις = Zusammenstellung, Satzbau, steht für die normative Struktur von Daten).

3+8=23syntaktisch richtigsemantisch falsch

3+8=11syntaktisch richtigsemantisch richtig

3+ü=%syntaktisch falsch

--

Bsp.:

Page 24: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

24

Semantic Web - Einführung1.2. Die Grenzen des WWW

Das Ende des WWW...?

•Das WWW ist spezialisiert auf dokumentenzentrierte Verarbeitung und für die Nutzung durch den Menschen bestimmt

•Problemfelder:

(1) Informationssuche„wo finde ich…?“

(2) Informationsextraktion„was ist wichtig?“

(3) Wartung„sind meine Daten (noch) konsistent?“

(4) Personalisierung„was mich interessiert…“

Page 25: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

25

Semantic Web - Einführung1.2. Die Grenzen des WWW

Problemfeld 1: Informationssuche

•Keyword-Suche führt zu vielen nicht relevanten Ergebnissen•Bedeutungsunterschiede•Homonyme•unterschiedlicher Kontext

•Keyword-Suche findet nichtalle relevanten Ergebnisse•Synonyme• fehlende Kontextpräzisierung

Suchbegriff: „Golf“

Page 26: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

26

Semantic Web - Einführung1.2. Die Grenzen des WWW

Problemfeld 2: Informationsextraktion•kann nur von menschlichem“Agenten“ korrekt durch-geführt und bewertet werden

•heterogene Anordnung von Information

•Software-Agent verfügt nicht über• Kontextwissen• Weltwissenum Informationen aus der Text-/Bilddarstellung zu lösen

bild.de

Page 27: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

27

Semantic Web - Einführung1.2. Die Grenzen des WWW

Problemfeld 2: Informationsextraktion

• implizites Wissen, d.h. Informationen, die nicht explizitspezifiziert werden, müssen durch logische Schlussfolgerungen aus der Kombination vorhandener Informationen ermittelt werden

Page 28: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

28

Semantic Web - Einführung1.2. Die Grenzen des WWW

Problemfeld 3: Wartung

• je komplexer und größer die WebSite, desto aufwändiger die Wartung der oft nur schwach-strukturierten Daten

• Problem:• Konsistenz• Korrektheit• Aktualität

Page 29: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

29

Semantic Web - Einführung1.2. Die Grenzen des WWW

Problemfeld 4: Personalisierung

•Anpassung des dargestellten Informations-inhalts an die persönlichen Bedürfnisse und Anforderungen

•Problem: •„woher kommen die

benötigten Informationen?“

Page 30: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

30

Semantic Web - Einführung1.2. Die Grenzen des WWW

Zusammenfassung•Das WWW ist (heute) zur Nutzung durch den Menschen bestimmt

•Lösungsansatz:

•Beschreibung der Bedeutung der dargestellten Information mit Hilfe standardisierter Formalismen

• Formalismus = maschinenlesbar

• Standard = interoperabel

•Metadaten

•= "Daten über Daten“

•strukturierte Daten, mit deren Hilfe eine Informationsressource beschrieben und dadurch besser auffindbar gemacht wird

Page 31: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

3120.10.2009 – Vorlesung Nr. 1 2 3 4 5 6 7 8 9 1110 12

13

1. Einführung

1.1. Das WWW - eine historisch orientierte Einführung

1.2. Die Grenzen des WWW

1.3.Die Vision des Semantic Web

1.4. Wie das Semantic Web die Welt verändert

14

Semantic Web - Vorlesungsinhalt

Page 32: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

32

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Die ursprüngliche Vision des World Wide Web

„The Web was designed as an information space, with the goal that it should be useful not only for human-human communication, but also that machines would be able to participate and help… “

Voraussetzung:• Inhalte können maschinell gelesen und korrekt

interpretiert (= verstanden) werden

Tim Berners-Lee, Semantic Web Roadmap, Sept 1998

Wie kann das funktionieren?

I knowwhat you mean…

Page 33: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

33 Die ursprüngliche Vision des World Wide Web

•ursprüngliche Beschreibung des WWW beschreibt unterschiedliche Beziehungen zwischen Dokumenten•describes•includes•refers to•…

•diese Beziehungen werden heute im WWW als nichtattributiertes Hyperlink ausgedrückt

•Semantik ging verloren!Tim Berners-Lee: Information Management - A Proposal,

CERN, March 1989.

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Page 34: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

34 Inhalte im Web maschinell „verstehen“•um Inhalte im Web maschinell „verstehen“ zu können werden zwei unterschiedliche Ansätze verfolgt

Natural Language Processing• Natürliche Sprache soll mit

Techniken der Linguistik und Statistik analysiert werden

• Die Bedeutung (Semantik) soll implizit (oder auch explizit) daraus erschlossen werden

• Techniken kommen im klassischen Information Retrieval (WWW-Such-maschinen) zum Einsatz

Semantic Web• (Natürlichsprachliche) Web-

Inhalte werden explizit mit Hilfe von semantischen Metadaten annotiert

• semantische Metadaten tragen die Bedeutung (Semantik) der Web-Inhalte und lassen sich maschinell lesen und korrekt interpretieren

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Page 35: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

35 Inhalte im Web maschinell „verstehen“

Text: „Diego zu Bayern?“

Diego Ribas da Cunha (Instanz)

Fußballspieler

ist ein

(Klasse)

Person

ist eine

(Klasse)

Superklasse

Subklasse

ist eine

Klassen-zugehörigkeit

Entitäten-zuweisung

• Die Bedeutung (Semantik) der Klassenmuss ebenfalls explizit definiert werden.

• Bedeutung wird über geeignete Wissens-repräsentationen (Ontologien) kodiert

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Page 36: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

36

Die Vision des Semantic Web•1997, WWW7 in Brisbane, Australien

• TBL stellt seine Vision eines „Global Reasoning Web“ vor

• 1998, WWW8 in Toronto, Kanada

• TBL präsentiert seine „Semantic Web Roadmap“

•Was ist das Semantic Web?

•Was kann das Semantic Web?

•Was ist das Semantic Web nicht?

•Wird das Semantic Web unser Leben verändern?

Tim Berners-Lee

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Page 37: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

37

Was ist das Semantic Web?

„The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation"

Tim Berners-Lee, James Hendler, Ora Lassila: The Semantic Web, Scientific American, 284(5), pp. 34-43(2001)

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Page 38: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

38

Was ist das Semantic Web?

•Das Semantic Web ist eine Art globaler Datenbank, das ein universales Netz semantischer Aussagen bereit hält

•Das Semantic Web kann sein Potenzial nur dann ausschöpfen, wenn Daten sowohl von Programmen als auch von Menschen ausgetauscht und verarbeitet werden können

• Programme müssen heterogene Daten austauschen und gemeinsam verarbeiten können, auch wenn diese Programme völlig unabhängig voneinander entwickelt wurden.

Tim Berners-Lee: Semantic Web Roadmap, W3C, 1998

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Page 39: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

39 Das Semantic Web - Datenzentrierte Verarbeitung •Die Bedeutung der Informationen (Semantik) wird durch standardisierte Wissensrepräsentationen (Ontologien) explizit formalisiert (strukturiert)

• Damit wird es möglich,

•die Bedeutung der Informationen maschinell zu verarbeiten

•unterschiedliche (heterogene) Daten miteinander in Beziehung zu setzen

•implizite (nicht offensichtliche) Information aus der vorhandenen (offensichtlichen) Information automatisch zu folgern

Das Semantic Web ist eine Art globaler Datenbank, die ein universales Netz semantischer Aussagen bereit hält

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Page 40: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

40 Semantic Web Roadmap

Stufe 1:Textdokumente undDatenbankeinträge

Stufe 2:XML-Dokumente miteinheitlichem Vokabular

Stufe 3:RDF-Taxonomien undDokumente mit unterschied-lichem Vokabular

Stufe 4:OWL-Ontologien undautomatischesSchlussfolgern

Tim Berners-Lee: Semantic Web Roadmap, W3C, 1998

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Page 41: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

41

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Semantic Web Roadmap

•Stufe 1: Textdokumente und Datenbankeinträge

•Daten sind anwendungsbezogen (proprietär), die Semantik steckt in den jeweiligen Anwendungen, nicht in den Daten

•z.B. Warenkatalog bei Amazon,

•Index von Google,

•Datenbestand bei Ebay, …

Page 42: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

42

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Semantic Web Roadmap

•Stufe 2: XML-Dokumente mit einheitlichem Vokabular

•Innerhalb bestimmter vorgegebener Domäne erreichen Daten Unabhängigkeit von der Anwendung und können so zwischen Anwendungen ausgetauscht werden

•z.B. Dublin-Core Bibliografien zur unabhängigen Beschreibung von Dokumenten

•Google API WebService,…

Page 43: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

43

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Semantic Web Roadmap

•Stufe 3: RDF-Taxonomien und Dokumente mit unterschiedlichem Vokabular

•Daten stammen aus unterschiedlichen Domänen und werden durch hierarchisch strukturierte Taxonomien/Partonomien klassifiziert. Einfache Beziehungen zwischen den einzelnen Kategorien dienen der Kombination von Daten.

•z.B. „Semantic Web“ ist eine „Vorlesung“ ist eine „Lehrveranstaltung“

•z.B. „Hans Mustermann“ gehört zum „Hasso-Plattner-Institut“ gehört zur „Universität Potsdam“

Page 44: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

44

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Semantic Web Roadmap

•Stufe 4: OWL-Ontologien und automatisches Schlussfolgern

•Neue Daten können aus bestehenden Daten gewonnen werden durch die Anwendung von Schlussfolgerungsregeln.Daten, Eigenschaften von Daten und Beziehungen zwischen Daten lassen sich semantisch beschreiben.

•z.B. automatisches Übersetzen eines Dokuments von einer Domäne in eine andere

•z.B. Formulieren komplexer Abhängigkeiten und Bedingungen

•d.h. die Anwendung „versteht“ Daten

Page 45: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

45

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Semantic Web Roadmap

•Kann man den semantischen Daten auch trauen?

•Authentizität Ist der mutmaßliche Urheber (Autor) auch der Tatsächliche?

•IntegritätWurden die Daten manipuliert?

•Public Key Kryptografie und digitale Signaturen

•Semantische Daten müssen signiert werden, damit Inferenzsysteme deren Zuverlässigkeit mit in Betracht ziehen können

•Semantisches Dokument = Sammlung von Aussagen + zugehörige Signaturen

Page 46: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

46

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Werkzeugkasten für das Semantic Web•Sprachstandards, mit denen Semantik der Information im Web

ausgedrückt werden kann

•Werkzeuge, um die Semantikinformation im Web nutzen zu können

•Beteiligung vieler unterschiedlicher Disziplinen der Informatik:

• Künstliche Intelligenz

• Computer Linguistik

• Kryptografie

• Datenbanktechnik

• Theoretische Informatik

• Rechnerarchitektur

• Software Engineering

• Systemtheorie

• Computernetzwerke

Page 47: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

47

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Das Semantic Web•Architektur und Stand der Standardisierung

Page 48: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

Semantic Web Architektur48

URI / IRI

XML / XSDData Interchange: RDF

RDFS

Ontology: OWL Rule: RIF

Query:SPARQL

Proof

Unifying Logic

Cry

pto

Trust

Interface & Application

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Page 49: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

49

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Das Semantic Web

Page 50: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

50

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Was ist das Semantic Web nicht•„The Semantic Web is not AI“

•RDF und OWL sind (im Vergleich zur Künstlichen Intelligenz) relativ simple Beschreibungssprachen

•einfache Art untereinander austauschbare Daten zu formulieren und zu beschreiben

•eine Möglichkeit, einfache Aussagen zu treffen

•bieten primitive Möglichkeit der Inferenz innerhalb eines beschränkten Rahmens

•….and that is it!

•„One goal in SW is to keep things relatively simple and not necessarily seek absolute completeness“

Page 51: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

51

Semantic Web - Einführung1.3. Die Vision des Semantic Web

Was ist das Semantic Web nicht•Nicht Teil des Semantic Webs sind (jetzt und in naher Zukunft)

•assoziatives Schlussfolgern

•räumliches Denken

•Erkennung von Text, Bildern, Gesten, etc…

•Komplexe Entscheidungsprozeduren

•Schlussfolgern aus unvollständigen oder kontextabhängigen Informationen

•„Strong AI“

Page 52: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

5220.10.2009 – Vorlesung Nr. 1 2 3 4 5 6 7 8 9 1110 12

13

1. Einführung

1.1. Das WWW - eine historisch orientierte Einführung

1.2. Die Grenzen des WWW

1.3. Die Vision des Semantic Web

1.4.Wie das Semantic Web die Welt verändert

14

Semantic Web - Vorlesungsinhalt

Page 53: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

53

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

Suchmaschinen - Document Retrieval•Eingabe in Suchmaschine: “GOLF von 2000“

•Nachfrage zu “GOLF“: PKW oder SPORTART oder SONSTIGES ?Verfeinerung: PKW

Page 54: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

54

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

Suchmaschinen - Document Retrieval•Eingabe in Suchmaschine: “GOLF von 2000“

•Nachfrage zu “2000“: Baujahr oder technische Parameter?Verfeinerung: Baujahr

• Name: Volkswagen Golf• Kategorie: Auto• ...• Baujahr <Integer>• technischer Parameter• Hubraum <Integer>• Leistung <Integer>• ...

• ...

Page 55: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

55

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

Suchmaschinen - Document Retrieval•Eingabe in Suchmaschine: “GOLF von 2000“

•Nachfrage zu “GOLF von 2000“: Verkaufsangebote, Dokumentation oder sonstige Artikel ? Verfeinerung: Dokumentationen ...

• Name: Volkswagen Golf• Kategorie: Auto• ...• Baujahr <2000>• technischer Parameter• Hubraum <Integer>• Leistung <Integer>• ...

• ...

Page 56: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

56

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

Suchmaschinen - Document Retrieval•Eingabe in Suchmaschine: “GOLF von 2000“

•Generelle Probleme:

•Korrekte Interpretation der Suchphrase

•Korrekte Identifikation von Entitäten

•Automatische Disambiguierung

•Usability

•Personalisierung

Page 57: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

57

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

Suchmaschinen II - Personalisierung•Eingabe in Suchmaschine: “GOLF von 2000“

•Nutze verfügbare (persönliche) Informationen, z.B:

•Benutzer hat in den vergangenen Monaten regelmäßig die Ergebnisse von Profi-Golfturnieren abgerufen

•Benutzer hat im vergangenen Jahr eine Garnitur Golfschläger (via Online-Shopping) gekauft

•Benutzer hat die RSS-Feeds zu Golf-Fachpublikationen imWeb abonniert

•Benutzer hat den Bildschirm-Hintergrund „Pebble-Beach“ gewählt

•Benutzer besitzt die Rechte an der Domain www.playing-golf.de

•…

Page 58: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

58

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

Suchmaschinen III - Fact Retrieval•Eingabe in Suchmaschine: “Wo kann ich hier am günstigsten tanken?“

Antwort: - Hohenfelden, xy-Str. 32 -> Super verbleit, 1,99 € - Route wird an das Navigationssystem weitergegeben - Leistung wird gedrosselt, damit das Benzin ausreicht…

Page 59: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

59

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

Suchmaschinen IV - Explorative Suche•Oft weiß der Benutzer gar nicht exakt, was er eigentlich sucht

•Bsp. „Suche Texte ähnlich den Texten von Ernest Hemingway“

dbpedia:ontology/influences dbpedia:ontology/influences

Ezra Pound Ernest Hemingway J.D. Salinger

Suchmaschine nutzt externes Wissen, um Vorschläge (Recommendations)Zu generieren und um mögliche Suchpfade aufzuzeigen...

Page 60: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

60

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

Intelligente Agenten im Semantic Web

Anwender

Suchdienst(z.B. Google)

WWW-Dokumente

Präsentationsdienst(z.B. Firefox)

WWWheute

WWW - Dokumente

SemanticWebAnwender

persönlicherAssistent

intelligenteInfrastrukturdienste

Page 61: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

61

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

Integration heterogener Daten im Semantic Web•Das WWW ist für die Nutzung durch den Menschen bestimmt

•Das Problem mit der Vielfalt:

•Informationen sind verstreut, liegen in unterschiedlichen Formaten vor und müssen vom Menschen verstanden und zusammengeführt werden

• Ein Beispiel: Reiseplanung

Page 62: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

62

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

Drei Generationen von Web-Dokumenten

statischeWeb-Seiten

HTML / CSS

1. Generation

interaktiveWeb-Seiten

dynamischeWeb-Seiten

JavaScript / Applets

DatenbankzugriffTemplate-basierte

Generierung

2. Generation

adaptiveWeb-Seiten

virtuelleWeb-Seiten

BenutzermodelleMachine Learning

Online Layout

NetbotsInformationsextraktionPräsentationsplaner

3. Generation

Page 63: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

63

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

...und die praktische Umsetzung?

• Jede Information im Semantic Web muss eindeutig identifiziert und kodiert werden können URI / IRI und Unicode

• Informationen im Semantic Web müssen so formuliert werden, dass Sie von Agenten verstanden werden können. Dies erfordert eine einheitliche Syntax XML und XSD

•Einfache Beziehungen zwischen Informationen müssen semantisch ausgedrückt werden können RDF mit RDFS

Page 64: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

64

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

...und die praktische Umsetzung?

•Unterschiedliche Semantik muss erklärt werden, damit scheinbar nicht vereinbare Informationen miteinander vereint werden können Ontologien/Regeln mit OWL / RIF

• Aus vorhandener Information soll neue Information geschlussfolgert werden Inferenzmechanismen

•Zugriffsrestriktionen und Vertrauenswürdigkeit müssen gewährleistet sein XMLEncryption und XMLSignature

Page 65: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

65

Semantic Web - Einführung1.4. Wie das Semantic Web die Welt verändert...

Zusammenfassung

•Das Semantic Web soll es (autonom agierenden) Anwendungs-programmen ermöglichen

•heterogene, über das Web zugreifbare Daten (Web of Data + Web of Services) miteinander in Beziehung zu setzen,

•diese Daten gemeinsam zu nutzen (Synergieeffekte),

•und aus diesen neue Informationen zu gewinnen (Inferenzmechanismen).

•Semantic Web und WWW ergänzen sich wechselseitig

Page 66: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

6620.10.2009 – Vorlesung Nr. 1 2 3 4 5 6 7 8 9 1110 12

13

1. Einführung

1.1. Das WWW - eine historisch orientierte Einführung

1.2. Die Grenzen des WWW

1.3. Die Vision des Semantic Web

1.4. Wie das Semantic Web die Welt verändert

14

Semantic Web - Vorlesungsinhalt

Page 67: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

67

Semantic Web - Einführung

Literatur

• P. Hitzler, S. Roschke, Y. Sure: Semantic Web Grundlagen, Springer, 2007.

• A. Gomez-Perez et al.Ontological Engineering, Springer, 2004.

Page 68: 20.10.2009, 01-Vom WWW zum Semantic Web, Vorlesung Semantic Web

Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam

68

Semantic Web - Einführung

Literatur

□Bloghttp://sewe0910.blogspot.com/

□Materialien-Webseitehttp://www.hpi.uni-potsdam.de/meinel/teaching/lectures_classes/semanticweb_ws0910.html

□bibsonomy - Bookmarkshttp://www.bibsonomy.org/user/lysander07/sw0910_01