47
Chapter 1 A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Embed Size (px)

Citation preview

Page 1: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer1

Chapitre 1 introduction au web sémantique

Grigoris Antoniou

Frank van Harmelen

Page 2: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer2

Sommaire

1. Le web actuel

2. Impact du web sémantique

3. Technologies du web sémantique

4. Approche par couches

Page 3: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer3

Le web actuel

La plus grande partie du contenu du web actuel est destinée à la consommation humaine

– Le contenu généré automatiquement au départ de bases de données est (même parfois) présenté sans les informations de structure d'origine que l'on trouve dans les bases de données.

Les utilisations courantes du web que font les gens aujourd'hui vont

– de la recherche et de l'utilisation des informations à la recherche et à la prise de contact avec d'autres gens, à la consultation de catalogues de boutiques virtuelles et à la commande de produits en ligne

Page 4: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer4

Moteurs de recherche à base de mots clés

Les activités actuellement déployées sur le web ne sont pas particulièrement bien prises en charge par les outils logiciels– Sauf pour les moteurs de recherche basés sur

des mots clés comme Google, AltaVista et Yahoo)

Sans ces moteurs de recherche, le web n'aurait pas connu son immense succès

Page 5: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer5

Problèmes liés aux moteurs de recherche à mots clé

Grand volume d'extraction, faible précision Faible extraction ou absence d'extraction Résultats très sensibles au vocabulaire Résultats limités à des pages (uniques du) web Intervention humaine nécessaire pour l'interprétation

et la combinaison des résultats Résultats de recherche non immédiatement

accessibles par d'autres outils logiciels

Page 6: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer6

Principaux problèmes du web actuel

Le sens du contenu du web n'est pas accessible par la machine : absence (manque) de sémantique

Il est par exemple difficile de faire la distinction entre le sens de ces deux phrases:

Je suis professeur d'informatique.

Je suis professeur d'informatique, vous croyez…, Bien, ...

Page 7: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer7

Approche du web sémantique

Représenter le contenu web sous une forme plus facilement traitable par la machine

Utiliser les techniques d'intelligence pour tirer profit de ces représentations

Le web sémantique va progressivement émerger du web actuel. Il n'entre pas en concurrence avec lui.

Page 8: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer8

Sommaire

1. Le web actuel

2. Impact du web sémantique

3. Technologies du web sémantique

4. Approche par couches

Page 9: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer9

Impact du web sémantique - Gestion du savoir

La gestion du savoir englobe l’acquisition, l’accès et l’actualisation (maintien) dans une organisation

L’activités principales des grandes entreprises: le savoir interne est un capital intellectuel

Particulièrement important pour les grandes entreprises internationales géographiquement dispersées

La majorité de l'information est actuellement disponible sous forme faiblement structurée (par ex. texte, audio, video)

Page 10: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer10

Restrictions des technologies actuelles de gestion du savoir

Recherche de l'information – moteurs de recherche à base de mots clés

Extraction de l'information– nécessité d'une intervention humaine pour la consultation, la

récupération, l'interprétation, la combinaison Actualisation de l'information

– incohérences terminologiques, informations obsolètes Visualisation de l'information

– impossibilité de définir des visualisations des connaissances sur le web

Page 11: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer11

Le web sémantique permet la gestion du savoir

Le savoir est organisé en espaces conceptuels en fonction de sa signification

Outils automatisés pour la maintenance et la découverte du savoir

Réponse sémantique aux requêtes Réponse aux requêtes couvrant plusieurs documents Possibilité de déterminer qui a accès à la

visualisation de certaines parties de l'information (et même, parties de documents)

Page 12: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer12

Impact du web sémantique - B2C e-commerce

Scénario classique : un utilisateur visite une ou plusieurs boutiques de vente en ligne, consulte leurs offres, choisit et passe commande.

Idéalement, toute personne se devrait de visiter toutes les boutiques en ligne ou au moins les plus importantes. Mais cela prendrait trop de temps.

Shopbots (robots (les agents) logiciels comparateurs de prix et produits) sont un des outils utiles

Page 13: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer13

Limites des Shopbots

Ils se basent sur des (Wrappers) conteneurs (répertoires à contenu caché): nécessité d'une très importante programmation

Les (Wrappers) conteneurs doivent être reprogrammés lorsque la boutique en ligne change son assortiment

Les (Wrappers) conteneurs extraient l'information basée sur l'analyse textuelle– propension aux erreurs– limitation dans l'extraction d'information

Page 14: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer14

e-commerce B2C favorisé par le web sémantique

Agents (Robots) logiciels capables d'interpréter les informations produits et les conditions de service– Les tarifs et informations produits ainsi que les

politiques de livraison et de respect de la vie privée seront interprétées et comparées en fonction des critères de l'utilisateur.

Informations sur la réputation des boutiques Des agents (robots) d'achat sophistiqués seront en

mesure de mener des négociations automatisées

Page 15: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer15

Impact du web sémantique – e-commerce B2B

Enormes perspectives économiques Repose actuellement principalement sur EDI (?)

– technologie isolée, comprise uniquement par les spécialistes– programmation et maintenance difficiles, propension aux

erreurs– chaque communication B2B nécessite une programmation

distincte Le web semble être l'infrastructure parfaite

– mais le B2B n'est pas bien pris en charge par les normes du web actuel.

Page 16: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer16

e-commerce B2B favorisé par le web sémantique

Les entreprises accèdent aux partenariats sans trop de frais généraux

Les différences terminologiques seront aplanies par l'utilisation de modèles standard de domaines abstraits

Les données seront échangées par le biais de services de traduction

Enchères, négociations et projets de contrats seront menés automatiquement (ou semi-automatiquement) par des agents (robots) logiciels

Page 17: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer17

Sommaire

1. Le web actuel

2. Impact du web sémantique

3. Technologies du web sémantique

4. Approche par couches

Page 18: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer18

Technologies du web sémantique

Métadonnées explicites Ontologies Logique et inférence (déduction) Agents (Robots) logiciels

Page 19: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer19

En HTML

Le contenu web est actuellement formaté pour sa lecture par des personnes et non par des programmes

HTML est le langage prédominant d'écriture des pages web (directement ou à l'aide d'outils)

Le vocabulaire décrit la mise en page (présentation)

Page 20: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer20

Exemple d'HTML

<h1>Centre de kinésithérapie Agilitas </h1>Bienvenue à la page d'accueil du Centre de kinésithérapie Agilitas.

Ressentez-vous de la douleur? Avez-vous eu un accident? Notre personnel

Lise Davanport,Josiane Bouville (notre charmante secrétaire) et Etienne Matthieu vont prendre soin de vous.<h2>Horaire des consultations</h2>Lun 11.00 - 19.00<br>Mar 11.00 - 19.00<br>Mer 15.00 - 19.00<br>Jeu 11.00 - 19.00<br>Ven 11.00 - 15.00<p>Veuillez noter que nous n'avons pas de consultations les semaines de <a href=". . .">State Of Origin</a> games.

Page 21: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer21

Problème liés à HTML

Les gens n'y voient pas de problèmes Les machines (robots agents logiciels), par

contre, en voient.– Comment distinguer les kinésithérapeutes de la

secrétaire – Comment déterminer exactement les heures de

consultations – On aurait à suivre le lien vers State Of Origin

games pour trouver où elles ont lieu (??)

Page 22: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer22

Représentation plus élaborée

<société><traitementProposé>Kinésithérapie</traitementProposé><nomSociété>Centre de Kinésithérapie Agilitas</nomSociété><personnel>

<kiné>Lise Davanport</kiné><kiné>Etienne Matthieu</kiné><secrétary>Josiane Bouville</secrétaire>

</personnel></société>

Page 23: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer23

Métadonnées explicites

Cette représentation se traite beaucoup plus facilement par la machine

Métadonnées: données au sujet des données – les métadonnées capturent une partie de la

signification des données

Le web sémantique ne repose plus sur la manipulation à base de texte mais sur les métadonnées que la machine peut traiter.

Page 24: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer24

Ontologies

Le mot ontologie provient de la philosophie Etude de la nature de l'existence (l'être en tant

qu'être)

L'informatique lui a donné une acception différente Une ontologie est un ensemble structuré et

formel de concepts permettant de donner un sens aux informations

Page 25: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer25

Composants généraux des ontologies

Termes indiquent les concepts importants (classes d'objets) du domaine :

– par ex. professeurs, membre du personnel, étudiants, cours, départements

Relations entre ces termes: classent les hiérarchies– une classe C étant une sous-classe d'une autre classe C' si

tous les objets de la classe C sont également compris en C' – par ex. tous les professeurs sont des membres du personnel

Page 26: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer26

Autres composants des ontologies

Propriétés: – par ex. X enseigne à Y

Restrictions de valeur – par ex. seuls les membres du corps académique peuvent

enseigner Déclarations de disjonction

– par ex. le corps académique et personnel général sont disjoints Relations logiques entre objets

– par ex. chaque département doit comprendre (avoir) au moins 10 facultés

Page 27: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer27

Exemple d'hiérarchie de classes

Population universitaire

Personnel Etudiants

Personnel académique

Personnel administratif

Personnel technique

Etudesen cours

Postgradués

Permanent Chercheur Visiteur

Page 28: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer28

Rôle des ontologies sur le web

Les ontologies apportent une compréhension partagée d'un domaine: interopérabilité sémantique– vaincre les différences terminologiques – établir la cartographie entre ontologies

Les ontologies sont utiles pour l'organisation et la navigation dans les sites web

Page 29: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer29

Rôle des ontologies dans les recherches sur le web

Les ontologies sont utiles pour améliorer la précision des recherches web

– les moteurs de recherche peuvent chercher des pages se référant à un concept précis dans une ontologie

Les recherches web peuvent exploiter les informations de généralisation / spécialisation

– si une requête n'aboutit pas à trouver les documents appropriés, le moteur de recherche peut suggérer de faire appel à une requête plus générale.

– si on obtient trop de réponses, le moteur de recherche peut suggérer d'utiliser des spécialisations plus étroites

Page 30: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer30

Langages ontologiques du web

RDF Schema RDF est un modèle de données pour les objets et

exprimer leurs relations (entre eux) RDF Schema est un langage à vocabulaire

descriptif Il décrit les propriétés et les classes des

ressources RDF Il fournit la sémantique pour les hiérarchies de

généralisation des propriétés et des classes

Page 31: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer31

Langages ontologique du web (2)

OWL langage ontologique enrichi relations entre classes

– par ex. disjonction cardinalité

– par ex. "un exactement" types enrichis de propriétés caractéristiques des propriétés (par ex.,

symétrie)

Page 32: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer32

Logique et inférence

La logique est la discipline qui étudie les principes et les formes du raisonnement

Langages formels servant à l'expression du savoir Sémantique formelle bien comprise

– connaissance déclarative: on décrit l'énonçable sans tenir compte de la manière dont on peut le déduire

Les dispositifs de raisonnement automatisé peuvent déduire (inférer) des conclusions au départ d'une

connaissance donnée

Page 33: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer33

Exemple d'inférence

prof(X) faculté(X)

faculté(X) membre du personnel(X)

prof(michael)

On peut déduire les conclusions suivantes:

faculté(michael)

membre du personnel (michael)

prof(X) membre du personnel(X)

Page 34: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer34

Logique par rapport à ontologies

L'exemple qui précède implique une connaissance résidant habituellement dans les ontologies– La logique peut servir à découvrir la

connaissance ontologique implicitement livrée – Elle peut aussi faciliter la découverte de relations

inattendues et d'incohérences La logique est donc plus générale que les ontologies

– Elle peut aussi être utilisée par les robots agents intelligents pour prendre des décisions et choisir une ligne de conduite

Page 35: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer35

Compromis entre puissance d'expression et complexité de calcul

Plus une logique est expressive, plus son calcul exige de moyens pour aboutir à des conclusions

– arriver à certaines conclusions peut devenir impossible si l'on rencontre des barrières incalculables

L'exemple précédent supposait des règles "Si (conditions), alors (conclusion)" et uniquement des objets en nombre fini

– ce sous-ensemble logique est maniable et supporté par des outils de raisonnement efficaces

Page 36: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer36

Inférence et explications

Explications : les étapes de l'inférence peuvent être reconstituées

Elles augmentent la confiance de l'utilisateur dans les robots du web sémantique: Touche "Oui, bien sûr?"

Activités entre robots: création ou validation des (les) contrôles

Page 37: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer37

Procédure classique d'explication

Les faits sont normalement raccrochés à des adresses web – la sécurité de l'adresse web est vérifiable par les

robots agents

Les règles peuvent faire partie d'une ontologie partagée de commerce ou de la politique d'une boutique en ligne.

Page 38: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer38

Robots agents logiciels

Les robots agents logiciels travaillent de manière autonome et proactive

– ils sont développés au départ d'une programmation orientée objet et à composants

Un robot agent personnel sur le web sémantique pourra:– recevoir certaines tâches et préférences d'une personne– chercher les informations de sources web, communiquer avec

d'autres robots agents– comparer les informations sur les critères et préférences de

l'utilisateur, effectuer certains choix– donner des réponses à l'utilisateur

Page 39: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer39

Agents (Robots) logiciels Personnels intelligents

Actuellement

Utilisateur

Présent dans le navigateur web

Moteur de recherche

Documents www

Dans le futur

Utilisateur

Agent personnel

Documents www

Infrastructure intelligente de services

Page 40: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer40

Technologies des agents robots logiciels du web sémantique

Métadonnées – Identifier et extraire l'information des sources web

Ontologies – Rechercher sur le web, interpréter l'information

extraite – Communiquer avec d'autres robots agents

Logique– Traiter l'information extraite, tirer des conclusions

Page 41: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer41

Technologies des agents robots logiciels du web sémantique (2)

Autres technologies (perpendiculaire orthogonale aux technologies du web sémantique)– langages de communication des robots– représentation formelle des convictions, souhaits

et intentions des robots agents– création et maintenance des modèles utilisateur

Page 42: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer42

Sommaire

1. Le web actuel

2. Impact du web sémantique

3. Technologies du web sémantique

4. Approche par couches

Page 43: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer43

Approche par couches

Le développement du web sémantique avance pas à pas– à chaque pas, une couche vient s'ajouter à une

autre

Principes: Compatibilité descendante Compréhension partielle verticale

Page 44: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer44

La construction par couches de la tour du web sémantique

Page 45: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer45

Couches du web sémantique

Couche XML– Base syntaxique

Couche RDF– Modèle de données de base RDF pour les faits– Langage ontologique simple RDF Schema

Couche ontologique– Langages plus expressifs que RDF Schema– Standard web actuel OWL

Page 46: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer46

Couches du web sémantique (2)

Couche logique – améliore les langages ontologiques– connaissance déclarative propre à l'application

Couche de contrôle– génération de contrôle, échange, validation

Couche de sécurisation– signatures numériques– avis, agences de notation ...

Page 47: Chapter 1A Semantic Web Primer 1 Chapitre 1 introduction au web sémantique Grigoris Antoniou Frank van Harmelen

Chapter 1 A Semantic Web Primer47

Les différentes présentations :

2. Documents web structurés en XML

3. Description des ressources web en RDF

4. Langage ontologique web OWL

5. Logique et inférence: règles

6. Applications

7. Ingénierie ontologique

8. Conclusion et perspectives