35

AntistoÐqish Ontologi¸n - iit.demokritos.gr · • DiaforetikoÐ ìroi qrhsimopoioÔntai gia thn anapar stash stoiqeÐwn thc ontologÐac me koin shmasÐa • Diaforetikèc sqèseic

Embed Size (px)

Citation preview

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

AntistoÐqish Ontologi¸n

BasÐlhc Sphliìpouloc 1,2

[email protected]

1Tm ma Mhqanik¸n Plhroforiak¸n kai Epikoinwniak¸n Susthm�twn,

Ergast rio Teqnht c NohmosÔnhc, Panepist mio AigaÐou2InstitoÔto Thlepikoinwni¸n kai Plhroforik c, Ergast rio TeqnologÐac

Gn¸sewn kai LogismikoÔ, E.K.E.F.E. Dhmìkritoc

6 DekembrÐou 2006

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Perieqìmena

Eisagwg 

AntistoÐqish - Sugq¸neush

DiadikasÐa AntistoÐqishc

Sumper�smata

ErgasÐa

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

TÐ eÐnai OntologÐa?

Mia morf  anapar�stashc gn¸shc sqetik c me mia jematik perioq , h opoÐa eÐnai:

• Formalistik 

• Υπάρχει πληθώρα διαθέσιμων γλωσσών οντολογιών,βασισμένες σε διαφορετικές θεωρίες (π.χ. Λογική Πρώτης

Τάξης, Description Logics, Frames)• ΄Ενα υποσύνολο των γλωσσών οντολογιών υποστηρίζουνμηχανισμούς συμπερασμού (π.χ OWL-DL)

• Koin¸c apodekt  kai diamoirazìmenh

• Δίνει την δυνατότητα για επαναχρησιμοποίησηυπάρχουσας γνώσης

• Ενισχύει την διαλειτουργικότητα μεταξύ εφαρμογών (π.χ.πράκτορες λογισμικού, δικτυακές εφαρμογές)

• Shmasiologikìc Istìc

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Qarakthristik� OntologÐac

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

O Idanikìc Kìsmoc kai h Pragmatikìthta

O idanikìc kìsmoc:

• MÐa gl¸ssa anapar�stashc ontologi¸n

• AnuparxÐa epikaluptìmenhc gn¸shc apì tic up�rqousecontologÐec

• Oi up�rqousec ontologÐec den exelÐssontai

• 'Uparxh miac koin c kai pagkìsmiac ontologÐac poukalÔptei ìlec thc gnwstikèc perioqèc

• K�je gnwstik  perioq  montelopoieÐtai apì ènaepanaqrhsimopoioÔmeno komm�ti thc koin c ontologÐac

O pragmatikìc kìsmoc:

• O idanikìc kìsmoc den up�rqei!

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Probl mata pou Qr zoun Antimet¸pishc

Phg  tou probl matoc:

• 'Idioi ìroi qrhsimopoioÔntai gia thn anapar�stashstoiqeÐwn thc ontologÐac (ènnoiec, idiìthtec, sqèseic,stigmiìtupa) me diaforetik  shmasÐa

• DiaforetikoÐ ìroi qrhsimopoioÔntai gia thnanapar�stash stoiqeÐwn thc ontologÐac me koin  shmasÐa

• Diaforetikèc sqèseic metaxÔ twn stoiqeÐwn thc ontologÐac(p.q. diaforetikèc taxonomÐec), montelopoioÔn thn Ðdiaperioq 

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

AntistoÐqish Ontologi¸n I

AntistoÐqish dÔo ontologi¸n eisìdou O1 kai O2 eÐnai h eÔreshgia k�je stoiqeÐo thc O1 to antÐstoiqo stoiqeÐo thc O2 pou èqeith “plhsièsterh” shmasÐa.

• MetaxÔ zeug¸n stoiqeÐwn upologÐzetai mia metrik omoiìthtac.

• H metrik  omoiìthtac eÐnai mia sun�rthsh, me tèssera eÐdhplhjukìthtac (1:1, 1:n, n:1, n:m)

• Hmi-autìmatopoihmènec kai pl rwc automatopoihmènecproseggÐseic

• Sunep c antistoÐqish

EÐdh antistoÐqishc metaxÔ stoiqeÐwn:

• IsodunamÐa (≡)• Pio genikì (w) - Ligìtero Genikì (v)• Epik�luyh (u)

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

AntistoÐqish Ontologi¸n II

• Pìte mia mèjodoc eÐnai Shmasiologik ?

• Den up�rqei koin� apodektìc orismìc

• ProseggÐseic:• Εντοπισμός συνολοθεωρητικών αντιστοιχίσεων (≡, w, v)• Χρήση της δομής των οντολογιών εισόδου - Πώς;• Χρήση εξωγενούς δομημένης πληροφορίας (π.χ. WordNet)• Χρήση τεχνικών αυτόματου συμπερασμού (π.χ. Description

Logics, First Order Logics)

• Koinìc paronomast c: Prosèggish tou no matoc twnstoiqeÐwn thc ontologÐac

• Orismìc sugkekrimènwn eid¸n shmasiologÐac kai kat�pìso qrhsimopoioÔntai apì k�je prosèggish

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Sugq¸neush Ontologi¸n

Sugq¸neush dÔo ontologi¸n eisìdou O1 kai O2 eÐnai hparagwg  mÐa nèac ontologÐac O3, h opoÐa perikleÐei ìlh thnplhroforÐa twn ontologi¸n O1 kai O2.

• An den up�rqoun epikalÔyeic metaxÔ twn O1 kai O2,sugq¸neush eÐnai h ènwsh touc

• Sthn pr�xh kurÐwc mac endiafèroun oi peript¸seic meepikalÔyeic

• H koin  plhroforÐa den prèpei na epanalamb�netai sthnO3

• Qr sh antistoiqÐsewn

• Qr sh endi�meshc ontologÐac

• KurÐwc hmi-autìmatec proseggÐseic

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

DiadikasÐa AntistoÐqishc Ontologi¸n

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

OmalopoÐhsh Ontologi¸n Eisìdou

Eswterik  anapar�stash twn ontologi¸n:

• Koin  gl¸ssa ontologÐac (p.q. OWL, DAML+OIL,RDF(S))

• Η προσέγγιση MAFRA [1] μετατρέπει τις οντολογίες στηνγλώσσα RDF(S))

• Anaparast�seic �llou tÔpou:• Η προσέγγιση Virtual Documents [2] μετατρέπει τιςοντολογίες σε RDF γράφο, τον οποίο ορίζουν οι ίδιοι

• Η προσέγγιση GMO [3] μετατρέπει τις οντολογίες σεδιμερείς κατευθυνόμενους γράφους

• Η προσέγγιση IF-Map [4] μετατρέπει τις οντολογίες σεεκφράσεις Prolog

• Η προσέγγιση OMEN [5] μετατρέπει τις οντολογίες σε έναΠιθανοτικό Δίκτυο (Bayesian Net)

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

DiadikasÐa AntistoÐqishc Ontologi¸n

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Epilog  Qarakthristik¸n

• Epilègontai ta qarakthristik� twn ontologi¸n eisìdoupou ja qrhsimopoihjoÔn

• EÐte giatÐ h prosèggish apl¸c ta agnoeÐ, eÐte giatÐ den tajewreÐ qr sima

• OrÐzontai exwgeneÐc phgèc plhroforÐac (p.q. WordNet,WWW)

• OrÐzetai tuqìn up�rqon sÔnolo apì antistoiqÐec (OMEN[5])

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

DiadikasÐa AntistoÐqishc Ontologi¸n

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Epilog  StoiqeÐwn twn Ontologi¸n

• Epilègontai ta zeÔgh twn stoiqeÐwn twn ontologi¸n gia taopoÐa upologÐzetai h metaxÔ touc omoiìthta

• To b ma autì ephre�zei �mesa thn poluplokìthta toualgorÐjmou

• Sun jwc epilègontai ìla ta zeÔgh

• H prosèggish QOM [6] apoteleÐ exaÐresh

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

DiadikasÐa AntistoÐqhshc Ontologi¸n

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Upologismìc Omoiìthtac I

• UpologÐzetai h omoiìthta metaxÔ twn zeug¸n stoiqeÐwnpou epilèqjhsan sto prohgoÔmeno b ma

• Pollaplèc metrikèc omoiìthtac eÐnai dunatìn naupologistoÔn

• Oi metrikèc axiopoioÔn ta qarakthristik� twn ontologi¸neisìdou pou epilèqjhsan sthn Epilog  Qarakthristik¸n

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Upologismìc Omoiìthtac II

TÔpoi metrik¸n:

• Basismènoi se sÔgkish twn alfarijmhtik¸n pouperigr�foun ta stoiqeÐa twn ontologi¸n

• Επέκταση ακρωνυμίων ή συντομογραφιών καιλημματοποίηση

• Απαλοιφή προκαθορισμένων λέξεων• Χρήση εξωτερικών μαντείων (π.χ. WordNet)• Συμπερίληψη των αλφαριθμητικών που περιγράφουν ταστοιχεία της γειτνίασης

• Basismènoi sthn dom  twn ontologi¸n:• Στην ίδια τη δομή και τις σχέσεις μεταξύ των στοιχείων(π.χ. Αν οι πατέρες δύο εννοιών έχουν ήδη αντιστοιχιθεί)

• Το πεδίο τιμών των ιδιοτήτων

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

DiadikasÐa AntistoÐqishc Ontologi¸n

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Sun�jroish Omoiìthtac - Prosèggish No matoc

• 'Olec oi metrikèc sunajroÐzontai se mÐa

• H sun�jroish mporeÐ na epiteuqjeÐ qrhsimopoi¸ntac thmetrik  me th megalÔterh   mikrìterh tim  (COMA++ [7])

• Me th qr sh bar¸n, mèsou ìrou, sigmoid function (QOM[6])

• Ta b�rh sun jwc kajorÐzontai apì ton qr sth (Cupid [8])

• Teqnikèc mhqanik c m�jhshc èqoun qrhsimopoihjeÐ (APFEL[9])

• Stìqoc eÐnai h prosèggish tou no matoc twn stoiqeÐwn kaioi metrikèc den eÐnai o mìnoc trìpoc

• Teqnikèc An�kthshc PlhroforÐac kai OmadopoÐhshc èqounefarmosteÐ (HCONE-merge [10])

• Teqnikèc Mhqanik c M�jhshc:• Πιθανοτικά Δίκτυα (Bayesian Nets) (OMEN [5], BayesOWL[11])

• Κατηγοριοποιητές Naive Bayes (GLUE [12])

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

DiadikasÐa AntistoÐqishc Ontologi¸n

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Aposaf nish No matoc B�sh Sun�jroishc Omoiìthtac

  Prosèggishc No matoc

• Epitugq�netai me th swst  axiopoÐhsh tou b matocSun�jroish Omoiìthtac - Prosèggish No matoc

• Ephre�zetai apì th plhjukìthta twn antistoiq sewn

• Up�rqoun dÐaforec proseggÐseic:• Χρήση κατωφλίου (AnchorPROMPT [13])

• Epilog  tou qr sth, prokajorismèno• MegistopoieÐ to f-measure se pollaplèc qr seic (NOM

[14])

• Επιλογή του χρήστη (iPROMPT [13])• Μέγιστες n τιμές (COMA++ [7])• Μέγιστη τιμή +− δ• Προκαθορισμένο Ποσοστό (NOM [14])• Relaxation Labeling (GLUE [12])

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

DiadikasÐa AntistoÐqishc Ontologi¸n

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

'Elegqoc Sunèpeiac

• Oi paragìmenec antistoiqÐseic eÐnai dunatìn na apaiteÐtaina eÐnai sunep c metaxÔ touc

• Den up�rqei koin� apodektìc orismìc

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

DiadikasÐa AntistoÐqishc Ontologi¸n

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Epanalhptikì B ma

• Se k�je epan�lhyh upologÐzontai xan� ìlec oiantistoiqÐseic   mèroc aut¸n (NOM [14], HCONE-merge[10])

• Oi antistoiqÐseic thc prohgoÔmenhc epan�lhyhcqrhsimopoioÔntai sthn trèqousa

• SthrÐzetai sth diaÐsjhsh ìti antistoiqÐseic k�poiwngeitonik¸n stoiqeÐwn, ephre�zoun thn omoiìthta twnupoloÐpwn

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Sumper�smata - KateujÔnseic

• Automatopoihmènec mèjodoi eÐnai aparaÐthtec

• Oi up�rqousec proseggÐseic mporoÔn na montelopoihjoÔnk�tw apì mia eniaÐa diadikasÐa

• Belti¸seic mporoÔn na gÐnoun se ìla ta b mata thcGenik c DiadikasÐac AntistoÐqishc

• Automatopoihmènoc sunduasmìc twn metrik¸n omoiìthtacb�sh twn qarakthristik¸n twn ontologi¸n eisìdou

• AnagkaÐa eÐnai h meÐwsh thc qronik c poluplokìthtac twnalgorÐjmwn antistoÐqishc

• Den up�rqei koin� apodektìc orismìc gia to pìte miamèjodoc eÐnai Shmasiologik 

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Stìqoc I

• UlopoÐhsh nèac mejìdou pou suneisfèrei sto b maProsèggish No matoc, thc Genik c DiadiadikasÐac

• Χρήση τεχνικών Ομαδοποίησης και Ανάκτησης Πληροφορίας• Μετασχηματισμός των οντολογιών εισόδου σε virtual

documents - terms πίνακα• Ενα v-doc αναπαριστά ένα στοιχείο της οντολογίας (π.χ.μια έννοια)

• Πιθανοτικά Θεματικά Μοντέλα (Probabilistic Topic Models)για τον εντοπισμό θεματικών ενοτήτων (topics)

• Η ομοιότητα υπολογίζεται βάση της συνεισφοράς των topicsστα v-dovs (π.χ. Kullback Divergence)

• Πρόβλημα η έλλειψη όρων (κοινών και μη)• Qr sh exwgen¸n phg¸n plhroforÐac (p.q. WordNet,

WWW)• Qr sh ìrwn apì th geitnÐash tou stoiqeÐou

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Stìqoi II & III

• Entopismìc sqèsewn upagwg c metaxÔ stoiqeÐwn twnontologi¸n eisìdou

• Χρηση των διανυσμάτων χαρακτηριστικών που έχουνεξαχθεί από τα Πιθανοτικά Θεματικά Μοντέλα

• Χρήση τεχνικών Επιβλεπόμενης Μηχανικής Μάθησης• Θετικά παραδείγματα οι ίδιες οι οντολογίες εισόδου

• MeÐwsh thc poluplokìthtac tou algorÐjmou antistoÐqishc• Με το να μην εξετάζονται για ομοιότητα, τα ζεύγηστοιχείων που θα οδηγήσουν σε μη συνεπή αντιστοίχιση

• Βήμα Επιλογή Στοιχείων της Γενικής Διαδικασίας

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Stìqoc IV

• Block Mapping• Πληθυκότητα αντιστοίχισης n:m• Τα Πιθανοτικά Θεματικά Μοντέλα ορίζουν ένα καινούργιον-χώρο, όπου ν τα topics

• Τα v-docs τοποθετούνται στον v-χώρο• ΄Εκτος από 1:1 και 1:n αντιστοιχίσεις, εντοπισμός n:m• Κριτήριο η απόσταση των v-docs στον ν-χώρο και χρήσηπ.χ. k-means αλγόριθμου

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

Peir�mata

• Qr sh twn ontologi¸n apì ton diejn  diagwnismì OntologyAlignment Evaluation Initiative (OAEI) 2006

• Ευρύ φάσμα ζευγών οντολογιών, όπου κάθε ένα εστιάζει σεδιαφορετικά χαρακτηριστικά τους

• Στόχος είναι να εντοπιστούν τα δυνατά σημεία, αλλά και οιαδυναμίες των αλγορίθμων

• Κοινά αποδεκτό golden standard

• Sthn paroÔsa f�sh èqei gÐnei h metatrop  twn ontologi¸neisìdou se virtual documents - terms pÐnaka

• Χρήση των Πιθανοτικών Θεματικών Μοντέλων pLSA καιLDA

• Χρήση όρων από σχόλια, ονόματα, ιδιότητες στοιχείων καιτης γειτνίασης τους

• Χρήση του WordNet για επιπλέον όρους

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

AporÐec Sqìlia??

AntistoÐqish Ontologi¸n

BasÐlhc Sphliìpouloc 1,2

[email protected]

1Tm ma Mhqanik¸n Plhroforiak¸n kai Epikoinwniak¸n Susthm�twn,

Ergast rio Teqnht c NohmosÔnhc, Panepist mio AigaÐou2InstitoÔto Thlepikoinwni¸n kai Plhroforik c, Ergast rio TeqnologÐac

Gn¸sewn kai LogismikoÔ, E.K.E.F.E. Dhmìkritoc

6 DekembrÐou 2006

Euqarist¸!

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

N. Silva, B. Motik, R. Volz: MAFRA - A Mapping Frameworkfor Distributed Ontologies. In Proceedings of EKAW, 2002.

Y. Qu, W. Hu, G. Cheng: Constructing Virtual Documents forOntology Matching. In Proceedings of WWW, 2006.

V. D. Blondel, A. Gajardo, M. Heymans, P.Senellart, P. VanDooren. A Measure of Similarity between Graph Vertices:Applications to Synonym Extraction and Web Searching.SIAM Review, 46(4) (2004) 647-666.

Y. Kalfoglou, M. Schorlemmer: IF-Map: an ontology mappingmethod based on Information Flow theory Journal on dataSemantics, 2003.

P. Mitra, N. Noy, A. R. Jaiswal: Ontology Mapping Discoverywith Uncertainty. In Proceedings of ISWC, 2005.

M. Ehrig, S. Staab: QOM - Quick Ontology Mapping InProceedings of ISWC, 2004.

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

D. Aumuller, H. H. Do, S. Massmann, and E. Rahm. Schemaand ontology matching with COMA++. In Proceedings of theInternational Conference on Management of Data (SIGMOD),Software Demonstration, 2005.

J. Madhavan, P. Bernstein, E. Rahm: Generic SchemaMatching with Cupid. In Proceedings of VLDB, 2001.

M. Ehrig, S. Staab, Y. Sure: Bootstrapping OntologyAlignment Methods with APFEL. In Proceedings of ISWC,2005.

K. Kotis, G. A. Vouros, K. Stergiou: Towards AutomaticMerging of Domain Ontologies: The HCONE-merge approachJournal of Web Semantics, (2006).

Pan R, Ding Z, Yu Y, Peng Y (2005). A Bayesian NetworkApproach to Ontology Mapping. In Proceedings of ISWC2005. Galway, Ireland.

Eisagwg  AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa

A. Doan, J. Madhavan, P. Domingos, A. Halevy: Learning tomap ontologies on the semantic web. Proceedings of WWW,2002

N. Noy and M. Musen: The PROMPT Suite: Interactive toolsfor ontology merging and mapping. International Journal ofHuman-Computer Studies, 2003.

M. Ehrig, Y. Sure: Ontology Mapping: An IntegratedApproach In Proceedings of ESWS, 2004.

S. Melnik, H. Garcia-Molina, E. Rahm: Similarity Flooding: AVersatile Graph Matching Algorithm. In Proceedings of ICDE,2002.