26
31 Janvier 2006 Youssef ROUMMIEH 1 XML Data Integration in OGSA Grids XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia DEIS, University of Calabria, Italy Présenté par : ROUMMIEH Youssef Master 2 Recherche : Système d’information Grille de donnée Le 31 janvier 2006

XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

  • Upload
    daryl

  • View
    51

  • Download
    0

Embed Size (px)

DESCRIPTION

XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia DEIS, University of Calabria, Italy Présenté par : ROUMMIEH Youssef Master 2 Recherche : Système d’information Grille de donnée. Le 31 janvier 2006. BD1. BD2. BDn. Intégration de donnée : But. Utilisateur. - PowerPoint PPT Presentation

Citation preview

Page 1: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

1

XML Data Integration in OGSA Grids

XML Data Integration in OGSA Grids

Carmela Comito & Domenico TaliaDEIS, University of Calabria, Italy

Présenté par :

ROUMMIEH Youssef

Master 2 Recherche : Système d’informationGrille de donnée

Le 31 janvier 2006

Page 2: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

2

XML Data Integration in OGSA Grids

Intégration de donnée : But

BD1 BD2 BDn

Système intégration de donnéeVue uniforme de donnée

(Virtuel)

Utilisateur

Page 3: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

3

XML Data Integration in OGSA Grids

Problématique d’intégration

BD à intégrer auront été développées indépendamment hétérogènesHétérogénéité des modèles de données (OO,

Relationnel, etc.)Hétérogénéité des schémas

◊ Conflits de type (date)◊ Conflits de description (adresse)◊ Conflits structurels (personne)

Hétérogénéité sémantique◊ Conflits de nommage (nom du même concept est différent)◊ Conflits de nommage de valeurs (valeur d’un concept est

différent)

Page 4: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

4

XML Data Integration in OGSA Grids

Plan Introduction

Intégration de données sur les grilles Les approches existantes pour intégrer les données Problématique de ces approches

Structure décentralisée d’intégration de donnée XML Modèle intégration Algorithme reformulation pour les requêtes XPath

Système d’intégration de donnée de Grille (GDIS) Évaluation Conclusion

Page 5: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

5

XML Data Integration in OGSA Grids

Introduction Intégration de donnée sur les grilles

Larges volumes de données, hétérogènes, distribués, et dynamiques

Bénéficier de l’infrastructure de grille basé sur OGSA Deux approches principales

Fédération◊ Les schémas sont fusionnés en schéma fédéré ◊ Allocation de ressource est statique ne peut pas profiter

d’évolutions des circonsatnces Mediator/wrapper

◊ Vue globale multi-sources/vue mono-source◊ Coordination de médiateurs a fait centralement SDs ne peuvent

pas changer souvent

Page 6: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

6

XML Data Integration in OGSA Grids

Introduction Approches centralisées ne bénéficient de la nature

dynamique et distribuée de ressources de la grille SI décentralisé qui conserve la sémantique

OGSA prévoit un ensemble d’outils permettant de gérer l’accès aux donnés

Intégration de schéma en établissant les connections sémantiques GDMS : wrapper/mediator basé sur un schéma global Hyper : donnée relationnelle dans les systèmes P2P

Approche proposée : Structure pour intégrer les sources de données XML hétérogènes distribués sur le grille

Page 7: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

7

XML Data Integration in OGSA Grids

Modèle d’Intégration

Grille environnement dynamique et distribuéArchitecture centralisé n’est pas convenableApproche proposée :

◊ Intégrer les SS d’une manière décentralisée◊ Basé sur le schéma mappings => correspondances

entre les schémas sources◊ collection de schémas locaux◊ Connections sémantique entre les nœuds reliés

A6

A0

A2

A1

A3

A4

A5

Page 8: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

8

XML Data Integration in OGSA Grids

Modèle d’Intégration

Chaque schéma source est relié directement au petit nombre d’autres schémas. accessible de tous les autres schémas qui appartiennent

à sa « fermeture transitive »

Graphe de sources reliés sémantiquement Aucune distinction entre sources de données et

médiateur

A B CMappings point-to-point

Mappings transitives

Mappings point-to-point

Page 9: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

9

XML Data Integration in OGSA Grids

Modèle d’Intégration Hétérogénéités structurales association de paths

dans les différentes schémas

Basé sur les mappings path-to-path exprimé dans la langage de query XPath.

Schéma source(XML)

- E1 (A1)

Schéma dest(XML)

- E2 (A2)

MappingsPath E1~Path E2

MappingsPath E2~Path E1

Page 10: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

10

XML Data Integration in OGSA Grids

Modèle d’Intégration .

‘n’ = label, ‘.’= nœud courant, ‘/’=child axis, ‘//’=descendant axis, ‘[]’ = prédicat

Schéma de mappings sur S= ensemble de règles de mappings sur S

. RM = label de la règle

SS = schéma source PS = expression path dans le schéma source SD = schéma destination PD = expression path dans le schéma destination CM = cardinalité de mappings : 1-1, 1-N, N-1, N-N

Règles mappings documents XMAP associé au SS

][///. qqqqqqnq

DDCSSM PSPSR M ,,:

Page 11: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

11

XML Data Integration in OGSA Grids

Schémas XML pour XMAP

Page 12: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

12

XML Data Integration in OGSA Grids

Algorithme pour reformuler la requête Xpath Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*

1. identifier les expressions path dans Q

Q=/Artist[style=″Cubism″]/artefact/title

P1=/Artist/style

P2=/Artist/artefact/title

P

1

/Artist[style=″Cubism″] /artefact/title/Artist id

Nameartefact

category

ArtistS1

codefirst-namelast-namekind

painter

InfoS2

Painting

Sculptor

XMAP

artefact

Title

title

Style

style

School

Page 13: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

13

XML Data Integration in OGSA Grids

Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*

1. identifier les expressions path dans Q2. Chercher les paths candidats dans le

schéma relié à SChercher les paths correspondants dans toutes

les sources sémantiquement relié à S.

Page 14: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

14

XML Data Integration in OGSA Grids

Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*

2. Chercher les paths candidats dans le schéma relié à SQ=/Artist[style=″Cubism″]/artefact/title

P1=/Artist/style

P2=/Artist/artefact/title

P

1

/Artist[style=″Cubism″] /artefact/title/Artist

P◊1,2=/Info/kind/Painter/School,

/Info/kind/Sculptor/Style

P◊2,2=/Info/Kind/Painter/Painting/Title,

/Info/kind/Sculptor/artefact

Candidate setS◊

2

2

id

Nameartefact

category

ArtistS1

codefirst-namelast-namekind

painter

InfoS2

Painting

Sculptor

XMAP

artefact

Title

title

Style

style

School

Page 15: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

15

XML Data Integration in OGSA Grids

Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*

1. identifier les expressions path dans Q2. Chercher les paths candidats dans le

schéma relié à S3.Pruning de schémas candidate

au moins un path candidate pour chaque path dans Q

aucune de ces paths candidates n’a été déjà utilisée

Page 16: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

16

XML Data Integration in OGSA Grids

Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*

3.Pruning de schémas candidate

idstyleNameartefact

titlecategory

ArtistS1

codefirst-namelast-namekind

painter

Title

InfoS2

PaintingSchool

SculptorartefactStyle

XMAP

Q=/Artist[style=″Cubism″]/artefact/title

P1=/Artist/style

P2=/Artist/artefact/title

P

1

/Artist[style=″Cubism″] /artefact/title/Artist

P◊1,2=/Info/kind/Painter/School,

/Info/kind/Sculptor/StyleP◊

2,2=/Info/Kind/Painter/Painting/Title,/Info/kind/Sculptor/artefact

Candidate setS◊

22

P*1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style

P*2,2=/Info/Kind/Painter/Painting/Title,/Info/kind/Sculptor/artefact

destination setS*2

3

Page 17: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

17

XML Data Integration in OGSA Grids

Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*

1. identifier les expressions path dans Q 2. Chercher les paths candidats dans le schéma

relié à S 3.Pruning de schémas candidate 4. Construction des requêtes reformulées

Estimer les contraintes de cardinalités◊ 1-1 ou N-1 simple requête sur le schéma de destination◊ 1-N plus d’une requête sur le schéma de destination

Vérifier les conditions de jointureComposition les requêtes XPath

Page 18: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

18

XML Data Integration in OGSA Grids

Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*

4. Construction de la requête reformulées

idstyleNameartefact

titlecategory

ArtistS1

codefirst-namelast-namekind

painter

Title

InfoS2

PaintingSchool

SculptorartefactStyle

XMAP

Q=/Artist[style=″Cubism″]/artefact/title

P1=/Artist/style

P2=/Artist/artefact/title

P

1

/Artist[style=″Cubism″] /artefact/title/Artist

P◊1,2=/Info/kind/Painter/School,

/Info/kind/Sculptor/StyleP◊

2,2=/Info/Kind/Painter/Painting/Title,/Info/kind/Sculptor/artefact

Candidate setS◊

2

2

P*1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style

P*2,2=/Info/Kind/Painter/Painting/Title,/Info/kind/Sculptor/artefact

destination setS*2

3

QR1=/Info/kind/Painter[School=″Cubism″]/Painting/TitleQR2=/Info/kind/Sculptor[style=″Cubism″]/artefact

4

Page 19: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

19

XML Data Integration in OGSA Grids

Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*

1. identifier les expressions path dans Q 2. Chercher les paths candidats dans le schéma

relié à S 3.Pruning de schémas candidate 4. Construction de la requête reformulées 5. Invocation récursive de l’algorithme

Sur les requêtes reformulées pour produire les requêtes qui correspondent à chaque mappings transitives.

Page 20: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

20

XML Data Integration in OGSA Grids

Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*

5. Invocation récursive de l’algorithme

idstyleNameartefact

titlecategory

ArtistS1

codefirst-namelast-namekind

painter

Title

InfoS2

PaintingSchool

SculptorartefactStyle

XMAP

Q=/Artist[style=″Cubism″]/artefact/title

P1=/Artist/style

P2=/Artist/artefact/title

P

1

/Artist[style=″Cubism″] /artefact/title/Artist

P◊1,2=/Info/kind/Painter/School,

/Info/kind/Sculptor/StyleP◊

2,2=/Info/Kind/Painter/Painting/Title,/Info/kind/Sculptor/artefact

Candidate setS◊

2

2

P*1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style

P*2,2=/Info/Kind/Painter/Painting/Title,/Info/kind/Sculptor/artefact

destination setS*2

3

QR1=/Info/kind/Painter[School=″Cubism″]/Painting/TitleQR2=/Info/kind/Sculptor[style=″Cubism″]/artefact

4

Page 21: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

21

XML Data Integration in OGSA Grids

Grid Data Integration System (GDIS)

Architecture d’intégration de donnée décentralisée basé sur le service

Réconciliation de sources de données hétérogènes Approche basé sur wrapper/mediator

Médiateur décentralisé XMAP sémantiqueWrapper syntactique

Basé sur OGSA en étendant OGSA-DAI et OGSA-DQPSpécifier les mappings sémantiquesExécuter l’algorithme de reformulation de la requête XMAP

Page 22: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

22

XML Data Integration in OGSA Grids

Architecture GDIS

Page 23: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

23

XML Data Integration in OGSA Grids

Évaluation Article bien structuré, parfois il présente des ambiguïtés L’exemple donné pour illustrer l’algorithme n’est pas détaillé Points fortes :

L’utilisateur peut retrouver les données en soumettant une simple requête XPath Ajouter une source dans le système établir des connections avec un petite

nombre de schémas Pruning dans la 3ème étape de l’algorithme permet d’éliminer une partie des

schémas candidates sans les tester Les prototypes du logiciel de l'algorithme XMAP et le système GDIS sont

développés actuellement Points faibles :

Changement dans un source changement dans tous les mappings reliés à ce source

Le modèle d’intégration proposée ne résoudre que les hétérogénéités structurales sur les BD XML

Les BDRs sont supportées dans la version courant de OGSA-DQP

Page 24: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

24

XML Data Integration in OGSA Grids

Évaluation

/S1/Artist[style=« Cubism »]/name ~ Select name from Artist where style =« Cubism »

Page 25: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

25

XML Data Integration in OGSA Grids

Conclusion

Intégration de la donnée dans le grilleConcevoir une structure pour intégrer des

donnée sources XML hétérogènesUn algorithme du reformulation de la

requête est proposé le formalisme d’intégration XML est

exposé comme un Service de la Grille dans l'architecture GDIS.

Page 26: XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

31 Janvier 2006 Youssef ROUMMIEH

26

XML Data Integration in OGSA Grids