23
A q (Algorithme de l’étoile) Jérôme AZÉ LRI – équipe IA

A q (Algorithme de l’étoile)

Embed Size (px)

DESCRIPTION

A q (Algorithme de l’étoile). Jérôme AZÉ LRI – équipe IA. Plan. Présentation de A q Algorithme Un exemple Défauts de la méthode Solution apportée Application à la génomique. A q (Algorithme de l’étoile). Proposé par R. Michalski (1969) Problème : un ensemble d’attributs - PowerPoint PPT Presentation

Citation preview

Page 1: A q  (Algorithme de l’étoile)

Aq (Algorithme de l’étoile)

Jérôme AZÉLRI – équipe IA

Page 2: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 2

Plan

Présentation de Aq

Algorithme Un exemple Défauts de la méthode Solution apportée Application à la génomique

Page 3: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 3

Aq (Algorithme de l’étoile)

Proposé par R. Michalski (1969) Problème :

un ensemble d’attributs 2 classes (POS, NEG)

Objectif : Apprendre une description correcte et complète de

la classe POS

Page 4: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 4

Ensemble d’apprentissage

Exemples Att1 Att2 Att3 Classe

E1 Y N R +E2 X M R +E3 Y N S +PO

S

E4 X N R +F1 X M S -F2 Y M T -F3 Y N T -F4 Z N T -F5 Z N R -

NEG

F6 X N S -

Page 5: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 5

Algorithme

Diviser les exemples en deux sous ensembles (POS, NEG)

Choisir un exemple dans POS (le noyau) Trouver un ensemble de règles générales

caractérisant le noyau (l’étoile) Choisir la meilleure règle dans l’étoile Itérer s’il reste des exemples non couverts

dans POS

Page 6: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 6

Changement de représentation (1/4)

Exemples Att1 Att2 Att3 Classe

E1 Y N R + E2 X M R + E3 Y N S + PO

S

E4 X N R +

F1 X M S - F2 Y M T - F3 Y N T - F4 Z N T - F5 Z N R -

NEG

F6 X N S -

NM

X Y

R

S

T

Z

F3

E3

E1E4

F4

F5

F6

Page 7: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 7

Changement de représentation (2/4)

Exemples Att1 Att2 Att3 Classe

E1 Y N R + E2 X M R + E3 Y N S + PO

S

E4 X N R +

F1 X M S - F2 Y M T - F3 Y N T - F4 Z N T - F5 Z N R -

NEG

F6 X N S -

MN

X Y

R

ST

ZE2

F2F1

NM

X Y

R

S

T

Z

F3

E3

E1E4

F4

F5

F6

Page 8: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 8

Changement de représentation (3/4)

Att1

E2 E4 F1 F6 X

E1 E3 F2 F3 Y

F5 F4 Z

M N M N M N Att2 R S T Att3

Exemples Att1 Att2 Att3 Classe

E1 Y N R + E2 X M R + E3 Y N S + PO

S

E4 X N R +

F1 X M S - F2 Y M T - F3 Y N T - F4 Z N T - F5 Z N R -

NEG

F6 X N S -

Page 9: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 9

Changement de représentation (4/4)

Att1

E2 E4 F1 F6 X

E1 E3 F2 F3 Y

F5 F4 Z

M N M N M N Att2 R S T Att3

Exemples Att1 Att2 Att3 Classe

E1 Y N R + E2 X M R + E3 Y N S + PO

S

E4 X N R +

F1 X M S - F2 Y M T - F3 Y N T - F4 Z N T - F5 Z N R -

NEG

F6 X N S -

Att1

+ + - - X

+ + - - Y

- - Z

M N M N M N Att2 R S T Att3

Page 10: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 10

Apprentissage (1/4)

Choix du noyau : E1

Génération de l ’étoile de E1 tel que F1 ne soit pas couvert

Exemples Att1 Att2 Att3 Classe

E1 Y N R +E2 X M R +E3 Y N S +PO

SE4 X N R +F1 X M S -F2 Y M T -F3 Y N T -F4 Z N T -F5 Z N R -

NEG

F6 X N S -

Page 11: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 11

Apprentissage (2/4)

E1 :• (Att1 = Y)• (Att2 = N)• (Att3 = R)

Négation de F1 :• (Att1 = Y v Z)• (Att2 = N)• (Att3 = R v T)

Att1

+ + - - X

+ + - - Y

- - Z

M N M N M N Att2R S T Att3

F1E1

Page 12: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 12

Apprentissage (3/4)

Prise en considération de F2• Att3 = R• (Att3 = (R v S)) & (Att1 = (Y v Z))• Att2 = N

Att1

+ + - - X

+ + - - Y

- - Z

M N M N M N Att2R S T Att3

F2

Page 13: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 13

Apprentissage (4/4)

Prise en considération de F3 (ou F4)• (Att3 = R) & (Att1 = X v Y)• (Att3 = (R v S)) & (Att1 = (Y v Z))

Att1

+ + - - X

+ + - - Y

- - Z

M N M N M N Att2R S T Att3

F3

F4

Page 14: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 14

Étoile de E1

La spécialisation des règles conduit à : R1’ : (att1 = X v Y) & (att3 = R)

R2’ : (att1 = Y) & (att3 = R v S)Att1

+ + - - X

+ + - - Y

- - Z

M N M N M N Att2R S T Att3

Page 15: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 15

Critères de sélection des règles dans l’étoile

Maximiser le nombre d ’éléments couverts par la règle retenue

Minimiser le nombre d ’attributs de la règle retenue

Maximiser la capacité à généraliser de la règle retenue

...

Page 16: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 16

Critère et règle retenus

Maximiser le nombre d’exemples couverts

Règle retenue :• R1’ : (att1 = X v Y) & (att3 = R)Att1

+ + - - X

+ + - - Y

- - Z

M N M N M N Att2R S T Att3

E3

Page 17: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 17

Itération de l’algorithme

Exemple non couvert par R1’ : E3 Étoile de E3 :

• R : (att1 = Y) & (att3 = R v S)Att1

+ + - - X

+ + - - Y

- - Z

M N M N M N Att2R S T Att3

Page 18: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 18

Résultat final

Deux règles permettent de caractériser POS par rapport à NEG• R1 : (att1 = X v Y) & (att3 = R)

• R2 : (att1 = Y) & (att3 = R v S)Att1

+ + - - X

+ + - - Y

- - Z

M N M N M N Att2R S T Att3

Page 19: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 19

Défauts de Aq

Sensibilité au bruit dans les classes Sensibilité liée à l’imprécision du

contexte

Solution proposée par R. Michalski (1990)• approche à deux niveaux (two-tiered

approach )

Page 20: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 20

Approche à deux niveaux(1/3)

Idée :• découper la description de la classe POS

en deux parties :Représentation de Base du Concept (RBC)Interprétation Inférentielle du Concept (IIC)

Possibilité d’apprendre des concepts flexibles

Page 21: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 21

Approche à deux niveaux(2/3)

Algorithme• Utiliser Aq pour obtenir l’ensemble initial

de règles• Retenir la règle la plus importante

(nombre maximal d’éléments de POS couverts) : RBC

• Définir la procédure IIC pour reconnaître les éléments de POS non couverts par RBC

Page 22: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 22

Approche à deux niveaux(3/3)

Exemple• BCR : si A1 & A2 & … & An alors POS

• IIC : au moins 3 conditions parmi A1, …, An doivent être vérifiées

BCR

IIC

Page 23: A q  (Algorithme de l’étoile)

DEA I3 - Module Génomique 23

Application à la génomique

Caractériser des gènes (ou des protéines) par classes de fonctions

Caractériser des séquences d’ADN (ou d’ARN) selon certaines propriétés