Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
SkillexExploiter la structure des réseaux lexicaux
extraits de ressources lexicalespour la modélisation en sciences cognitives
Bruno Gaume
Axe CARTEL
12 Octobre 2015
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 1 / 45
Travaux réalisés en collaboration avec Karine Duvignau (DidAPs)
Motivation
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 2 / 45
Artefact Cognitif
QuestionLes dictionnaires peuvent-ils être utilisés pour modéliser une partie du fonctionnementcognitif du lexique ?
Motivation
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 3 / 45
Réponse du conseil scienti�que d'un appel àprojet (2000) :
Plan
1 Structure des réseaux lexicaux
2 Un score d'habilité lexicale: Skillex
3 Perspectives
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 4 / 45
Plan
1 Structure des réseaux lexicaux
2 Un score d'habilité lexicale: Skillex
3 Perspectives
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 4 / 45
⇐=
1 Structure des réseaux lexicaux : Problème
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 5 / 45
Constat : Il existe de nombreux désaccords entre lesmembres d'une même communauté linguistique :
I Beaucoup de paires de mots sont synonymes pour l'individu I1 et pas pourl'individu I2 et vice et versa
1 Structure des réseaux lexicaux : Problème
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 5 / 45
Constat : Il existe de nombreux désaccords entre lesmembres d'une même communauté linguistique :
I Beaucoup de paires de mots sont synonymes pour l'individu I1 et pas pourl'individu I2 et vice et versa
Incompatible avec :
Hypothèse : La synonymie re�ète la structuresémantique du lexique commune aux membres d'unemême communauté linguistique
1 Structure des réseaux lexicaux : Problème
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 5 / 45
Constat : Il existe de nombreux désaccords entre lesmembres d'une même communauté linguistique :
I Beaucoup de paires de mots sont synonymes pour l'individu I1 et pas pourl'individu I2 et vice et versa
Hypothèse : La synonymie re�ète la structuresémantique du lexique commune aux membres d'unemême communauté linguistique
Résoudre cette contradiction apparente
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 6 / 45
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 6 / 45
bavarder : parler, discourir, causercauser : parler, discuter, bavarder, provoquer, exciterdiscourir : parler, palabrer, pérorer, bavarderdiscuter : parler, palabrer, causer, pérorerexciter : causer, provoquerpalabrer : parler, discourir, pérorer, discuterparler : palabrer, discourir, causer, pérorer, discuter, bavarderpérorer : parler, palabrer, discourir, discuterprovoquer : causer, exciter
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 6 / 45
bavarder : parler, discourir, causercauser : parler, discuter, bavarder, provoquer, exciterdiscourir : parler, palabrer, pérorer, bavarderdiscuter : parler, palabrer, causer, pérorerexciter : causer, provoquerpalabrer : parler, discourir, pérorer, discuterparler : palabrer, discourir, causer, pérorer, discuter, bavarderpérorer : parler, palabrer, discourir, discuterprovoquer : causer, exciter
G = (V,E) où E ⊆ PV2
V ={bavarder, causer, discourir, discuter, exciter, palabrer, parler, pérorer, provoquer
}E =
{{bavarder, parler}, {bavarder, discourir}, {bavarder, causer} {causer, discuter},
{causer, parler}, {causer, provoquer}, {causer, exciter}, {discourir, parler},{discourir, palabrer}, {discourir, pérorer}, {discuter, parler}, {discuter, palabrer},{discuter, pérorer}, {exciter, provoquer}, {palabrer, parler}, {palabrer, pérorer},{parler, pérorer}
}Un graphe de n = |V | sommets et m = |E | arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 6 / 45
G = (V,E) où E ⊆ PV2
V ={bavarder, causer, discourir, discuter, exciter, palabrer, parler, pérorer, provoquer
}E =
{{bavarder, parler}, {bavarder, discourir}, {bavarder, causer} {causer, discuter},
{causer, parler}, {causer, provoquer}, {causer, exciter}, {discourir, parler},{discourir, palabrer}, {discourir, pérorer}, {discuter, parler}, {discuter, palabrer},{discuter, pérorer}, {exciter, provoquer}, {palabrer, parler}, {palabrer, pérorer},{parler, pérorer}
}Un graphe de n = |V | sommets et m = |E | arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 7 / 45
Structures des graphes de terrain
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 8 / 45
Structures des graphes de terrain
I Les graphes Lexicaux
I Les graphes d'accointance d'un groupe d'humains
I Le graphe des appels téléphoniques aux USA
I Le graphe du World Wide Web
I Le graphe des collaborations cinématographiques
I Le graphe de Caenorhabditis elegans
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45
Structures des graphes de terrain
I Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45
Structures des graphes de terrain
I Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45
Structures des graphes de terrain
I Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45
Structures des graphes de terrain
I Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45
Structures des graphes de terrain
I Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45
Structures des graphes de terrain
I Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45
Structures des graphes de terrain
I Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45
Structures des graphes de terrain
I Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45
Structures des graphes de terrain
I Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45
Structures des graphes de terrain
I Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 10 / 45
Structures des graphes de terrain
Réseaux Petits Mondes Hiérarchiques ClusterisésI Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 10 / 45
Structures des graphes de terrain
Réseaux Petits Mondes Hiérarchiques ClusterisésI Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
- Les graphes Lexicaux
- Les graphes d'accointance d'un groupe d'humains
- Le graphe des appels téléphoniques aux USA
- Le graphe du World Wide Web
- Le graphe des collaborations cinématographiques
- Le graphe de Caenorhabditis elegans
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 10 / 45
Structures des graphes de terrain
Réseaux Petits Mondes Hiérarchiques ClusterisésI Faible densité
I Chemins courts
I Distribution des degrés à queue lourde (loi de puissance)
I Fort coe�cient de clustering : zones denses en arêtes
Réseaux lexicaux construits à partir de ressources électroniques
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 11 / 45
Les réseaux Lexicaux extraits des dictionnaires sont des Réseaux PetitsMondes Hiérarchiques Clusterisés
[Gaume, 2004, Steyvers and Tenenbaum, 2005, De Deyne and Storms, 2008,
Morais et al., 2013]
Comparer E1 et E2 comme des �sacs de liens�
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 12 / 45
Comparer E1 et E2 comme des �sacs de liens�
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 12 / 45
G1 = (V1,E1)
G2 = (V2,E2)
Comparer E1 et E2 comme des �sacs de liens�
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 12 / 45
G1 = (V1,E1)
G2 = (V2,E2)
Comparer E1 et E2 comme des �sacs de liens�
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 12 / 45
G1 = (V1,E1)
G2 = (V2,E2)
G ′1 =
(V ′ = (V1 ∩ V2),E ′
1 = E1 ∩ (V ′ × V ′))
Comparer E1 et E2 comme des �sacs de liens�
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 12 / 45
G1 = (V1,E1)
G2 = (V2,E2)
G ′1 =
(V ′ = (V1 ∩ V2),E ′
1 = E1 ∩ (V ′ × V ′))
Comparer E1 et E2 comme des �sacs de liens�
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 12 / 45
G1 = (V1,E1)
G2 = (V2,E2)
G ′1 =
(V ′ = (V1 ∩ V2),E ′
1 = E1 ∩ (V ′ × V ′))
G ′2 =
(V ′ = (V1 ∩ V2),E ′
2 = E2 ∩ (V ′ × V ′))
Comparer E1 et E2 comme des �sacs de liens�
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 13 / 45
G′1
=(V′,E′
1
)
G′2
=(V′,E′
2
)
Comparer E1 et E2 comme des �sacs de liens�
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 13 / 45
G′1
=(V′,E′
1
)
G′2
=(V′,E′
2
)
Comparer E1 et E2 comme des �sacs de liens�
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 13 / 45
G′1
=(V′,E′
1
)
G′2
=(V′,E′
2
)GED(G ′1,G′2) =
|E ′1∩E ′
2|+|E ′2∩E ′
1||E ′
1|+|E ′2| ∈ [0, 1]
Comparer E1 et E2 comme des �sacs de liens�
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 13 / 45
G′1
=(V′,E′
1
)
G′2
=(V′,E′
2
)GED(G ′1,G′2) =
|E ′1∩E ′
2|+|E ′2∩E ′
1||E ′
1|+|E ′2| ∈ [0, 1]
GED(Lar ′,Rob′) = 0.47
Comparer E1 et E2 comme des �sacs de liens�
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 13 / 45
G′1
=(V′,E′
1
)
G′2
=(V′,E′
2
)GED(G ′1,G′2) =
|E ′1∩E ′
2|+|E ′2∩E ′
1||E ′
1|+|E ′2| ∈ [0, 1]
GED(Lar ′,Rob′) = 0.47
Nombreux désaccords entre Larousse et Robert
Hypothèse
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 14 / 45
Hypothèse
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 14 / 45
Nombreux désaccords au niveau des arêtes
Hypothèse
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 14 / 45
Nombreux désaccords au niveau des arêtes
G1 = (V ,E1) G2 = (V ,E2)
Aucune arête commune entre ces deux graphes.
Hypothèse
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 14 / 45
Nombreux désaccords au niveau des arêtes
G1 = (V ,E1) G2 = (V ,E2)
Aucune arête commune entre ces deux graphes.
GED(G1,G2) = 1
Hypothèse
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 14 / 45
Nombreux désaccords au niveau des arêtes
G1 = (V ,E1) G2 = (V ,E2)
Aucune arête commune entre ces deux graphes.
GED(G1,G2) = 1
Mais
Bon accord au niveau des clusters...
Métaphore
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 15 / 45
Métaphore
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 16 / 45
La photo d'un chat
Chaque pixel impair est peint en blanc
Chaque pixel pair est peint en blanc
Métaphore
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 17 / 45
Pair =
Métaphore
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 17 / 45
Pair = Impair =
Métaphore
Aucun pixel communImages distantes (au niveau des pixels)
Cependant ces deux images se ressemblent
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 17 / 45
Pair = Impair =
Métaphore
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 17 / 45
Pair = Impair =
Marches Aléatoires
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 18 / 45
Marches Aléatoires
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 18 / 45
causerallumer
amenerapporter
attirer
avoir pour effet
bavarder
blaguer
cancaner
commérer
confabuler
conférer
converser
créer
deviser
dialoguer
discourir
discuter
disserter
donner
déclencherdéterminer
engendrer
entraîner
exciterfairefaire naître fomenter
former
giberner
inspirer
jaboter
jacasser
jaserjaspiner
jeter
motiver
occasionner
papoterparler
parloterpotiner
procurerproduire
provoquer
s'entretenir
soulever
susciter
valoir
être cause de
être à l'origine de
Réseaux Petits Mondes HiérarchiquesI Faible densité
I Chemins courts
I Distribution des degrés à queue lourde
I Fort coe�cient de clustering : zones denses
Marches Aléatoires
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 18 / 45
causerallumer
amenerapporter
attirer
avoir pour effet
bavarder
blaguer
cancaner
commérer
confabuler
conférer
converser
créer
deviser
dialoguer
discourir
discuter
disserter
donner
déclencherdéterminer
engendrer
entraîner
exciterfairefaire naître fomenter
former
giberner
inspirer
jaboter
jacasser
jaserjaspiner
jeter
motiver
occasionner
papoterparler
parloterpotiner
procurerproduire
provoquer
s'entretenir
soulever
susciter
valoir
être cause de
être à l'origine de
Réseaux Petits Mondes HiérarchiquesI Faible densité
I Chemins courts
I Distribution des degrés à queue lourde
I Fort coe�cient de clustering : zones denses
Marches AléatoiresI Idée: si (u, v) sont dans un même �cluster� , alors beaucoup de
chemins mènent de u à v (même si ils ne sont pas adjacents).
I Un marcheur aléatoire a tendance a être capturé par les �clusters�
Marches Aléatoires
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45
1 État initial (t=0)
2 t = 1
3 t = 2
4 t = 3
Marches Aléatoires
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45
1
1 État initial (t=0)
2 t = 1
3 t = 2
4 t = 3
Marches Aléatoires
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45
0,2 0,2
0,2
0,2
0,2
0,2
1 État initial (t=0)
2 t = 1
3 t = 2
4 t = 3
Marches Aléatoires
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45
0,13 0,16
0,21
0,09
0,12
0,16
0,03
0,03
0,05
1 État initial (t=0)
2 t = 1
3 t = 2
4 t = 3
Marches Aléatoires
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45
0,13 0,16
0,17
0,10
0,12
0,15
0,07
0,06
0,06
1 État initial (t=0)
2 t = 1
3 t = 2
4 t = 3
Marches Aléatoires
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45
0,13 0,16
0,17
0,10
0,12
0,15
0,07
0,06
0,06
1 État initial (t=0)
2 t = 1
3 t = 2
4 t = 3
La Proxémie : P t
G(u, v)
Dans G , probabilité d'être sur v à l'instant t en partant de u
Marches Aléatoires
1) dépouiller* 11) dévoiler 21) arracher 31) tailler 41) dire2) défaire* 12) dégager 22) délacer* 32) développer 42) ouvrir3) démunir* 13) étaler* 23) voler 33) déchirer 43) déployer4) déshabiller* 14) ôter* 24) dénouer 34) déchausser 44) dépiauter5) dévêtir* 15) enlever 25) desserrer 35) vider 45) déposséder6) révéler 16) défrusquer 26) médire* 36) peler 46) frustrer7) découvrir* 17) a�cher 27) débarrasser 37) dépourvoir 47) indiquer8) montrer* 18) désa�ubler 28) exposer 38) défubler 48) démontrer9) dénuder* 19) écorcher* 29) couper 39) priver 49) manifester10) dégarnir* 20) démasquer* 30) exhiber* 40) trahir 50) détacher
Table: Les cinquante verbes qui ont la plus forte probabilité d'être atteints en 4 pasdepuis déshabiller (sur 10000 verbes).
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45
La Proxémie : P t
G(u, v)
Dans G , probabilité d'être sur v à l'instant t en partant de u
Liste ordonnées des verbes selon leur score de proxémie à partir de déshabiller(t = 4)
Marches Aléatoires
1) dépouiller* 11) dévoiler 21) arracher 31) tailler 41) dire2) défaire* 12) dégager 22) délacer* 32) développer 42) ouvrir3) démunir* 13) étaler* 23) voler 33) déchirer 43) déployer4) déshabiller* 14) ôter* 24) dénouer 34) déchausser 44) dépiauter5) dévêtir* 15) enlever 25) desserrer 35) vider 45) déposséder6) révéler 16) défrusquer 26) médire* 36) peler 46) frustrer7) découvrir* 17) a�cher 27) débarrasser 37) dépourvoir 47) indiquer8) montrer* 18) désa�ubler 28) exposer 38) défubler 48) démontrer9) dénuder* 19) écorcher* 29) couper 39) priver 49) manifester10) dégarnir* 20) démasquer* 30) exhiber* 40) trahir 50) détacher
Table: Les cinquante verbes qui ont la plus forte probabilité d'être atteints en 4 pasdepuis déshabiller (sur 10000 verbes).
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45
La Proxémie : P t
G(u, v)
Dans G , probabilité d'être sur v à l'instant t en partant de u
Liste ordonnées des verbes selon leur score de proxémie à partir de déshabiller(t = 4)
Marches Aléatoires
1) dépouiller* 11) dévoiler 21) arracher 31) tailler 41) dire2) défaire* 12) dégager 22) délacer* 32) développer 42) ouvrir3) démunir* 13) étaler* 23) voler 33) déchirer 43) déployer4) déshabiller* 14) ôter* 24) dénouer 34) déchausser 44) dépiauter5) dévêtir* 15) enlever 25) desserrer 35) vider 45) déposséder6) révéler 16) défrusquer 26) médire* 36) peler 46) frustrer7) découvrir* 17) a�cher 27) débarrasser 37) dépourvoir 47) indiquer8) montrer* 18) désa�ubler 28) exposer 38) défubler 48) démontrer9) dénuder* 19) écorcher* 29) couper 39) priver 49) manifester10) dégarnir* 20) démasquer* 30) exhiber* 40) trahir 50) détacher
Table: Les cinquante verbes qui ont la plus forte probabilité d'être atteints en 4 pasdepuis déshabiller (sur 10000 verbes).
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45
La Proxémie : P t
G(u, v)
Dans G , probabilité d'être sur v à l'instant t en partant de u
Liste ordonnées des verbes selon leur score de proxémie à partir de déshabiller(t = 4)
Marches Aléatoires
1) dépouiller* 11) dévoiler 21) arracher 31) tailler 41) dire2) défaire* 12) dégager 22) délacer* 32) développer 42) ouvrir3) démunir* 13) étaler* 23) voler 33) déchirer 43) déployer4) déshabiller* 14) ôter* 24) dénouer 34) déchausser 44) dépiauter5) dévêtir* 15) enlever 25) desserrer 35) vider 45) déposséder6) révéler 16) défrusquer 26) médire* 36) peler 46) frustrer7) découvrir* 17) a�cher 27) débarrasser 37) dépourvoir 47) indiquer8) montrer* 18) désa�ubler 28) exposer 38) défubler 48) démontrer9) dénuder* 19) écorcher* 29) couper 39) priver 49) manifester10) dégarnir* 20) démasquer* 30) exhiber* 40) trahir 50) détacher
Table: Les cinquante verbes qui ont la plus forte probabilité d'être atteints en 4 pasdepuis déshabiller (sur 10000 verbes).
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45
La Proxémie : P t
G(u, v)
Dans G , probabilité d'être sur v à l'instant t en partant de u
Liste ordonnées des verbes selon leur score de proxémie à partir de déshabiller(t = 4)
Con�uence
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 20 / 45
Con�uence
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 20 / 45
I Marches longues: la probabilité d'atteindre un sommet v ne dépend quedu degrés de v :
limt→∞ PtG (u, v) = degG (v)∑
r∈VdegG (r) = πG (v)
Con�uence
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 20 / 45
I Marches longues: la probabilité d'atteindre un sommet v ne dépend quedu degrés de v :
limt→∞ PtG (u, v) = degG (v)∑
r∈VdegG (r) = πG (v)
I Marches courtes: forte probabilité de rester dans un cluster:
• Pt
G (u, v) > πG (v) si u et v sont dans un même cluster• Pt
G (u, v) < πG (v) sinon
Con�uence
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 20 / 45
I Marches longues: la probabilité d'atteindre un sommet v ne dépend quedu degrés de v :
limt→∞ PtG (u, v) = degG (v)∑
r∈VdegG (r) = πG (v)
I Marches courtes: forte probabilité de rester dans un cluster:
• Pt
G (u, v) > πG (v) si u et v sont dans un même cluster• Pt
G (u, v) < πG (v) sinon
0 20 40 60 80 100
t : Longueur des marches10−5
10−4
10−3
10−2
10−1
y
G = Rob : {eplucher,depecer} ∈ ELar
P tG(eplucher, depecer)
P tG(eplucher, sonner)
0 20 40 60 80 100
t : Longueur des marches10−5
10−4
10−3
10−2
y
G = Lar : {eplucher,depecer} /∈ ELar
P tG(eplucher, depecer)
P tG(eplucher, sonner)
Con�uence
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 20 / 45
I Marches longues: la probabilité d'atteindre un sommet v ne dépend quedu degrés de v :
limt→∞ PtG (u, v) = degG (v)∑
r∈VdegG (r) = πG (v)
I Marches courtes: forte probabilité de rester dans un cluster:
• Pt
G (u, v) > πG (v) si u et v sont dans un même cluster• Pt
G (u, v) < πG (v) sinon
t = 5 : CONFG(u, v) =P5
G(u,v)
P5G
(u,v)+πG(v)
CONFG est une mesure de proximité normalisée basée sur les marchesaléatoires courtes dans G :
I Beaucoup de chemins courts entre u et v : CONFG (u, v) > 0, 5;
I Peu de chemins courts entre u et v : CONFG (u, v) < 0, 5;
Con�uence: Expérience contrôlée
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45
Con�uence: Expérience contrôlée
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45
Ga = (V ,Ea)
Con�uence: Expérience contrôlée
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45
Ga = (V ,Ea)
Gb = (V ,Eb) Gc = (V ,Ec)
Con�uence: Expérience contrôlée
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45
Ga = (V ,Ea)
Gb = (V ,Eb) Gc = (V ,Ec)
Eb ∩ Ec = ∅⇒GED(Gb,Gc) = 1
Con�uence: Expérience contrôlée
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45
Ga = (V ,Ea)
Gb = (V ,Eb) Gc = (V ,Ec)
Eb ∩ Ec = ∅⇒GED(Gb,Gc) = 1
GRa = (V ,ER
a )
GR
b= (V ,ER
b) GR
c = (V ,ERc )
ER
b∩ ER
c = ∅⇒GED(GR
b,GR
c ) = 1
Con�uence: Expérience contrôlée
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45
Ga = (V ,Ea)
Gb = (V ,Eb) Gc = (V ,Ec)
Eb ∩ Ec = ∅⇒GED(Gb,Gc) = 1
GRa = (V ,ER
a )
GR
b= (V ,ER
b) GR
c = (V ,ERc )
ER
b∩ ER
c = ∅⇒GED(GR
b,GR
c ) = 1
Con�uence: Expérience contrôlée
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45
Ga = (V ,Ea)
Gb = (V ,Eb) Gc = (V ,Ec)
Eb ∩ Ec = ∅⇒GED(Gb,Gc) = 1
GRa = (V ,ER
a )
GR
b= (V ,ER
b) GR
c = (V ,ERc )
ER
b∩ ER
c = ∅⇒GED(GR
b,GR
c ) = 1
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
200
400
600
800
1000
Freq
uenc
e
Gb/Gc
Con�uence: Expérience contrôlée
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45
Ga = (V ,Ea)
Gb = (V ,Eb) Gc = (V ,Ec)
Eb ∩ Ec = ∅⇒GED(Gb,Gc) = 1
GRa = (V ,ER
a )
GR
b= (V ,ER
b) GR
c = (V ,ERc )
ER
b∩ ER
c = ∅⇒GED(GR
b,GR
c ) = 1
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
200
400
600
800
1000
Freq
uenc
e
Gb/Gc
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
200
400
600
800
1000
Freq
uenc
e
GR
b /GRc
Con�uence: Expérience contrôlée
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 22 / 45
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
200
400
600
800
1000
Freq
uenc
e
Gb/Gc
GED(Gb,Gc) = 1
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
200
400
600
800
1000
Freq
uenc
e
GR
b /GRc
GED(GR
b,GR
c ) = 1
Con�uence: Expérience contrôlée
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 22 / 45
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
200
400
600
800
1000
Freq
uenc
e
Gb/Gc
GED(Gb,Gc) = 1
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
200
400
600
800
1000
Freq
uenc
e
GR
b /GRc
GED(GR
b,GR
c ) = 1
µ(G1,G2) =
1
|E1∩E2|+|E2∩E1|
(∑{u,v}∈(E2∩E1) CONFG1({u, v}) +
∑{u,v}∈(E1∩E2) CONFG2({u, v})
)
Con�uence: Expérience contrôlée
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 22 / 45
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
200
400
600
800
1000
Freq
uenc
e
Gb/Gc
GED(Gb,Gc) = 1
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
200
400
600
800
1000
Freq
uenc
e
GR
b /GRc
GED(GR
b,GR
c ) = 1
µ(G1,G2) =
1
|E1∩E2|+|E2∩E1|
(∑{u,v}∈(E2∩E1) CONFG1({u, v}) +
∑{u,v}∈(E1∩E2) CONFG2({u, v})
)
µ(Gb,Gc) = 0.74 µ(GR
b,GR
c ) = 0.49
Applications sur les Réseaux lexicaux
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 23 / 45
Applications sur les Réseaux lexicaux
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 23 / 45
µ(G1,G2) =
1
|E1∩E2|+|E2∩E1|
(∑{u,v}∈(E2∩E1) CONFG1({u, v}) +
∑{u,v}∈(E1∩E2) CONFG2({u, v})
)Robert / Larousse
Applications sur les Réseaux lexicaux
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 23 / 45
µ(G1,G2) =
1
|E1∩E2|+|E2∩E1|
(∑{u,v}∈(E2∩E1) CONFG1({u, v}) +
∑{u,v}∈(E1∩E2) CONFG2({u, v})
)Robert / Larousse
GED(G ′Rob
,G ′Lar
) = 0.47 GED(G ′RRob
,G ′RLar
) = 0.47
Applications sur les Réseaux lexicaux
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 23 / 45
µ(G1,G2) =
1
|E1∩E2|+|E2∩E1|
(∑{u,v}∈(E2∩E1) CONFG1({u, v}) +
∑{u,v}∈(E1∩E2) CONFG2({u, v})
)Robert / Larousse
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
5000
10000
15000
20000
25000
Freq
uenc
e
GED(G ′Rob
,G ′Lar
) = 0.47
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
5000
10000
15000
20000
25000
Freq
uenc
e
GED(G ′RRob
,G ′RLar
) = 0.47
Applications sur les Réseaux lexicaux
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 23 / 45
µ(G1,G2) =
1
|E1∩E2|+|E2∩E1|
(∑{u,v}∈(E2∩E1) CONFG1({u, v}) +
∑{u,v}∈(E1∩E2) CONFG2({u, v})
)Robert / Larousse
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
5000
10000
15000
20000
25000
Freq
uenc
e
GED(G ′Rob
,G ′Lar
) = 0.47
0.0 0.2 0.4 0.6 0.8 1.0
Valeur0
5000
10000
15000
20000
25000
Freq
uenc
e
GED(G ′RRob
,G ′RLar
) = 0.47
µ(G′Rob
,G′Lar
) = 0.80 µ(G′RRob
,G′RLar
) = 0.24
Applications sur les Réseaux lexicaux
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 24 / 45
Applications sur les Réseaux lexicaux
Table: Pédigrés de quelques graphes lexicaux
Graphes lexicaux n m 〈k〉 C Llcc λ (r2)
Lar
Adjectifs 5510 21147 7,68 0,21 4,92 -2,06 (0,88)Noms 12159 31601 5,20 0,20 6,10 -2,39 (0,88)Verbes 5377 22042 8,20 0,17 4,61 -1,94 (0,88)
Rob
Adjectifs 7693 20011 5,20 0,14 5,26 -2,05 (0,94)Noms 24570 55418 4,51 0,11 6,08 -2,34 (0,94)Verbes 7357 26567 7,22 0,12 4,59 -2,01 (0,93)
Jdm
Adjectifs 9859 30087 6,10 0,16 5,44 -2,24 (0,90)Noms 29213 56381 3,86 0,14 6,48 -2,66 (0,93)Verbes 7658 22260 5,81 0,14 5,06 -2,08 (0,89)
Wik
Adjectifs 6960 6594 1,89 0,15 8,48 -2,46 (0,95)Noms 43206 37661 1,74 0,13 10,56 -2,51 (0,89)Verbes 7203 7497 2,08 0,25 9,22 -2,28 (0,92)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 24 / 45
Applications sur les Réseaux lexicaux
Table: Mesurer la similarité structurelle entre réseaux lexicaux
GED (µ) (µR) sur les paires de graphes
G1/G2 RobA JdmA WikALarA 0, 45 (0, 76) (0, 34) 0, 47 (0, 71) (0, 38) 0, 75 (0, 41) (0, 06)RobA 0, 51 (0, 70) (0, 29) 0, 71 (0, 42) (0, 05)JdmA 0, 54 (0, 43) (0, 03)
G1/G2 RobN JdmN WikNLarN 0, 48 (0, 70) (0, 20) 0, 48 (0, 70) (0, 19) 0, 72 (0, 31) (0, 03)RobN 0, 47 (0, 70) (0, 13) 0, 71 (0, 29) (0, 02)JdmN 0, 46 (0, 32) (0, 01)
G1/G2 RobV JdmV WikVLarV 0, 48 (0, 73) (0, 40) 0, 46 (0, 70) (0, 39) 0, 78 (0, 25) (0, 05)RobV 0, 47 (0, 70) (0, 37) 0, 78 (0, 25) (0, 06)JdmV 0, 55 (0, 31) (0, 04)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 24 / 45
Applications sur les Réseaux lexicaux
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 24 / 45
causer
amener
entraîner
faire
conférer
donner
apporter
produire
exciter
provoquersoulever
déclencheroccasionnersusciter
déterminerengendrer
procurer
motiver
parler
valoir
jaser
bavarder
jacasserpapoter
converser
cancanercommérer
potiner
deviser
dialoguer
discuter
créer
jeters'entretenir
disserter
jaspiner
parloter
causer
donner
engendrer
créerfaire
amener
entraîner
exciterapporter
parler
attirer
discuter
provoquerproduire
susciter
déterminer
occasionner
motiver
former
se procurer
conférer
bavarder
cancaner
jaser
potiner
être cause deconverser
confabulerdevisers'entretenir
faire naître
disserter
causer
procurer
déterminer
donner
jacasser
attirer
entraîner
coûter
occasionner
disserterproduire
papoter
apportercréer
amener
bavarder
susciter
valoir
engendrer
détruireparlers\'entretenir
causer apporter
occasionner
générer
Larousse Robert
Jeux de mots Wiktionary
Bilan
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 25 / 45
Bilan
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 25 / 45
Hypothèse : La synonymie re�ète la structure sémantique dulexique commune aux membres d'une même communautélinguistique
Constat : Il existe de nombreux désaccords entre membres d'unemême communauté linguistique:GED(G1,G2) ≈ 0.50
I Beaucoup de paires de mots sont synonymes pour l'individu I1 et pas pourl'individu I2
I Beaucoup de paires de mots sont synonymes pour l'individu I2 et pas pourl'individu I1
Bilan
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 25 / 45
Hypothèse : La synonymie re�ète la structure sémantique dulexique commune aux membres d'une même communautélinguistique
Incompatible ?
Constat : Il existe de nombreux désaccords entre membres d'unemême communauté linguistique:GED(G1,G2) ≈ 0.50
I Beaucoup de paires de mots sont synonymes pour l'individu I1 et pas pourl'individu I2
I Beaucoup de paires de mots sont synonymes pour l'individu I2 et pas pourl'individu I1
Bilan
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 25 / 45
Hypothèse : La synonymie re�ète la structure sémantique dulexique commune aux membres d'une même communautélinguistique
Incompatible ?
Constat : Il existe de nombreux désaccords entre membres d'unemême communauté linguistique:GED(G1,G2) ≈ 0.50
I Beaucoup de paires de mots sont synonymes pour l'individu I1 et pas pourl'individu I2
I Beaucoup de paires de mots sont synonymes pour l'individu I2 et pas pourl'individu I1
Non
Parceque : Ces désaccords sont des désaccords faibles :µ(G1,G2) ≈ 0.70 (accord au niveau structurel)
Bilan
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 25 / 45
Hypothèse : La synonymie re�ète la structure sémantique dulexique commune aux membres d'une même communautélinguistique
L'analyse d'une relation lexicale doit être faite au niveau dela structure globale dessinée par la relation. C'est ce que lamesure µ peut faire: avec un niveau de représentationadéquat, elle réconcilie les jugements portés par deux jugesdi�érents sur une même relation lexicale.
1 Structure des réseaux lexicaux
2 Un score d'habilité lexicale: Skillex
3 Perspectives
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 26 / 45
⇐=
Le protocole Approx [Duvignau et Gaume, 2004]
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 27 / 45
Le protocole Approx [Duvignau et Gaume, 2004]
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 27 / 45
�Qu'est-ce qu'elle a fait la dame ?�
�Ce qu'elle a fait la dame, dis le moi d'une autre manière, avec d'autresmots�
Le protocole Approx [Duvignau et Gaume, 2004]
Exemple
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 27 / 45
Le protocole Approx [Duvignau et Gaume, 2004]
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 28 / 45
Approx : premiers résultats [Duvignau, 2008]
2-5 ans 18-40 ans% d'approximations 37% 6%% de verbes spéci�ques 40% 84%
Table: Résultats (à la main)
Les productions des enfants typiques :
I Des verbes plus génériques que les adultes typiques.
Hypothèses H1 : Le degrés : la généricité du verbe u est corrélée à deg(u) .
I Des verbes plus approximatifs que les adultes typiques.
Hypothèses H2 : La con�uence: la proximité sémantique entre u et v estcorrélée à CONFG (u, v).
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 29 / 45
Approx : premiers résultats [Duvignau, 2008]
2-5 ans 18-40 ans% d'approximations 37% 6%% de verbes spéci�ques 40% 84%
Table: Résultats (à la main)
Les productions des enfants typiques :
I Des verbes plus génériques que les adultes typiques.
Hypothèses H1 : Le degrés : la généricité du verbe u est corrélée à deg(u) .
I Des verbes plus approximatifs que les adultes typiques.
Hypothèses H2 : La con�uence: la proximité sémantique entre u et v estcorrélée à CONFG (u, v).
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 29 / 45
Approx : premiers résultats [Duvignau, 2008]
2-5 ans 18-40 ans% d'approximations 37% 6%% de verbes spéci�ques 40% 84%
Table: Résultats (à la main)
Les productions des enfants typiques :
I Des verbes plus génériques que les adultes typiques.
Hypothèses H1 : Le degrés : la généricité du verbe u est corrélée à deg(u) .
I Des verbes plus approximatifs que les adultes typiques.
Hypothèses H2 : La con�uence: la proximité sémantique entre u et v estcorrélée à CONFG (u, v).
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 29 / 45
Approx : premiers résultats [Duvignau, 2008]
2-5 ans 18-40 ans% d'approximations 37% 6%% de verbes spéci�ques 40% 84%
Table: Résultats (à la main)
Les productions des enfants typiques :
I Des verbes plus génériques que les adultes typiques.
Hypothèses H1 : Le degrés : la généricité du verbe u est corrélée à deg(u) .
I Des verbes plus approximatifs que les adultes typiques.
Hypothèses H2 : La con�uence: la proximité sémantique entre u et v estcorrélée à CONFG (u, v).
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 29 / 45
Approx : premiers résultats [Duvignau, 2008]
2-5 ans 18-40 ans% d'approximations 37% 6%% de verbes spéci�ques 40% 84%
Table: Résultats (à la main)
Les productions des enfants typiques :
I Des verbes plus génériques que les adultes typiques.
Hypothèses H1 : Le degrés : la généricité du verbe u est corrélée à deg(u) .
I Des verbes plus approximatifs que les adultes typiques.
Hypothèses H2 : La con�uence: la proximité sémantique entre u et v estcorrélée à CONFG (u, v).
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 29 / 45
Zone lexico-semantique d'une action
A chaque �lm Fi est associé une zone lexico-sémantique dans le graphe desynonymie (départ de la balade aléatoire) ∆(Fi ):
I(∆(Fi )
)vla probabilité que le verbe v soit utilisé par un échantillon de
population pour décrire l'action du �lm Fi
Français Mandarin24-59 mois 74 2918-40 ans 76 60
Table: Populations étudiées (Duvignau & Cheung)
I échantillon de population = 25 adultes et 25 enfants (aucun avantage à unequelconque population =⇒ pas de biais méthodologique)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 30 / 45
Zone lexico-semantique d'une action
A chaque �lm Fi est associé une zone lexico-sémantique dans le graphe desynonymie (départ de la balade aléatoire) ∆(Fi ):
I(∆(Fi )
)vla probabilité que le verbe v soit utilisé par un échantillon de
population pour décrire l'action du �lm Fi
Français Mandarin24-59 mois 74 2918-40 ans 76 60
Table: Populations étudiées (Duvignau & Cheung)
I échantillon de population = 25 adultes et 25 enfants (aucun avantage à unequelconque population =⇒ pas de biais méthodologique)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 30 / 45
Zone lexico-semantique d'une action
A chaque �lm Fi est associé une zone lexico-sémantique dans le graphe desynonymie (départ de la balade aléatoire) ∆(Fi ):
I(∆(Fi )
)vla probabilité que le verbe v soit utilisé par un échantillon de
population pour décrire l'action du �lm Fi
Français Mandarin24-59 mois 74 2918-40 ans 76 60
Table: Populations étudiées (Duvignau & Cheung)
I échantillon de population = 25 adultes et 25 enfants (aucun avantage à unequelconque population =⇒ pas de biais méthodologique)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 30 / 45
Scores de Degrés et de Con�uence
Deux mesures sont associées à chaque participant p qui produit le verbe v pourdécrire l'action du �lm Fi de zone lexico-semantique ∆(Fi ):
I Un score de Degrés : degG (v)
I Un score de Con�uence : CONFG (∆(Fi ), v)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 31 / 45
Scores de Degrés et de Con�uence
Deux mesures sont associées à chaque participant p qui produit le verbe v pourdécrire l'action du �lm Fi de zone lexico-semantique ∆(Fi ):
I Un score de Degrés : degG (v)
I Un score de Con�uence : CONFG (∆(Fi ), v)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 31 / 45
Scores de Degrés et de Con�uence
Deux mesures sont associées à chaque participant p qui produit le verbe v pourdécrire l'action du �lm Fi de zone lexico-semantique ∆(Fi ):
I Un score de Degrés : degG (v)
I Un score de Con�uence : CONFG (∆(Fi ), v)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 31 / 45
Scores de Degrés et de Con�uence
Deux mesures sont associées à chaque participant p qui produit le verbe v pourdécrire l'action du �lm Fi de zone lexico-semantique ∆(Fi ):
I Un score de Degrés : degG (v)
I Un score de Con�uence : CONFG (∆(Fi ), v)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 31 / 45
Populations
Français Mandarin24-59 mois 74 2918-40 ans 76 60
Table: Populations étudiées (Duvignau & Cheung)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 32 / 45
Hypotèse H1 (Moyenne des degrés)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 33 / 45
Hypotèse H1 (Moyenne des degrés)
●
●
●
Children Adults
4080
120
FRENCH (DEGREE)●
●
Children Adults1020
3040
MANDARIN (DEGREE)
Figure: Scores de degrés pour le Français et pour le Mandarin
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 33 / 45
Hypotèse H1 (Moyenne des degrés)
●
●
●
Children Adults
4080
120
FRENCH (DEGREE)●
●
Children Adults1020
3040
MANDARIN (DEGREE)
Figure: Scores de degrés pour le Français et pour le Mandarin
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 33 / 45
Man-Whitney-Wilcoxon testW (150) = 5389; p < 0.001
Hypotèse H1 (Moyenne des degrés)
●
●
●
Children Adults
4080
120
FRENCH (DEGREE)●
●
Children Adults1020
3040
MANDARIN (DEGREE)
Figure: Scores de degrés pour le Français et pour le Mandarin
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 33 / 45
Man-Whitney-Wilcoxon testW (150) = 5389; p < 0.001
Man-Whitney-Wilcoxon testW (89) = 1243; p < .001
Hypotèse H1 (Moyenne des degrés)
●
●
●
●
●
●
Children Adults
0.01
00.
020
FRENCH (RECIPROCAL DEGREE)
Children Adults0.02
0.04
0.06
0.08
MANDARIN (RECIPROCAL DEGREE)
Figure: (Inverse des scores de degrés pour le Français et pour le Mandarin
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 33 / 45
Hypothèse H2 (Moyenne des Con�uences)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 34 / 45
Hypothèse H2 (Moyenne des Con�uences)
Figure: Scores de Con�uence pour le Français et pour le Mandarin
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 34 / 45
Hypothèse H2 (Moyenne des Con�uences)
Figure: Scores de Con�uence pour le Français et pour le Mandarin
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 34 / 45
Fisher testF (150) = 13.58; p < .001
Hypothèse H2 (Moyenne des Con�uences)
Figure: Scores de Con�uence pour le Français et pour le Mandarin
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 34 / 45
Fisher testF (150) = 13.58; p < .001
Fisher testF (89) = 79.41; p < .001
Score Skillex
Le score Skillex est associé à chaque participant p qui produit le verbe v pourdécrire l'action du �lm Fi de zone lexico-semantique ∆(Fi ):
I SkillexG (∆(Fi ), v) = CONFG (∆(Fi ),v)degG (v)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 35 / 45
Score Skillex
●
Children Adults0.00
00.
010
0.02
0
FRENCH (SKILLEX)
●
●
●
●
●●
Children Adults0.02
0.04
0.06
MANDARIN (SKILLEX)
Figure: Scores Skillex pour le Français et pour le Mandarin
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 35 / 45
Score Skillex
●
Children Adults0.00
00.
010
0.02
0
FRENCH (SKILLEX)
●
●
●
●
●●
Children Adults0.02
0.04
0.06
MANDARIN (SKILLEX)
Figure: Scores Skillex pour le Français et pour le Mandarin
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 35 / 45
Man-Whitney-Wilcoxon testW (150) = 5756; p < .001
Score Skillex
●
Children Adults0.00
00.
010
0.02
0
FRENCH (SKILLEX)
●
●
●
●
●●
Children Adults0.02
0.04
0.06
MANDARIN (SKILLEX)
Figure: Scores Skillex pour le Français et pour le Mandarin
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 35 / 45
Man-Whitney-Wilcoxon testW (150) = 5756; p < .001
Man-Whitney-Wilcoxon testW (89) = 1670; p < .001
Classi�cation automatique: jeunes enfants VS Adultes
Est-ce que le score Skillex permet une classi�cation automatiqueenfants VS adultes des participants au protocole Approx ?
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 36 / 45
Classi�cation automatique: jeunes enfants VS Adultes
Figure: Scores Skillex selon l'age des participants au protocole Approx
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 36 / 45
Classi�cation automatique: jeunes enfants VS Adultes
Figure: Scores Skillex selon l'age des participants au protocole Approx
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 36 / 45
Score Precision κDegree .91 .81Conf .61 .21Skillex .96 .92
Table: 2-means clustering: French
Classi�cation automatique: jeunes enfants VS Adultes
Figure: Scores Skillex selon l'age des participants au protocole Approx
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 36 / 45
Score Precision κDegree .91 .81Conf .61 .21Skillex .96 .92
Table: 2-means clustering: French
Score Precision κDegree .64 .17Conf .84 .62Skillex .91 .80
Table: 2-means clustering: Mandarin
Robustesse
Les �lms sont sans biais culturels [Cheung et al., 2010]:Analyses statistiques d'un protocole culturel [Cheung et al., 2010]:
I 20 participants Français (Duvignau);
I 20 participants Taiwanais (Cheung);
Les scores de degrés, ni de con�uence ne sont sensibles à la variabilité des réseauxlexicaux pour une langue donnée [Gaillard et al., 2011, Gaume et al., 2014]
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 37 / 45
Robustesse
Figure: Scores Skillex selon l'age des participants au protocole Approx
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 38 / 45
Bilan
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 39 / 45
Artefact Cognitif
Bilan
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 39 / 45
Artefact Cognitif
1 Structure des réseaux lexicaux
2 Un score d'habilité lexicale: Skillex
3 Perspectives
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 40 / 45
⇐=
Travaux futurs : typologieAutres langues et autres catégories d'actions
I Etendre les analyses à d'autres langues⇒ typologie des dynamiques d'acquisition lexicale selon les langues
I Etendre le protocole à d'autres catégories d'actions(i.e. verbes de mouvement)
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 41 / 45
Travaux futurs : cliniqueAide au diagnostic de troubles provoquant des troubleslangagiers
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 42 / 45
Travaux futurs : cliniqueAide au diagnostic de troubles provoquant des troubleslangagiers
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 42 / 45
Travaux futurs : cliniqueAide au diagnostic de troubles provoquant des troubleslangagiers
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 42 / 45
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 43 / 45
Merci谢谢
Thank you
Cheung, H., Desalle, Y., Duvignau, K., Gaume, B., Chang, C.-H., and Magistry, P. (2010).
The use of a cultural protocol for quantifying cultural variations in verbs semantic betweenchinese and french.
In Proceedings of 24th Paci�c Asia Conference on Language, Information andComputation: Workshop on Model and Measurement of Meaning (M3), Sendai, Japan.
De Deyne, S. and Storms, G. (2008).
Word associations: Network and semantic properties.
Behavior Research Methods, 40(1):213�231.
Duvignau, K. (2008).
Acquisition du lexique verbal par proximité sémantique: premiers pas avec les troublesspéci�ques du langage oral et ouverture sur la dyslexie.
ANAE: Revue de Neuropsychologie du Développement et des Apprentissages,20(96�97):65�70.
Gaillard, B., Gaume, B., and Navarro, E. (2011).
Invariant and variability of synonymy networks: Self mediated agreement by con�uence.
In Proceedings of the TextGraph-6 Workshop, pages 15�23. Association for ComputationalLinguistics.
Gaume, B. (2004).
Balades aléatoires dans les petits mondes lexicaux.
Information Engineering Sciences, 4(2):39�96.
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 44 / 45
Gaume, B., Navarro, E., Desalle, Y., and Gaillard, B. (2014).
Mesurer la similarité structurelle entre réseaux lexicaux.
In Réseaux Lexicaux et Traitement des Langues Naturelles, TALN 2014, Marseille, France.TALN.
Morais, A., Olsson, H., and Schooler, L. (2013).
Mapping the structure of semantic memory.
Cognitive Science, 27(1):125�145.
Steyvers, M. and Tenenbaum, J. B. (2005).
The Large Scale Structure of Semantic Networks: Statistical Analyses and Model ofSemantic Growth.
Cognitive Science, 29:41�78.
Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 45 / 45