32
VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation de l’arbre de contexte dans les VLHMM Colloque des jeunes probabilistes et statisticiens - CIRM Thierry Dumont ID Services - Universit´ e de Paris sud XI April 19, 2012 Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Estimation de l’arbre de contexte dans les VLHMMColloque des jeunes probabilistes et statisticiens - CIRM

Thierry Dumont

ID Services - Universite de Paris sud XI

April 19, 2012

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 2: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

1 VLMC : Variable Length Markov Chain.

2 VLHMM : Variable Length Hidden Markov ModelsNotations et definitionsResultats principauxAlgorithmeSimulations

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 3: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Definition

Un processus stationnaire (Xn)n∈Z d’espace d’etats X est unechaıne de Markov de longueurs variables s’il existe deux fonctions let c sur X∞ telles que : pour tout ”passe” x−∞:0,

`(x−∞:0) = min{k | ∀x1 ∈ E ,

P(X1 = x1|X−∞:0 = x−∞:0) =

P(X1 = x1|X−k+1:0 = x−k+1:0)}

et,c(x−∞:0) = x−`(x−∞:0)+1:0

Les elements de l’image de c sont appeles contextes et possedentune representation d’arbre. La fonction c est appelee fonctioncontexte. −→ Rissanen (1983), Csiszar et Talata (2006).

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 4: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Representation en arbre de la fonction c :

Ici X = {0, 1}. Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 5: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Remarque

Connaitre l’arbre de contextes ”minimal” d’un processus VLMCpermet de connaitre le nombre minimal de parametres a estimernecessaires a l’analyse du processus.Une des utilisations les plus repandues des modeles VLMC apparaıten theorie de l’information (Minimum Description Length), et enpratique pour la modelisation de sequences biologiques.

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 6: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Definition

(Xn,Yn)n∈N est un modele de Markov cache a longueurs variables(VLHMM pour Variable Length Hidden Markov Model) si (Xn)n∈Nest une chaıne de Markov a longueurs variables (irreductible dansnotre etude) non-observee et (Yn)n∈N, appelees observationssont independantes conditionnellement a (Xn)n∈N :

P(Y1 ∈ A1, ....,Yk ∈ Ak |X1, ...,Xk) =k∏

i=1

P(Yi ∈ Ai |Xi )

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 7: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Remarque

Notre objectif dans cette presentation est l’etude d’unestimateur de l’arbre de contexte associe a la chaıne deMarkov cachee (Xn)n∈Z, note τ?, et construit sur la base desobservations (Yk)k=1...,n.

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 8: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Modele

Supposons (Xn,Yn)n∈N VLHMM, Xn a valeur dans X fini et Yn avaleurs dans RB .

notons τ? l’arbre de contextes du processus (Xn)n,

pour tout τ arbre de contextes notons

Θt,τ =

{(Ps,x)s∈τ, x∈X, Ps,x ≥ 0 ∀(s, x) ∈ τ × X,

∑x∈X

Ps,x = 1, ∀s ∈ τ

}

Espace des parametres de transition.Remarque : dim(Θt,τ ) = |τ |(|X| − 1).

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 9: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Modele

P(Y1 ∈ A1, ....,Yk ∈ Ak |X1 = x1, ...,Xk = xk) =k∏

i=1

[∫Ai

gθe,xi ,η(y)dµy

]

Θe =

{((θe,x)x∈X, η) ∈

(Rdθ)|X|× Rdη

}Espace des parametres d’emission.

L’espace des parametres du modele est donc Θτ = Θt,τ ×Θe

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 10: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Definition

La VraisemblancePour tout τ arbre de contextes, pour tout θ = (θt , θe) ∈ Θτ , nousdefinissons ce que nous appelons la vraisemblance par :

∀y1:n ∈ (RB)n, gθ(y1:n) =∑

x1:n∈Xn

[n∏

i=1

gθe,xi ,η(yi )

]gθt (x1:n)

ou :

gθt (x1:n) =∑

x−d(τ)+1:0∈Xd(τ)

νd(τ)(x−d(τ)+1:0)n∏

i=1

Psi ,xi

avecsi = cτ (x−d(τ)+1:i−1)

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 11: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Definition

Si nous observons Y1:n, nous definissons l’estimateur de l’arbre decontextes pour la chaıne de Markov cachee a longueur variable Xpar

τn = argminτ arbre complet

[− supθ∈Θτ

log gθ(Y1:n) + pen(n, τ)

]= argmin

τ arbre completsc(τ)

Ou pen(n, τ) = penα(n, τ) =

[|τ |∑t=1

(|X|−1)t+α2

]log n

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 12: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Theorem

Sous certaines conditions classiques sur le modele, s’il existe unprior πe sur Θe et une constante b > 0 tels que, si, pour toutx1:n ∈ Xn, on definit la loi melange sur RB , conditionnellement ax1:n par,

KTne(y1:n|x1:n) =

∫Θe

[n∏

i=1

gθe,xi ,η(yi )

]πe(dθe),

alors eventuellement p.s. :

supθe∈Θe

supx1:n

[log

n∏i=1

gθe,xi ,η(Yi )− logKTne(Y1:n|x1:n)

]≤ b log n

et si α > 2(b + 1), alors τn ∼ τ? pour n assez grand p.s.

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 13: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Cas particulier important ou les lois d’emission sont desgaussiennes de moyennes inconnues (mx)x∈X et de variance

σ2 commune a tous les x ∈ X mais inconnue.

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 14: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Definition

Posons :

η = − 12σ2

θe,x = mxσ2 pour tout x ∈ X

AlorsΘe =

{((θe,x)x∈X, η)

∣∣θe,x ∈ R, η < 0}

Et ∀x1:n ∈ Xn, ∀y1:n ∈ Rn,

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 15: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 16: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Theorem

Si α > k + 3, alors τn ∼ τ? pour n assez grand p.s.

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 17: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Nous proposons un algorithme d’elagage pour le cas general. Ilpermet, se donnant une suite d’observations Y1:n de calculer τn en”elaguant” un arbre couvrant notre τ? dans l’esprit des premierstravaux de Rissanen dans le cadre des VLMC.

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 18: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Arbre couvrant maximal.

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 19: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Processus d’elagage

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 20: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Processus d’elagage

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 21: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Processus d’elagage

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 22: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Processus d’elagage

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 23: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Processus d’elagage

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 24: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Processus d’elagage

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 25: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Processus d’elagage

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 26: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Processus d’elagage

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 27: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Processus d’elagage

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 28: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Processus d’elagage

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 29: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Pour tester nos resultats, nous simulons une VLHMM(Xk ,Yk)k=1..,n ou

X = {0, 1}l’arbre de contextes minimal est celui representeprecedemment.

le vrai parametre d’emission est donne par m?0 = 0, m?

1 valant2,3 ou 4 (cf tableau suivant), et σ2,? = 1.

n varie entre 100 et 50000

Nous comparons notre estimateur τn avec l’estimateur BIC, quiverifie

penBIC (n, τ) =|X| − 1

2|τ | log n

qui est beaucoup moins ”lourde” que penα(n, τ).

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 30: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Resultats de simulations :

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 31: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

J. Rissanen, “A universal data compression system,” IEEETrans. Inform. Theory, vol. 29, pp. 656 – 664, 1983.

I. Csiszar and Z. Talata, “Context tree estimation for notnecessarily finite memory processes, via bic and mdl,” IEEETrans. Inf. Theory, vol. 52, pp. 1007–1016, 2006.

Z. L. W. J. Wang, Y. and Z. Liu, “Mining complex time-seriesby learning markovian models,” in Proceedings ICDM’06, sixthinternational conference on data mining, China, 2005.

Y. Wang, “The variable-length hidden markov model and itsapplications on sequential data mining,” Departement ofcomputer science, Tech. Rep., 2005.

P. Collet, A. Galves, and F. Leonardi, “Random perturbationsof stochastic processes with unbounded variable lengthmemory,” Electron. J. Probab., vol. 13, pp. no. 48,1345–1361, 2008.

T.Dumont, “Context tree estimation in variable length hiddenmarkov models,” Soumis, 2011.

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM

Page 32: Estimation de l’arbre de contexte dans les VLHMMreynaudb/jps/statappli/Dumont.pdf · VLMC : Variable Length Markov Chain. VLHMM : Variable Length Hidden Markov Models Estimation

VLMC : Variable Length Markov Chain.VLHMM : Variable Length Hidden Markov Models

Notations et definitionsResultats principauxAlgorithmeSimulations

Merci beaucoup pour votre attention.

Thierry Dumont Estimation de l’arbre de contexte dans les VLHMM