Download pdf - Commande adaptative directe basee sur la passivit´ e´homepages.laas.fr/peaucell/presentation/EADSRGT2011.pdf · 2013-05-06 · Introduction n Commande adaptative : “Modiﬁer

Commande adaptative directe basee sur la passivite

Dimitri PEAUCELLE - LAAS-CNRS - Universite de Toulouse

Razvan LUZI - CNES - ONERA

New trends & challenges in control from specification to validation

RTG12 Workshop Toulouse - 29-30 Novembre 2011

Introduction

n Commande adaptative :

“Modifier le comportement de la loi de commande en reponse a des modifications

dans les dynamiques du processus a controler et des perturbations”

w yΣ (θ,δ)c

yc

u

θ,δ

Σ(θ,δ)

s Suppose de connaıtre θ, δ, w. Comment ?

s Impose un choix de loi d’adaptation. Lequel ?

s Le schema global est non-lineaire. Preuves de stabilite ?

n Commande adaptative robuste :

wΣ(θ,δ)

yc

uy

θ

c

δΣ (θ)

Commande adaptative - RTG12 Workshop 1 Novembre 2011, Toulouse

Introduction

n Commande adaptative - Sequencement de gain

l Hypotheses : θ connu en temps reel, varie lentement dans le temps

wc

uy

θδ

cΣ (θ )

θ

c

c

Σ(θ,δ)y

s Calculer regulierement les parametres (optimaux, robustes...) de Σc

s Choisir les parametres de Σc dans une table de valeurs pre-calculees

(commande tabulee)

s Definir a priori une fonction θc(θ)

(Quand Σc est lineaire : commande Lineaire a Parametres Variants, LPV)

l Variations temporelles de θ induisent des comportements non-lineaires

l Et si θ n’est pas mesuree ?


Introduction

n Commande adaptative indirecte

l Hypotheses : θ, δ varient lentement dans le temps

l Estimation parametrique en temps reel : estimees θ, δ

w

cθ,δ

cΣ (θ ) Σ(θ,δ)c

yc

u y

θ,δ

θ

l Principe de separation :

s Dynamiques d’estimation/sequencement de gain

n’ont pas/peu d’influence sur la dynamique globale

s Estimation independante de Σc

l Differentes techniques d’estimation : moindres carres, gradient, projections...

l Precision d’estimation : besoin d’excitation permanente


Introduction


l Si les dynamiques de Σ sont suffisamment lentes : estimation de l’hyper-etat

w

x,w,

yc

u y

θ,δθ,δ

Σ(θ,δ)N.L.

s Dynamiques de θ et celles de x peuvent etre proches

s Generalise le schema : retour d’etat/observateur

s Probleme d’estimation tres complexe

s Commande fortement non lineaire, grandes dimensions


Introduction


w

cθ,δ

cΣ (θ ) Σ(θ,δ)c

yc

u y

θ,δ

θ

n Commande adaptative directe

wc

u y

θ,δ

cΣ (θ )

θc

Σ(θ,δ)c

y

s Si θc = F (θ, δ) et F inversible :

le calcul de θc est un probleme d’estimation pour Σ(F−1(θc))

s “MIT rule” : heuristique quand F est inconnue


Introduction

n Commande adaptative directe

wc

u y

θ,δ

cΣ (θ )

θc

Σ(θ,δ)c

y

l Schema de commande plus simple

(parfois appelee “simple adaptive control”, [Barkana])

l Possibilite d’obtenir des preuves de stabilite de la boucle fermee complete

(sans principe de separation)

s Resultats de stabilite par la theorie de Lyapunov

s Limitations : Hypotheses de passivite sur Σ

(parfois appelee “passivity-based adaptive control”, [Fradkov])


Introduction

n Commande adaptative a modele de reference - MRAC

l Jusqu’ici : regulation autour d’un point d’equilibre

l Resultats s’etendent a : adaptation pour suivre comportement de reference

w

m

+−

ε

yc

yc

u

θ,δ

cΣ (θ )

θc y

Σ

Σ(θ,δ)

m

l Exemple : Modele de reference du second ordre pour moteur a courant continu

−++

( s+1)( s+1)1ττ1 2

−k

Is+f

ωuωc e


Plan

Ê MRAC dans le cas SISO et regle du MIT

s Basee sur probleme de regulation a 2 degres de liberte (RST)

s Methode de gradient issue des techniques d’estimation

s Regle heuristique

Ë Stabilisation par PBAC - le cas MIMO

s Hypotheses de type passivite sur les systemes

s Preuves de stabilite avec theorie de Lyapunov

Ì PBMRAC

Í Cas des systemes non passifiables



n Commande a deux degres de liberte pour les systemes lineaires

l Hypotheses

s Systeme a commander SISO, LTI : y =B

Au

s Modele de reference : ym =Bm

Amuc

l Loi de commande : u =T

Ruc −

S

Ry

l Nombreuses hypotheses sur A, B, Am, Bm, R, S, T



n Commande adaptative pour regler les coefficients de R, S, T

R(s) = sq + rq−1sq−1 + . . . r1s+ r0,

S(s) = sqsq + . . . s1s+ s0, T (s) = tqs

q + . . . t1s+ t0

l Parametres de commande

θc =(rq−1 · · · r0 sq · · · s0 tq · · · t0

)s Commande adaptative : ajuster les θci pour avoir y = ym

s Choix d’un cout a minimiser :

J1 = |e|, J2 =1

2e2...

ou e = y − ym



l Methode du gradient pour minimiser les parametres de commande :

dθcidt

= −γ ∂J∂θci

s Pour J2 on trouvedθcidt

= −γe ∂e∂θci

l Connaıtre en temps reel∂e

∂θci?



l Regle du MIT :

∂e

∂ti' si

AoAmuc ,

∂e

∂si' − si

AoAmy ,

∂e

∂ri' − si

AoAmu

ou Ao polynome aux dynamiques rapides (le plus souvent = 1).

l Les regles d’adaptation sont realisables a l’aide de filtres et d’integrateurs

s Exemple pour cout J2 :

dsidt

= γesi

AoAmy +

− εm

i

si

Σ(θ,δ)

yθ,δ

*γs

y

Σ

A Aso m

m



l Remarques :

s Resultat est heuristique : pas de garantie (ni suivi de reference, ni stabilite)

s Si l’ordre du systeme est inconnu :

choisir Ao et degres de R, S et T intuitivement

s Stabilite implique convergence de e = y − yms Aucune indication sur la convergence des gains du correcteur



n Exemple : moteur a courant continu

−++

−

uc e

mG

kIs+f

ωω

l Boucle de regulationS

R=

s0

s+ r0, Precommande

T

R=

t0s+ r0

+−− 1

s

u

ω

cω t

s

r

o

o

o

so = γe[ 1Amω]

to = −γe[ 1Amωc]

ro = γe[ 1Amu]



n Exemple : moteur a courant continu - Simulations

lG(s) = 1s+1

, Gm(s) = 6s2+5s+6

, γ = 0.6,

l ωc(t) creneau de periode 20s, valeur max = 0.375, valeur min = −0.125

0 20 40 60 80 100 120 140 160 180 200 220

−0.1

0

0.1

0.2

0.3

0.4

0.5

s Relativement bonne convergence




lG(s) = 10(s+0.8)(s+8)

, Gm(s) = 6s2+5s+6

, γ = 0.6,


0 20 40 60 80 100 120 140 160−0.2

−0.1

0

0.1

0.2

0.3

0.4

0.5

0.6

s Parait robuste




lG(s) = 10(s+0.8)(s+8)

, Gm(s) = 6s2+5s+6

, γ = 0.6,


0 20 40 60 80 100 120 140 160

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

t0

s0

r0

s Convergence lente (deux periodes) - augmenter γ pour accelerer




lG(s) = 10(s+0.8)(s+8)

, Gm(s) = 6s2+5s+6

, γ = 6,


0 20 40 60 80 100 120 140 160

0

0.2

0.4

0.6

0.8

1

t0

s0

r0

s Les gains sont rapidement plus grands (et tres differents...)




lG(s) = 10(s+0.8)(s+8)

, Gm(s) = 6s2+5s+6

, γ = 6,


0 20 40 60 80 100 120 140 160

−0.2

−0.1

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

ω

ωm

s Le transitoire (avant convergence des gains adaptatifs)

plus court, mais avec fort depassement




lG(s) = 10(s+0.8)(s+8)

, Gm(s) = 6s2+5s+6

, γ = 60,


0 10 20 30 40 50 60 70 80 90 100−0.2

0

0.2

0.4

0.6

0.8

1

ω

ωm

s Le transitoire tres court, mais avec fort depassement

s Suivi de reference parfait une fois que les gains ont converge




lG(s) = 10(s+0.8)(s+8)

, Gm(s) = 6s2+5s+6

, γ = 60,


0 10 20 30 40 50 60 70 80 90 100

−1

0

1

2

3

4

5

6

t0

s0

r0

s Les gains semblent vraiment converger




lG(s) = 10(s+0.8)(s+8)

, Gm(s) = 6s2+5s+6

, γ = 60,


0 50 100 150

−0.04

−0.02

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

ω

ωm

s L’amplitude de l’erreur etant faible, la convergence est lente

s Possibilite pour eviter ces phenomenes : adapter γ




lG(s) = 10(s2+s+1)

, Gm(s) = 6s2+5s+6

, γ = 60,


0 10 20 30 40 50 60 70 80 90 100−1

0

1

2

3

4

5

ω

ωm

s Ce n’est quand meme pas parfait pour tout systeme

s Degres du regulateur RST sous hypothese d’un systeme du 1er ordre




lG(s) = −1.1s+10(s2+s+1)

, Gm(s) = 6s2+5s+6

, γ = 60,


200 220 240 260 280 300 320 340 360 380 400−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

ω

ωm

s Il peut y avoir des phenomenes instables : ‘burst’




lG(s) = −1.1s+10(s2+s+1)

, Gm(s) = 6s2+5s+6

, γ = 60,


330 335 340 345 350 355 3600

200

400

600

800

1000

1200

1400

1600

1800

2000

t0

s0

r0

s Ce ne sont evidement pas des valeurs de gain realisables



n Modification des lois d’adaptation

l σ-modification : Empecher les gains de diverger

(en particulier sous l’effet de bruits de mesure)

so = γe[ 1Amω]

to = −γe[ 1Amωc]

ro = γe[ 1Amu]

−→so = γ

1+βe2e[ 1Amω]− σso

to = − γ1+βe2

e[ 1Amωc]− σto

ro = γ1+βe2

e[ 1Amu]− σro

s Pas de point d’equilibre possible pour les gains




lG(s) = 10(s+0.8)(s+8)

, Gm(s) = 6s2+5s+6

, γ = 60, β = 0.1, σ = 10−4,


0 20 40 60 80 100 120 140 160 180 200

0

0.5

1

1.5

2

ω

ωm

s Bon reglage de l’algorithme d’adaptation : bonnes performances de suivi




lG(s) = 10(s+0.8)(s+8)

, Gm(s) = 6s2+5s+6

, γ = 60, β = 0.1, σ = 10−4,


0 50 100 150 200 250 300−5

0

5

10

15

20

t0

s0

r0

s Bon reglage de l’algorithme d’adaptation : gains raisonnables, varient peu



n Conclusions

l Algorithme du gradient potentiellement satisfaisant

s Robustesse relativement grande - mais non prouvee

s Pas besoin de connaıtre le modele du systeme

s γ influe sur la vitesse de convergence, a regler par experimentations

s β, σ modifications, a regler par experimentations

l Aucune preuve de stabilite/performance

s Quelles hypotheses a faire sur le systeme ?

s Est-il possible de stabiliser des systemes instables ?

s Extensions aux systemes MIMO ?

s Comment garantir des gains bornes/realisables ?


Plan




s Regle heuristique




Ì PBMRAC



Ë Stabilisation par PBAC

n Commande adaptative basee sur la passivite (PBAC)



w

m

+−

cΣ (θ )

θc y

Σ

θ,δy

e

Σ(θ,δ)c

yc

u

m

l Dans un premier temps on suppose yc = 0

l On veut montrer que le systeme est stable



n Systemes passifs

l Systeme non-lineaire x = f(x, v), z = g(x, v) est passif si

s il est carre : nombre d’entrees v = nombre de sorties z,

s pour des CI nulles x(0) = 0, pour tout v et pour tout t ≥ 0, on a∫ t

0

zT (t)v(t)dt ≥ 0

l Passivite : produit scalaire entrees/sorties est positif

“sorties vont dans le meme sens que les entrees”

l Propriete de nombreux systemes

l Pour les systemes mecaniques (entrees : forces - sorties : vitesse),

l’integrale correspond a l’energie accumulee dans le systeme



n Theoreme - Systemes passifs

Un systeme est strictement passif s’il existe une fonction V : Rn → R

s nulle a l’origine : V (0) = 0

s definie-positive : V (x) > 0 ∀x 6= 0

s dont les derivees le long des trajectoires du systeme verifient

V (x) ≤ zTv − εxTx

l V : “storage function”

l aussi fonction de Lyapunov prouvant la stabilite asymptotique du systeme



n Retroaction de systemes passifs

l Soient deux systemes avec le meme nombre d’entrees/sorties

x1 = f1(x1, v1) , z1 = g1(x1, v1)

x2 = f2(x2, v2) , z2 = g2(x2, v2)

s s’ils sont tous les deux strictement passifs

s alors l’interconnexion v2 = z1, v1 = −z2 est asymptotiquement stable

l Preuve V1 + V2 ≤ zT1 v1 + zT2 v2︸︷︷︸=0

−ε1xT1 x1 − ε2xT2 x2 < 0

l Cas particulier : z2(t) = ∆K(t)v2(t) avec ∆K(t) + ∆TK(t) � 0

s un cone de gains statiques qui preservent la stabilite de la boucle fermee

s les gains peuvent varier dans le temps, quelle que soit la regle, adaptative ?



l Conditions de strict-passivite des systemes lineaires :

P = P T � 0 :

ATP + PA+ 2ε1 PB − CT

BTP − C −D −DT

� 0

s Preuve : V = 12xTPx(

x

w

)T [ATP + PA+ 2ε1 PB − CT

BTP − C −D −DT

](x

w

)= 2(V − zTw + εxTx) ≤ 0

s Dans le cas des systemes sans transfert direct (D = 0)

P = P T � 0 , ATP + PA+ 2ε1 � 0 , PB = CT



n [Fra74, BK85] Theoreme

l Passification par retour de sortie adaptatif des systemes “presque passifs”

l S’il existe un retour de sortie statique u = −Fy qui rend le systeme

x = Ax+Bu+Bv, y = Cx, z = y

strictement passif en boucle fermee, alors, pour tout Γ � 0,

la commande adaptative

u = −Ky, K = yyTΓ

rend le systeme passif en boucle fermee.



l Preuve intuitive

s Existence d’un retour de sortie passifiant :

⇒ x = (A−BFC)x+Bv, z = Cx est passif

⇒ ∀∆TK + ∆K � 0 x = (A−BFC −B∆KC)x est stable

s En prenant ∆K suffisamment grand,

tout K = F + ∆K , K +KT � 0, stabilise le systeme

s La loi adaptative K = yyTΓ “pousse” les gains a devenir “grands”

dans la direction K +KT � 0

s Tand que y n’a pas converge a zero,

la loi tend a augmenter le gain de commande



l Preuve par la theorie de Lyapunov

s On souhaite prouver la passivite du systeme non lineaire :

x(t) = (A−BK(t)C)x(t)+Bv(t) , K(t) = y(t)yT (t)Γ , z(t) = Cx(t)

s sous l’hypothese qu’il existe un gain Ko strictement passifiant :

∃F, P � 0, ε > 0 :

(A−BFC)TP + P (A−BFC) + 2ε1 � 0 , PB = CT

s Choix d’une fonction de Lyapunov qui depend de tous les etats

V (x,K) =1

2

(xTPx+ Tr

((K − F )Γ−1(K − F )T

))s Il suffit de demontrer que V ≤ zTv, le long des trajectoires



l Preuve par la theorie de Lyapunov

V (x,K) =1

2

(xTPx+ Tr

((K −Ko)Γ

−1(K −Ko)T))

s Calcul de sa derivee

V = xTPx+ Tr(KΓ−1(K −Ko)

T)

s Trajectoires : x = (A−BKC)x+Bv, K = yyTΓ

V = xT (A−BKC)TPx+ vTBTPx+ Tr(yyT (K −Ko)

T)

s Propriete de l’operateur trace : Tr(AB) = Tr(BA) :

Tr(yyT (K −Ko)

T)

= Tr(yT (K −Ko)

Ty)

= yT (K −Ko)Ty

s Donc comme y = Cx on a

V = xT (A−BKC)TPx+ vTBTPx+ xTCT (K −Ko)TCx



n Conditions pour qu’un systeme lineaire soit stabilisable par PBAC [Fra03]

l Cas des systemes SISO, y = H(s)u :

s Le systeme doit etre stabilisable par u = −ky avec k > 0 grand

s Lieu d’Evans : H(s) ne doit pas avoir de zeros instables

s Lieu d’Evans : H(s) doit etre de degre relatif≤ 1

l Cas des systemes MIMO : (A,B,C) a hyper minimum de phase

s det(sI − A) det(C(sI − A)−1B) a toutes ses racines stables (zeros)

s CB = (CB)T � 0, gain haute frequence est defini positif

(le degre relatif du systeme≤ m ou m : nb d’entrees)

l Limitations

s Systemes carres (CB est carree), et tels que CB = (CB)∗ � 0

s Degre relatif≤ m et zeros stables



n PBAC modifiee pour les systemes non-carres

n [Fra03] Theoreme

l S’il existe un retour de sortie statique u = −Koy,

et une matrice G qui rendent le systeme

x = Ax+Bu+Bv, y = Cx, z = Gy

strictement passif en boucle fermee, alors, pour tout Γ � 0,

la commande adaptative

u = −Ky, K = GyyTΓ

rend le systeme passif en boucle fermee.

s Exercice : demontrer le theoreme

l Applicable si le nombre de sorties est superieur au nombre de commandes



n Exemple - Modele avion - longitudinal

l x =(α q

)T, α incidence, q vitesse de tangage,

l u = δ braquage de gouverne

x =

zα 1

mα mq

x+

0

mδ

u , y = x

s Matrice de transfert :

y =mδ

s2 − (zα +mq)s+ zαmq −mα

1

s− zα

u



n Exemple - Modele avion

s Combinaison lineaire des sorties z =[g1 g2

]y :

z

u=

mδg2(s− zα + g1/g2)

s2 − (zα +mq)s+ zαmq −mα

est a hyper minimum de phase si g1/g2 − zα > 0 et mδg2 > 0

s En prenant g2 = sign(mδ) (mδ doit etre de signe connu)

et en prenant |g1| suffisamment grand devant valeurs attendues de zα

u = −Ky , K = GyyTΓ

stabilise le systeme pour toute valeur des parametres.

s Γ (et β, σ modifications) a regler en simulation.


Plan




s Regle heuristique




Ì PBMRAC



Ì PBMRAC

n MRAC basee sur la passivite

w

m

+−

cΣ (θ )

θc y

Σ

θ,δy

e

Σ(θ,δ)c

yc

u

m

l Jusqu’ici yc = 0 et commande u(t) = −K(t)y(t)

l Cas avec modele de reference : u = −K(t)e(t)+L(t)xm(t)+M(t)yc(t)

sK(t) a pour role de stabiliser la boucle (comme precedemment)

s L(t) et M(t) definissent une pre-commande pour le suivi de la reference

l Etude menee pour les systemes lineaires (linearise d’un modele non-lineaire)


Ì PBMRAC

n Hypotheses sur le systeme

l Le systeme est “presque passif” :

Il existe un retour de sortie statique u = −Koy,

et une matrice G qui rendent le systeme

x = Ax+Bu+Bv, y = Cx, z = Gy

strictement passif en boucle fermee

l Il existe une pre-commande Lo, Mo qui permet le suivi parfait :

xo = Axo +B(Loxm +Moyc) ⇒ Cxo = ym

ou xm est l’etat du modele de reference (dont l’ordre peut etre 6= n)

xm = Amxm +Bmyc , ym = Cmxm

s Hypothese forte, equivalente aux hypotheses sur regulateurs RST


Ì PBMRAC

n MRAC basee sur la passivite

w

m

+−

cΣ (θ )

θc y

Σ

θ,δy

e

Σ(θ,δ)c

yc

u

m

l Si les hypotheses sont verifies, alors pour tous ΓK � 0, ΓL � 0, ΓM � 0,

la loi de commande

u = −K(t)e(t) + L(t)xm(t) +M(t)yc(t) , e = y − ymK = GeeTΓK , L = −GexTmΓL , M = −GeyTc ΓM

est telle que lim(x(t)− xo(t)) = 0.


Ì PBMRAC

n PBMRAC pour une classe de systemes nonlineaires

x = Ax+ Aφφ(y, u, t) +Bu , y = Cx

l La loi de commande suivante stabilise le systeme et x(t)→ xm(t).

u = −Ke+ Lxm +Myc +Nφ , e = y − ymK = GeeTΓK , L = −GexTmΓL , M = −GeyTc ΓM , N = −GeφTΓN

s Example : systeme sature

x = Ax+Bsat(u) = Ax+Bu−Bdz(u)

Le terme Ndz(u) de la commande est un anti-windup.

s En pratique si yc n’est pas constante N(t) diverge...


Ì PBMRAC

n Conclusions sur PBMRAC

l Fort potentiel d’application pour les systemes “presque passifs”

(existence de G et Ko tels que G(H(s) ? Ko) est passif

l Loi d’adaptation de la forme K = GeeTΓ

s Tant que e n’a pas converge les gains s’adaptent, dans la direction G

s Ils peuvent potentiellement diverger

s Si (transitoirement) ||e|| est grand, alors K est grand (pas realisable)

l Possibilite de faire β, σ modifications :

K = GeeTΓ(1 + eTβe)−1 − σK

s mais les preuves de stabilite ne tiennent plus ...

s Ici dans le cas β = 0

V ≤ −ε||x− xo||2 − σTr(KΓ−1(K −Ko)T ) ≤ 0?

Si K est bornee, on peut avoir V ≤ 0 pour ||x− xo|| ≥ ρ : stabilite pratique


Plan




s Regle heuristique




Ì PBMRAC




n Passivity-Based Adaptive Control [Fradkov 1974, 2003]

& Simple Adaptive Control [Kaufman, Barkana, Sobel 94]

l Let Σ ∼ (A,B,C,D) be a MIMO system with m inputs / p ≥ m outputs.

l If ∃ (G,F ) ∈ (Rp×m)2 such that the following system is passive

uΣ

y+

zv

F

G

l then the following adaptive law stabilizes the system for all Γ > 0

K = −GyyTΓ , u = Ky



n Underlying properties

l Passivity implies that for all ∆ + ∆∗ ≥ 0 the following system is stable

zΣ

yv+

u

−∆

F

G

l i.e. all gains (F −∆G) stabilize the system, for ∆ + ∆∗ ≥ 0, possibly large

l K = −GyyTΓ “pushes” the gains in that direction until stability is reached

s In practice : Need to limit growth of K . Modifications of adaptive law

K = −GyyTΓ + φ(K) (eg. φ(K) = −σK)



n What if Σ is not passifiable by (G,F ) ?

l ∃S a feedthrough (or Shunt) such that the following system is passive

Σz

+yv

+u

F

S

G

l then the adaptive law stabilizes the system Σ + S.

s [KBS94] For SISO Σ one can takeS(s) = F−1S (s) whereFS is stabilizing

s In practice : S should be small for tracking issues (u = K(y + Su))

s Rq : The actual gain is bounded

K = (1−KS)−1K

Σ

K +

u

K

y

S



n Proposed result [PDPM11]

lK bounded thanks to a modification of the adaptive law :

K = −GyyTΓ− ψD(K) · (K − F ) , u = Ky

s ψD is a deadzone : no modification when K is close to F

ψD(K) = 0 if ||K − F ||2• ≤ ν

sψD is a barrier : goes to infinity whenK reaches border of accepted region

ψD(K)→ +∞ if ||K − F ||2• → νβ (β > 1)



n LMI-based design of (G,D = µ21, ν) assuming a given stabilizing F

l Step 1 (LMI) : minimize µ such that

x = A(F )x+Bw,

z = GCx+ µ2w

is passive :[AT (F )P + PA(F ) PB − CTGT

BTP −GC −µ1

]< 0

l Step 2 (LMI) : maximize ν, the size of admissible adaptive gains T (F − F )T

(F − F ) µ−11

≥ 0, Tr(T ) ≤ νµ,

Q > 0,

AT (F )Q+QA(F ) + νµβCTC

+R+ CT (GT (F − F ) + (F − F )TG)C

< 0. R QB − CTGT

BTQ−GC µ1

≥ 0,



n LMI-based design of (G,D = µ21, ν) assuming a given stabilizing F

s Procedure guaranteed to succeed if F stabilizes the system

sK remains in a convex set around F (appreciated by engineers)

s ν may be small, i.e. small admissible adaptation (K ' F )

s LMI results can be easily extended to uncertain systems

⇒ proof of robustness of adaptive control for given uncertainty set

s In the robust case, step 2 is based on the existence of a PDSOF F (θ)

Compared to F (θ), the adaptive gain K needs not the estimation of θ

s Lyapunov function for global (robust) stability of PBAC

V (x,K, θ) = xTQ(θ)x+ Tr((K − F (θ))Γ−1(K − F (θ))T )


Conclusions

n LMI-based method that guarantees (robust) stability of PBAC

l Applies to any stabilizable LTI MIMO system

l Adaptive gains remain bounded

l Adaptive gains remain close to known value F

l With σ-modification : converge to known value F0

K = −GyyTΓ− ψD(K) · (K − F )− σ(K − F0)

n Prospectives

l Enlarge admissible region for K

l Structured control (decentralized etc.)

l Guaranteed robustness for time-varying uncertainties

l Take advantage of flexibilities on G for engineering issues (saturations...)

l ...


REFERENCES Quelques references REFERENCES

References

[AKO07] A. Astolfi, D. Karagiannis, and R. Ortega, Nonlinear and adaptive

control with applications, Communications and Control Engineering,

Springer-Verlag, 2007.

[AOS00] A. Astolfi, R. Ortega, and R. Sepulchre, Control of complex systems,

ch. Passivity–based control of Nonlinear Systems, Springer, London,

2000.

[AW89] K.J. Astrom and B. Wittenmark, Adaptive control, Addison-Wesley,

1989.

[BK85] I. Barkana and H. Kaufman, Global stability and performance of an

adaptive control algorithm, Int. J. Control 42 (1985), no. 6, 1491–

1505.



[FFY81] V. Fomin, A. Fradkov, and V. Yakubovich, Adaptive control of dynamic

plants, Nauka, Moscow, 1981, In Russian.

[Fra74] A.L. Fradkov, Adaptive stabilization of a linear dynamic plant, Autom.

Remote Contr. 35 (1974), no. 12, 1960–1966.

[Fra90] , Adaptive control of complex systems, Nauka, 1990, in Rus-

sian.

[Fra03] , Passification of non-square linear systems and feedback

Yakubovich-Kalman-Popov lemma, European J. of Control 6 (2003),

573–582.

[HC98] W.M. Haddad and V.-S. Chellaboina, Nonlinear fixed-order dynamic

compensation for passive systems, International Journal of Robust

and Nonlinear Control 8 (1998), 349–365.

[IF06] P. Ioannou and B. Fidan, Adaptive control tutorial, Advances in Design

and Control, SIAM, 2006.



[IS96] P. Ioannou and J. Sun, Robust adaptive control, Prentice Hall, Inc,

1996.

[KBS94] H. Kaufman, I. Barkana, and K. Sobel, Direct adaptive control algo-

rithms, Springer, New York, 1994.

[PDPM11] D. Peaucelle, A. Drouot, C. Pittet, and J. Mignot, Simple adaptive

control without passivity assumptions and experiments on satellite at-

titude control DEMETER benchmark, IFAC World Congress, August

2011.

[PKP09] D. Peaucelle, H.M. Khan, and P.V. Pakshin, LMI-based analysis of ro-

bust adaptive control for linear systems with time-varying uncertainty,

Autom. Remote Contr. 70 (2009), no. 9, 1540–1552.