Commande adaptative directe basee sur la passivite
Dimitri PEAUCELLE - LAAS-CNRS - Universite de Toulouse
Razvan LUZI - CNES - ONERA
New trends & challenges in control from specification to validation
RTG12 Workshop Toulouse - 29-30 Novembre 2011
Introduction
n Commande adaptative :
“Modifier le comportement de la loi de commande en reponse a des modifications
dans les dynamiques du processus a controler et des perturbations”
w yΣ (θ,δ)c
yc
u
θ,δ
Σ(θ,δ)
s Suppose de connaıtre θ, δ, w. Comment ?
s Impose un choix de loi d’adaptation. Lequel ?
s Le schema global est non-lineaire. Preuves de stabilite ?
n Commande adaptative robuste :
wΣ(θ,δ)
yc
uy
θ
c
δΣ (θ)
Commande adaptative - RTG12 Workshop 1 Novembre 2011, Toulouse
Introduction
n Commande adaptative - Sequencement de gain
l Hypotheses : θ connu en temps reel, varie lentement dans le temps
wc
uy
θδ
cΣ (θ )
θ
c
c
Σ(θ,δ)y
s Calculer regulierement les parametres (optimaux, robustes...) de Σc
s Choisir les parametres de Σc dans une table de valeurs pre-calculees
(commande tabulee)
s Definir a priori une fonction θc(θ)
(Quand Σc est lineaire : commande Lineaire a Parametres Variants, LPV)
l Variations temporelles de θ induisent des comportements non-lineaires
l Et si θ n’est pas mesuree ?
Commande adaptative - RTG12 Workshop 2 Novembre 2011, Toulouse
Introduction
n Commande adaptative indirecte
l Hypotheses : θ, δ varient lentement dans le temps
l Estimation parametrique en temps reel : estimees θ, δ
w
cθ,δ
cΣ (θ ) Σ(θ,δ)c
yc
u y
θ,δ
θ
l Principe de separation :
s Dynamiques d’estimation/sequencement de gain
n’ont pas/peu d’influence sur la dynamique globale
s Estimation independante de Σc
l Differentes techniques d’estimation : moindres carres, gradient, projections...
l Precision d’estimation : besoin d’excitation permanente
Commande adaptative - RTG12 Workshop 3 Novembre 2011, Toulouse
Introduction
n Commande adaptative indirecte
l Si les dynamiques de Σ sont suffisamment lentes : estimation de l’hyper-etat
w
x,w,
yc
u y
θ,δθ,δ
Σ(θ,δ)N.L.
s Dynamiques de θ et celles de x peuvent etre proches
s Generalise le schema : retour d’etat/observateur
s Probleme d’estimation tres complexe
s Commande fortement non lineaire, grandes dimensions
Commande adaptative - RTG12 Workshop 4 Novembre 2011, Toulouse
Introduction
n Commande adaptative indirecte
w
cθ,δ
cΣ (θ ) Σ(θ,δ)c
yc
u y
θ,δ
θ
n Commande adaptative directe
wc
u y
θ,δ
cΣ (θ )
θc
Σ(θ,δ)c
y
s Si θc = F (θ, δ) et F inversible :
le calcul de θc est un probleme d’estimation pour Σ(F−1(θc))
s “MIT rule” : heuristique quand F est inconnue
Commande adaptative - RTG12 Workshop 5 Novembre 2011, Toulouse
Introduction
n Commande adaptative directe
wc
u y
θ,δ
cΣ (θ )
θc
Σ(θ,δ)c
y
l Schema de commande plus simple
(parfois appelee “simple adaptive control”, [Barkana])
l Possibilite d’obtenir des preuves de stabilite de la boucle fermee complete
(sans principe de separation)
s Resultats de stabilite par la theorie de Lyapunov
s Limitations : Hypotheses de passivite sur Σ
(parfois appelee “passivity-based adaptive control”, [Fradkov])
Commande adaptative - RTG12 Workshop 6 Novembre 2011, Toulouse
Introduction
n Commande adaptative a modele de reference - MRAC
l Jusqu’ici : regulation autour d’un point d’equilibre
l Resultats s’etendent a : adaptation pour suivre comportement de reference
w
m
+−
ε
yc
yc
u
θ,δ
cΣ (θ )
θc y
Σ
Σ(θ,δ)
m
l Exemple : Modele de reference du second ordre pour moteur a courant continu
−++
( s+1)( s+1)1ττ1 2
−k
Is+f
ωuωc e
Commande adaptative - RTG12 Workshop 7 Novembre 2011, Toulouse
Plan
Ê MRAC dans le cas SISO et regle du MIT
s Basee sur probleme de regulation a 2 degres de liberte (RST)
s Methode de gradient issue des techniques d’estimation
s Regle heuristique
Ë Stabilisation par PBAC - le cas MIMO
s Hypotheses de type passivite sur les systemes
s Preuves de stabilite avec theorie de Lyapunov
Ì PBMRAC
Í Cas des systemes non passifiables
Commande adaptative - RTG12 Workshop 8 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Commande a deux degres de liberte pour les systemes lineaires
l Hypotheses
s Systeme a commander SISO, LTI : y =B
Au
s Modele de reference : ym =Bm
Amuc
l Loi de commande : u =T
Ruc −
S
Ry
l Nombreuses hypotheses sur A, B, Am, Bm, R, S, T
Commande adaptative - RTG12 Workshop 9 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Commande adaptative pour regler les coefficients de R, S, T
R(s) = sq + rq−1sq−1 + . . . r1s+ r0,
S(s) = sqsq + . . . s1s+ s0, T (s) = tqs
q + . . . t1s+ t0
l Parametres de commande
θc =(rq−1 · · · r0 sq · · · s0 tq · · · t0
)s Commande adaptative : ajuster les θci pour avoir y = ym
s Choix d’un cout a minimiser :
J1 = |e|, J2 =1
2e2...
ou e = y − ym
Commande adaptative - RTG12 Workshop 10 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
l Methode du gradient pour minimiser les parametres de commande :
dθcidt
= −γ ∂J∂θci
s Pour J2 on trouvedθcidt
= −γe ∂e∂θci
l Connaıtre en temps reel∂e
∂θci?
Commande adaptative - RTG12 Workshop 11 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
l Regle du MIT :
∂e
∂ti' si
AoAmuc ,
∂e
∂si' − si
AoAmy ,
∂e
∂ri' − si
AoAmu
ou Ao polynome aux dynamiques rapides (le plus souvent = 1).
l Les regles d’adaptation sont realisables a l’aide de filtres et d’integrateurs
s Exemple pour cout J2 :
dsidt
= γesi
AoAmy +
− εm
i
si
Σ(θ,δ)
yθ,δ
*γs
y
Σ
A Aso m
m
Commande adaptative - RTG12 Workshop 12 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
l Remarques :
s Resultat est heuristique : pas de garantie (ni suivi de reference, ni stabilite)
s Si l’ordre du systeme est inconnu :
choisir Ao et degres de R, S et T intuitivement
s Stabilite implique convergence de e = y − yms Aucune indication sur la convergence des gains du correcteur
Commande adaptative - RTG12 Workshop 13 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu
−++
−
uc e
mG
kIs+f
ωω
l Boucle de regulationS
R=
s0
s+ r0, Precommande
T
R=
t0s+ r0
+−− 1
s
u
ω
cω t
s
r
o
o
o
so = γe[ 1Amω]
to = −γe[ 1Amωc]
ro = γe[ 1Amu]
Commande adaptative - RTG12 Workshop 14 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = 1s+1
, Gm(s) = 6s2+5s+6
, γ = 0.6,
l ωc(t) creneau de periode 20s, valeur max = 0.375, valeur min = −0.125
0 20 40 60 80 100 120 140 160 180 200 220
−0.1
0
0.1
0.2
0.3
0.4
0.5
s Relativement bonne convergence
Commande adaptative - RTG12 Workshop 15 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = 10(s+0.8)(s+8)
, Gm(s) = 6s2+5s+6
, γ = 0.6,
l ωc(t) creneau de periode 20s, valeur max = 0.375, valeur min = −0.125
0 20 40 60 80 100 120 140 160−0.2
−0.1
0
0.1
0.2
0.3
0.4
0.5
0.6
s Parait robuste
Commande adaptative - RTG12 Workshop 16 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = 10(s+0.8)(s+8)
, Gm(s) = 6s2+5s+6
, γ = 0.6,
l ωc(t) creneau de periode 20s, valeur max = 0.375, valeur min = −0.125
0 20 40 60 80 100 120 140 160
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
t0
s0
r0
s Convergence lente (deux periodes) - augmenter γ pour accelerer
Commande adaptative - RTG12 Workshop 17 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = 10(s+0.8)(s+8)
, Gm(s) = 6s2+5s+6
, γ = 6,
l ωc(t) creneau de periode 20s, valeur max = 0.375, valeur min = −0.125
0 20 40 60 80 100 120 140 160
0
0.2
0.4
0.6
0.8
1
t0
s0
r0
s Les gains sont rapidement plus grands (et tres differents...)
Commande adaptative - RTG12 Workshop 18 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = 10(s+0.8)(s+8)
, Gm(s) = 6s2+5s+6
, γ = 6,
l ωc(t) creneau de periode 20s, valeur max = 0.375, valeur min = −0.125
0 20 40 60 80 100 120 140 160
−0.2
−0.1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
ω
ωm
s Le transitoire (avant convergence des gains adaptatifs)
plus court, mais avec fort depassement
Commande adaptative - RTG12 Workshop 19 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = 10(s+0.8)(s+8)
, Gm(s) = 6s2+5s+6
, γ = 60,
l ωc(t) creneau de periode 20s, valeur max = 0.375, valeur min = −0.125
0 10 20 30 40 50 60 70 80 90 100−0.2
0
0.2
0.4
0.6
0.8
1
ω
ωm
s Le transitoire tres court, mais avec fort depassement
s Suivi de reference parfait une fois que les gains ont converge
Commande adaptative - RTG12 Workshop 20 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = 10(s+0.8)(s+8)
, Gm(s) = 6s2+5s+6
, γ = 60,
l ωc(t) creneau de periode 20s, valeur max = 0.375, valeur min = −0.125
0 10 20 30 40 50 60 70 80 90 100
−1
0
1
2
3
4
5
6
t0
s0
r0
s Les gains semblent vraiment converger
Commande adaptative - RTG12 Workshop 21 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = 10(s+0.8)(s+8)
, Gm(s) = 6s2+5s+6
, γ = 60,
l ωc(t) creneau de periode 20s, valeur max = 0.075, valeur min = −0.025
0 50 100 150
−0.04
−0.02
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
ω
ωm
s L’amplitude de l’erreur etant faible, la convergence est lente
s Possibilite pour eviter ces phenomenes : adapter γ
Commande adaptative - RTG12 Workshop 22 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = 10(s2+s+1)
, Gm(s) = 6s2+5s+6
, γ = 60,
l ωc(t) creneau de periode 20s, valeur max = 0.375, valeur min = −0.125
0 10 20 30 40 50 60 70 80 90 100−1
0
1
2
3
4
5
ω
ωm
s Ce n’est quand meme pas parfait pour tout systeme
s Degres du regulateur RST sous hypothese d’un systeme du 1er ordre
Commande adaptative - RTG12 Workshop 23 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = −1.1s+10(s2+s+1)
, Gm(s) = 6s2+5s+6
, γ = 60,
l ωc(t) creneau de periode 20s, valeur max = 0.375, valeur min = −0.125
200 220 240 260 280 300 320 340 360 380 400−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
ω
ωm
s Il peut y avoir des phenomenes instables : ‘burst’
Commande adaptative - RTG12 Workshop 24 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = −1.1s+10(s2+s+1)
, Gm(s) = 6s2+5s+6
, γ = 60,
l ωc(t) creneau de periode 20s, valeur max = 0.375, valeur min = −0.125
330 335 340 345 350 355 3600
200
400
600
800
1000
1200
1400
1600
1800
2000
t0
s0
r0
s Ce ne sont evidement pas des valeurs de gain realisables
Commande adaptative - RTG12 Workshop 25 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Modification des lois d’adaptation
l σ-modification : Empecher les gains de diverger
(en particulier sous l’effet de bruits de mesure)
so = γe[ 1Amω]
to = −γe[ 1Amωc]
ro = γe[ 1Amu]
−→so = γ
1+βe2e[ 1Amω]− σso
to = − γ1+βe2
e[ 1Amωc]− σto
ro = γ1+βe2
e[ 1Amu]− σro
s Pas de point d’equilibre possible pour les gains
Commande adaptative - RTG12 Workshop 26 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = 10(s+0.8)(s+8)
, Gm(s) = 6s2+5s+6
, γ = 60, β = 0.1, σ = 10−4,
l ωc(t) creneau de periode 20s, valeur max = 0.75, valeur min = −0.25
0 20 40 60 80 100 120 140 160 180 200
0
0.5
1
1.5
2
ω
ωm
s Bon reglage de l’algorithme d’adaptation : bonnes performances de suivi
Commande adaptative - RTG12 Workshop 27 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Exemple : moteur a courant continu - Simulations
lG(s) = 10(s+0.8)(s+8)
, Gm(s) = 6s2+5s+6
, γ = 60, β = 0.1, σ = 10−4,
l ωc(t) creneau de periode 20s, valeur max = 0.75, valeur min = −0.25
0 50 100 150 200 250 300−5
0
5
10
15
20
t0
s0
r0
s Bon reglage de l’algorithme d’adaptation : gains raisonnables, varient peu
Commande adaptative - RTG12 Workshop 28 Novembre 2011, Toulouse
Ê MRAC dans le cas SISO et regle du MIT
n Conclusions
l Algorithme du gradient potentiellement satisfaisant
s Robustesse relativement grande - mais non prouvee
s Pas besoin de connaıtre le modele du systeme
s γ influe sur la vitesse de convergence, a regler par experimentations
s β, σ modifications, a regler par experimentations
l Aucune preuve de stabilite/performance
s Quelles hypotheses a faire sur le systeme ?
s Est-il possible de stabiliser des systemes instables ?
s Extensions aux systemes MIMO ?
s Comment garantir des gains bornes/realisables ?
Commande adaptative - RTG12 Workshop 29 Novembre 2011, Toulouse
Plan
Ê MRAC dans le cas SISO et regle du MIT
s Basee sur probleme de regulation a 2 degres de liberte (RST)
s Methode de gradient issue des techniques d’estimation
s Regle heuristique
Ë Stabilisation par PBAC - le cas MIMO
s Hypotheses de type passivite sur les systemes
s Preuves de stabilite avec theorie de Lyapunov
Ì PBMRAC
Í Cas des systemes non passifiables
Commande adaptative - RTG12 Workshop 30 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
n Commande adaptative basee sur la passivite (PBAC)
s Hypotheses de type passivite sur les systemes
s Preuves de stabilite avec theorie de Lyapunov
w
m
+−
cΣ (θ )
θc y
Σ
θ,δy
e
Σ(θ,δ)c
yc
u
m
l Dans un premier temps on suppose yc = 0
l On veut montrer que le systeme est stable
Commande adaptative - RTG12 Workshop 31 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
n Systemes passifs
l Systeme non-lineaire x = f(x, v), z = g(x, v) est passif si
s il est carre : nombre d’entrees v = nombre de sorties z,
s pour des CI nulles x(0) = 0, pour tout v et pour tout t ≥ 0, on a∫ t
0
zT (t)v(t)dt ≥ 0
l Passivite : produit scalaire entrees/sorties est positif
“sorties vont dans le meme sens que les entrees”
l Propriete de nombreux systemes
l Pour les systemes mecaniques (entrees : forces - sorties : vitesse),
l’integrale correspond a l’energie accumulee dans le systeme
Commande adaptative - RTG12 Workshop 32 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
n Theoreme - Systemes passifs
Un systeme est strictement passif s’il existe une fonction V : Rn → R
s nulle a l’origine : V (0) = 0
s definie-positive : V (x) > 0 ∀x 6= 0
s dont les derivees le long des trajectoires du systeme verifient
V (x) ≤ zTv − εxTx
l V : “storage function”
l aussi fonction de Lyapunov prouvant la stabilite asymptotique du systeme
Commande adaptative - RTG12 Workshop 33 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
n Retroaction de systemes passifs
l Soient deux systemes avec le meme nombre d’entrees/sorties
x1 = f1(x1, v1) , z1 = g1(x1, v1)
x2 = f2(x2, v2) , z2 = g2(x2, v2)
s s’ils sont tous les deux strictement passifs
s alors l’interconnexion v2 = z1, v1 = −z2 est asymptotiquement stable
l Preuve V1 + V2 ≤ zT1 v1 + zT2 v2︸ ︷︷ ︸=0
−ε1xT1 x1 − ε2xT2 x2 < 0
l Cas particulier : z2(t) = ∆K(t)v2(t) avec ∆K(t) + ∆TK(t) � 0
s un cone de gains statiques qui preservent la stabilite de la boucle fermee
s les gains peuvent varier dans le temps, quelle que soit la regle, adaptative ?
Commande adaptative - RTG12 Workshop 34 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
l Conditions de strict-passivite des systemes lineaires :
P = P T � 0 :
ATP + PA+ 2ε1 PB − CT
BTP − C −D −DT
� 0
s Preuve : V = 12xTPx(
x
w
)T [ATP + PA+ 2ε1 PB − CT
BTP − C −D −DT
](x
w
)= 2(V − zTw + εxTx) ≤ 0
s Dans le cas des systemes sans transfert direct (D = 0)
P = P T � 0 , ATP + PA+ 2ε1 � 0 , PB = CT
Commande adaptative - RTG12 Workshop 35 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
n [Fra74, BK85] Theoreme
l Passification par retour de sortie adaptatif des systemes “presque passifs”
l S’il existe un retour de sortie statique u = −Fy qui rend le systeme
x = Ax+Bu+Bv, y = Cx, z = y
strictement passif en boucle fermee, alors, pour tout Γ � 0,
la commande adaptative
u = −Ky, K = yyTΓ
rend le systeme passif en boucle fermee.
Commande adaptative - RTG12 Workshop 36 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
l Preuve intuitive
s Existence d’un retour de sortie passifiant :
⇒ x = (A−BFC)x+Bv, z = Cx est passif
⇒ ∀∆TK + ∆K � 0 x = (A−BFC −B∆KC)x est stable
s En prenant ∆K suffisamment grand,
tout K = F + ∆K , K +KT � 0, stabilise le systeme
s La loi adaptative K = yyTΓ “pousse” les gains a devenir “grands”
dans la direction K +KT � 0
s Tand que y n’a pas converge a zero,
la loi tend a augmenter le gain de commande
Commande adaptative - RTG12 Workshop 37 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
l Preuve par la theorie de Lyapunov
s On souhaite prouver la passivite du systeme non lineaire :
x(t) = (A−BK(t)C)x(t)+Bv(t) , K(t) = y(t)yT (t)Γ , z(t) = Cx(t)
s sous l’hypothese qu’il existe un gain Ko strictement passifiant :
∃F, P � 0, ε > 0 :
(A−BFC)TP + P (A−BFC) + 2ε1 � 0 , PB = CT
s Choix d’une fonction de Lyapunov qui depend de tous les etats
V (x,K) =1
2
(xTPx+ Tr
((K − F )Γ−1(K − F )T
))s Il suffit de demontrer que V ≤ zTv, le long des trajectoires
Commande adaptative - RTG12 Workshop 38 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
l Preuve par la theorie de Lyapunov
V (x,K) =1
2
(xTPx+ Tr
((K −Ko)Γ
−1(K −Ko)T))
s Calcul de sa derivee
V = xTPx+ Tr(KΓ−1(K −Ko)
T)
s Trajectoires : x = (A−BKC)x+Bv, K = yyTΓ
V = xT (A−BKC)TPx+ vTBTPx+ Tr(yyT (K −Ko)
T)
s Propriete de l’operateur trace : Tr(AB) = Tr(BA) :
Tr(yyT (K −Ko)
T)
= Tr(yT (K −Ko)
Ty)
= yT (K −Ko)Ty
s Donc comme y = Cx on a
V = xT (A−BKC)TPx+ vTBTPx+ xTCT (K −Ko)TCx
Commande adaptative - RTG12 Workshop 39 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
n Conditions pour qu’un systeme lineaire soit stabilisable par PBAC [Fra03]
l Cas des systemes SISO, y = H(s)u :
s Le systeme doit etre stabilisable par u = −ky avec k > 0 grand
s Lieu d’Evans : H(s) ne doit pas avoir de zeros instables
s Lieu d’Evans : H(s) doit etre de degre relatif≤ 1
l Cas des systemes MIMO : (A,B,C) a hyper minimum de phase
s det(sI − A) det(C(sI − A)−1B) a toutes ses racines stables (zeros)
s CB = (CB)T � 0, gain haute frequence est defini positif
(le degre relatif du systeme≤ m ou m : nb d’entrees)
l Limitations
s Systemes carres (CB est carree), et tels que CB = (CB)∗ � 0
s Degre relatif≤ m et zeros stables
Commande adaptative - RTG12 Workshop 40 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
n PBAC modifiee pour les systemes non-carres
n [Fra03] Theoreme
l S’il existe un retour de sortie statique u = −Koy,
et une matrice G qui rendent le systeme
x = Ax+Bu+Bv, y = Cx, z = Gy
strictement passif en boucle fermee, alors, pour tout Γ � 0,
la commande adaptative
u = −Ky, K = GyyTΓ
rend le systeme passif en boucle fermee.
s Exercice : demontrer le theoreme
l Applicable si le nombre de sorties est superieur au nombre de commandes
Commande adaptative - RTG12 Workshop 41 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
n Exemple - Modele avion - longitudinal
l x =(α q
)T, α incidence, q vitesse de tangage,
l u = δ braquage de gouverne
x =
zα 1
mα mq
x+
0
mδ
u , y = x
s Matrice de transfert :
y =mδ
s2 − (zα +mq)s+ zαmq −mα
1
s− zα
u
Commande adaptative - RTG12 Workshop 42 Novembre 2011, Toulouse
Ë Stabilisation par PBAC
n Exemple - Modele avion
s Combinaison lineaire des sorties z =[g1 g2
]y :
z
u=
mδg2(s− zα + g1/g2)
s2 − (zα +mq)s+ zαmq −mα
est a hyper minimum de phase si g1/g2 − zα > 0 et mδg2 > 0
s En prenant g2 = sign(mδ) (mδ doit etre de signe connu)
et en prenant |g1| suffisamment grand devant valeurs attendues de zα
u = −Ky , K = GyyTΓ
stabilise le systeme pour toute valeur des parametres.
s Γ (et β, σ modifications) a regler en simulation.
Commande adaptative - RTG12 Workshop 43 Novembre 2011, Toulouse
Plan
Ê MRAC dans le cas SISO et regle du MIT
s Basee sur probleme de regulation a 2 degres de liberte (RST)
s Methode de gradient issue des techniques d’estimation
s Regle heuristique
Ë Stabilisation par PBAC - le cas MIMO
s Hypotheses de type passivite sur les systemes
s Preuves de stabilite avec theorie de Lyapunov
Ì PBMRAC
Í Cas des systemes non passifiables
Commande adaptative - RTG12 Workshop 44 Novembre 2011, Toulouse
Ì PBMRAC
n MRAC basee sur la passivite
w
m
+−
cΣ (θ )
θc y
Σ
θ,δy
e
Σ(θ,δ)c
yc
u
m
l Jusqu’ici yc = 0 et commande u(t) = −K(t)y(t)
l Cas avec modele de reference : u = −K(t)e(t)+L(t)xm(t)+M(t)yc(t)
sK(t) a pour role de stabiliser la boucle (comme precedemment)
s L(t) et M(t) definissent une pre-commande pour le suivi de la reference
l Etude menee pour les systemes lineaires (linearise d’un modele non-lineaire)
Commande adaptative - RTG12 Workshop 45 Novembre 2011, Toulouse
Ì PBMRAC
n Hypotheses sur le systeme
l Le systeme est “presque passif” :
Il existe un retour de sortie statique u = −Koy,
et une matrice G qui rendent le systeme
x = Ax+Bu+Bv, y = Cx, z = Gy
strictement passif en boucle fermee
l Il existe une pre-commande Lo, Mo qui permet le suivi parfait :
xo = Axo +B(Loxm +Moyc) ⇒ Cxo = ym
ou xm est l’etat du modele de reference (dont l’ordre peut etre 6= n)
xm = Amxm +Bmyc , ym = Cmxm
s Hypothese forte, equivalente aux hypotheses sur regulateurs RST
Commande adaptative - RTG12 Workshop 46 Novembre 2011, Toulouse
Ì PBMRAC
n MRAC basee sur la passivite
w
m
+−
cΣ (θ )
θc y
Σ
θ,δy
e
Σ(θ,δ)c
yc
u
m
l Si les hypotheses sont verifies, alors pour tous ΓK � 0, ΓL � 0, ΓM � 0,
la loi de commande
u = −K(t)e(t) + L(t)xm(t) +M(t)yc(t) , e = y − ymK = GeeTΓK , L = −GexTmΓL , M = −GeyTc ΓM
est telle que lim(x(t)− xo(t)) = 0.
Commande adaptative - RTG12 Workshop 47 Novembre 2011, Toulouse
Ì PBMRAC
n PBMRAC pour une classe de systemes nonlineaires
x = Ax+ Aφφ(y, u, t) +Bu , y = Cx
l La loi de commande suivante stabilise le systeme et x(t)→ xm(t).
u = −Ke+ Lxm +Myc +Nφ , e = y − ymK = GeeTΓK , L = −GexTmΓL , M = −GeyTc ΓM , N = −GeφTΓN
s Example : systeme sature
x = Ax+Bsat(u) = Ax+Bu−Bdz(u)
Le terme Ndz(u) de la commande est un anti-windup.
s En pratique si yc n’est pas constante N(t) diverge...
Commande adaptative - RTG12 Workshop 48 Novembre 2011, Toulouse
Ì PBMRAC
n Conclusions sur PBMRAC
l Fort potentiel d’application pour les systemes “presque passifs”
(existence de G et Ko tels que G(H(s) ? Ko) est passif
l Loi d’adaptation de la forme K = GeeTΓ
s Tant que e n’a pas converge les gains s’adaptent, dans la direction G
s Ils peuvent potentiellement diverger
s Si (transitoirement) ||e|| est grand, alors K est grand (pas realisable)
l Possibilite de faire β, σ modifications :
K = GeeTΓ(1 + eTβe)−1 − σK
s mais les preuves de stabilite ne tiennent plus ...
s Ici dans le cas β = 0
V ≤ −ε||x− xo||2 − σTr(KΓ−1(K −Ko)T ) ≤ 0?
Si K est bornee, on peut avoir V ≤ 0 pour ||x− xo|| ≥ ρ : stabilite pratique
Commande adaptative - RTG12 Workshop 49 Novembre 2011, Toulouse
Plan
Ê MRAC dans le cas SISO et regle du MIT
s Basee sur probleme de regulation a 2 degres de liberte (RST)
s Methode de gradient issue des techniques d’estimation
s Regle heuristique
Ë Stabilisation par PBAC - le cas MIMO
s Hypotheses de type passivite sur les systemes
s Preuves de stabilite avec theorie de Lyapunov
Ì PBMRAC
Í Cas des systemes non passifiables
Commande adaptative - RTG12 Workshop 50 Novembre 2011, Toulouse
Í Cas des systemes non passifiables
n Passivity-Based Adaptive Control [Fradkov 1974, 2003]
& Simple Adaptive Control [Kaufman, Barkana, Sobel 94]
l Let Σ ∼ (A,B,C,D) be a MIMO system with m inputs / p ≥ m outputs.
l If ∃ (G,F ) ∈ (Rp×m)2 such that the following system is passive
uΣ
y+
zv
F
G
l then the following adaptive law stabilizes the system for all Γ > 0
K = −GyyTΓ , u = Ky
Commande adaptative - RTG12 Workshop 51 Novembre 2011, Toulouse
Í Cas des systemes non passifiables
n Underlying properties
l Passivity implies that for all ∆ + ∆∗ ≥ 0 the following system is stable
zΣ
yv+
u
−∆
F
G
l i.e. all gains (F −∆G) stabilize the system, for ∆ + ∆∗ ≥ 0, possibly large
l K = −GyyTΓ “pushes” the gains in that direction until stability is reached
s In practice : Need to limit growth of K . Modifications of adaptive law
K = −GyyTΓ + φ(K) (eg. φ(K) = −σK)
Commande adaptative - RTG12 Workshop 52 Novembre 2011, Toulouse
Í Cas des systemes non passifiables
n What if Σ is not passifiable by (G,F ) ?
l ∃S a feedthrough (or Shunt) such that the following system is passive
Σz
+yv
+u
F
S
G
l then the adaptive law stabilizes the system Σ + S.
s [KBS94] For SISO Σ one can takeS(s) = F−1S (s) whereFS is stabilizing
s In practice : S should be small for tracking issues (u = K(y + Su))
s Rq : The actual gain is bounded
K = (1−KS)−1K
Σ
K +
u
K
y
S
Commande adaptative - RTG12 Workshop 53 Novembre 2011, Toulouse
Í Cas des systemes non passifiables
n Proposed result [PDPM11]
lK bounded thanks to a modification of the adaptive law :
K = −GyyTΓ− ψD(K) · (K − F ) , u = Ky
s ψD is a deadzone : no modification when K is close to F
ψD(K) = 0 if ||K − F ||2• ≤ ν
sψD is a barrier : goes to infinity whenK reaches border of accepted region
ψD(K)→ +∞ if ||K − F ||2• → νβ (β > 1)
Commande adaptative - RTG12 Workshop 54 Novembre 2011, Toulouse
Í Cas des systemes non passifiables
n LMI-based design of (G,D = µ21, ν) assuming a given stabilizing F
l Step 1 (LMI) : minimize µ such that
x = A(F )x+Bw,
z = GCx+ µ2w
is passive :[AT (F )P + PA(F ) PB − CTGT
BTP −GC −µ1
]< 0
l Step 2 (LMI) : maximize ν, the size of admissible adaptive gains T (F − F )T
(F − F ) µ−11
≥ 0, Tr(T ) ≤ νµ,
Q > 0,
AT (F )Q+QA(F ) + νµβCTC
+R+ CT (GT (F − F ) + (F − F )TG)C
< 0. R QB − CTGT
BTQ−GC µ1
≥ 0,
Commande adaptative - RTG12 Workshop 55 Novembre 2011, Toulouse
Í Cas des systemes non passifiables
n LMI-based design of (G,D = µ21, ν) assuming a given stabilizing F
s Procedure guaranteed to succeed if F stabilizes the system
sK remains in a convex set around F (appreciated by engineers)
s ν may be small, i.e. small admissible adaptation (K ' F )
s LMI results can be easily extended to uncertain systems
⇒ proof of robustness of adaptive control for given uncertainty set
s In the robust case, step 2 is based on the existence of a PDSOF F (θ)
Compared to F (θ), the adaptive gain K needs not the estimation of θ
s Lyapunov function for global (robust) stability of PBAC
V (x,K, θ) = xTQ(θ)x+ Tr((K − F (θ))Γ−1(K − F (θ))T )
Commande adaptative - RTG12 Workshop 56 Novembre 2011, Toulouse
Conclusions
n LMI-based method that guarantees (robust) stability of PBAC
l Applies to any stabilizable LTI MIMO system
l Adaptive gains remain bounded
l Adaptive gains remain close to known value F
l With σ-modification : converge to known value F0
K = −GyyTΓ− ψD(K) · (K − F )− σ(K − F0)
n Prospectives
l Enlarge admissible region for K
l Structured control (decentralized etc.)
l Guaranteed robustness for time-varying uncertainties
l Take advantage of flexibilities on G for engineering issues (saturations...)
l ...
Commande adaptative - RTG12 Workshop 57 Novembre 2011, Toulouse
REFERENCES Quelques references REFERENCES
References
[AKO07] A. Astolfi, D. Karagiannis, and R. Ortega, Nonlinear and adaptive
control with applications, Communications and Control Engineering,
Springer-Verlag, 2007.
[AOS00] A. Astolfi, R. Ortega, and R. Sepulchre, Control of complex systems,
ch. Passivity–based control of Nonlinear Systems, Springer, London,
2000.
[AW89] K.J. Astrom and B. Wittenmark, Adaptive control, Addison-Wesley,
1989.
[BK85] I. Barkana and H. Kaufman, Global stability and performance of an
adaptive control algorithm, Int. J. Control 42 (1985), no. 6, 1491–
1505.
Commande adaptative - RTG12 Workshop 58 Novembre 2011, Toulouse
REFERENCES Quelques references REFERENCES
[FFY81] V. Fomin, A. Fradkov, and V. Yakubovich, Adaptive control of dynamic
plants, Nauka, Moscow, 1981, In Russian.
[Fra74] A.L. Fradkov, Adaptive stabilization of a linear dynamic plant, Autom.
Remote Contr. 35 (1974), no. 12, 1960–1966.
[Fra90] , Adaptive control of complex systems, Nauka, 1990, in Rus-
sian.
[Fra03] , Passification of non-square linear systems and feedback
Yakubovich-Kalman-Popov lemma, European J. of Control 6 (2003),
573–582.
[HC98] W.M. Haddad and V.-S. Chellaboina, Nonlinear fixed-order dynamic
compensation for passive systems, International Journal of Robust
and Nonlinear Control 8 (1998), 349–365.
[IF06] P. Ioannou and B. Fidan, Adaptive control tutorial, Advances in Design
and Control, SIAM, 2006.
Commande adaptative - RTG12 Workshop 59 Novembre 2011, Toulouse
REFERENCES Quelques references REFERENCES
[IS96] P. Ioannou and J. Sun, Robust adaptive control, Prentice Hall, Inc,
1996.
[KBS94] H. Kaufman, I. Barkana, and K. Sobel, Direct adaptive control algo-
rithms, Springer, New York, 1994.
[PDPM11] D. Peaucelle, A. Drouot, C. Pittet, and J. Mignot, Simple adaptive
control without passivity assumptions and experiments on satellite at-
titude control DEMETER benchmark, IFAC World Congress, August
2011.
[PKP09] D. Peaucelle, H.M. Khan, and P.V. Pakshin, LMI-based analysis of ro-
bust adaptive control for linear systems with time-varying uncertainty,
Autom. Remote Contr. 70 (2009), no. 9, 1540–1552.
Commande adaptative - RTG12 Workshop 60 Novembre 2011, Toulouse