381

Control Adaptativo y Robusto

Embed Size (px)

Citation preview

Page 1: Control Adaptativo y Robusto
Page 2: Control Adaptativo y Robusto
Page 3: Control Adaptativo y Robusto
Page 4: Control Adaptativo y Robusto

Indice general1 Introducci�on al problema del control realimentado 11.1 Introducci�on : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 11.2 Los bene�cios de la realimentaci�on : : : : : : : : : : : : : : : : : : : 21.3 Sensibilidad en bucle abierto y en bucle cerrado. : : : : : : : : : : : : 31.4 An�alisis y dise~no en presencia de incertidumbres : : : : : : : : : : : : 51.5 Posibles planteamientos : : : : : : : : : : : : : : : : : : : : : : : : : 61.6 Sistemas de tiempo continuo y de tiempo discreto : : : : : : : : : : : 72 Control adaptativo 92.1 Introducci�on : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 92.2 Controladores adaptativos con modelo de referencia (MRAC) : : : : : 132.3 Reguladores autoajustables (STR) : : : : : : : : : : : : : : : : : : : : 162.4 Ejemplo simple : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 172.5 >Porqu�e control adaptativo? : : : : : : : : : : : : : : : : : : : : : : : 192.6 El problema del control adaptativo : : : : : : : : : : : : : : : : : : : 23i

Page 5: Control Adaptativo y Robusto

ii Indice general3 Algoritmo de identi�caci�on de par�ametros 273.1 Introducci�on : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 273.2 Modelo del sistema y de las perturbaciones : : : : : : : : : : : : : : : 283.3 M�etodo de m��nimos cuadrados : : : : : : : : : : : : : : : : : : : : : : 293.3.1 Caso determinista : : : : : : : : : : : : : : : : : : : : : : : : : 303.3.2 Caso no determinista : : : : : : : : : : : : : : : : : : : : : : : 303.3.3 M�etodo recursivo : : : : : : : : : : : : : : : : : : : : : : : : : 323.4 M�etodo de m��nimos cuadrados extendidos y generalizados : : : : : : : 333.5 Aproximaci�on estoc�astica : : : : : : : : : : : : : : : : : : : : : : : : : 333.6 M�etodo de variable instrumental : : : : : : : : : : : : : : : : : : : : : 343.7 M�etodo de m�axima verosimilitud : : : : : : : : : : : : : : : : : : : : 353.8 Modi�caciones al algoritmo de identi�caci�on : : : : : : : : : : : : : : 353.9 Algoritmos de identi�caci�on r�apidos : : : : : : : : : : : : : : : : : : : 383.10 Estimaci�on de los valores de continua : : : : : : : : : : : : : : : : : : 383.11 Algoritmo de identi�caci�on propuesto : : : : : : : : : : : : : : : : : : 393.12 Convergencia e identi�cabilidad : : : : : : : : : : : : : : : : : : : : : 413.13 Ejemplo de identi�caci�on : : : : : : : : : : : : : : : : : : : : : : : : : 444 Control adaptativo por modelo de referencia 474.1 Introducci�on : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 474.2 Dise~no de controladores adaptativos : : : : : : : : : : : : : : : : : : : 484.2.1 Enfoque de sensibilidad : : : : : : : : : : : : : : : : : : : : : : 49

Page 6: Control Adaptativo y Robusto

Indice general iii4.2.2 M�etodo de Lyapunov : : : : : : : : : : : : : : : : : : : : : : : 504.2.3 M�etodo de hiperestabilidad : : : : : : : : : : : : : : : : : : : 544.3 Estructura general de los sistemas adaptativos (MRAC) : : : : : : : : 554.4 Ejemplos ilustrativos : : : : : : : : : : : : : : : : : : : : : : : : : : : 584.4.1 M�etodo del gradiente : : : : : : : : : : : : : : : : : : : : : : : 604.4.2 M�etodo de Lyapunov : : : : : : : : : : : : : : : : : : : : : : : 624.4.3 M�etodo de hiperestabilidad : : : : : : : : : : : : : : : : : : : 665 Reguladores autoajustables (STR) 735.1 Introducci�on : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 735.2 Asignaci�on de polos y ceros : : : : : : : : : : : : : : : : : : : : : : : 765.3 Casos particulares : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 805.4 Predicci�on �optima : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 815.5 Regulador de m��nima varianza : : : : : : : : : : : : : : : : : : : : : : 835.6 Control predictivo generalizado : : : : : : : : : : : : : : : : : : : : : 855.6.1 Formulaci�on del control predictivo generalizado : : : : : : : : 865.6.2 Consideraci�on de ruidos coloreados : : : : : : : : : : : : : : : 915.7 Controladores para plantas con par�ametros desconocidos : : : : : : : 925.8 Algoritmos con estructura expl��cita e impl��cita : : : : : : : : : : : : : 935.9 Propiedad de autosinton��a : : : : : : : : : : : : : : : : : : : : : : : : 965.10 Procedimiento de s��ntesis : : : : : : : : : : : : : : : : : : : : : : : : : 985.11 Ejemplos ilustrativos : : : : : : : : : : : : : : : : : : : : : : : : : : : 99

Page 7: Control Adaptativo y Robusto

iv Indice general5.11.1 Ejemplo de m��nima varianza : : : : : : : : : : : : : : : : : : : 995.11.2 Control adaptativo PI : : : : : : : : : : : : : : : : : : : : : : 1005.11.3 Control de robot m�ovil : : : : : : : : : : : : : : : : : : : : : : 1026 Autoajuste y ajuste por tabla de controladores 1136.1 Introducci�on : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1136.2 Control PID : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1156.3 M�etodos de respuesta transitoria : : : : : : : : : : : : : : : : : : : : 1166.3.1 M�etodo de respuesta en escal�on de Ziegler-Nichols : : : : : : : 1176.3.2 Caracterizaci�on de la respuesta en escal�on : : : : : : : : : : : 1176.4 M�etodos basados en realimentaci�on con rel�e : : : : : : : : : : : : : : 1186.4.1 El m�etodo del balance arm�onico : : : : : : : : : : : : : : : : : 1196.4.2 El m�etodo de Ziegler-Nichols en bucle cerrado : : : : : : : : : 1216.4.3 Oscilaciones de rel�e : : : : : : : : : : : : : : : : : : : : : : : : 1216.5 Ajuste por tabla : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1236.6 Dise~no de reguladores con ajuste por tabla : : : : : : : : : : : : : : : 1246.6.1 Actuador no lineal : : : : : : : : : : : : : : : : : : : : : : : : 1256.6.2 Tanque de secci�on variable : : : : : : : : : : : : : : : : : : : : 1266.6.3 Transformaci�on no lineal : : : : : : : : : : : : : : : : : : : : : 1297 Aplicaci�on de control adaptativo 1337.1 Introducci�on : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 133

Page 8: Control Adaptativo y Robusto

Indice general v7.2 Descripci�on de la planta : : : : : : : : : : : : : : : : : : : : : : : : : 1347.3 Modelo din�amico del campo : : : : : : : : : : : : : : : : : : : : : : : 1367.3.1 Modelo concentrado : : : : : : : : : : : : : : : : : : : : : : : 1367.3.2 Modelo distribuido : : : : : : : : : : : : : : : : : : : : : : : : 1377.4 Control en adelanto : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1407.5 Control en bucle cerrado : : : : : : : : : : : : : : : : : : : : : : : : : 1407.5.1 Controlador PI : : : : : : : : : : : : : : : : : : : : : : : : : : 1417.5.2 Controlador PI por asignaci�on de polos : : : : : : : : : : : : : 1427.5.3 Controlador autoajustable : : : : : : : : : : : : : : : : : : : : 1437.5.4 Controlador PID adaptativo : : : : : : : : : : : : : : : : : : : 1447.5.5 Controlador predictivo generalizado : : : : : : : : : : : : : : : 1467.5.6 Supervisi�on : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1487.6 Estudios de simulaci�on : : : : : : : : : : : : : : : : : : : : : : : : : : 1507.7 Resultados en planta : : : : : : : : : : : : : : : : : : : : : : : : : : : 1528 El problema del control robusto 1598.1 Introducci�on : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1598.2 Relaciones fundamentales : : : : : : : : : : : : : : : : : : : : : : : : 1638.3 Descripci�on de las incertidumbres : : : : : : : : : : : : : : : : : : : : 1718.4 Estabilidad robusta : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1768.5 Comportamiento robusto : : : : : : : : : : : : : : : : : : : : : : : : : 1878.6 Robustez de plantas con fuerte ganancia direccional : : : : : : : : : : 190

Page 9: Control Adaptativo y Robusto

vi Indice general9 M�etodos de dise~no LTR 1979.1 Introducci�on : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1979.2 Propiedades del regulador LQR : : : : : : : : : : : : : : : : : : : : : 1989.3 El controlador LQG : : : : : : : : : : : : : : : : : : : : : : : : : : : : 2049.4 Controlador LTR basado en observador : : : : : : : : : : : : : : : : : 2079.4.1 M�etodo LQG/LTR-i : : : : : : : : : : : : : : : : : : : : : : : 2079.4.2 M�etodo LQG/LTR-o : : : : : : : : : : : : : : : : : : : : : : : 2109.5 Controlador LTR no basado en observador : : : : : : : : : : : : : : : 2129.6 Controlador LTR=H1 : : : : : : : : : : : : : : : : : : : : : : : : : : 22110 Controladores H1 22710.1 Introducci�on : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 22710.2 Justi�caci�on del control H1 : : : : : : : : : : : : : : : : : : : : : : : 22810.2.1 Interpretaci�on H1 del comportamiento nominal : : : : : : : : 22810.2.2 Interpretaci�on H1 de la estabilidad robusta : : : : : : : : : : 23110.2.3 Control H1 y la teor��a de juegos diferencial : : : : : : : : : : 23310.3 Planteamiento del problema general de control : : : : : : : : : : : : : 23410.3.1 Problema de seguimiento : : : : : : : : : : : : : : : : : : : : : 23710.3.2 Problema de estabilidad robusta : : : : : : : : : : : : : : : : : 23810.4 Parametrizaci�on de los controladores : : : : : : : : : : : : : : : : : : 23910.4.1 El problema de ajuste del modelo : : : : : : : : : : : : : : : : 24210.4.2 Aplicabilidad del teorema de Nehari : : : : : : : : : : : : : : : 244

Page 10: Control Adaptativo y Robusto

Indice general vii10.5 Soluciones al problema de ajuste del modelo : : : : : : : : : : : : : : 24610.5.1 El problema escalar : : : : : : : : : : : : : : : : : : : : : : : : 24610.5.2 Optimizaci�on del comportamiento nominal : : : : : : : : : : : 24810.6 Problemas de control H2; H1 en el espacio de estados : : : : : : : : : 25310.6.1 Controlador �optimo H2 : : : : : : : : : : : : : : : : : : : : : : 25510.6.2 Relaci�on entre LQG/LTR y H2 : : : : : : : : : : : : : : : : : 25710.6.3 Controlador H1 : : : : : : : : : : : : : : : : : : : : : : : : : : 25910.6.4 Algoritmo de c�alculo del regulador H1 : : : : : : : : : : : : : 26210.6.5 Ejemplos ilustrativos : : : : : : : : : : : : : : : : : : : : : : : 26411 Aplicaci�on de control robusto 27711.1 Introducci�on : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 27711.2 Descripci�on de la planta : : : : : : : : : : : : : : : : : : : : : : : : : 28011.3 Evaluaci�on de los controladores : : : : : : : : : : : : : : : : : : : : : 29111.4 Dise~no de controladores LTR multivariables : : : : : : : : : : : : : : 29211.4.1 Dise~no LTR-o : : : : : : : : : : : : : : : : : : : : : : : : : : : 29311.4.2 Dise~no LTR-i : : : : : : : : : : : : : : : : : : : : : : : : : : : 29711.5 Dise~no de controladores H2 y H1 multivariables : : : : : : : : : : : : 30411.5.1 Controladores H1 para sistema de orden elevado : : : : : : : 30611.5.2 Regulador H1 para una planta no lineal : : : : : : : : : : : : 31311.6 S��ntesis de los resultados obtenidos : : : : : : : : : : : : : : : : : : : 318

Page 11: Control Adaptativo y Robusto

viii Indice generalA An�alisis de los sistemas de control basados en observador 321A.1 An�alisis de robustez con y sin observador : : : : : : : : : : : : : : : : 321A.2 Condici�on su�ciente para la recuperaci�on : : : : : : : : : : : : : : : : 323A.3 Planteamiento del M�etodo LQG en el Dominio de la Frecuencia : : : 325A.4 Regulador LQG obtenido mediante ecuaci�on diof�antica : : : : : : : : 329B Elementos matem�aticos �utiles en la teor��a de control 331B.1 Polos y ceros de un sistema multivariable : : : : : : : : : : : : : : : : 331B.2 Normas : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 333B.3 Los Valores Singulares : : : : : : : : : : : : : : : : : : : : : : : : : : 334B.4 Los Valores Propios : : : : : : : : : : : : : : : : : : : : : : : : : : : : 337B.5 La Matriz de Ganancia Relativa : : : : : : : : : : : : : : : : : : : : : 339C De�niciones y algoritmos relacionados con la teor��a H1 343C.1 Algunas de�niciones : : : : : : : : : : : : : : : : : : : : : : : : : : : 343C.2 El operador de Riccati : : : : : : : : : : : : : : : : : : : : : : : : : : 345C.3 El problema de aproximaci�on de Hankel : : : : : : : : : : : : : : : : 346C.4 El algoritmo de Glover : : : : : : : : : : : : : : : : : : : : : : : : : : 348

Page 12: Control Adaptativo y Robusto

Indice general ix

Page 13: Control Adaptativo y Robusto

x Indice general

Page 14: Control Adaptativo y Robusto

Pr�ologoEste libro pretende ser una puesta al d��a sobre el control de sistemas en los que no seconoce con precisi�on su din�amica. Para ello se aborda el problema desde dos puntosde vista diferentes, como son las t�ecnicas de Control Adaptativo y las metodolog��asde dise~no de Controladores Robustos.A lo largo del libro se procede a describir ambos enfoques y se ilustran conalgunos ejemplos te�oricos, as�� como mediante la exposici�on de dos aplicaciones aprocesos reales. Los cap��tulos 2 al 7 se dedican a las t�ecnicas de control adaptativoy los cap��tulos 8 al 11 al control robusto.El libro est�a organizado en once cap��tulos. El primero constituye una intro-ducci�on al tema, y en �el se tratan cuestiones relativas al control realimentado ya los posibles enfoques para tener en cuenta la presencia de incertidumbres en lossistemas reales.El cap��tulo segundo se dedica a una descripci�on de las t�ecnicas de dise~no decontroladores adaptativos. Los algoritmos de identi�caci�on de par�ametros se des-criben en el cap��tulo 3, siendo �estos una parte esencial de los sistemas de controladaptativos.Los cap��tulos 4 y 5 se dedican a describir en profundidad las dos t�ecnicas b�asicasde control adaptativo, como son, los controladores adaptativos por modelo de refe-rencia (MRAC) y los controladores adaptativos autoajustables (STR).En el cap��tulo 6 se describen varias t�ecnicas de autoajuste y ajuste por tabla decontroladores. Estas t�ecnicas, sin ser consideradas por muchos autores como adap-tativas, son de gran utilidad y aplicabilidad en el control de procesos industriales.

Page 15: Control Adaptativo y Robusto

Las t�ecnicas descritas en los cap��tulos 2 al 6 son aplicadas en el cap��tulo 7, alcontrol de un proceso real particularmente interesante, como es el control de uncampo de colectores solares cil��ndrico parab�olico tipo acurex, disponible en laplanta solar de Tabernas (Almer��a).En el cap��tulo 8 se hace una introducci�on al problema del control robusto,de�ni�endose algunos conceptos clave en el estudio de la robustez de sistemas decontrol. El cap��tulo 9 se dedica a las metodolog��as de dise~no ltr o metodolog��asde recuperaci�on de la funci�on de transferencia. Aunque �estas t�ecnicas fueron desa-rrolladas inicialmente para el controlador lqg, hoy en d��a han transcendido paraconvertirse en t�ecnicas de ajuste de funciones de transferencia.El cap��tulo 10 se dedica a la t�ecnica de dise~no de controladores robustos conocidacomo H1. Dado que esta metodolog��a est�a hoy en d��a en permanente desarrollo,existe una gran variedad de posibles algoritmos. En este libro se presenta el plan-teamiento inicial para resolver el problema de control H1, as�� como algunas de lasmetodolog��as basadas en la descripci�on por variables de estado.Por �ultimo, el cap��tulo 11 se dedica a la aplicaci�on de los desarrollos planteadosen los cap��tulos 8, 9 y 10 al control de un barco. Para ello, se presentan distin-tos desarrollos para control multivariable, haciendo especial �enfasis en el grado derobustez que se consigue, evaluado mediante distintos ��ndices de comportamiento.El libro est�a compuesto de material recogido de apuntes y notas impartidasa alumnos de cursos de doctorado y de art��culos publicados por los autores. Elmaterial de este libro ha servido y sirve en la actualidad, como parte fundamentalde un curso de doctorado. El libro va dirigido a una gran variedad de personas, el�unico requisito es tener unos conocimientos b�asicos de la teor��a de control.

Page 16: Control Adaptativo y Robusto

AgradecimientosLos autores desean expresar su agradecimiento a las personas que de distintas formashan hecho posible este libro. En primer lugar a Javier Aracil y Eduardo F. Camacho,por sus valiosas sugerencias, est��mulos y consejos.Tambi�en deseamos expresar nuestro agradecimiento a todos los compa~neros delos Departamentos de Ingenier��a de Sistemas y Autom�atica de las Universidadesde Sevilla y C�adiz, especialmente a Manolo Berenguel y Carlos Bord�ons por susaportaciones en la elaboraci�on de pruebas en la Planta Solar de Almer��a. As�� mismoa Julio Terr�on y Manuel Haro por su disponibilidad y cooperaci�on.Parte del material incluido en el libro es el fruto del trabajo de investigaci�onrealizado, que ha sido �nanciado por la cicyt y el ciemat. Deseamos expresarnuestro agradecimiento a estas instituciones por su �nanciaci�on.Tambi�en deseamos expresar nuestro agradecimiento al departamento de Sistemasde la F�abrica de Artiller��a y Sistemas de la empresa bazan en San Fernando (C�adiz)y en especial a Francisco Gonz�alez Men�e, que nos motiv�o en el estudio y aplicaci�onde las t�ecnicas de control robusto.Por �ultimo damos las gracias a nuestras familias por el apoyo, paciencia y tiempo,durante la escritura del libro, sin lo cual, este libro no habr��a sido posible.Sevilla, Diciembre de 1995 C�adiz, Diciembre de 1995Francisco Rodr��guez Rubio Manuel Jes�us L�opez S�anchezIng. de Sistemas y Autom�atica Ing. de Sistemas y Autom�aticaEscuela Superior de Ingenieros Facultad de Ciencias N�auticas41012 - Sevilla 11510 - Puerto Real. C�adizE-mail: [email protected] E-mail: [email protected]

Page 17: Control Adaptativo y Robusto

Cap��tulo 1Introducci�on al problema delcontrol realimentado1.1 Introducci�onEn la con�guraci�on est�andar de un sistema de control, la planta y el controladorforman un bucle cerrado en el que cada componente ejerce una in uencia sobreel otro. La entrada a la planta u depende a trav�es del controlador de la variablecontrolada y, la cu�al a su vez depende de la entrada por la din�amica de la planta.Este fen�omeno se llama realimentaci�on.La realimentaci�on se considera como un concepto general para controlar sistemast�ecnicos, ecol�ogicos o sociales. Las plantas qu��micas, por ejemplo, tienen cientos debucles para hacer que las temperaturas, presiones o ujos permanezcan en los nivelesdados a pesar de la in uencia de las se~nales externas no medibles. Controladoresmultivariables m�as complejos son utilizados para procesos con dos o m�as se~nalesacopladas fuertemente, tales como sistemas de aire acondicionado, columnas de des-tilaci�on, plantas de generaci�on de energ��a el�ectrica, calderas de vapor o aviones.Pretendemos ver los sistemas realimentados desde el punto de vista del controlingenieril, el cual tiene por misi�on encontrar un controlador para conseguir o man-tener la estabilidad, mejorar la robustez, atenuar las perturbaciones, asegurar laregulaci�on asint�otica, etc. Un sistema realimentado consta de un proceso dado conunas propiedades �jas y de un controlador que puede elegirse libremente.1

Page 18: Control Adaptativo y Robusto

2 Los bene�cios de la realimentaci�on1.2 Los bene�cios de la realimentaci�onLos sistemas realimentados muestran varias propiedades importantes porque el com-portamiento del sistema global est�a dado por las propiedades de la interacci�on decada una de las partes. La realimentaci�on hace posible estabilizar sistemas ines-tables, mejorar la robustez ante variaciones del comportamiento de algunas partesdel sistema, o atenuar las pertubaciones externas no medibles. Hay muchas razonespara introducir deliberadamente la realimentaci�on en procesos que funcionan bien.El principal bene�cio de la realimentaci�on no puede deducirse sin la conside-raci�on de las incertidumbres en el comportamiento de la planta. Hay dos razonespor las que la salida de la planta y, para una entrada dada u, produce una trajec-toria que no est�a completamente determinada previamente. Primero, la din�amicade la planta no se conoce completamente, por lo que el modelo de la planta solopuede considerarse como una aproximaci�on m�as que como una descripci�on exacta.Segundo, perturbaciones desconocidas pueden in uir en el comportamiento del sis-tema. En este caso, la salida y no es solo la respuesta a la se~nal de control u, sinoa la perturbaci�on d, que es generalmente indeterminada en el sentido que puede sercualquier cosa dentro de un conjunto de posibles se~nales de perturbaci�on (�gura1.1).-� �� - - -� �� -6 ?K(s) G(s)r e u yd

Figura 1.1: Control en bucle cerradoIndeterminaciones de esta clase ocurren en menor o mayor medida en todos losproblemas de control, porque a causa del proceso de modelado y dise~no, el sistemaa ser controlado tiene que ser considerado fuera de su entorno. Usualmente no esf�acil saber qu�e fen�omenos tienen que ser considerados como parte de la planta ocomo conexiones entre la planta y su entorno y cuales no. Bajo estas circunstancias

Page 19: Control Adaptativo y Robusto

Introducci�on al problema del control realimentado 3es importante conocer que las principales propiedades de los sistemas realimentadosdependen solo d�ebilmente de tales indeterminaciones. Robustez frente a elementosde din�amicas inmodeladas y perturbaciones, pueden igualmente ser consideradoscomo una propiedad estructural de los sistemas realimentados. Como la se~nal decontrol u es calculada por el controlador dependiendo del valor actual de y, hay quetener en cuenta el efecto de las se~nales de control anteriores y de las perturbaciones.Esta propiedad fundamental de los sistemas realimentados se hace evidente porla comparaci�on de las con�guraciones de los sistemas de control en bucle abiertoy en bucle cerrado. El control en bucle abierto est�a basado en la exactitud delmodelo de la planta, dado que la se~nal de control se calcula en base al modelo. Losefectos que resultan de las dos clases de indeterminaciones aparecen enteramentecomo desviaciones de la trajectoria resultante sobre la respuesta especi�cada. Sinembargo, en el control en bucle cerrado, se compara el valor actual de la salida ycon la se~nal de referencia r, y la entrada a la planta se calcula dependiendo de lase~nal de error. Adem�as de la informaci�on dada a priori acerca de la planta en formade un modelo matem�atico, el control realimentado usa el conocimiento acerca delcomportamiento actual de la planta y de las perturbaciones existentes, lo cual essuministrado impl��citamente por la medida del valor de y.La introducci�on de la realimentaci�on est�a principalmente motivada por el cono-cimiento incompleto del sistema a ser controlado y por el efecto de las perturba-ciones externas. M�as estrictamente, el uso de la realimentaci�on puede verse comono justi�cable, si no hay indeterminaciones en el sistema, porque para sistemas noperturbados, el control en bucle abierto produce la misma o probablemente mejorrespuesta.1.3 Sensibilidad en bucle abierto y en bucle ce-rrado.Sea un sistema cuya funci�on de transferencia en bucle abierto es G(s). Si la funci�onde transferencia en bucle cerrado es T (s) se tendr�a que en el dominio de frecuenciasde inter�es, es decir, para ! 2 [0;], siendo la frecuencia angular que de�ne elancho de banda para el que se proyecta el sistema, se tendr�a que,T (s) ' 1es decir, se pretende que en el anterior dominio de frecuencias la reproducci�on de

Page 20: Control Adaptativo y Robusto

4 Sensibilidad en bucle abierto y en bucle cerrado.las se~nales sea lo m�as �el posible.Se sabe que la relaci�on que liga a G(s) y a T (s) esT (s) = G(s)1 +G(s)Por lo tanto, puesto que T ' 1 para todas las frecuencias de inter�es, se tendr�a queG� 1 para ! 2 [0;] (1:1)Se de�ne la sensibilidad de un sistema, dado por su funci�on de transferencia T (s),como la variaci�on que sufre esta funci�on de transferencia como consecuencia de lavariaci�on de uno de los par�ametros p que interviene en la misma. Se denota porSTp la sensibilidad de la funci�on de transferencia T (s) con respecto a variaciones delpar�ametro p. Formalmente se escribe:STp = % variaci�on de T (s)% variaci�on de plo que a su vez puede escribirseSTp = dT=Tdp=p = dTdp � pTSup�ongase, que uno de los par�ametros que aparecen en G(s) sufre una variaci�on(por envejecimiento, efecto de perturbaciones exteriores, etc.). La sensibilidad de lafunci�on de transferencia en bucle cerrado T (s) a la variaci�on de un par�ametro deG(s) ser�a: STG = 1(1 +G)2 � GT = 11 +Glo que habida cuenta de la expresi�on 1.1 conduce a STG � 1 es decir, un sistema enbucle cerrado tiene una sensibilidad a las variaciones de los elementos que constitu-yen la cadena en bucle abierto mucho menor que 1.Este resultado debe compararse con la sensibilidad de un sistema en bucle abiertoG = G1G2, que puede escribirse, SGG1 = 1Se concluye de lo anterior que la introducci�on de la realimentaci�on reduce no-tablemente la sensibilidad del sistema con respecto a la variaci�on de los par�ametros.Es �este un resultado fundamental que justi�ca sobradamente la introducci�on de larealimentacci�on en el dise~no de sistemas de control.

Page 21: Control Adaptativo y Robusto

Introducci�on al problema del control realimentado 51.4 An�alisis y dise~no en presencia de incertidum-bresLa mayor��a de los m�etodos de an�alisis y dise~no para sistemas realimentados presupo-nen que se dispone de un modelo su�cientemente exacto del proceso a controlar odel sistema en bucle cerrado, respectivamente. En este modelo est�a �jado, tanto laestructura del modelo como los par�ametros. Aunque algunos de los m�etodos hacenalgunas consideraciones sobre el efecto de las posibles incertidumbres, el tratamientoy atenuaci�on de las pertubaciones no son su principal raz�on de ser.Sin embargo, un enfoque m�as realista para el control por realimentaci�on tieneque tener en cuenta las imprecisiones del modelo, lo cual es la principal raz�on parala utilizaci�on de la realimentaci�on. Otra forma de abordar el problema es tratar conprincipios y m�etodos que nos permitan considerar expl��citamente las discrepanciasentre el modelo y el proceso real. Esto es, intentar analizar y dise~nar el controladorsin tener un modelo matem�atico preciso de la planta. Intentar obtener resultadosque no solo sean v�alidos para el modelo aproximado, sino que lo sean para un rangode modelos de la planta dados y en consecuencia para el proceso real.La conveniencia de investigaciones te�oricas sobre el an�alisis y dise~no de sistemasrobustos pone de mani�esto que la robustez es una cuesti�on fundamental en lossistemas realimentados que ha sido explorada desde hace bastante tiempo (Dorato1987, Grimble 1994). Conforme a la declaraci�on de que un ingeniero encuentra unaherramienta y una soluci�on para cada problema, puede ser tosco, ya que muchosbucles de control tienen que operar sin ning�un modelo matem�atico. Las bien cono-cidas reglas de Ziegler y Nichols y similares, son un ejemplo obvio para un ingenieropr�actico, el cu�al se ha basado originalmente en un modelo aproximado simple, peroque es utilizado sucesivamente sin con�rmaci�on del grado de aproximaci�on de estetipo de modelos para el proceso bajo consideraci�on.Sin embargo, sin un profundo conocimiento de los bene�cios de la realimentaci�on,el campo de aplicaciones de los controladores lineales invariantes en el tiempo, para elcaso de desconocimiento del proceso, variable con el tiempo o no lineal, debe quedarmucho m�as limitado. Experiencias pr�acticas y ejemplos acad�emicos muestran queuna mera introducci�on a la realimentaci�on no garantiza obtener los requerimientosde robustez e insensibilidad frente a las imprecisiones del modelo. La realimentaci�ondebe estar relacionada con la clase y cantidad de incertidumbre del modelo y conlas propiedades que ser�an preservadas.Desde el punto de vista ingenieril, las investigaciones te�oricas sobre la robustez

Page 22: Control Adaptativo y Robusto

6 Posibles planteamientosde los sistemas realimentados, deben estar encaminadas a,� determinar las capacidades fundamentales de la realimentaci�on lineal paracontrolar plantas con incertidumbres, y� elaborar procedimientos de an�alisis y dise~no pr�acticos.La primera tarea concierne a preguntas como: > Qu�e incertidumbre del modelo puedeser tolerada por el controlador lineal ? > Qu�e estructura debe tener el controlador? > Bajo qu�e condiciones debe ser dise~nado el controlador para que asegure laestabilidad (integridad) en el caso de fallo del sensor o actuador ? La segunda tareaes claro que va hacia la explotaci�on sistem�atica de la robustez.1.5 Posibles planteamientosPrincipalmente, para el dise~no de controladores a partir de modelos de la planta queson lineales e invariantes con el tiempo, hay dos posibles enfoques para contemplarlas incertidumbres en el modelo del sistema y las perturbaciones sobre este (Grimble1994). El primero de ellos es utilizar un controlador adaptativo, el cu�al estimalos par�ametros y calcula la se~nal de control bas�andose en dichos par�ametros. Lametodolog��a de los reguladores autoajustables es la adecuada en este caso, peroconlleva el dise~no en l��nea, con el esfuerzo de c�alculo necesario para ello, muchomayor que en el caso de un regulador m�as simple.El segundo enfoque es considerar las incertidumbres del sistema en el dise~no de uncontrolador �jo, lo cu�al lleva a un esquema de control robusto, que es m�as insensible alas variaciones en los par�ametros y a las perturbaciones. Existen distintas �losof��aspara hacer �esto, desde el c�alculo de un controlador lqg con recuperaci�on de lafunci�on de transferencia del lqr, lo cual conduce a un controlador robusto llamadolqg/ltr, a considerar la minimizaci�on de una cierta norma de una funci�on detransferencia. Las normas m�as empleadas son la norma H2 y la norma H1.Tambi�en est�an apareciendo recientemente en la literatura enfoques combinadosde los mencionados anteriormente. Por ejemplo el dise~no de sistemas de controlrobustos H1 adaptativos. Aunque estos enfoques son dif��ciles de tratar por el mo-mento.A lo largo de este texto nos centraremos en algunos aspectos de ambos enfoques,tratando de ilustrar la aplicaci�on al control de procesos.

Page 23: Control Adaptativo y Robusto

Introducci�on al problema del control realimentado 71.6 Sistemas de tiempo continuo y de tiempodiscretoLas se~nales de inter�es en el control de sistemas (se~nales de control, error, salida de losactuadores, etc.), son usualmente se~nales en tiempo continuo y las especi�caciones(ancho de banda, sobreoscilaci�on, tiempo de subida, etc.), se formulan tambi�en entiempo continuo. Pero dado que la tecnolog��a digital ofrece multiples bene�cios,los sistemas de control actuales emplean tecnolog��a digital para la realizaci�on de loscontroladores. Un controlador digital ejecuta b�asicamente tres funciones: muestreay cuanti�ca una se~nal de tiempo continuo (tal como el error de seguimiento) paraobtener una se~nal digital; procesa esta se~nal digital utilizando un computador digital;y posteriormente convierte la se~nal digital resultante a una se~nal de tiempo continuo.Este proceso involucra sistemas de tiempo continuo y sistemas de tiempo discreto.Los sistemas muestreados operan en tiempo continuo, pero algunas se~nales detiempo continuo son muestreadas en ciertos instantes de tiempo (normalmente deforma peri�odica), produciendo se~nales de tiempo discreto. Por ello, los sistemasmuestreados son sistemas h��bridos, que involucran ambos tipos de se~nales.La s��ntesis de un controlador digital puede efectuarse de acuerdo con los tresm�etodos alternativos siguientes:� Discretizaci�on de controladores anal�ogicos.� Discretizaci�on de la planta y dise~no en tiempo discreto.� Dise~no directo utilizando la representaci�on en tiempo discreto.En el primer caso se emplean los m�etodos basados en la utilizaci�on de representa-ciones en tiempo continuo para determinar un controlador anal�ogico que posterior-mente se discretiza (por ejemplo mediante la tranformaci�on bilineal), obteni�endoseuna descripci�on del controlador como un sistema de tiempo discreto. La ventajade este m�etodo es que el dise~no se realiza en tiempo continuo donde las especi�ca-ciones se dan de forma natural. Este m�etodo es v�alido siempre y cuando el periodode muestreo sea lo su�cientemente peque~no para que la actuaci�on del controladordigital se aproxime a la del anal�ogico. Esto lleva a que se necesite un hardwarem�as potente y caro, por lo que hay que llegar a un compromiso entre el coste y laprecisi�on del controlador aproximado.

Page 24: Control Adaptativo y Robusto

8 Sistemas de tiempo continuo y de tiempo discretoEn el segundo caso se utilizan t�ecnicas espec���cas en tiempo discreto, con-templ�andose espec���camente los procesos de muestreo y reconstrucci�on de se~nales.En este caso se utiliza una representaci�on equivalente del conjunto como un sistemade tiempo discreto. La ventaja de este m�etodo es su simplicidad. Por contra, elenfoque ignora completamente qu�e ocurre entre los instantes de muestreo, y porotro lado las especi�caciones de tiempo continuo no siempre se pueden trasladarde forma clara a tiempo discreto. Por �ultimo, si el periodo de muestreo cambia, elcontrolador debe ser redise~nado.En el tercer caso el controlador se dise~na directamente para el sistema de tiempodiscreto. La ventaja es que en este caso se resuelve el problema sin aproximaciones.A lo largo de los pr�oximos cap��tulos, se describen t�ecnicas de dise~no de con-troladores tanto para sistemas en tiempo continuo como para sistemas en tiempodiscreto. En algunos casos los desarrollos te�oricos est�an demostrados para sistemascontinuos, no existiendo hasta el momento desarrollos equivalentes para sistemas entiempo discreto, siendo necesario por tanto, para la realizaci�on digital de �estos con-troladores emplear el primer tratamiento de los tres mencionados. En otros casos elplanteamiento se realiza directamente para sistemas en tiempo discreto, por lo quesu realizaci�on es m�as directa.En otras ocasiones, debido a la naturaleza del proceso de identi�caci�on se disponede una descripci�on en tiempo discreto y los controladores a dise~nar est�an basadosen la teor��a de sistemas de tiempo continuo. En este caso se calcula la aproximaci�onde tiempo continuo del sistema (por ejemplo mediante la tranformaci�on bilinealinversa), se dise~na el controlador y posteriormente se deshace el cambio para larealizaci�on del controlador en un computador digital.

Page 25: Control Adaptativo y Robusto

Cap��tulo 2Control adaptativo2.1 Introducci�onEl t�ermino adaptativo signi�ca cambiar el comportamiento conforme a nuevas circun-stancias. Un regulador adaptativo es un regulador que puede modi�car su compor-tamiento en respuesta a cambios en la din�amica del sistema y a las perturbaciones.Este mismo objetivo es el de la inclusi�on de la realimentaci�on en el bucle de control,por lo que surge la pregunta de cu�al es la diferencia entre control realimentado ycontrol adaptativo.Existen muchas de�niciones de control adaptativo, siendo una de las m�as acep-tadas, que control adaptativo es un tipo especial de control no lineal en el que elestado del proceso puede ser separado en dos escalas de tiempo que evolucionan adiferente velocidad. La escala lenta corresponde a los cambios de los par�ametrosy por consiguiente a la velocidad con la cual los param�etros del regulador son mo-di�cados, y la escala r�apida que corresponde a la din�amica del bucle ordinario derealimentaci�on.El esquema b�asico de control adaptativo, (Landau 1974) seg�un puede verse enla �gura 2.1, est�a compuesto de un bucle principal de realimentaci�on negativa, en elque act�ua al igual que en los sistemas convencionales un regulador y de otro bucleen el que se mide un cierto ��ndice de funcionamiento, el cual es comparado con el��ndice deseado y se procesa el error en un mecanismo de adaptaci�on que ajusta lospar�ametros del regulador y en algunos casos act�ua directamente sobre la se~nal decontrol. Tambi�en puede existir un tercer bucle dedicado a supervisar la marcha de9

Page 26: Control Adaptativo y Robusto

10 Introducci�onlos dos bucles anteriores (Isermann 1982), en orden a asegurar la estabilidad delsistema y a mejorar la actuaci�on del conjunto.El mecanismo de adaptaci�on presenta una soluci�on en tiempo real al problemade dise~no para sistemas con par�ametros conocidos, aunque como veremos m�as ade-lante, puede ir a un tiempo de muestreo superior al correspondiente al regulador eidenti�cador.La caracter��stica fundamental que distingue a los sistemas adaptativos es la pre-sencia de un bucle de control en el que se compara un ��ndice de funcionamiento(Landau 1981).-���� - -����- -? ?Perturbaci�onPlantaControladorAjustable yur

-?Actuaci�onDeseada ??6Comparaci�onDecisi�on MecanismodeAdaptaci�on Medida delIndice deActuaci�on6��

���

Figura 2.1: Con�guraci�on b�asica de control adaptativoExisten muchos tipos de controladores que proporcionan buenas caracter��sticasde regulaci�on en presencia de cambios de los par�ametros del sistema y que seg�un lade�nici�on anterior no son realmente adaptativos, puesto que la adaptaci�on se realizaen bucle abierto.Un ejemplo muy utilizado de control adaptativo en bucle abierto es el denomi-nado Cambio por tabla1. Consiste en la modi�caci�on de los par�ametros del contro-lador a partir de una tabla que ha sido calculada previamente para distintos puntosde funcionamiento, en funci�on de una variable auxiliar. Un caso t��pico es el controlde vuelo de un avi�on, cuyo regulador puede ser cambiado en funci�on de la altura de�este.1En la terminolog��a inglesa se denomina Gain Scheduling

Page 27: Control Adaptativo y Robusto

Control adaptativo 11-����- - -6r e ControladorAjustable u Planta yCC

CCW��MecanismodeAdaptaci�on Medida dela Variableauxiliar MedioAmbiente

Figura 2.2: Sistema adaptativo en bucle abiertoEn la �gura 2.2, se presenta esquematicamente este tipo de controladores. Sesupone que existe una fuerte relaci�on entre la variable auxiliar y la din�amica delos par�ametros del sistema. Este tipo de adaptaci�on tiene la ventaja de que elcontrolador puede ser cambiado muy r�apidamente, dependiendo de la rapidez conque la variable auxiliar re eje el cambio de la din�amica del proceso, siendo muyimportante la elecci�on de dicha variable. Sin embargo estos reguladores consumenmucho tiempo en la realizaci�on de la tabla de par�ametros, presentando as�� mismoalgunos problemas en la conmutaci�on de unos par�ametros a otros.Seg�un sean dise~nados los bloques descritos anteriormente, podemos tener unou otro tipo de control adaptativo, pudi�endose dividir principalmente en dos gru-pos: Controladores adaptativos con modelo de referencia (mrac) y Reguladoresautoajustables (str).mrac y str pueden ser considerados como una aproximaci�on a la soluci�on delproblema de control adaptativo. La hip�otesis que justi�ca la aproximaci�on es quepara cualquier juego de valores posibles de los par�ametros de la planta y las pertur-baciones, existe un controlador lineal con una complejidad �jada, tal que el conjuntode controlador y planta tienen caracter��sticas preespeci�cadas.1. Los controladores adaptativos con modelo de referencia, intentan alcanzar parauna se~nal de entrada de�nida, un comportamiento en bucle cerrado dado porun modelo de referencia.2. Los reguladores adaptativos autoajustables, tratan de alcanzar un control�optimo, sujeto a un tipo de controlador y a obtener informaci�on del proceso y

Page 28: Control Adaptativo y Robusto

12 Introducci�onsus se~nales.Estas dos t�ecnicas han sido desarrolladas separadamente durante varios a~nos,pudi�endose demostrar su equivalencia en muchos casos. Las ventajas de mracest�an en su r�apida adaptaci�on para una entrada de�nida y en la simplicidad detratamiento de la estabilidad utilizando la teor��a de estabilidad de sistemas no lin-eal. Sin embargo, no se adapta convenientemente si la se~nal de entrada al sistematiene poca riqueza. El str tiene la ventaja de que se adapta para cualquier caso yen particular para perturbaciones no medibles, teniendo al mismo tiempo una es-tructura modular, lo que hace posible la programaci�on por bloques, siendo f�acil derealizar distintos reguladores.En este cap��tulo se hace una breve introducci�on a las distintas variantes de controladaptativo, describiendose las ventajes e inconvenientes de estos controladores. Encap��tulos posteriores se analizan con m�as detalle cada uno de ellos.Hasta la actualidad han sido propuestas varias formas de dise~no del algoritmode control de un sistema lineal, pudi�endose clasi�car �estas de diferentes maneras,siendo una posible, en funci�on de que el criterio de dise~no sea �optimo o no �optimo,pudi�endose destacar entre ellos los siguientes :1. Criterio �optimo:� Controlador de m��nima varianza de Astrom y Wittenmark 1973.� Controlador de m��nima varianza generalizado de Clarke yGawthrop 1975,1979.� Controladores predictivos generalizados Clarke y Gawthrop 1988.2. Criterio no �optimo:� Asignaci�on de polos y ceros (Wellstead et al. 1979).� Asignaci�on de polos y ceros (Astrom y Wittenmark 1980).� Controlador en tiempo m��nimo (Isermann 1981).� Regulador PID (Ortega 1982).

Page 29: Control Adaptativo y Robusto

Control adaptativo 132.2 Controladores adaptativos con modelo de refe-rencia (MRAC)Los sistemas adaptativos con modelo de referencia fueron dise~nados primeramentepara sistemas continuos por minimizaci�on de un ��ndice de actuaci�on, siendo dicho��ndice la integral del error al cuadrado (Hang 1973). Esta regla de dise~no fue pro-puesta por Whitaker del MIT (1958), Instrumentation Laboratory, denomin�andosepor ello como la regla del MIT.En cuanto a las con�guraciones posibles con modelo de referencia, la m�as usuales utilizar un modelo paralelo (�gura 2.3), aunque son posibles otras con�guraciones(Landau 1974, 1981), como modelo serie, serie-paralelo, etc.-����- - -6

- ?����6

Modelo deReferenciaPlantaControladorAjustable

MecanismodeAdaptaci�onCC BBN?r u ypymFigura 2.3: Estructura con modelo de referencia (MRAC)Existe una dualidad entre los sistemas de control adaptativo a un modelo dereferencia y el problema de identi�caci�on con un modelo ajustable, siendo en estecaso el modelo de referencia la planta a identi�car.Dado un modelo de referencia Gm(s; p) y un sistema ajustable Ga(s; p), el cualse desea que siga al modelo para que el error sea nulo (o m��nimo en el caso de lapresencia de perturbaciones), se de�ne el ��ndice de funcionamiento:

Page 30: Control Adaptativo y Robusto

14 Controladores adaptativos con modelo de referencia (MRAC)J = 12 Z e2dt ; e = ym � yaym � salida del modelo de referencia,ya � salida del modelo ajustable,p � par�ametro a ajustar.Usando la t�ecnica de optimizaci�on del gradiente (Landau 1981) se tiene que laregla de adaptaci�on es: �p(e; t) = �Kgrad(J) = �K@J@psiendo �p la variaci�on de p con relaci�on al �ultimo valor calculado y K es la gananciade adaptaci�on.La variaci�on del par�ametro ajustable con relaci�on al tiempo ser�a:_p = dpdt = �K @@t @J@p!Si se asume variaci�on lenta de la ley de adaptaci�on, se puede intercambiar elorden de las derivadas: _p = �K @@p @J@t ! = �K @@p �12e2�_p = �Ke@e@p (2:1)La ley de adaptaci�on (2.1) representa la regla del M.I.T.@e@p = @(ym � ya)@p = �@ya@pluego, _p = Ke@ya@p

Page 31: Control Adaptativo y Robusto

Control adaptativo 15La @ya=@p es la funci�on de sensibilidad del modelo ajustable con respecto alpar�ametro. En este caso la funci�on de sensibilidad es proporcional a ym, quedandola ley de adaptaci�on de la forma : _p = K1 e ymEsta regla ha sido muy popular debido a su simplicidad. Sin embargo para elcaso de ajuste de varios par�ametros requiere un n�umero elevado de funciones desensibilidad (tantas como par�ametros). Por otro lado la ganancia de adaptaci�on go-bierna la velocidad de respuesta, si �esta es muy grande el sistema puede ser inestabley si es muy peque~na la velocidad ser�a muy lenta. Para obtener un buen compro-miso entre velocidad de respuesta y estabilidad es necesario un laborioso estudio porsimulaci�on.Otra t�ecnica de dise~no se fundamenta en la utilizacion del segundo m�etodo deLyapunov, el cual tiene la ventaja de que asegura la estabilidad global para cualquiervalor de la ganancia de adaptaci�on y cualquier tipo de entrada. La principal desven-taja de este m�etodo es que se requiere el conocimiento del vector de estado, que nosiempre es accesible. Otra desventaja es que no es aplicable a los casos donde lospar�ametros del conjunto planta m�as controlador no pueden ser modi�cados directa-mente.-���� - -

�6 Parte lineale invarianteen el tiempo

Parte no-linealy/o variableen el tiempow vFigura 2.4: Separaci�on del sistema (Hiperestabilidad)Landau (1981) propone una t�ecnica de dise~no basada en el concepto de hiper-estabilidad y en la teor��a de estabilidad de Popov. El concepto de hiperestabilidadest�a relacionado con la estabilidad de una clase de sistemas, tales que pueden ser

Page 32: Control Adaptativo y Robusto

16 Reguladores autoajustables (STR)separados en dos bloques, �gura 2.4. Este sistema est�a formado por una parte linealinvariante en el tiempo y otra no lineal y/o variable en el tiempo.Si la entrada y salida de la parte no lineal est�an relacionadas por la desigualdadde Popov : n(0; t) = Z t0 v w dt � �Y 2o ; 8t > 0:donde v es la entrada y w la salida e Y 2o es una constante �nita positiva independientede t, el problema de encontrar la estabilidad absoluta de este sistema, se concretaen averiguar las condiciones que debe de cumplir la parte lineal para que el conjuntosea estable.Para dise~nar la ley de adaptaci�on mediante esta t�ecnica se tienen que seguir lospasos que se detallan a continuaci�on de forma resumida :1. Transformar el sistema con modelo de referencia en uno equivalente que tengala estructura de la �gura 2.4.2. Encontrar la ley de adaptaci�on para que se cumpla la desigualdad de Popov.3. Encontrar la parte de la ley de adaptaci�on que aparezca en la parte lineal paraque el conjunto del sistema sea globalmente estable.4. Volver al sistema original y formular la ley de adaptaci�on expl��citamente.Una discusi�on extensa de esta t�ecnica puede encontrarse en el libro de Landau(1981), resultando en casos particulares que la ley de adaptaci�on es de la formaproporcional + integral �o proporcional + integral + derivada. Con esta t�ecnica segarantiza la estabilidad del conjunto, siendo su principal desventaja que a menudoson necesarios una serie de diferenciadores.2.3 Reguladores autoajustables (STR)El diagrama de bloques de estos controladores se puede ver en la �gura 2.5; en �el sedistinguen tres partes claramente diferenciadas:� un algoritmo recursivo de estimaci�on de par�ametros

Page 33: Control Adaptativo y Robusto

Control adaptativo 17� un mecanismo de adaptaci�on que desarrolla la tarea de dise~no del regulador y� un regulador con par�ametros ajustables.Estos reguladores conforman una estructura sub�optima basada en el principio deseparaci�on de las tareas de control e identi�caci�on. El dise~no se hace de forma quese suponen par�ametros conocidos y despu�es estos son sustituidos por sus estimados.Desde el punto de vista del control estoc�astico de sistemas no lineales, es clara-mente un controlador que aplica el principio de equivalencia cierta (supone que lospar�ametros identi�cados coinciden con los reales).- ��

- -s����- -6 s -BB BBNActuaci�onDeseada Dise~no delControlador Estimaci�onde la Planta

PlantaControladorAjustableFigura 2.5: Esquema del regulador autoajustable (STR)La idea de los reguladores autoajustables puede ser aplicada a muchos proble-mas de control que no son formulados como un problema de control estoc�astico.Dada la modularidad y la separaci�on del control e identi�caci�on, pueden formarsemuchas clases de reguladores autoajustables por combinaci�on de diferentes m�etodosde dise~no e identi�cadores.2.4 Ejemplo simpleA continuaci�on se describe un ejemplo simple (Astrom 1980), en el que se ilustrael problema de control adaptativo y las aproximaciones m�as usuales. Sup�ongase el

Page 34: Control Adaptativo y Robusto

18 Ejemplo simplesistema discreto cuya ecuaci�on en diferencias es de la forma:y(t+ 1) = y(t) + bu(t) + e(t)donde y es la salida del proceso, u, la se~nal de control, e, es un ruido blanco y b, unpar�ametro �jo.Se quiere minimizar el criterio:J = limN!1E 1N NX1 y2(t)!Cuando se conoce el par�ametro b, la ley de control que minimiza el criterio es:u(t) = �y(t)=b; =) y(t+ 1) = e(t)Si no se conoce el par�ametro b, pero se sabe que en el instante t tiene unadistribuci�on gausiana normal de media b(t) y covarianza P (t). El problema decontrol que tiene en cuenta el estado, en este caso la salida y(t), b(t) y P (t) llevar��aconsigo la resoluci�on de la ecuaci�on de Bellman, que para este caso podr��a ser resueltanum�ericamente. Este ser��a el problema del control Dual. Sin embargo se puedenhacer aproximaciones, deriv�andose una de ellas de aplicar el principio de equivalenciacierta, para lo cual se emplear��a la ley de control:u(t) = �y(t)=b(t)Si las estimaciones de b(t) son malas y llega a tomar un valor peque~no, el esfuerzode control puede llegar a ser muy grande. Una forma de evitar �esto es utilizar elcontrol cauteloso siguiente: u(t) = � b(t)b2(t) + P (t)y(t)El control cauteloso puede presentar algunos problemas debido a la incertidumbrede la estimaci�on, dado que para P (t) >> b2(t), u(t) puede ser muy peque~na y altener poca riqueza la identi�caci�on es pobre, con lo que se incrementa P (t), por loque u(t) puede llegar a ser cero. Si este control se aplica a un proceso estable, elfen�omeno se llama apagado, ya que el proceso ir�a a un punto de funcionamiento,igual al que ten��a sin control. Si se aplica a un proceso inestable, al ser u(t) = 0,la salida puede ser muy grande y no se podr��a controlar al sistema, en este caso elfen�omeno se conoce como escape.

Page 35: Control Adaptativo y Robusto

Control adaptativo 192.5 >Porqu�e control adaptativo?Dado que un controlador adaptativo es un sistema no lineal en el que es necesarioajustar una serie de par�ametros, es importante explorar bajo qu�e circunstancias esinsu�ente utilizar un controlador �jo y ser�a necesario un controlador adaptativo.Un controlador convencional est�a pensado para controlar sistemas (la mayorparte de las veces lineales), cuyos par�ametros permanecen constantes. Esto es unabuena aproximaci�on en la mayor parte de los casos, cuando se pretende regularun sistema en un punto �jo de operaci�on. Cuando exiten pertubaciones, si �estasson peque~nas, dicha aproximaci�on contin�ua siendo su�ciente para obtener un buencontrol. Sin embargo, la aproximaci�on en torno a un punto de funcionamiento nosuele seguir siendo buena, si el punto de funcionamiento cambia.Vamos a ver mediante algunos ejemplos, cuando es su�ciente un regulador �jo ocuando es necesario otro tipo de control, o un controlador adaptativo. En generalno es inmediato decidir el tipo de control que se necesitar�a. Es necesario estudiarcada caso en particular antes de decidirse por el tipo de control a aplicar.Actuador no linealMuchos actuadores poseen caracter��sticas no lineales, las cuales crean di�cultadespara el control.-� �� - - - -6 Planta yvueyr Gc V�alvula G0Figura 2.6: Diagrama de bloques de sistema realimentadoSup�ongase un sistema lineal (�gura 2.6), con un regulador PI cuyo actuador esuna v�alvula con la caracter��stica,v = f(u) = u4; u � 0

Page 36: Control Adaptativo y Robusto

20 >Porqu�e control adaptativo?Linealizando el sistema en torno al punto de operaci�on estacionario, puede de-mostrarse que la ganancia del bucle es proporcional a la derivada de la funci�on f(u).Se deduce entonces que el sistema puede funcionar correctamente en un punto detrabajo y pobremente en otros. Esto puede ilustrarse particularizando el sistema dela �gura 2.6 con:G0(s) = 1(s+ 1)3 ; Gc(s) = K �1 + 1Tis� ; K = 0:15; Ti = 1:0En la �gura 2.7 puede verse la respuesta a un escal�on de distinta magnitud, la cualpone de mani�esto el hecho de tener distinto comportamiento dependiendo del valordel escal�on (punto de funcionamiento).Sistema de dep�ositos interconectadosOtro ejemplo particularmente interesante es aqu�el en el que existen tanques ytuber��as largas interconectados. Sup�ongase un sistema como el de la �gura 2.8 enel que se pretende controlar la concentraci�on en el segundo tanque.La ecuaci�on diferencial que controla dicho proceso viene dada por:Vmdc(t)dt = q(t) [cin(t� �)� c(t)]donde, � = Vdq ; T = Vmqque cuando se aplica la transformada de Laplace queda,Gp(s) = e�s�1 + Tssistema de primer orden en el que var��an la constante de tiempo T y el retardoasociado � .Si se simula a este sistema en bucle cerrado con un regulador PI con constantesK = 0:5 y Ti = 1:1, puede verse que el comportamiento de este sistema var��aconsiderablemente con las variaciones de caudal (�gura 2.9).Con estos ejemplos se pone mani�esto que existen muchos procesos que puedenser candidatos para aplicar control adaptativo. Si la modi�caci�on de los par�ametros

Page 37: Control Adaptativo y Robusto

Control adaptativo 210

0.1

0.2

0.3

0.4

0 10 20 30 40 50 60 70 80 90 100

0

0.5

1

1.5

0 10 20 30 40 50 60 70 80 90 100a

0

5

10

15

0 10 20 30 40 50 60 70 80 90 100

0

2

4

6

8

0 10 20 30 40 50 60 70 80 90 100

bFigura 2.7: Respuesta a diferentes escalones

Page 38: Control Adaptativo y Robusto

22 >Porqu�e control adaptativo?

Vm CVdCin

-bbb"""

Figura 2.8: Sistema de tanques interconectados

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

0 1 2 3 4 5 6 7 8 9 10

tiempo

cs

Figura 2.9: Respuestas a escal�on para diferentes caudales

Page 39: Control Adaptativo y Robusto

Control adaptativo 23es conocida, puede aplicarse un controlador ajustable por tabla (gain scheduling),pero cuando existen partes del sistema cuya variaci�on no conocemos y no podemosmedir (por ejemplo la carga de un robot), un buen candidato es aplicar controladaptativo identi�cando s�olo la parte que desconocemos.2.6 El problema del control adaptativoLos ejemplos de la secci�on anterior muestran porqu�e es necesario utilizar controladaptativo. Ellos ponen de mani�esto que los procesos industriales son bastantecomplejos y la variaci�on de par�ametros no puede determinarse desde un primermomento. Por lo tanto, puede ser ventajoso emplear esfuerzo en desarrollar con-troladores m�as inteligentes. Un controlador m�as complejo puede utilizarse paradiferentes procesos y por tanto el mayor costo en el desarrollo puede compartirseentre las diversas aplicaciones. Sin embargo, es muy importante recordar que la uti-lizaci�on de un controlador adaptativo no sustituye el buen conocimiento del procesoque es necesario para elegir las especi�caciones, la estructura del controlador y elm�etodo de dise~no.Como se ha visto en las secciones precedentes, un controlador adaptativo debecontener:� Una ley de control con par�ametros ajustables.� Caracterizaci�on de la respuesta del sistema en bucle cerrado (Modelo de refe-rencia o las especi�caciones para el dise~no).� Procedimiento de dise~no.� Actualizaci�on de par�ametros basado en las medidas.� Realizaci�on de la ley de control.Estas partes son un poco diferentes para los distintos esquemas de control adap-tativo, pero tienen muchos factores comunes.Existe hoy en d��a una separaci�on entre la teor��a y la pr�actica en control adapta-tivo. En teor��a es posible manejar situaciones idealizadas. En la pr�actica se utilizanalgoritmos bastante complejos, que introducen reglas concretas para manejar las

Page 40: Control Adaptativo y Robusto

24 El problema del control adaptativoposibles di�cultades encontradas durante el an�alisis o con la experiencia de la apli-caci�on.El hecho de que haya variaciones signi�cativas en la respuesta en bucle abierto,no signi�ca necesariamente que sea necesario un controlador adaptativo. Esto puedeilustrarse con los siguientes ejemplos.Diferente respuesta en bucle abiertoEl sistema con funci�on de transferencia en bucle abierto dado por,G0(s) = 1(s+ 1)(s+ a)con a=-0.01, 0 y 0.01, tiene una din�amica muy diferente para los valores de a (�gura2.10a). Sin embargo el sistema realimentado unitariamente da las respuestas de la�gura 2.10b.0

100

200

300

400

0 50 100 150 200 250 300

0

0.5

1

1.5

0 2 4 6 8 10 12Figura 2.10: Respuestas en tiempo diferentes en bucle abiertoLa raz�on estriba en que las funciones de transferencia de los tres sistemas sonmuy similares en el entorno de la frecuencia de cruce, mientras que son diferentes a

Page 41: Control Adaptativo y Robusto

Control adaptativo 25baja frecuencia.Similar respuesta en bucle abiertoEl sistema con funci�on de transferencia en bucle abierto dado por,G0(s) = 20(1� sT )(s+ 1)(s+ 20)(Ts+ 1)con T=0, 0.015 y 0.03, tiene una din�amica para los valores de T (�gura 2.11a) muysimilar. Sin embargo el sistema realimentado con u = 20(yr � y), da las respuestade la �gura 2.10b.0

0.2

0.4

0.6

0.8

1

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

0

0.5

1

1.5

2

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2Figura 2.11: Respuestas en tiempo similares en bucle abiertoEste sistema tiene un comportamiento inverso al anterior. La raz�on estriba enque las funciones de transferencia de los tres sistemas son muy similares a bajafrecuencia, mientras que son bastante diferentes a alta frecuencia.La ense~nanza a seguir de estos ejemplos es que es esencial conocer la respuestaen frecuencia a la frecuencia de cruce deseada, para poder juzgar si las variacionesde los par�ametros afectar�an a la respuesta en bucle cerrado.

Page 42: Control Adaptativo y Robusto

26 El problema del control adaptativo

Page 43: Control Adaptativo y Robusto

Cap��tulo 3Algoritmo de identi�caci�on depar�ametros3.1 Introducci�onUna parte muy importante de los sistemas adaptativos es el algoritmo de identi�-caci�on de par�ametros, consumiendo �este la mayor parte del tiempo de c�alculo en cadaperiodo de muestreo, y siendo muy cierta la frase de que una buena identi�caci�onlleva a un buen control.La identi�caci�on de sistemas tiene diversos signi�cados en la literatura cient���ca.La acepci�on m�as usada es la dada por Sage et al. (1971), que de�nen la identi�caci�ono modelado de un sistema como el proceso de determinar un conjunto de ecuacionesdiferenciales o en diferencias, o los par�ametros de tales ecuaciones, que describenun proceso f��sico de acuerdo con un determinado criterio.El modelo del proceso puede obtenerse algunas veces por consideraciones f��sicas,siendo mucho m�as di�cil determinar el modelo de las perturbaciones, que tienentanta o m�as importancia. Por otro lado un proceso puede no ser representable porun modelo matem�atico, siendo necesario una jerarqu��a de modelos complejos queimplementan hasta el m�as m��nimo detalle. Desde el punto de vista del dise~nadores deseable disponer de modelos simples, aunque s�olo sean v�alidos para estudios agroso modo. Es tarea del ingeniero elegir el modelo adecuado entre la gran variedadde modelos existentes entre un modelo simple o complejo.27

Page 44: Control Adaptativo y Robusto

28 Modelo del sistema y de las perturbacionesDesde el punto de vista de procesamiento, la identi�caci�on puede ser hecha enl��nea con el proceso o bien las medidas efectuadas son guardadas en un archivo yposteriormente procesadas. Por otro lado, si la identi�caci�on en l��nea se hace cadaperiodo de muestreo, tenemos lo que se llama\identi�caci�on en tiempo real". Para elcaso de los sistemas adaptativos, estamos interesados en la identi�caci�on en tiemporeal, por lo que normalmente utilizaremos la versi�on recursiva de los algoritmos. Portodo ello, es interesante disponer de un algoritmo de identi�caci�on que sea adecuadoen tiempo de ejecuci�on y convergencia.La identi�caci�on de un sistema comprende las siguientes tareas :� Estudio experimental. (Adquisici�on de datos).� Formulaci�on de un criterio.� Seleccionar la estructura del modelo.� Estimaci�on de los par�ametros.� Validaci�on del modelo obtenido.A continuaci�on describimos los algoritmos de identi�caci�on de par�ametros de sis-temas lineales discretos m�as utilizados y algunas modi�caciones de �estos, propues-tas por diversos autores. Un buen art��culo monogr�a�co sobre identi�caci�on es elde Astrom y Eykho� (1971). La demostraci�on exhaustiva de los distintos m�etodospuede encontrarse en Eykho� (1974) y en otros textos cl�asicos, como por ejemploen Ljung (1987).3.2 Modelo del sistema y de las perturbacionesSuponemos que el sistema puede ser modelado como un proceso estable, invarianteen el tiempo y linealizable, con una sola entrada y una sola salida, por lo que puedeser descrito por una ecuaci�on lineal en diferencias de la forma :y(k) + a1y(k � 1) + � � �+ any(k � n) = b1u(k � d� 1) + b2u(k � d� 2) + � � �+ bnu(k � d� n) + v(k) + c1v(k � 1) + c2v(k � 2) + � � �+ cnv(k � n)o bien en forma vectorial: y(k) = 'T (k) � + v(k) (3:1)

Page 45: Control Adaptativo y Robusto

Algoritmo de identi�caci�on de par�ametros 29donde:'T (k) = (�y(k � 1);�y(k � 2) � � � � y(k � n); u(k � d� 1); u(k � d� 2) � � �u(k � d� n); v(k); v(k � 1); v(k � 2); ::; v(k � n))�T = (a1; a2; � � �an; b1; b2; � � � bn; c1; c2; � � � cn)u(k) = U(k)� U1 (3.2)y(k) = Y (k)� Y1U(k) e Y (k) son los valores de entrada y salida del sistema en el instante k, U1es el valor medio de la se~nal de entrada, Y1 es el valor medio de la variable desalida y v(k) es una se~nal de ruido estad��sticamente independiente y estacionariacon distribuci�on normal y de media nula. Asumimos que las perturbaciones puedenser modeladas por un proceso ARMA1, con el mismo polinomio que el sistema. Lafunci�on de transferencia en z de este sistema puede escribirse como:y(z) = B(z�1)A(z�1) z�d u(z) + C(z�1)A(z�1) v(z) (3:3)donde: A(z�1) = 1 + a1z�1 + a2z�2 + :::: + anz�n (3.4)B(z�1) = b1z�1 + b2z�2 + :::: + bnz�nC(z�1) = 1 + c1z�1 + c2z�2 + ::::+ cnz�nEl primer cociente B(z�1)=A(z�1) representa el modelo de la planta, y el segundoC(z�1)=A(z�1) representa el modelo de las perturbaciones. El conjunto planta m�asperturbaciones, se denomina modelo ARMAX2.3.3 M�etodo de m��nimos cuadradosEste m�etodo es el m�as popular y m�as utilizado en la pr�actica como parte funda-mental de los sistemas de control adaptativo. De acuerdo con Gauss, el principiode m��nimos cuadrados consiste en buscar los par�ametros desconocidos de tal formaque la suma de los cuadrados de las diferencias entre los valores observados y calcu-lados multiplicado por un n�umero que mide el grado de precisi�on, sea un m��nimo.Para poder obtener una soluci�on anal��tica, los valores calculados deben ser funcioneslineales de los par�ametros desconocidos.1Auto Regresive Moving Average2Auto Regresive Moving Average con una variable eXogenous

Page 46: Control Adaptativo y Robusto

30 M�etodo de m��nimos cuadrados3.3.1 Caso deterministaEn un primer paso vamos a considerar que el sistema a identi�car es perfectamentedeterminista y que sobre el mismo no inciden perturbaciones ni ruidos de ning�untipo. Para este caso el modelo de la secci�on 3.2 se reduce a:y(k) + a1y(k � 1) + � � �+ any(k � n) = b1u(k � d� 1) + b2u(k � d� 2) + � � �+ bnu(k � d� n)Por lo que, para encontrar los 2n par�ametros se necesitan realizar 2n medidas deu(k) e y(k), con las que se puede plantear un sistema de ecuaciones lineales, dondelas inc�ognitas son los par�ametros ai y bj. O sea,y(k) = 'T (k)�y(k + 1) = 'T (k + 1)�� � � � � �y(k +N � 1) = 'T (k +N � 1)�O bien, Yk = k�donde N = 2n y cuya soluci�on viene dada por:� = �1k Yk3.3.2 Caso no deterministaNormalmente el sistema no es perfectamente determinista, sino que est�a afectadopor ruidos. En el modelo descrito anteriormente (ecuaciones 3.3 y 3.5), para el casoconsiderado se supone que C(z�1) = 1 , v(k) = e(k) y que el error residual e(k) esincorrelado con los elementos de '(k), de media nula y distribuci�on normal, por loque el modelo del sistema resulta ser:y(k) = 'T (k) �(k) + e(k) (3:5)

Page 47: Control Adaptativo y Robusto

Algoritmo de identi�caci�on de par�ametros 31donde, 'T (k) = (�y(k � 1);�y(k � 2) � � � � y(k � n);u(k � d� 1); u(k � d� 2) � � �u(k � d� n)�T (k) = (a1; a2; � � �an; b1; b2; � � � bn)El primer t�ermino del segundo miembro (ecuaci�on 3.5), puede ser interpretadocomo la predicci�on de un paso y(k=k� 1) de la salida y(k) con los datos disponiblesen el instante k � 1, por lo que el error resulta ser la diferencia entre la salida realy su predicci�on: e(k) = y(k)� y(k=k � 1)El m�etodo de m��nimos cuadrados consiste en minimizar el cuadrado del error:J =Xk e2k =Xk (yk � 'Tk �)2 (3:6)O bien en forma matricial,J = �Tk �k= (Yk � k�)T (Yk � k�)= Y Tk Yk � Y Tk k� � �TTk Yk + �TTkk�Calculando la derivada e igualando a cero se obtiene:�2Y Tk k + 2�TTkk = 0que resolviendo se llega a la expresi�on de,�MC = (Tkk)�1TkYk (3:7)El desarrollo anterior se ha realizado para 2n par�ametros, pero es igualmente v�alidopara el caso de na + nb par�ametros.Si el sistema est�a cambiando o bien estamos identi�cando un sistema no linealen una determinada zona de trabajo y pasamos a otra, necesitamos tomar otrasmedidas (N > 2n) y volver a calcular los par�ametros estimados. Este proceso, a laluz de la expresi�on 3.7, conlleva la inversi�on de una matriz de dimensi�on 2n � 2n,por lo que si la identi�caci�on se realiza en tiempo real puede sobrepasar el tiempode muestreo necesario para el sistema de control.

Page 48: Control Adaptativo y Robusto

32 M�etodo de m��nimos cuadrados3.3.3 M�etodo recursivoLos m�etodos recursivos aprovechan parte de los c�alculos realizados en un paso parael siguiente, por lo que el c�alculo de los par�ametros en un instante se realiza como,�N+1 = �N + correcci�on (3:8)Adem�as si el sistema est�a variando, (o bien se desea una actualizaci�on permanentede los par�ametros), se suelen ponderar las medidas que se van tomando, d�andolem�as peso a las m�as recientes como se ver�a en un apartado posterior.Para el desarrollo de la versi�on recursiva se plantean las expresiones de lospar�ametros en los instantes N y N + 1 y se calcula el t�ermino de correcci�on dela expresi�on 3.8.La soluci�on es bien conocida y conduce a los siguientes pasos (Franklin y Powell1980):1. Seleccionar los valores iniciales de P (k) y �(k).2. Obtener los nuevos valores de y(k + 1) y u(k + 1).3. Calcular el error residual a priori :e(k + 1) = y(k + 1)� 'T (k + 1)�(k) (3:9)4. Calcular L(k + 1) dado por la expresi�on :L(k + 1) = P (k)'(k + 1)1 + 'T (k + 1)P (k)'(k + 1)5. Calcular los nuevos par�ametros estimados dados por :�(k + 1) = �(k) + L(k + 1)e(k + 1) (3:10)6. Actualizar la matriz de covarianza.P (k + 1) = (I � L(k + 1)'T (k + 1))P (k) (3:11)7. Actualizar el vector de medidas '(k + 2).8. Hacer k = k + 1 y volver al paso 2.

Page 49: Control Adaptativo y Robusto

Algoritmo de identi�caci�on de par�ametros 33La estimaci�on de los par�ametros (�) est�a dada por los valores de la estimaci�onanterior corregida por un t�ermino lineal del error entre la salida y su predicci�on,siendo L(k + 1) la ganancia de la correcci�on.La ecuaci�on 3.10 tambi�en puede ser interpretada (Astrom 1980), como una cuasi-Newton iteraci�on para minimizar e2, donde ' = �gradp(e) y el t�ermino 'e puede serinterpretado como el gradiente de e2=2. La matriz de covarianza P (k) modi�ca la di-recci�on del gradiente y determina la longitud del paso. Tambi�en puede interpretarsecomo un factor de ganancia que determina el cambio de la identi�caci�on.Cuando los residuos estan correlados, los par�ametros estimados pueden sufrirdesviaciones. Por otro lado el orden del sistema y el retardo deben ser conocidosexactamente.3.4 M�etodo de m��nimos cuadrados extendidos ygeneralizadosEn m��nimos cuadrados se supone que los residuos est�an incorrelados, si no es as��, sepuede utilizar una versi�on extendida, en cuyo caso se supone que los residuos est�ancorrelados de la forma C(z�1)e(k), donde el polinomio C(z�1) tiene todos sus cerosdentro del circulo unidad. De todo ello se deduce que utilizando el modelo 3.1 conv(k) = e(k) cuyo valor es calculado mediante la ecuaci�on 3.9, se puede identi�car elmodelo de la planta y de las perturbaciones.Por otro lado, el m�etodo de m��nimos cuadrados generalizados se utiliza cuandose dispone de alguna informaci�on acerca de las perturbaciones, como puede ser elconocimiento del polinomio C(z�1) o la matriz de covarianza, en cuyo caso puededemostrarse que se obtienen mejores resultados si la matriz N = E(vvT ), es distintade la identidad, minimizando en este caso el criterio J = eTN�1e en vez de J = eT e,que se utiliza en m��nimos cuadrados.3.5 Aproximaci�on estoc�asticaEste es un m�etodo de identi�caci�on recursiva, caracterizado por su gran simplicidad.Existen muchas versiones de este algoritmo, siendo una de ellas (Isermann 1981), la

Page 50: Control Adaptativo y Robusto

34 M�etodo de variable instrumentalque minimiza la funci�on de costo: J = 12 e2(k)resultando el algoritmo:e(k + 1) = y(k + 1)� 'T (k + 1)�(k)�(k + 1) = �(k) +W (k + 1)'(k + 1)e(k + 1)Puede verse que el m�etodo es muy similar al de m��nimos cuadrados, con ladiferencia del factor W (k + 1) que es de elecci�on libre. Una de las formas m�asfrecuentes de escoger este factor es:W (k + 1) = Constante(k + 1)La desventaja del m�etodo, es que los par�ametros sufren desviaciones de los exac-tos y que la convergencia no es muy buena.3.6 M�etodo de variable instrumentalSi s�olo se est�a interesado en los par�ametros del sistema y no en los del modelo de lasperturbaciones cuando �estas est�an correladas con '(k), se puede utilizar el m�etodode variable instrumental. Este m�etodo (Isermann 1981), sustituye el vector '(k)por otro W (k) que es incorrelado con e(k). Dicho vector es de la forma:W T (k) = (�h(k�1);�h(k�2) � � ��h(k�n); u(k�d�1); u(k�d�2) � � �u(k�d�n))donde h(k) = y(k) =W T (k)�aux(k)es la salida de un modelo auxiliar de par�ametros �aux(k), sin perturbaciones. La es-tructura del algoritmo es igual a la de m��nimos cuadrados recursivos. Los par�ametrossuelen �ltrarse con un �ltro paso bajo. La elecci�on de los par�ametros iniciales pre-senta algunos problemas, por lo que suele inicializarse con los par�ametros estimadospor m��nimos cuadrados.

Page 51: Control Adaptativo y Robusto

Algoritmo de identi�caci�on de par�ametros 353.7 M�etodo de m�axima verosimilitudEste m�etodo se basa en maximizar la probabilidad de las medidas obtenidas en lospar�ametros ai y bi y es fuertemente no lineal en los ci. Por ello este m�etodo requieremuchos m�as c�alculos que los anteriores, siendo de aplicaci�on pr�actica limitada poreste motivo.El modelo utilizado es el dado el apartado 3.2, pudi�endose estimar los par�ametrosdel sistema y los del modelo de las perturbaciones.3.8 Modi�caciones al algoritmo de identi�caci�onTodos los algoritmos citados pueden darse bajo una formulaci�on uni�cada (Isermann1981). Por otro lado se ha supuesto que los par�ametros del sistema son invariantescon el tiempo, por lo que el identi�cador formulado tiene memoria in�nita, es decir,tienen el mismo peso todas las medidas obtenidas. Sin embargo si los par�ametrosdel sistema varian lentamente, bien por derivas o por que el sistema sea no lineal,es conveniente reducir la memoria del identi�cador con el objeto de que �este puedaseguir las variaciones del sistema, ponderando las medidas de forma que tengan m�aspeso las �ultimas sobre las m�as antiguas. Esto puede hacerse (Wellstead y Zanker1978) esencialmente:� Introduciendo un factor de olvido (c).� Sumando una matriz positiva (R) a la matriz de covarianza (P ) del identi�-cador.� O bien por una combinaci�on de las dos t�ecnicas anteriores.Los dos m�etodos consiguen que la matriz P no se haga muy peque~na, ya que en elidenti�cador original, esta matriz es mon�otonamente decreciente. El m�etodo m�asempleado es el del factor de olvido, que en algunos casos puede ser variable.Inclusi�on de un factor de olvidoIntroduciendo un factor de olvido, se consigue que el identi�cador tenga memoria�nita. La modi�caci�on en concreto consiste en sustituir P (k) por P (k)=c.

Page 52: Control Adaptativo y Robusto

36 Modi�caciones al algoritmo de identi�caci�onPara c = 1 se tiene el algoritmo de m��nimos cuadrados normal, mientras quepara c < 1 el algoritmo olvida las medidas m�as antiguas. Como referencia se puededecir que para c = 0:99 tiene una memoria de 100 pasos, siendo un rango normal deutilizaci�on del factor de olvido entre 0:98 y 1, pudiendo en algunos casos especialesdisminuirse hasta 0:95. La elecci�on de c es un compromiso entre una gran eliminaci�ondel ruido o un mejor seguimiento de la variaci�on de los par�ametros.La funci�on de costo que se minimiza por m��nimos cuadrados pasa a ser:J = kXm=1 ck�me2(k)Suma de una matriz positivaEste m�etodo (random walk), consiste en sumar una matriz (R) positiva a la matrizP (k), que pasa a ser de la forma :P (k + 1) = (I � L(k + 1)'T (k + 1))P (k) +Rcon ello se asegura que la matriz de covarianza permanezca limitada a un valorsuperior a R.Problemas que pueden presentarseSi a lo largo del tiempo el punto de funcionamiento del sistema no cambia, es decir,en este caso la excitaci�on es pobre, pueden aparecer algunos problemas. El productoP (k)'(k) puede hacerse cero o muy peque~no, por lo que la expresion 3.11 se reducea P (k + 1) = P (k)=c. Si se utiliza un factor de olvido menor de la unidad, P (k)puede crecer mucho, siendo por ello el identi�cador muy sensible a cualquier cambio(problema de Blow up o bursts, identi�cador windup). Al mismo tiempo puedenpresentarse problemas num�ericos en P (k) (Latawiec 1983, Astrom 1983).Para evitar el problema mencionado se han utilizado varias t�ecnicas, las cualesno son excluyentes.Posibles soluciones1. Un m�etodo para evitar los problemas mencionados es utilizar un factor de

Page 53: Control Adaptativo y Robusto

Algoritmo de identi�caci�on de par�ametros 37olvido variable (Fortescue 1981), bas�andose para ello en la informaci�on disponible,de forma que es calculado a cada paso seg�un la expresi�on:c(k + 1) = 1� �1� 'T (k + 1)L(k + 1)� e(k + 1)2SoCuando el error tiende a cero, c(k) tiende a uno, por lo que puede evitarse elproblema de crecimiento de la matriz P (k). El par�ametro So debe buscarsea priori, (So est�a relacionado con la suma de los errores al cuadrado), pero elidenti�cador es menos sensible a su busqueda que a la de c(k).Normalmente en la fase inicial de puesta en marcha del algoritmo es cuandointeresa que el factor de olvido sea peque~no, ya que es en esta fase cuando lospar�ametros son m�as inciertos, siendo necesario que a lo largo del tiempo seincremente al valor que deseamos tener. Esto puede conseguirse facilmente,utilizando por ejemplo una expresi�on de la forma (Isermann 1981):c(k + 1) = coc(k) + cf(1� co)con: co < 1 y c(0) < 1siendo el l��mite de c(k + 1) cuando k tiende a in�nito igual a cf . La t�ecnicadel factor de olvido variable no elimina totalmente los problemas mencionadosanteriormente, pero disminuye la probabilidad de aparici�on.2. Otra posible soluci�on para evitar el crecimiento de la matriz P (k), es hacerc(k) = 1 cuando la traza de la matriz P (k) exceda de un cierto valor (Cordero1981).3. Landau 1981 y Lozano 1982, proponen una estructura con dos factores deolvido, cuya expresi�on es de la forma:L(k + 1) = P (k)'(k + 1)c1(k)c2(k) + 'T (k + 1)P (k)'(k + 1)P (k + 1) = (I � L(k + 1)'T (k + 1))P (k)c1(k)donde 0 < c1(k) < 1 y 0 < c2(k) < 2;obteni�endose los mejores resultados para ganancia constante P (k) = P (0), obien para traza constante traza(P (k)) = traza(P (0)). Una posible soluci�on es�jar el cociente c1(k)=c2(k) entre 0:8 y 1, resolviendo la ecuaci�on de P (k + 1)para c1(k) de forma que la traza de P (k + 1) sea igual a la traza de P (k) eigual a una constante.

Page 54: Control Adaptativo y Robusto

38 Algoritmos de identi�caci�on r�apidos3.9 Algoritmos de identi�caci�on r�apidosCuando el tiempo es un factor primordial, se puede utilizar un algoritmo r�apidocomo por ejemplo el que sugiere Robin (1981). La idea de estos algoritmos es usaruna propiedad de invarianza. En concreto, de una iteraci�on a la siguiente de unalgoritmo recursivo, mucha de la informaci�on que se necesita en el instante k+1 yase tiene en el instante k, aunque en otro lugar distinto al que se precisa. Por elloutilizando este hecho se puede ahorrar tiempo, ya que en vez de calcular nuevamentetodos los datos, a algunos s�olo habr�a que cambiarlos de lugar, siendo menor el tiempode traslaci�on que el de c�alculo.3.10 Estimaci�on de los valores de continuaComo se ha visto, el identi�cador trabaja con los valores incrementales de las se~nalesde entrada y salida con respecto a los valores de continua U1 e Y1. Por ello estosvalores deben ser calculados o cancelados. A continuaci�on se dan varias formas depoder hacer esto.Utilizaci�on de los incrementos de las variablesMediante este m�etodo no se necesitan conocer los valores de continua ya que:u(k) = u(k)� u(k � 1) = (U(k)� U1)� (U(k � 1)� U1) = U(k)� U(k � 1)y(k) = y(k)� y(k � 1) = (Y (k)� Y1)� (Y (k � 1)� Y1) = Y (k)� Y (k � 1)La expresi�on anterior es aplicar un �ltro paso alto tanto a la entrada como a lasalida.C�alculo de los valores mediosUna forma simple de calcular U1 e Y1 es hallando su valor medio para una serie demedidas o bien recursivamente:

Page 55: Control Adaptativo y Robusto

Algoritmo de identi�caci�on de par�ametros 39U1 = � 1M � MXi=1 u(i) Y1 = � 1M � MXi=1 y(i)U1(k) = U1(k � 1) + 1k (U(k)� U1(k � 1))Y1(k) = Y1(k � 1) + 1k (Y (k)� Y1(k � 1))Mediante estimaci�on de una constanteSi se tiene descrito el sistema por la ecuaci�on en diferencias de la forma:Y (k) = �a1Y (k � 1)� a2Y (k � 2)� � � � � anY (k � n) +b1U(k � d� 1) + b2U(k � d� 2) + � � �+ bnU(k � d� n)Sustituyendo las expresiones 3.3 se obtiene:y(k) = �a1y(k � 1)� a2y(k � 2)� � � � � any(k � n) +b1u(k � d� 1) + b2u(k � d� 2) + ::: + bnu(k � d� n) +KK = (1 + a1 + a2 + ::+ an)Y1 � (b1 + b2 + :: + bn)U1 (3:12)Luego extendiendo el vector p(k) con un elemento K m�as y el vector de datos'(k) con un 1, se puede estimar la constante K y �jando uno de los dos valores U1o bien Y1 se podr�a calcular el otro. Se obtienen buenos resultados tomando Y1igual a la referencia y calculando U1 por la expresion 3.12.Para estimaci�on de sistemas en bucle cerrado donde act�ua un regulador, Witten-mark (1973), recomienda sustituir y(k) por y(k) � r(k) y u(k) por u(k) = u(k) �u(k � 1), tanto para el identi�cador como para el regulador.3.11 Algoritmo de identi�caci�on propuestoDadas las buenas caracter��sticas de simplicidad y convergencia, el m�etodo de iden-ti�caci�on m�as utilizado es el de m��nimos cuadrados recursivos, normal o extendido,

Page 56: Control Adaptativo y Robusto

40 Algoritmo de identi�caci�on propuestocon un factor de olvido variable y utilizando las soluciones propuestas para salvaralgunos problemas que se pueden presentar, quedando resumido en los pasos:1. Seleccionar los valores iniciales de P (k) y �(k).2. Obtener los nuevos valores de y(k + 1) y u(k + 1).3. Calcular el error residual a priori :e(k + 1) = y(k + 1)� 'T (k + 1)�(k)4. Calcular L(k+1) dado por la expresi�on :L(k + 1) = P (k)'(k + 1)c(k) + 'T (k + 1)P (k)'(k + 1)5. Calcular los nuevos par�ametros estimados dados por :�(k + 1) = �(k) + L(k + 1)e(k + 1)6. Calcular el nuevo factor de olvido c(k + 1).c(k + 1) = 1� (1� 'T (k + 1)L(k + 1))e(k + 1)2SoSi c(k + 1) < cmin Entonces c(k + 1) = cminSi c(k + 1) > 1 Entonces c(k + 1) = 17. Actualizar la matriz de covarianza.W (k + 1) = (I � L(k + 1)'T (k + 1))P (k) +R1Si tr W (k + 1)c(k + 1) ! > trmax Entonces c(k + 1) = 1P (k + 1) = W (k + 1)c(k + 1)8. Actualizar el vector de medidas '(k + 2).9. Hacer k = k + 1 y volver al paso 2.

Page 57: Control Adaptativo y Robusto

Algoritmo de identi�caci�on de par�ametros 413.12 Convergencia e identi�cabilidadEl criterio general que debe cumplir un algoritmo de identi�caci�on es que los par�ametrosno sufran desviaciones, o sea, que E(�(N)) = �o para N !1.Para m��nimos cuadrados las condiciones que se necesitan, (Isermann 1981), sepueden resumir en :1. El orden de los polinomios y el retardo (d) del sistema deben ser conocidos.2. U1 e Y1 deben ser conocidos exactamente.3. u(k) debe ser persistentemente excitada de orden n o mayor.4. y(k) debe estar perturbada por un ruido estacionario.5. e(k) debe ser incorrelado con los elementos de '(k).6. E(e(k)) = 0.7. La convergencia tambi�en depende de los valores de inicializaci�on del identi�-cador.Identi�caci�on en bucle cerradoUn sistema en bucle cerrado se dice identi�cable si los par�ametros estimados sonconsistentes cuando, usando un m�etodo de identi�caci�on apropiado, se tiene que:limN!1E(�(N)) = �oy la salida debe ser medible.Dado que en los sistemas de control adaptativo la identi�caci�on se realiza con elsistema operando en bucle cerrado, pueden aparecer problemas de identi�cabilidaden ciertos par�ametros, cuando se utiliza un regulador lineal y no se emplean se~nalesexternas de excitaci�on. En Isermann (1981), se plantean las condiciones de iden-ti�cabilidad de un sistema actuando en bucle cerrado sin se~nales externas. Estascondiciones est�an relacionadas con los �ordenes de los polinomios del sistema y delregulador. A continuaci�on se exponen los resultados m�as importantes.

Page 58: Control Adaptativo y Robusto

42 Convergencia e identi�cabilidadDado el sistema :A(z�1)y(k + d) = B(z�1)u(k) + C(z�1)e(k + d) (3:13)donde, A(z�1) = 1 + a1z�1 + a2z�2 + � � �+ amaz�maB(z�1) = b1z�1 + b2z�2 + � � �+ bmbz�mbC(z�1) = 1 + c1z�1 + c2z�2 + � � �+ cmcz�mcSuponiendo que el sistema opera en bucle cerrado con un regulador de la forma:u(t) = �Q(z�1)P (z�1) y(t)donde, Q(z�1) = q1z�1 + q2z�2 + :::: + qvz�vP (z�1) = 1 + p1z�1 + p2z�2 + :::: + pwz�wPrimera condici�onIntroduciendo el regulador en la ecuaci�on del sistema 3.13, suponiendo d = 0 ysumando en ambos miembros de la igualdad el t�ermino 'Sy', donde S es un polinomioarbitrario en z�1, se tiene que :Ay + Sy = �BQP y + Sy + CeMultiplicando por Q y operando se obtiene :(A + S)Qy = (�SP +BQ)�QP y�+ CQeAy = Bu+Cesiendo, A = (A+ S)QB = �SP +BQC = CQO sea, dado que S es arbitrario, existen muchas soluciones basadas en las medidasde u(k), y(k) y e(k). Luego esta condici�on implica que los �ordenes del modelo delproceso y de las perturbaciones deben ser conocidos con exactitud.

Page 59: Control Adaptativo y Robusto

Algoritmo de identi�caci�on de par�ametros 43Segunda condici�onLa funci�on de transferencia de la salida a las perturbaciones es de la forma :y(z)e(z) = CPAP +Bz�dQ = 1 + b01 + b02::+ b0rz�r1 + a01 + a02:: + a0lz�fLuego debe cumplirse que,f = max(ma + w;mb + d+ v)r = mc + wEl n�umero de par�ametros a identi�car es ma + mb que deben ser calculados apartir de f , o sea , f debe ser mayor o igual a ma +mb. Dicha condici�on se expresapor: max(ma + w;mb + d+ v) � ma +mbo sea, max(w �mb; d+ v �ma) � 0En dicha condici�on pueden ocurrir dos casos :1. d+ v �ma � w �mb � 0v � w �mb +ma � d � ma � d2. w �mb � d+ v �ma � 0w � d+ v �ma +mb � mbPor otro lado para estimar los mc par�ametros de C(z�1), se necesita que r seamayor que mc, lo cual se cumple si se escoge por ejemplo w > 0. Si A y C tienen pceros comunes, estos no pueden ser identi�cados y la condici�on 3.12 quedar��a como:max(w �mb; d+ v �ma) � pPara hacer cumplir esta condici�on, seg�un el caso, habr�a que �jar algunos par�a-metros a priori para disminuir el n�umero de par�ametros a identi�car o bien habr�aque aumentar el retardo (d) del sistema. Normalmente p = 0 y se considerar�a quelos �ordenes de los polinomios son iguales a n, por lo que esta condici�on se puedeexpresar como: max(w; v + d) � n

Page 60: Control Adaptativo y Robusto

44 Ejemplo de identi�caci�onUn ejemploSupongamos un sistema con orden de los polinomios A y B igual a n y que trabajacon el regulador de m��nima varianza que se describir�a m�as adelante (apartado 5.5),dado por: u(k) = �GzBF y(k)Los ordenes de los polinomios G y F son respectivamente n� 1 y d, luego :v = n� 1 y w = n+ d� 1De acuerdo con la condici�on expresada en el apartado anterior, para que elsistema sea identi�cable, el retardo debe ser mayor o igual a 1 o bien habr�a que �jarun par�ametro.3.13 Ejemplo de identi�caci�onA continuaci�on se muestra la evoluci�on de los par�ametros identi�cados en bucleabierto, del sistema dado por su funci�on de transferencia:G(z) = 3z�1 + 4z�21� z�1 � 2z�2cuando se le somete a una entrada aleatoria de media cero. Puede observarse en la�gura 3.1, com�o los par�ametros convergen a los valores correctos.

Page 61: Control Adaptativo y Robusto

Algoritmo de identi�caci�on de par�ametros 45

0.0 10.0 20.0 30.0 40.0 50.0 60.0 70.0Tiempo

0.0

1.0

2.0

3.0

4.0

5.0

Par

amet

ros

a1a2b1b2

Figura 3.1: Par�ametros identi�cados

Page 62: Control Adaptativo y Robusto

46 Ejemplo de identi�caci�on

Page 63: Control Adaptativo y Robusto

Cap��tulo 4Control adaptativo por modelo dereferencia4.1 Introducci�onComo se mencion�o en el cap��tulo 2, la t�ecnica de control adaptativo por modelode referencia (mrac) fu�e introducida por Whitacker en 1958, siendo su forma m�aspopular la mostrada en la �gura 4.1.En este esquema puede verse un controlador primario que se utiliza para obtenerel comportamiento en bucle cerrado (como en cualquier esquema de control conven-cional). Por otro lado como los par�ametros del proceso pueden ser desconocidos yvariables, es dif��cil encontrar un controlador �jo que responda en todas las situa-ciones. En la t�ecnica mrac, la respuesta deseada a una se~nal de entrada del procesose especi�ca como un modelo de referencia. El mecanismo de adaptaci�on mira lasalida yp del proceso y la salida ym del modelo de referencia y calcula los par�ametrosadecuados de forma que la diferencia tienda a cero. El mecanismo de adaptaci�onpuede utilizar, si est�an disponibles, adem�as de las se~nales de salida del proceso y delmodelo de referencia (yp, ym), las se~nales de entrada, de referencia y las variablesde estado del proceso.En el esquema de la �gura 4.1, el modelo de referencia est�a colocado en paralelocon el proceso. Este esquema es bastante usual, aunque existen diversas posibili-dades, como colocarlo en serie o bien una combinaci�on serie-paralelo. A lo largo deeste cap��tulo nos centraremos en la estructura paralelo.47

Page 64: Control Adaptativo y Robusto

48 Dise~no de controladores adaptativos-����- - -6

- ?����6

Modelo deReferenciaPlantaControladorAjustable

MecanismodeAdaptaci�onCC BBN?r u ypymFigura 4.1: Esquema general de MRAC paraleloUna de las partes m�as importantes en control adaptativo es el dise~no de laley de control. La primera ley de control adaptativo hac��a uso de los modelos desensibilidad y m�as tarde de la teor��a de estabilidad de Lyapunov y de la teor��a dehiperestabilidad de Popov. Estas �ultimas garantizan la estabilidad del conjunto delsistema, lo que las hace particularmente interesantes, convirti�endose en m�etodos dedise~no est�andar.

4.2 Dise~no de controladores adaptativosComo se ha visto en la secci�on anterior, un sistema de control adaptativo b�asicamenteest�a formado por tres partes: un controlador primario, un modelo de referencia y laley de adaptaci�on. Por lo tanto para el dise~no de un sistema de control adaptativo,ser�a necesario de�nir las tres partes. Dado que la parte que caracteriza al controladaptativo es la ley de adaptaci�on, en lo que sigue, nos centraremos fundamental-mente en esta parte.

Page 65: Control Adaptativo y Robusto

Control adaptativo por modelo de referencia 49Controlador PrimarioEl controlador primario puede tener en principio cualquiera de las con�guracionesconocidas para el dise~no de controladores lineales. Sin embargo, debe cumplir lacondici�on de que sea posible que el conjunto del proceso y el controlador puedanreproducir al modelo de referencia. Este requisito, supone restricciones sobre elorden y la estructura del controlador. Por otro lado para que pueda aplicarse unaadaptaci�on directa, la se~nal de control debe ser una funci�on lineal de los par�ametros.Modelo de referenciaEl modelo de referencia, que especi�ca el comportamiento deseado en bucle ce-rrado, se d�a usualmente en forma param�etrica. La condici�on mencionada anterior-mente para el seguimiento del modelo de referencia, tambi�en condiciona en ciertosaspectos el modelo de referencia posible, en cuanto al orden relativo del proceso(exceso de polos). Por otro lado el modelo elegido debe ser sensible a la din�amicadel proceso, ya que si por ejemplo se elige un modelo con una din�amica muy r�apida,la se~nal de control ser�a muy grande causando saturaciones y no pudiendo el sistemaresponder a dicha din�amica. Por ello la elecci�on del modelo de referencia no es f�acil,eligiendose normalmente un modelo conservador.4.2.1 Enfoque de sensibilidadEste m�etodo est�a basado en el uso de los modelos de sensibilidad para adaptar lospar�ametros en la direcci�on correcta. La deducci�on de este m�etodo comienza con elplanteamiento de un ��ndice de actuaci�on, normalmente cuadr�atico:J (t+ T ) = Z t+Tt e21(�)d�En esta ecuaci�on e1 = yp � ym y el ��ndice J se eval�ua sobre el periodo T �jo, en elcual los par�ametros permanecen constantes. En el instante (t + T ) los par�ametrosson ajustados en la direcci�on decreciente de J .�(t + T ) = �(t)� �@J@� = �(t)� � Z t+Tt 2e1(�)@e1(�)@� d� (4:1)� debe ser una matriz cuadrada de�nida positiva, que representa la ganancia deadaptaci�on. Usualmente es diagonal. Teniendo en cuenta que:@e1(�)@� = @yp@�

Page 66: Control Adaptativo y Robusto

50 Dise~no de controladores adaptativosLa ecuaci�on (4.1) queda:�(t + T )� �(t)T = � 1� Z t+Tt 2e1(�)@yp@� d� (4:2)Que en el l��mite para T ! 0 da la ley de adaptaci�on:d�dt = �2�e1@yp@� (4:3)El factor @yp=@� representa la sensibilidad de la salida del proceso a las varia-ciones en �, y puede ser generado por un modelo de sensibilidad. Como puedeobservarse esta ley de adaptaci�on es la misma obtenida en el cap��tulo 2, denomi-nada como la regla del MIT.El modelo de sensibilidad anterior se sustituye por la sensibilidad del modelode referencia, dado que normalmente el modelo del proceso se desconoce. Estasuposici�on se hace en base a que pasado un tiempo la respuesta del sistema convergea la respuesta del modelo de referencia.La principal desventaja de este m�etodo, es la ausencia de un criterio que garanticela estabilidad del sistema de control. El sistema puede hacerse inestable si el modelode referencia no se escoge adecuadamente o si la ganancia de adaptaci�on se eligedemasiado grande.4.2.2 M�etodo de LyapunovDado el caracter no lineal y variable en el tiempo de los sistemas adaptativos pormodelo de referencia mrac, no son v�alidos los criterios de estabilidad de sistemaslineales. Un m�etodo bien conocido es el m�etodo directo de Lyapunov. Este m�etodoestablece que un sistema tiene un equilibrio x = 0, asint�oticamente estable, si existeuna funci�on, llamada de Lyapunov, V (x) que satisface:V (x) > 0 para x 6= 0 de�nida positiva_V (x) < 0 para x 6= 0 de�nida negativaV (x) ! 1 para jjxjj ! 1 (4.4)V (0) = 0

Page 67: Control Adaptativo y Robusto

Control adaptativo por modelo de referencia 51Como la funci�on de Lyapunov es similar a una funci�on de energ��a, �esta debedecrecer con el tiempo. Utilizando este m�etodo en el dise~no de sistemas adaptativos,se trasladan las especi�caciones de estabilidad directamente en la ley de adaptaci�on,siguiendo los pasos:1. El primer paso es encontrar la ecuaci�on de error, bien en la salida (yp� ym) oen las variables de estado (xp � xm).2. Encontrar una funci�on de Lyapunov como una funci�on del error entre lasse~nales y del error en los par�ametros (� = � � �). En su forma m�as sim-ple esta funci�on toma la forma:V = eTPe+ �T��1�Donde las matrices P y ��1 deben ser de�nidas positivas.3. Calcular la derivada de la funci�on de Lyapunov. La derivada debe ser de�nidanegativa. Generalmente toma la forma:_V = �eTQe + algunos t�erminos incluyendo �El primer t�ermino garantiza que la derivada es de�nida negativa, por lo que,haciendo el resto igual a cero se tiene una posible soluci�on. La matriz Q esde�nida positiva. Las matrices P y Q, para un sistema gobernado por unamatriz A, est�an relacionadas por la ecuaci�on de Lyapunov:�Q = ATP + PA (4:5)4. Haciendo el termino extra igual a cero se obtiene la ley de adaptaci�on. Nor-malmente tiene la forma: _� = ��"� (4:6)" est�a directamente relacionado con el error e y � es una versi�on modi�cadadel vector de se~nales (referencia, salida, etc).Ejemplo de sistema de primer ordenConsiderando el sistema de la �gura 4.2, donde la se~nal de control est�a dada por:u = K r, siendo K la ganancia ajustable que hay que calcular, la deducci�on de laley de adaptaci�on es como sigue:_yp = bKr � yp_ym = r � ym_e = _yp � _ym = (bK � 1)r � (yp � ym) (4.7)= �e + (bK � 1)r

Page 68: Control Adaptativo y Robusto

52 Dise~no de controladores adaptativos- - -

- ����?6 -K bs+11s+1

r u ypym

eProceso

ModeloFigura 4.2: Sistema y modelo de primer ordenTeniendo en cuenta que el t�ermino (bK�1) es proporcional al error en el par�ametro,la funci�on de Lyapunov en este caso puede elegirse como:V = e2 + 1 (bK � 1)2Su derivada resulta ser:_V = 2e _e + 2b _K(bK � 1)= 2e[�e + (bK � 1)r] + 2b _K(bK � 1)= �2e2 + 2e(bK � 1)r + 2b _K(bK � 1) (4.8)El primer t�ermino es negativo. As�� que haciendo el resto igual a cero se obtiene laley de adaptaci�on:2e(bK � 1)r + 2b _K(bK � 1) = 0 =) _K = � b er = � 1erEn esta ley de adaptaci�on el par�ametro libre es 1, siendo necesario conocer el signode b para �jar el de 1.En las �guras 4.3 y 4.4 se representa una simulaci�on del ejemplo descrito cuandoel par�ametro b vale inicialmente 4 y en el instante 20 pasa a valer 2. Puede observarse

Page 69: Control Adaptativo y Robusto

Control adaptativo por modelo de referencia 53-1

-0.5

0

0.5

1

1.5

0 5 10 15 20 25 30 35 40

Tiempo

Sal

idas

yp

- ym

0

0.1

0.2

0.3

0.4

0.5

0 5 10 15 20 25 30 35 40

Tiempo

Par

amet

ro k

Figura 4.3: Proceso de primer orden ( 1 = 0:1)-1

-0.5

0

0.5

1

1.5

0 5 10 15 20 25 30 35 40

Tiempo

Sal

idas

yp

- ym

0

0.2

0.4

0.6

0 5 10 15 20 25 30 35 40

Tiempo

Par

amet

ro k

Figura 4.4: Proceso de primer orden ( 1 = 0:5)

Page 70: Control Adaptativo y Robusto

54 Dise~no de controladores adaptativosc�omo la adaptaci�on es buena en ambos casos, siendo m�as r�apida en el caso de la�gura 4.4, dado que la ganancia de adaptaci�on es superior. En l��nea a trazos serepresenta la salida del modelo de referencia y en l��nea continua la salida del modeloajustable.La principal desventaja del m�etodo de Lyapunov es que no es un m�etodo sis-tem�atico, dado que hay que encontrar la funci�on de Lyapunov V adecuada en cadacaso.4.2.3 M�etodo de hiperestabilidadCon este m�etodo tambi�en se consigue una ley de adaptaci�on estable. Como en elm�etodo de Lyapunov, en primer lugar se formulan las ecuaciones de error. Estasecuaciones se dividen en una parte lineal invariable con el tiempo y otra no lineal yvariable con el tiempo. La primera parte contiene usualmente al modelo de referenciay su salida es la se~nal de error que es utilizada para la ley de adaptaci�on. La segundaparte contiene la ley de adaptaci�on y su salida negada es la entrada a la parte lineal.Esta estructura se corresponde con la vista en la secci�on 2.2 del cap��tulo 2. Lateor��a de hiperestabilidad garantiza la estabilidad asint�otica si ambas partes (linealy no lineal), satisfacen las condiciones de pasividad (Landau 1979):1. La parte lineal (ll�amese G(s)), debe ser estrictamente positiva. Ello signi�caque:(a) G(s) debe ser real si s es real.(b) los polos de G(s) deben tener parte real negativa, y(c) la parte real de G(j!) de ser mayor que cero para �1 < ! <1.2. La parte no lineal debe cumplir la desigualdad de Popov.Z t0 vTw dt � � 2 ; 8t > 0siendo v el vector de entrada y w el vector de salida de la parte no lineal, y 2una constante �nita positiva que no depende de t.

Page 71: Control Adaptativo y Robusto

Control adaptativo por modelo de referencia 554.3 Estructura general de los sistemas adapta-tivos (MRAC)Considerando de nuevo el esquema paralelo de la �gura 4.1, pueden considerarse dosposibles formas de descripci�on: mediante variables de estado o bien entrada-salida.Considerando la primera de ellas, puede escogerse el modelo de referencia como elconjunto de ecuaciones lineales,_x = AMx +BMu; x(0) = x0 (4:9)donde x es el vector de estado y u es el vector de entrada. Este modelo se suponeestable y completamente controlable. En cuanto al modelo ajustable (planta m�ascontrolador), puede utilizarse la siguiente representaci�on,_y = AS(e; t)x+BS(e; t)u; x(0) = x0; AS(0) = AS0; BS(0) = BS0; (4:10)El vector de error generalizado viene dado por: e = x� yEl objetivo de dise~no, en el caso param�etrico, es encontrar la ley de adaptaci�ontal que las matrices de par�ametros AS(e; t) y BS(e; t) sean modi�cadas de forma queel error tienda a cero para cualquier entrada u.La derivada del error puede obtenerse restando las ecuaciones anteriores, dondeadem�as se suma y resta el t�ermino AMy._e = _x� _y = AMx+BMu� AS(e; t)x� BS(e; t)u+ AMy � AMy (4:11)pudi�endose expresar como:_e = AMe+ [AM � AS(e; t)]y + [BM �BS(e; t)]u (4:12)Si se desea que el mecanismo de adaptaci�on tenga memoria (lo cual es lo m�ashabitual), debe considerarse la inclusi�on de un integrador en el mecanismo de

Page 72: Control Adaptativo y Robusto

56 Estructura general de los sistemas adaptativos (MRAC)

-���� - lll,,,�6

����ZZZZZZZZ��������?6 �� ������

��?66

?�� ��

AM � AS(0)BM �BS(0)u

yAM_e e

F (e; t)G(e; t)Figura 4.5: Representaci�on equivalente del modelo de error

Page 73: Control Adaptativo y Robusto

Control adaptativo por modelo de referencia 57adaptaci�on. Esto tendr�a el efecto de que los par�ametros ajustables depender�anno s�olo del error en un instante sino tambi�en de los valores pasados. Por ello la leyde adaptaci�on se de�ne como:AS(e; t) = F (e; �; t) + AS(0); 0 � � � tBS(e; t) = G(e; �; t) +BS(0); 0 � � � t (4.13)Las ecuaciones 4.12 y 4.13, pueden representarse seg�un la �gura 4.5, sistema quese puede descomponer en un sistema lineal y otro no lineal, al cual se le puedenaplicar el criterio de Popov de estabilidad (o criterio de hiperestabilidad).-���� ���� - lll,,,�6

ZZZZ��������ZZZZ����

6

? � ����6 � ����?

6? AS(0)� AM

BS(0)� BMu

yAM_e e -

,,,lll,,,lll

��� � ��

��6?6

D�1�212

SL

SNL

w1w v

Figura 4.6: Sistema adaptativo por modelo de referencia paraleloPara conseguir cumplir dicho criterio, por un lado la parte lineal se modi�caa~nadi�endole un t�ermino D en serie. En cuanto a las funciones F y G, caben muchas

Page 74: Control Adaptativo y Robusto

58 Ejemplos ilustrativosposibilidades de elecci�on, pero teniendo en cuenta que deseamos que el error enr�egimen permanente sea cero, pueden elegirse de la forma:F (e; t) = Z 10 �1(v; t)dt+ �2(v; t)G(e; t) = Z 10 1(v; t)dt+2(v; t) (4.14)La estructura �nal del sistema ser��a la representada en la �gura 4.6 donde lospar�ametros de dise~no ser��an las funciones D, �1, �2, 1 y 2. La resoluci�on serealiza para cada caso concreto y no de forma general, ya que el caso general resultabastante complicado.4.4 Ejemplos ilustrativosEn primer lugar vamos a ver un ejemplo de control de un barco, de los dos primerosm�etodos comentados y posteriormente un ejemplo del m�etodo de hiperestabilidad.Generalmente, la din�amica de un barco se obtiene aplicando las leyes de Newtonal movimiento del barco. Para buques de grandes dimensiones, el movimiento enel plano vertical puede despreciarse, dado que el efecto del balance y cabezada espeque~no en esos casos. El movimiento es descrito generalmente por un sistema decoordenadas �jo al barco (ver �gura 4.7).Un modelo simple que describe el comportamiento din�amico de un buque puedeexpresarse mediante la ecuaci�on diferencial (modelo de Nomoto de 3er orden):3)(t) + � 1�1 + 1�2� �(t) + � 1�1�2� _(t) = K�1�2 ��3 _�(t) + �(t)� (4:15)donde es el rumbo y � el �angulo de tim�on. Asumiendo condiciones iniciales nulas,(4.15) puede escribirse como,(s)�(s) = K(�3s+ 1)s(�1s+ 1)(�2s+ 1) (4:16)donde K, �1, �2 y �3 son par�ametros, los cuales son funci�on de la constante develocidad axial del barco u y de su longitud l, pudi�endose expresar dichos par�ametroscomo:

Page 75: Control Adaptativo y Robusto

Control adaptativo por modelo de referencia 59Ψ

uv

y

δ

x

VFigura 4.7: Sistema de coordenadas del barcoK = K0 �ul � (4.17)�i = �i0 lu! ; i = 1; 2; 3: (4.18)En nuestro ejemplo tomaremos los siguientes par�ametros que corresponden a unbuque tipo carguero (Layne y Passino 1993): K0 = �3:86, �10 = 5:66, �20 = 0:38,�30 = 0:89, y l = 161 m. Tambi�en asumimos que el barco est�a navegando en ladirecci�on x a una velocidad de 5 m/s.En la navegaci�on de mantenimiento de rumbo, un barco s�olo experimenta peque~nasdesviaciones del curso marcado. De esta forma, el modelo (4.15) se obtiene de lalinealizaci�on de las ecuaciones de movimiento en torno a un �angulo de tim�on decero grados (� = 0). Como resultado de �esto, el �angulo de tim�on no debe excederaproximadamente de 5o, en otro caso el modelo ser�a inadecuado, ya que se pondr�ade mani�esto el comportamiento no lineal. Para nuestro prop�osito, necesitamos unmodelo que sea v�alido para variaciones del �angulo de tim�on superiores a los 5o, porello, utilizaremos el modelo propuesto por Bech y Smitt (Layne y Passino 1993).Este modelo extendido est�a dado por,

Page 76: Control Adaptativo y Robusto

60 Ejemplos ilustrativos3)(t) + � 1�1 + 1�2� �(t) + � 1�1�2�H( _(t)) = K�1�2 ��3 _�(t) + �(t)� (4:19)donde H( _(t)) es una funci�on no lineal de _(t). La funci�on H( _(t)) puede cal-cularse de la relaci�on entre � y _ en r�egimen permanente tal que 3) = � _� = 0.Un experimento conocido como el test de espiral ha demostrado que H( _) puedeaproximarse por: H( _) = a _3 + b _ (4:20)donde a y b son dos valores reales constantes tal que a es siempre positivo. Ennuestro ejemplo elegiremos ambos valores de a y b como la unidad.A continuaci�on vamos a presentar dos controladores adaptativos por modelo dereferencia para el sistema descrito anteriormente. Ambos utilizar�an un controladorproporcional derivativo (PD). Los m�etodos considerados son el m�etodo del gradi-ente y el m�etodo basado en el criterio de estabilidad de Lyapunov para dise~no decontroladores adaptativos.4.4.1 M�etodo del gradienteEl mecanismo de ajuste de par�ametros utilizando este m�etodo puede ser implemen-tado mediante la conocida regla del MIT. Para ello, se utiliza la funci�on de costo,J = 122e(t) (4:21)donde e(t) = m(t)� (t)y d�dt = � @J@�por lo que, d�dt = � e(t)@e(t)@�Para el desarrollo de la regla del MIT para el control del barco, asumimos queel barco puede ser modelado por un sistema lineal de segundo orden. Este modelo

Page 77: Control Adaptativo y Robusto

Control adaptativo por modelo de referencia 61puede obtenerse eliminando el polo del sistema correspondiente a �2 en (4.15), dadoque la din�amica asociada a este polo es mucho mayor que la resultante del polo �1.Por otro lado, se supone que el sistema opera con peque~nos valores de la derivadadel �angulo de tim�on, de forma que el t�ermino correspondiente a _� es despreciable;quedando en ese caso que el modelo (conocido como de Nomoto) de 2o orden delbuque tiene la forma: �(t) + � 1�1� _(t) = �K�1 � �(t) (4:22)El controlador PD que puede emplearse en este caso viene dado por,�(t) = kp(r(t)�(t))� kd _(t) (4:23)donde kp y kd son las ganancias proporcional y derivativa respectivamente y r(t)es la salida deseada. Sustituyendo 4.23 en 4.22 se obtiene,�(t) + 1 +Kkd�1 ! _(t) + Kkp�1 !(t) = Kkp�1 !r(t) (4:24)cuya funci�on de transferencia es,(t) = Kkp�1s2 + �1+Kkd�1 � s+ �Kkp�1 �r(t) (4:25)El modelo de referencia para este sistema se escoge como:m(t) = !2ns2 + 2�!ns+ !2nr(t) (4:26)con � = 1 y !n = 0:05. Combinando 4.26 con 4.25 y calculando la derivada parcialcon respecto a kp y kd se tiene,@e(t)@kp = 0@ K�1s2 + �1+Kkd�1 � s + �Kkp�1 �1A ((t)� r(t)) (4:27)y @e(t)@kd = 0@ K�1 ss2 + �1+Kkd�1 � s+ �Kkp�1 �1A(t) (4:28)

Page 78: Control Adaptativo y Robusto

62 Ejemplos ilustrativosEn general las expresiones 4.27 y 4.28 no se pueden utilizar porque los par�ametroskp y kd no se conocen, pero en el caso �optimo se tiene que,s2 + 1 +Kkd�1 ! s+ Kkp�1 ! = s2 + 2�!ns+ !2n (4:29)Adem�as el t�ermino K=�1 puede incluirse en la ganancia de adaptaci�on . Noobstante, esto requiere que se conozca el signo de K=�1. En general debe serpositivo para asegurar que la adaptaci�on del controlador se hace en la direcci�onnegativa del gradiente. Para un buque de las caracter��sticas rese~nadas en el apartadoanterior el signo de K=�1 es negativo lo cual implica que el de con K=�1 incluidodebe ser negativo para asegurar la direcci�on negativa del gradiente. Despu�es deestas aproximaciones se obtienen las ecuaciones diferenciales del controlador PDsiguientes: dkpdt = � 1 1s2 + 2�!ns+ !2n (�r)!e (4:30)dkddt = � 2 ss2 + 2�!ns+ !2n!e (4:31)donde 1 y 2 son n�umeros negativos. Despu�es de muchas simulaciones, se hanencontrado que los mejores par�ametros son: 1 = �0:005 y 2 = �0:1En la �gura 4.8, puede verse la evoluci�on de la respuesta del sistema junto conla salida del modelo de referencia y la se~nal de referencia. En el instante de tiempo2300 segundos se cambia la velocidad de 5 m/s a 7.5 m/s, variable que afecta engran medida a la din�amica del buque. Puede observarse como la salida del sistemase va aproximando a la salida deseada conforme los par�ametros del controlador PDvan convergiendo a los valores �optimos. En la �gura 4.9 se muestran la se~nal decontrol y los par�ametros kp y kd. La convergencia de estos �ultimos es un poco lenta,aunque como se aprecia en la �gura 4.8 el seguimiento es bueno a partir de 1500segundos.4.4.2 M�etodo de LyapunovA continuaci�on se va a resolver el mismo ejemplo anterior utilizando el m�etodo deLyapunov descrito en la secci�on 4.2.2. En este caso tambi�en se utilizar�a un regulador

Page 79: Control Adaptativo y Robusto

Control adaptativo por modelo de referencia 63

-80

-60

-40

-20

0

20

40

60

80

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Tiempo (segundos)

Rum

bo (

grad

os)

Figura 4.8: Respuesta ante entradas en escalon

-400

-200

0

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Tiempo (segundos)

kd -

kp

-100

-50

0

50

100

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Tiempo (segundos)

Ang

ulo

de ti

mon

Figura 4.9: Evoluci�on de la se~nal de control y de los par�ametros

Page 80: Control Adaptativo y Robusto

64 Ejemplos ilustrativosPD (4.23) y se considerar�a el modelo reducido (4.22). Tambi�en se emplear�an losmismos valores de � = 1 y !n = 0:05.Las ecuaciones que describen la din�amica del barco pueden ponerse en formamatricial de la siguiente forma: _� ! = 0 1�Kkp�1 �1+Kkd�1 ! _ !+ 0Kkp�1 !r (4:32)As�� mismo el modelo de referencia esta dado por: _m�m ! = 0 1�!2n �2�!n ! m_m !+ 0!2n !r (4:33)La din�amica que describe la evoluci�on del error e(t) = m(t) � (t) puedeexpresarse por: _e = Ame + (Am � As(t)) + (Bm � Bs(t))r (4:34)donde el sub��ndice m y s corresponde a las matrices del modelo y del sistemaajustable dados por las ecuaciones 4.32 y 4.33. Los vectores corresponden a:e = [e _e]T ; = [ _]TEl punto de equilibrio e = 0 es asint�oticamente estable si se elige la ley deadaptaci�on como: _As(t) = PeT (4.35)_Bs(t) = Perdonde P es una matriz de�nida positiva, soluci�on de la ecuaci�on de Lyapunov ATmP+PAm = �Q < 0. Resolviendo para Q la matriz identidad se tiene que:P = p11 p12p21 p22 ! = 25:0125 200:000200:000 2005:00 ! (4:36)

Page 81: Control Adaptativo y Robusto

Control adaptativo por modelo de referencia 65Por otro lado a partir de las ecuaciones 4.35 para _kp y _kd, se tiene la ley deadaptaci�on, _kp = � 1 (p21e + p22 _e)(� r) (4.37)_kd = � 2 (p21e + p22 _e) _ (4.38)donde 1 y 2 son n�umeros negativos. Despu�es de varias simulaciones, se han en-contrado los valores de los par�ametros: 1 = �0:0005 y 2 = �0:001

-80

-60

-40

-20

0

20

40

60

80

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Tiempo (segundos)

Rum

bo (

grad

os)

Figura 4.10: Respuesta ante entradas en escal�onEn la �gura 4.10, puede verse la evoluci�on de la respuesta del sistema junto conla salida del modelo de referencia y la se~nal de referencia. Puede observarse comola salida del sistema se va aproximando a la salida deseada conforme los par�ametrosdel controlador PD van convergiendo a los valores �optimos. En la �gura 4.11 semuestran la se~nal de control y los par�ametros kp y kd. La convergencia de estos�ultimos es un poco lenta, aunque como se aprecia en la �gura 4.10 el seguimiento esbueno a partir de 500 segundos.

Page 82: Control Adaptativo y Robusto

66 Ejemplos ilustrativos

-400

-200

0

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Tiempo (segundos)

kd -

kp

-100

-50

0

50

100

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Tiempo (segundos)

Ang

ulo

de ti

mon

Figura 4.11: Evoluci�on de la se~nal de control y de los par�ametros4.4.3 M�etodo de hiperestabilidadSup�ongase el modelo de referencia y el sistema ajustable dados por:yRu = �s2 + a1s+ a2 (4.39)yAu = �s2 + a1s+ a2 (4.40)La aplicaci�on del enfoque de hiperestabilidad a este caso conlleva los siguientespasos:1. Transformar el sistema en la forma equivalente de dos bloques, con la partelineal y no lineal.2. Encontrar la soluci�on de la parte de la ley de adaptaci�on no lineal utilizandoel criterio de Popov.

Page 83: Control Adaptativo y Robusto

Control adaptativo por modelo de referencia 673. Encontrar la soluci�on de la parte de la ley de adaptaci�on correspondiente a laparte lineal de forma que sea estrictamente positiva.4. Realizar la ley de adaptaci�on.Siguiendo estos pasos, en primer lugar restando las ecuaciones 4.40 y 4.39 setiene, (1 + a1s+ a2s2)" = [�� �("; t)]u (4:41)donde �("; t), de acuerdo con la estructura general de la ley de adaptaci�on vendr�adado por: �("; t) = Z t0 1(v; t; �)d� + 2(v; t) + �(0) (4:42)siendo v la salida de la parte lineal, que es la salida del error generalizado con eloperador D. O sea, v = D(s)".La parte derecha de la ecuaci�on 4.41, puede considerarse como una entradaw1 = [�� �("; t)]u. Por lo que la parte lineal vendr�a de�nida por:(1 + a1s+ a2s2)" = w1v = D(s)" (4.43)Si se considera la expresi�on dada por la ecuaci�on 4.42, la se~nal w1 aparece comola salida del bloque no lineal que tiene a su vez como entrada la se~nal v. Por lotanto se tiene,w = �w1 = �[�� �("; t)]u = u �Z t0 1(v; t; �)d� + 2(v; t) + �(0)� �� (4:44)El esquema equivalente correspondiente puede verse en la �gura 4.12.El segundo paso, corresponde a encontrar la soluci�on para 1 y 2 de forma quese veri�que,Z t10 v w dt = Z t10 v u �Z t0 1(v; t; �)d� + 2(v; t) + �(0)� �� dt � � 20 (4:45)En este caso particular, para resolver la desigualdad puede descomponerse endos integrales I1 e I2 tales que,

Page 84: Control Adaptativo y Robusto

68 Ejemplos ilustrativos���� - -

��� @@@6

� ����� ���HHH � ��6?611+a1s+a2s2 D(s)

1 2�(0)� �

uw w1 ve

Figura 4.12: Esquema equivalente del ejemploI1 = Z t10 v u �Z t0 1(v; t; �)d� + �(0)� �� dt � � 21 (4.46)I2 = Z t10 v u 2(v; t)dt � � 22 (4.47)Si se hace que ambas integrales sean � 0, la suma ser�a � 0 y por lo tanto � � 2para todo t � 0.Centr�andonos, en primer lugar, en la integral I2, una soluci�on puede ser, 2(v; t) = k2(t) v u; [k2(t) � 0] para todo t � 0 (4:48)A su vez de la ecuaci�on 4.48, pueden deducirse soluciones particulares:� Adaptaci�on proporcional: 2(v; t) = k2 v u; k2 � 0 (4:49)

Page 85: Control Adaptativo y Robusto

Control adaptativo por modelo de referencia 69� Adaptaci�on mediante rel�e:{ Si se elige k2(t) = k2=jvj, 2(v; t) = k2(v=jvj) u = k2 signo(v) u; k2 � 0 (4:50){ Si se elige k2(t) = k2=juj, 2(v; t) = k2 signo(u) v; k2 � 0 (4:51){ Si se elige k2(t) = k2=juvj, 2(v; t) = k2 signo(uv); k2 � 0 (4:52)Para la resoluci�on de la integral I1, teniendo en cuenta un resultado bien conocidocomo, Z t10 _f(t)k1f(t)dt = k12 hf 2(t1)� f 2(0)i � �12k1f 2(0); k1 � 0 (4:53)puede hacerse, _f(t) = vuy k1f(t) = Z t0 1(v; t; �)d� + �(0)� � (4.54)Diferenciando con respecto a t se obtiene, 1(v; t) = k1vu (4:55)Si se elige k1 � 0 se cumple la condici�on buscada. En conjunto la ley de adaptaci�on,con la elecci�on particular que se ha realizado, quedar��a,�("; t) = Z t0 k1 v u dt+ k2 v u+ �(0) (4:56)Considerando el producto vu como una variable, se tiene que la ley de adaptaci�on(ecuaci�on 4.56), tiene una parte proporcional y otra integral (PI).El tercer paso, consiste en encontrar el t�ermino D, tal que la parte lineal GSL,sea una funci�on de transferencia estrictamente real positiva.GSL = D(s)1 + a1s+ a2s2 (4:57)

Page 86: Control Adaptativo y Robusto

70 Ejemplos ilustrativosPara ello el modelo de referencia debe ser estable y los coe�cientes a1, a2 y losde D(s) deben ser reales. Eligiendo D(s) = d0 + d1s, puede encontrarse que,Re[GSL(jw)] = d0a2 + (d1a1 � d0)w2(a2 � w2)2 + a21w2 (4:58)As�� que para que 4.58 sea mayor que cero para todo w real, se tiene la condici�on,d0a2 � 0 =) d0 � 0a1d1 � d0 � 0 =) d1 � d0=a1 (4.59)El cuarto paso es realizar la estructura completa del sistema de control adapta-tivo, la cual corresponde en este a una ley de adaptaci�on proporcional m�as integralque puede verse en la �gura 4.13. Puede observarse que en la realizaci�on de estaestructura tambi�en es necesario un t�ermino derivada del error. En algunos casospuede accederse al estado completo del modelo de referencia y del modelo ajustablepor lo que podr��a obtenerse directamente el t�ermino derivada sin tener que realizarun derivador.

Page 87: Control Adaptativo y Robusto

Control adaptativo por modelo de referencia 71

- ���@@@ - 6� ��- ? --r ��ddt - ?� ��-

6� ��- � ���HHH � ��� @@@� �� r6 6u �1+a1s+a2s2

11+a1s+a2s2yMyA d0 d1

vuk2k1�(0) �e _e

Figura 4.13: MRAC con ley de adaptaci�on P+I

Page 88: Control Adaptativo y Robusto

72 Ejemplos ilustrativos

Page 89: Control Adaptativo y Robusto

Cap��tulo 5Reguladores autoajustables(STR)5.1 Introducci�onEn general cuando dise~namos un controlador, �este se dise~na para un punto de fun-cionamiento determinado del proceso. Ahora bien, si los par�ametros del procesovar��an con el tiempo, ya sea por derivas o desgastes de las constantes f��sicas, obien porque el proceso es no lineal y se modi�ca el punto de funcionamiento en elque estamos trabajando, el controlador calculado para un punto de funcionamientoconcreto, no ser�a en general el adecuado para este tipo de situaciones.Cuando nos enfrentamos con este tipo de problemas, podemos plantear unaestructura de control que adem�as del bucle principal de regulaci�on que existe entodo sistema de control, incorpore un segundo bucle de control, en el que a partirde la informaci�on recogida del proceso y con un determinado criterio de dise~no, semodi�quen los par�ametros del regulador.Como se vi�o en el cap��tulo 2 sobre los controladores adaptativos, �esto puede ha-cerse con dos planteamientos diferentes: con un modelo de referencia o bien mediantelos reguladores autoajustables1.En este caso, se comienza con un m�etodo de dise~no para sistemas con par�ametrosconocidos, sustituyendo posteriormente los par�ametros conocidos por sus estimados1Self-tuning regulator (STR) en la terminolog��a inglesa73

Page 90: Control Adaptativo y Robusto

74 Introducci�ony recalculando el controlador en cada paso. La aplicaci�on de esta idea es lo que seconoce como el principio de equivalencia cierta.El diagrama de bloques de estos controladores se puede ver en la �gura 5.1; en�el se distinguen tres partes claramente diferenciadas:� un algoritmo recursivo de estimaci�on de par�ametros� un mecanismo de adaptaci�on que desarrolla la tarea de dise~no del regulador y� un regulador con par�ametros ajustables.Estos reguladores conforman una estructura sub�optima basada en el principio deseparaci�on de las tareas de control e identi�caci�on.- ��

- -s����- -6 s -BB BBNActuaci�onDeseada Dise~no delControlador Estimaci�onde la Planta

PlantaControladorAjustableFigura 5.1: Esquema de regulador autoajustable (STR)La idea de los reguladores autoajustables puede ser aplicada a muchos proble-mas de control que no son formulados como un problema de control estoc�astico.Dada la modularidad y la separaci�on del control e identi�caci�on, pueden formarsemuchas clases de reguladores autoajustables por combinaci�on de diferentes m�etodosde dise~no e identi�cadores.En cuanto al modelo de la planta, supondremos en general, que sobre el sistemaactuan perturbaciones estoc�asticas, por lo que el proceso estar�a descrito por sumodelo ARMAX, de la siguiente forma:

Page 91: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 75y(k) = B(z�1)A(z�1)z�du(k) + C(z�1)A(z�1)v(k) (5:1)donde los distintos polinomios y variables tienen el siguiente signi�cado:A(z�1) = 1 + a1z�1 + a2z�2 + :::: + anz�nB(z�1) = b1z�1 + b2z�2 + :::: + bnz�nC(z�1) = 1 + c1z�1 + c2z�2 + ::::+ cnz�nsiendo y(k) la secuencia de salida, u(k) la se~nal de control del sistema, v(k) unase~nal aleatoria independiente con distribuci�on gaussiana N(0; �), d es el retardo delsistema y z�1 es el operador retardo tal que y(k) = z�1y(k + 1).En cuanto al criterio de dise~no, pueden dividirse en dos tipos, seg�un el plantea-miento del problema sea: estoc�astico o no estoc�astico. Cuando el planteamiento esestoc�astico, se consideran sistemas cuyas se~nales no se pueden conocer exactamentey tampoco se pueden predecir.En el dise~no con planteamiento estoc�astico, normalmente se minimiza un cierto��ndice de actuaci�on, como por ejemplo para el caso de m��nima varianza, se trata deminimizar las variaciones con respecto a cero, ya que se trata de un problema deregulaci�on. J = Efy2(k + d+ 1)gO bien puede plantearse un ��ndice m�as general de la forma:J = Ef(Py(k + d+ 1) +Qu(k)�Rr(k))2gMediante el planteamiento no estoc�astico, se considera que las perturbacionesque inciden sobre un sistema son exactamente conocidas, pudi�endose describir estossistemas anal��ticamente por medio de un sistema din�amico determinista.En este caso el ��ndice de actuaci�on se da en funci�on de unas especi�caciones quedebe cumplir la salida del sistema, lo que normalmente se traduce en especi�caruna funci�on de transferencia deseada en bucle cerrado, como es el caso de asig-naci�on de polos. En la actualidad, se ha demostrado en numerosos casos, que ambosplanteamientos conducen a resultados similares.

Page 92: Control Adaptativo y Robusto

76 Asignaci�on de polos y cerosA continuaci�on se exponen algunas t�ecnicas de dise~no de controladores, que sonutilizadas frecuentemente en control adaptativo.5.2 Asignaci�on de polos y cerosAstrom y Wittenmark (1980) proponen una estructura de control con dise~no porasignaci�on de polos como la dada en la �gura 5.2. Esta estructura puede inter-pretarse como un compensador en adelanto y un compensador en bucle cerrado.Tambi�en puede demostrarse que dicha estructura corresponde a un controlador linealpor realimentaci�on del estado y a un observador. La ley de control puede dise~narsepara unos polos deseados del sistema en bucle cerrado, preservando los ceros ines-tables del sistema en bucle abierto.- -����- - -����-?

-�6w(k) S 1M Bz�dACAv(k)

y(k)G

Figura 5.2: Estructura de control por asignaci�on de polos y cerosEl problema que se plantea consiste en hacer que la funci�on de transferencia,desde la salida a la referencia, del sistema (�gura 5.2), sea de la forma:y(k) = RmPm z�dw(k) (5:2)donde los polinomios Rm y Pm no tienen factores comunes y el grado de Pm es mayoro igual a Rm. Esto permitir�a dar las especi�caciones del problema de seguimiento

Page 93: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 77en t�erminos de la respuesta deseada a una se~nal de referencia. Tambi�en habr�a queespeci�car la din�amica del observador mediante el polinomio Ao.El m�etodo de dise~no elegido es el de s��ntesis algebraica directa. La soluci�onconsiste b�asicamente en resolver una ecuaci�on polinomial con ciertas restriccionesen los �ordenes de los polinomios para asegurar que el regulador propuesto sea causaly con realizaci�on m��nima.A partir de la �gura 5.2, la funci�on de transferencia en bucle cerrado que seobtiene es: y(k) = SBz�dAM +BGz�dw(k) + CMAM +BGz�d v(k) (5:3)Suponiendo que las perturbaciones son despreciables e igualando dicha ecuaci�oncon la 5.2, se tiene la siguiente ecuaci�on polinomial:(AM +BGz�d)Rm = SBPm (5:4)Las raices de �esta ecuaci�on polinomial contienen las raices de los polinomios S,B y Pm. Si el polinomio B no est�a contenido en el polinomio Rm, entonces formar�aparte del regulador que cancelar�a estos ceros, luego para que as�� pueda ocurrir, losceros del polinomio B deben ser estables o estar contenidos en Rm.Factorizando B como B�B+, donde el super��ndice � corresponde a los cerosinestables y el + a los ceros estables. Haciendo tambi�en,Rm = B�Rm1M = M1B+ (5.5)S = AoRm1introduci�endolos en la ecuaci�on 5.4, se obtiene la expresi�on :AM1 +B�Gz�d = AoPm (5:6)Para resolver esta ecuaci�on polinomial, cuyas incognitas son M1 y G, puedenutilizarse varios m�etodos, como son: resoluci�on de un sistema de ecuaciones linealessimult�aneas, utilizaci�on del m�etodo de la matriz polinomial (Aracil 1974), o biencomo apuntan Alix et al. (1982), mediante un segundo algoritmo de identi�caci�on,lo que conduce a un m�etodo llamado cuasi-directo.

Page 94: Control Adaptativo y Robusto

78 Asignaci�on de polos y cerosLa ecuaci�on caracter��stica del bucle cerrado es de la forma:AM +BGz�d = AM1B+ +B�B+Gz�d = B+AoPm (5:7)luego dicha ecuaci�on tiene como ceros suyos, los ceros estables del sistema en bucleabierto, los ceros del observador y los polos del modelo deseado.La ecuaci�on 5.6 (5.7), tiene in�nitas soluciones, pudi�endose obtener una soluci�on�unica realizable. Para ello es necesario determinar los ordenes m��nimos de los poli-nomios para que el controlador por asignaci�on de polos y ceros de Astrom y Wit-tenmark, sea causal. El grado de un polinomio A, se escribe como grd(A).A partir de la ecuaci�on 5.7, se sabe que,max(grd(A)+grd(M); grd(B)+grd(G)+d) = grd(B+)+grd(Ao)+grd(Pm) (5:8)Adem�as para que el regulador sea causal debe cumplirse que,grd(G) < grd(M) y grd(S) < grd(M) (5:9)Por otro lado para una ecuaci�on de la forma,AX +BY = Cdonde X e Y son las incognitas, se tiene una soluci�on �unica, (resultado conocido del�algebra), si grd(X) < grd(B) o grd(Y ) < grd(A)A partir de (5.8) pueden ocurrir dos casos:1. grd(A) + grd(M) = grd(B+) + grd(Ao) + grd(Pm)o sea, grd(M) = grd(B+) + grd(Ao) + grd(Pm)� grd(A)y para obtener una soluci�on �unica,grd(G) < grd(A) tomando grd(G) < grd(A)� 1El grado del polinomio del observador puede deducirse utilizando 5.9, quesustituyendo se tiene,grd(Ao) > 2grd(A)� grd(Pm)� grd(B+)� 1

Page 95: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 792. grd(B) + grd(G) + d = grd(B+) + grd(Ao) + grd(Pm)o sea, grd(G) = grd(Ao) + grd(Pm)� grd(B�)� dy para obtener una soluci�on �unica,grd(M) < grd(B) + d tomando grd(M) < grd(B) + d� 1Sustituyendo grd(M) = grd(M1) + grd(B+), en los dos casos nos dan las condi-ciones para los grados de M1 y G como:grd(G) = grd(A)� 1grd(M1) = grd(Ao) + grd(Pm)� grd(A) (5.10)o bien, grd(G) = grd(Ao) + grd(Pm)� grd(B�)� dgrd(M1) = grd(B�) + d� 1 (5.11)

- - -����- -����� 6s??

s- Rmz�dPm

ABRmPmw(k) u Bz�dAGM eyr(k)

y(k)Figura 5.3: Interpretaci�on como modelo de referenciaLa estructura del regulador dise~nado puede interpretarse como seguimiento a unmodelo de referencia de la forma dada en 5.2. Operando con la ecuaci�on 5.4, paraobtener S=M y sustituyendo en la expresi�on del regulador,u(k) = 1M (Sw(k)�Gy(k)) (5:12)

Page 96: Control Adaptativo y Robusto

80 Casos particularesse tiene, u(k) = AByr(k + d) + GM (yr(k)� y(k)) (5:13)que corresponde a la estructura de la �gura 5.3.En dicha estructura se puede observar que el regulador est�a compuesto de dospartes, un controlador en adelanto (feedforward) y un controlador en bucle cerrado.Si la se~nal e es igual a cero, la acci�on del bloque G=M desaparece y la relaci�on queliga la entrada con la salida es justamente el modelo de referencia 5.2. Por otro ladoes de notar que el bloque A=B no es realizable pero s�� lo es RmA=PmB.5.3 Casos particularesComo se desprende de la deducci�on anterior, para el dise~no del regulador propuestoes necesario factorizar el polinomio B y resolver la ecuaci�on polinomial 5.6. Estospasos pueden consumir un tiempo de c�alculo apreciable y si se pretende que elalgoritmo funcione en l��nea con el proceso (caso normal en control adaptativo), es degran inter�es considerar casos particulares en los que dichos c�alculos se simpli�quen.1. Cancelaci�on de todos los ceros del sistema.En este caso se supone que el sistema es de fase m��nima, pudi�endose cancelartodos los ceros del sistema en bucle abierto, por lo que se tiene,B+ = B B� = 1Rm = Rm1 = K M =M1BS = KAoque sustituyendo en la ecuaci�on 5.6, se llega a,AM1 +Gz�d = PmAo (5:14)Dicha ecuaci�on es m�as simple de resolver, sobre todo si se toman las condiciones5.11. Este caso tambi�en puede verse como el controlador de Clarke y Gawthropsi se eligen, M1 = zF C = z�1AoQ = 0 w(k) = 0

Page 97: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 812. No se cancela ning�un cero del sistema.Si el sistema a controlar es de fase no m��nima, se supone que todos los cerosest�an fuera del circulo unidad, y se eligen los ceros del sistema en bucle cerradocomo Rm = KB, siendo K una constante, o sea,B+ = 1 B� = BRm = BRm1 = KB M =M1S = KAola ecuaci�on resultante es de la forma,AM +BGz�d = PmAo5.4 Predicci�on �optimaEl problema de control estoc�astico est�a ��ntimamente ligado con el de predicci�on. Porello vamos a desarrollar el predictor �optimo (Astrom 1970, Wittenmark 1974), de dpasos de la salida de un sistema, el cual ser�a necesario posterioremente.Dado el proceso estoc�astico en tiempo discreto:A(z�1)y(k + d) = B(z�1)u(k) + C(z�1)v(k + d) (5:15)donde, A(z�1) = 1 + a1z�1 + a2z�2 + :::: + anz�nB(z�1) = b1z�1 + b2z�2 + :::: + bnz�nC(z�1) = 1 + c1z�1 + c2z�2 + ::::+ cnz�nconsideramos el problema de encontrar la predicci�on de la salida en el instante k+dcon la informaci�on disponible en el instante k, tal que la esperanza matem�atica dey(k + d) � y(k + d=k) al cuadrado sea m��nima, siendo y(k) la secuencia de salida,u(k) la se~nal de control del sistema y v(k) una se~nal aleatoria independiente condistribuci�on gaussiana N(0; �).

Page 98: Control Adaptativo y Robusto

82 Predicci�on �optimaPredictor �optimoLa ecuaci�on del sistema 5.15 puede escribirse como :y(k + d) = B(z�1)A(z�1)u(k) + C(z�1)A(z�1)v(k + d) (5:16)El �ultimo t�ermino de la expresi�on anterior es una funci�on de v(k+ d); v(k+ d�1) � � � v(k); v(k�1) � � �, donde v(k+d); � � �v(k+1) no est�an disponibles en el instantek, por ello se va a descomponer este �ultimo t�ermino, mediante la utilizaci�on de laidentidad: C(z�1) = A(z�1)F (z�1) + z�(d+1)G(z�1) (5.17)con; F (z�1) = 1 + f1z�1 + :::+ fdz�dG(z�1) = go + g1z�1 + ::: + gn�1z�(n�1)quedando el sistema 5.16 de la forma:y(k + d) = B(z�1)A(z�1)u(k) + F (z�1)v(k + d) + z�1G(z�1)A(z�1) v(k) (5:18)resolviendo la ecuaci�on 5.16 para v(k).v(k) = A(z�1)C(z�1)y(k)� B(z�1)C(z�1)z�du(k) (5:19)Sustituyendo 5.19 en 5.18 y operando con la ayuda de la identidad 5.17.y(k+d) = B(z�1)A(z�1)u(k)+F (z�1)v(k+d)+z�1G(z�1)C(z�1) y(k)�B(z�1)C(z�1)G(z�1)A(z�1)z�(d+1)u(k)y(k + d) = F (z�1)v(k + d) + z�1G(z�1)C(z�1) y(k) + B(z�1)F (z�1)C(z�1) u(k)

Page 99: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 83Tomando la esperanza matem�atica del error de predicci�on. (En lo que se sigue,se omite z�1 en los polinomios para mayor claridad).E(y(k + d)� y(k + d=k))2 == E(Fv(k + d) + z�1GC y(k) + BFC u(k)� y(k + d=k))2 == E(Fv(k + d))2 + E(z�1GC y(k) + BFC u(k)� y(k + d=k))2 ++ 2E(Fv(k + d)(z�1GC y(k) + BFC u(k)� y(k + d=k)))El �ultimo t�ermino es cero puesto que v(k+d) es independiente, y sobre el primert�ermino no podemos in uir, luego la mejor predicci�on de la salida se obtiene igua-lando a cero el segundo t�ermino, con lo que resulta que:y(k + d=k) = z�1G(z�1)C(z�1) y(k) + B(z�1)F (z�1)C(z�1) u(k)O bien : y(k + d+ 1=k) = G(z�1)C(z�1)y(k) + zB(z�1)F (z�1)C(z�1) u(k)siendo el error de predicci�on,y(k + d+ 1)� y(k + d+ 1=k) = F (z�1)v(k + d+ 1)5.5 Regulador de m��nima varianzaEste regulador �optimo pretende reducir el efecto de las perturbaciones sobre la sa-lida. Para ello la estrategia de control consiste en calcular la se~nal de control u(k),como una funci�on de los valores disponibles en ese instante, o sea, u(k � 1); u(k �2); � � � ; y(k); y(k� 1); � � �, de tal forma que se minimice el criterio:J = E(y2(k + d=k))Se supone que sobre el sistema act�uan perturbaciones estoc�asticas, por lo que elproceso estar�a descrito por su modelo ARMA, de la siguiente forma:A(z�1)y(k + d) = B(z�1)u(k) + C(z�1)v(k + d) (5:20)

Page 100: Control Adaptativo y Robusto

84 Regulador de m��nima varianzadonde los distintos polinomios y variables tienen el signi�cado dado en el apartadoanterior. Deduci�endose que la se~nal de control u(k) afecta a la salida y(k + d) perono antes. Utilizando la identidad,C(z�1) = A(z�1)F (z�1) + z�(d+1)G(z�1) (5:21)El segundo miembro de la igualdad anterior puede descomponerse, quedando laecuaci�on: y(k + d) = B(z�1)A(z�1)u(k) + F (z�1)v(k + d) + z�1G(z�1)A(z�1) v(k) (5:22)Los dos �ultimos t�erminos del lado derecho de la igualdad tienen la siguienteinterpretaci�on:1. F (z�1)v(k + d), es una combinaci�on lineal de las perturbaciones producidasentre el instante k y k + d, cuyo efecto sobre la salida y(k + d) no se puedecontrolar con u(k), ya que v(k + d) para d > 0, es independiente de y(k �1); y(k � 2) � � � ; u(k � 1); u(k � 2) � � �2. z�1G(z�1)v(k)=A(z�1), es el efecto sobre la salida de las perturbaciones ante-riores a k.Resolviendo la ecuaci�on 5.20 para v(k) y sustituyendo su expresi�on en 5.22 se obtiene:y(k + d) = F (z�1)v(k + d) + F (z�1)B(z�1)C(z�1) u(k) + z�1G(z�1)C(z�1) y(k)Tomando la esperanza matem�atica en ambos miembros se tiene que:E(y2(k + d)) = E(Fv(k + d))2 + E(FBC u(k) + z�1GC y(k))2 ++ 2E(Fv(k + d)(z�1GC y(k) + FBC u(k)))El �ultimo t�ermino de la expresi�on anterior es cero, ya que v(k + d) es indepen-diente de los valores anteriores de y(k) y u(k), y sobre el primer t�ermino del segundomiembro de la ecuaci�on no se puede in uir, luego el m��nimo se obtendr�a igualandoa cero el t�ermino que queda, resultando que :u(k) = � z�1G(z�1)F (z�1)B(z�1)y(k)

Page 101: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 85o bien, u(k) = � G(z�1)zB(z�1)F (z�1)y(k) (5:23)A la vista de las expresiones obtenidas y compar�andolas con la deducci�on del pre-dictor �optimo en el apartado anterior, se puede interpretar el problema del reguladorde m��nima varianza, como la determinaci�on del predictor y buscar la se~nal de controltal que la predicci�on coincida con la salida deseada. En este caso y(k + d=k) = 0.5.6 Control predictivo generalizadoEl Control predictivo generalizado (gpc) fue propuesto por Clarke et al. (Clarke1987a), y se ha convertido en uno de los m�etodos m�as populares en el �ambito del Con-trol Predictivo tanto en el mundo industrial como en el acad�emico. Se ha empleadocon �exito en numerosas aplicaciones industriales (Clarke 1988), mostrando buenasprestaciones, a la vez que un cierto grado de robustez respecto a sobreparametrizaci�ono retardos mal conocidos. Puede resolver muchos problemas de control diferentespara un amplio campo de procesos con un n�umero razonable de variables de dise~no,que son especi�cadas por el operario dependiendo del conocimiento previo del pro-ceso y de los objetivos de control. Pero a pesar de este �exito en la pr�actica, estem�etodo adolece de la ausencia de un an�alisis te�orico completo que estudie la in- uencia de los par�ametros de dise~no (horizontes, secuencias de ponderaci�on) sobrela estabilidad del bucle cerrado as�� como de resultados de robustez.La idea b�asica del gpc es calcular una secuencia de futuras acciones de control detal forma que minimice una funci�on de coste multipaso. El ��ndice a minimizar es laesperanza matem�atica de una funci�on cuadr�atica que mide por un lado la distanciaentre la salida predicha del sistema y una cierta trayectoria de referencia hasta elhorizonte de predicci�on, y por otro el esfuerzo de control necesario para obtenerdicha salida. Esta idea ha sido usada por Lelic y Zarrop (Lelic 1987a), y Lelic yWellstead (Lelic 1987b), para la obtenci�on de un controlador por asignaci�on de polosgeneralizado que pertenece a la clase de los controladores de horizonte extendido yes una extensi�on de los bien conocidos controladores por asignaci�on de polos.El Control Predictivo Generalizado tiene muchas ideas en com�un con otros con-troladores predictivos, ya que est�a basado en las mismas ideas pero posee a su vezalgunas diferencias. Como se ver�a m�as adelante, es capaz de proporcionar unasoluci�on expl��cita (en ausencia de restricciones), puede trabajar con procesos ines-tables o de fase no m��nima e incorpora el concepto de horizonte de control as�� como

Page 102: Control Adaptativo y Robusto

86 Control predictivo generalizadola consideraci�on en la funci�on de coste de ponderaci�on de los incrementos en las ac-ciones de control. Las diversas posibilidades disponibles para el gpc conducen a unagran variedad de objetivos de control comparado con otras realizaciones, algunas delas cuales pueden ser consideradas como subconjuntos o casos l��mites del gpc.5.6.1 Formulaci�on del control predictivo generalizadoLa mayor��a de los procesos de una sola entrada y una sola salida (single-input single-output, siso), al ser considerados en torno a un determinado punto de trabajo y trasser linealizados, pueden ser descritos de la siguiente forma:A(z�1)y(t) = z�dB(z�1)u(t� 1) + C(z�1)e(t)donde u(t) y y(t) son respectivamente la se~nal de control y la salida del proceso ye(t) es un ruido blanco de media cero. A, B y C son los siguientes polinomios en eloperador de desplazamiento hacia atr�as z�1 :A(z�1) = 1 + a1z�1 + a2z�2 + :::+ anaz�naB(z�1) = b0 + b1z�1 + b2z�2 + ::: + bnbz�nbC(z�1) = 1 + c1z�1 + a2z�2 + :::+ cncz�ncdonde d es el tiempo muerto del sistema.Este modelo es conocido como Autorregresivo de Media M�ovil (Controller Auto-Regressive Moving-Average carma). En muchas aplicaciones industriales en lasque las perturbaciones son no-estacionarias resulta m�as conveniente (Clarke 1987a),el uso de un modelo carma integrado, dando lugar al carima, que viene descritopor:A(z�1)y(t) = B(z�1)z�d u(t� 1) + C(z�1)e(t)4 con 4 = 1� z�1 (5:24)Por simplicidad, a partir de ahora el polinomio C se va a tomar igual a 1. N�oteseque en el caso de que C pueda ser truncado se puede absorber en A y B. El casogeneral de ruido coloreado (C distinto de 1), es tratado m�as adelante.El algoritmo del Control Predictivo Generalizado consiste en aplicar una secuen-cia de se~nales de control que minimice una funci�on de coste de la forma:J(N1; N2; Nu) = Ef N2Xj=N1 �(j)[y(t+j j t)�w(t+j)]2+NuXj=1�(j)[4u(t+j�1)]2g (5:25)

Page 103: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 87donde E f.g es la esperanza matem�atica e y(t+ j j t) es la predicci�on �optima j pasoshacia delante de la salida del proceso con datos conocidos hasta el instante t, N1y N2 son los horizontes m��nimo y m�aximo de coste, Nu es el horizonte de controly �(j) y �(j) son las secuencias de ponderaci�on mientras que w(t + j) es la futuratrayectoria de referencia, que se puede calcular seg�un se muestra en la �gura 5.4.En (Clarke 1987a) se considera �(j) igual a 1 y �(j) constante.

y(t)

r(t+k)

w (t+k) w (t+k)

t

12

Figura 5.4: Trajectoria de referenciaEl objetivo es pues el c�alculo de la futura secuencia de control u(t), u(t+1),... detal manera que la salida futura del proceso y(t+ j) permanezca pr�oxima a w(t+ j).Esto se logra minimizando J(N1; N2; Nu).Con la intenci�on de minimizar la funci�on de coste, se obtendr�a previamente lapredicci�on �optima de y(t + j) para j � N1 y j � N2. Consid�erese la siguienteecuaci�on diof�antica: 1 = Ej(z�1)4 A+ z�jFj(z�1) (5.26)1 = Ej(z�1) ~A+ z�jFj(z�1)Los polinomios Ej and Fj est�an �unicamente de�nidos con grados j � 1 y narespectivamente. Se pueden obtener dividiendo 1 entre ~A(z�1) hasta que el resto

Page 104: Control Adaptativo y Robusto

88 Control predictivo generalizadopueda ser factorizado como z�jFj(z�1) . El cociente de la divisi�on es entonces elpolinomio Ej(z�1).Si se multiplica la ecuaci�on (5.24) por Ej(z�1) zj 4~A(z�1)Ej(z�1)y(t+ j) = Ej(z�1)B(z�1)4 u(t+ j � d� 1) + Ej(z�1)e(t + j)(5.27)Teniendo en cuenta (5.26), la ecuaci�on (5.27) queda:(1� z�jFj(z�1))y(t+ j) = Ej(z�1)B(z�1)4 u(t+ j � d� 1) + Ej(z�1)e(t+ j)La cual puede ser escrita comoy(t+ j) = Fj(z�1)y(t)+Ej(z�1)B(z�1)4 u(t+ j� d� 1) +Ej(z�1)e(t+ j) (5:28)Al ser el grado del polinomio Ej(z�1) igual a j � 1 los t�erminos del ruido en laecuaci�on (5.28) est�an todos en el futuro. La mejor predicci�on de y(t + j) ser�a porconsiguiente: y(t + j j t) = Gj(z�1)4 u(t+ j � d� 1) + Fj(z�1)y(t)donde Gj(z�1) = Ej(z�1)B(z�1)Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursi-vamente, de forma que los nuevos valores en el paso j+1 (Ej+1 y Fj+1) sean funci�onde los del paso j. La recursividad de la ecuaci�on diof�antica ha sido demostrada en(Clarke 1987a). A continuaci�on se muestra una demostraci�on m�as simple. Existenotras formulaciones del gpc que no est�an basadas en la recursividad de esta ecuaci�on(Albertos 1989).Consid�erese que los polinomios Ej y Fj se han obtenido dividiendo 1 entre ~A(z�1)hasta que el resto haya sido factorizado como z�jFj(z�1) .Con: Fj(z�1) = fj;0 + fj;1z�1 + � � �+ fj;naz�naEj(z�1) = ej;0 + ej;1z�1 + � � �+ ej;j�1z�(j�1)Sup�ongase que se utiliza el mismo procedimiento para obtener Ej+1 y Fj+1, es de-cir, dividir 1 entre ~A(z�1) hasta que el resto se pueda factorizar como z�(j+1)Fj+1(z�1)con Fj+1(z�1) = fj+1;0 + fj+1;1z�1 + � � �+ fj+1;naz�na

Page 105: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 89Est�a claro que solamente es necesario dar un paso m�as en la divisi�on para obtenerlos polinomios Ej+1 y Fj+1. Donde Ej+1 vendr�a dado por:Ej+1(z�1) = Ej(z�1) + ej+1;jz�j con ej+1;j = fj;0Los coe�cientes del polinomio Fj+1 se pueden expresar como:fj+1;i = fj;i+1 � fj;0 ~ai+1 i = 0 � � �na� 1El polinomio Gj+1 puede ser obtenido recursivamente como sigue:Gj+1 = Ej+1B = (Ej + fj;0z�j)B = Gj + fj;0z�jBEs decir, los primeros j coe�cientes de Gj+1 ser�an id�enticos a los de Gj mientrasque el resto viene dado por:gj+1;j+i = gj;j+i + fj;0 bi para i = 0 � � �nbPara resolver el gpc es necesario obtener el conjunto de se~nales de control u(t),u(t + 1), ...,u(t + N) que minimizan la ecuaci�on (5.25). Al tener el proceso unretardo de d per��odos de muestreo, la salida s�olo se ver�a in uenciada por la se~nalu(t) despu�es del instante d+ 1. Los valores N1, N2 y Nu que marcan los horizontespueden ser de�nidos como N1 = d + 1, N2 = d + N y Nu = N . No tiene sentidohacer N1 < d + 1 ya que los t�erminos de (5.25) s�olo depender�an de las se~nales decontrol pasadas. Por otro lado, haciendo N1 > d + 1 los primeros puntos de lasecuencia de salida, que ser�an los mejor estimados, no se tendr�an en cuenta.El conjunto de las j predicciones �optimas:y(t + d+ 1 j t) = Gd+1 4 u(t) + Fd+1y(t)y(t + d+ 2 j t) = Gd+2 4 u(t+ 1) + Fd+2y(t)...y(t+ d+N j t) = Gd+N 4 u(t+N � 1) + Fd+Ny(t)puede ser escrito en forma matricial como:y = Gu + F(z�1)y(t) +G0(z�1)4 u(t� 1) (5:29)

Page 106: Control Adaptativo y Robusto

90 Control predictivo generalizadoDonde y = 266664 y(t+ d+ 1 j t)y(t+ d+ 2 j t)...y(t+ d+N j t) 377775 u = 266664 4u(t)4u(t+ 1)...4u(t+N � 1) 377775G = 266664 g0 0 ::: 0g1 g0 ::: 0... ... ... ...gN�1 gN�2 ::: g0 377775G0(z�1) = 266664 z(Gd+1(z�1)� g0)z2(Gd+2(z�1)� g0 � g1z�1)...zN (Gd+N(z�1)� g0 � g1z�1 � � � � � gN�1z�(N�1)) 377775F(z�1) = 266664 Fd+1(z�1)Fd+2(z�1)...Fd+N (z�1) 377775Al depender los �ultimos t�erminos de la ecuaci�on (5.29) s�olo del pasado, puedenagruparse en f, dando lugar a: y = Gu+ f (5:30)Entonces la ecuaci�on (5.25) puede escribirse como:J = (Gu + f �w)T (Gu + f �w) + �uTu (5:31)donde: w = h w(t+ d+ 1) w(t+ d+ 2) � � � w(t+ d+N) iT (5.32)La ecuaci�on (5.31) se puede poner como:J = 12uTHu+ bu + f0 (5:33)donde: H = 2(GTG+ �I)b = 2(f �w)TGf0 = (f �w)T (f �w)

Page 107: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 91El m��nimo de J , siempre que no existan restricciones en la se~nal de control, puedeser calculado igualando a cero el gradiente de J , lo cual conduce a:u = �H�1bT (5:34)Debido al uso de la estrategia deslizante, s�olo el primer elemento del vector u es apli-cado realmente, repitiendo de nuevo el mismo procedimiento al siguiente instantede muestreo. La soluci�on propuesta involucra la inversi�on (o al menos la triangu-larizaci�on) de una matriz de dimensi�on N � N , lo cual conlleva una gran carga dec�alculo. El concepto ya usado en otros m�etodos de horizonte de control es empleadoen (Clarke 1987a) con la �nalidad de reducir la cantidad de c�alculo, asumiendo quelas se~nales de control permanecer�an en un valor constante a partir del intervaloNu < N . Por tanto la dimensi�on de la matriz que hay que invertir queda reducidaa Nu�Nu, quedando la carga de c�alculo reducida (en el caso l��mite de Nu = 1, sereduce al caso escalar, como en el epsac, (De Keyser 1985) aunque restringiendo laoptimalidad.Para aumentar la rapidez del algoritmo, fundamental sobre todo en el caso adap-tativo, en Camacho y Bordons (1994,1995), se presenta un m�etodo desarrollado parala gran mayor��a de procesos industriales y con una carga de c�alculo m��nima. Tambi�enexisten realizaciones usando redes neuronales de Hop�eld para obtener algoritmosr�apidos (Quero 1990).5.6.2 Consideraci�on de ruidos coloreadosCuando el polinomio del ruido C(z�1) de la ecuaci�on (5.24) no es igual a 1 lapredicci�on cambia ligeramente. Para calcular el predictor en esta situaci�on se deberesolver la siguiente ecuaci�on diof�antica:C(z�1) = Ej(z�1) ~A(z�1) + z�jFj(z�1) (5:35)con �(Ej(z�1)) = j � 1 y �(Fj(z�1)) = �( ~A(z�1)) � 1, siendo �() el grado delpolinomio.Multiplicando la ecuaci�on (5.24) por 4Ej(z�1) y usando (5.35)C(z�1)(y(t+ j)� Ej(z�1)e(t+ j)) = Ej(z�1)B(z�1)4 u(t+ j � 1) + Fj(z�1)y(t)Como los t�erminos de ruido est�an todos en el futuro, el valor esperado para elt�ermino de la izquierda de la ecuaci�on anterior es:

Page 108: Control Adaptativo y Robusto

92 Controladores para plantas con par�ametros desconocidosE[C(z�1)(y(t+ j)� Ej(z�1)e(t + j))] = C(z�1)y(t+ jjt)El valor esperado de la salida puede ser generado por la ecuaci�on:C(z�1)y(t+ jjt) = Ej(z�1)B(z�1)4 u(t+ j � 1) + Fj(z�1)y(t) (5:36)N�otese que esta ecuaci�on de predicci�on podr��a ser usada para generar las predic-ciones de forma recursiva. Se puede obtener una expresi�on expl��cita para la predicci�on�optima de j pasos resolviendo la siguiente ecuaci�on diof�antica:1 = C(z�1)Mj(z�1) + z�jNj(z�1) (5:37)con �(Mj(z�1)) = j � 1 y �(Nj(z�1)) = �(C(z�1))� 1.Multiplicando la ecuaci�on (5.36) por Mj(z�1) y usando (5.37),y(t+ jjt) =MjEj(z�1)B(z�1)4 u(t+ j � 1) +Mj(z�1)Fj(z�1)y(t) +Nj(z�1)y(t)que se puede expresar como:y(t+jjt) = G(z�1)4u(t+j�1)+Gp(z�1)4u(t+j�1)+(Mj(z�1)Fj(z�1)+Nj(z�1))y(t)con �(G(z�1)) < j. Estas predicciones se pueden usar en la funci�on de coste que seminimiza de la misma forma que el caso de ruido blanco.5.7 Controladores para plantas con par�ametrosdesconocidosEn los apartados anteriores se han dise~nado reguladores y controladores para plantascuyos par�ametros se han supuesto conocidos. En este punto reemplazaremos estahip�otesis por otra en que se supone que los par�ametros son desconocidos y constantes.No obstante, como han demostrado experimentalmente algunos autores (Astrom1973, Clarke et. al. 1979, Wellstead et al. 1979), estas t�ecnicas pueden ser aplicadascuando los par�ametros var��an lentamente o bien bruscamente, pero sus valores semantienen constantes durante largos periodos de tiempo.

Page 109: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 93Como se ha comentado anteriormente, la idea en que se basan los reguladoresautoajustables (STR), reside en la aplicaci�on del principio de equivalencia cierta.Ello implica el utilizar un algoritmo de identi�caci�on de par�ametros, y calcular lospar�ametros del regulador en base a suponer que los par�ametros estimados coincidencon los reales.5.8 Algoritmos con estructura expl��cita e impl��-citaDentro de los controladores autoajustables, que aplican el principio de equivalenciacierta, para realizar el mecanismo de adaptaci�on, existen b�asicamente dos tipos dealgoritmos, unos que identi�can directamente los par�ametros de la planta (algoritmocon identi�caci�on expl��cita), �gura 5.1, y otros que mediante una reescritura delmodelo de la planta, simpli�can los pasos, estim�andose en este caso directamentelos par�ametros del controlador (algoritmo con identi�caci�on impl��cita), �gura 5.5.- ��- -s����- -6 sBB BBNActuaci�onDeseada Identi�caci�onmodeloreparametrizado

PlantaControladorAjustableFigura 5.5: Algoritmo con identi�caci�on impl��cita

Algoritmo con identi�caci�on expl��cita1. Estimar los par�ametros del modelo 5.20 mediante un algoritmo de identi�-caci�on de par�ametros, como el propuesto en el cap��tulo 3.

Page 110: Control Adaptativo y Robusto

94 Algoritmos con estructura expl��cita e impl��cita2. Calcular los par�ametros del controlador, seg�un se ha visto en los apartadosanteriores, necesitandose en muchos casos resolver una ecuaci�on polinomial.3. Calcular la se~nal de control con los par�ametros del controlador.4. Repetir los pasos 1, 2 y 3 en cada periodo de muestreo.Mediante este algoritmo se puede realizar un paquete de programas de control, dondeel paso 1 de identi�caci�on ser��a com�un para todos los controladores, cambiando cadauno de �estos bajo demanda del usuario, seg�un el tipo de proceso a controlar.Algoritmo con identi�caci�on impl��cita1. Estimar los par�ametros del modelo reparametrizado mediante un algoritmo deidenti�caci�on de par�ametros.2. Calcular la se~nal de control con los par�ametros del controlador.3. Repetir los pasos 1 y 2 en cada periodo de muestreo.La realizaci�on de este algoritmo no siempre es posible, ya que para el paso 1, se nece-sita en cada caso particular reformular el modelo para que aparezcan directamentelos par�ametros del controlador.Se ilustran estos dos tipos de algoritmos, para el caso de dise~no del controladorcon el criterio de asignaci�on de polos, poni�endose de mani�esto, que en el caso de laidenti�caci�on impl��cita, la reescritura del modelo conduce a un modelo bilineal enlos par�ametros que entra~na una mayor di�cultad para su identi�caci�on. Tambi�en sehace notar que la reescritura del modelo no siempre es posible y hay que realizarlapara cada caso en particular.Algoritmo con identi�caci�on expl��citaDados: Rm, Ao, Pm, d1. Estimar A y B en el modelo, y(k) = BAz�du(k)

Page 111: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 952. Factorizar el polinomio B = B+B�3. Resolver la ecuaci�on siguiente para M1 y G,AM1 +B�Gz�d = AoPm (5:38)que corresponde a un sistema de ecuaciones lineales.4. Calcular la se~nal de control mediante,u(k) = 1M (Sw(k)�Gy(k)) ( S = AoRm1M =M1B+5. Ir al paso 1.Algoritmo con identi�caci�on impl��citaLa ecuaci�on 5.38 puede reescribirse de la siguiente forma:AM1y(k) +B�Gz�dy(k) = AoPmy(k)como por otro lado Ay(k) = Bz�du(k), lleva a,M1Bz�du(k) +B�Gz�dy(k) = AoPmy(k)teniendo en cuenta que M =M1B+ y B = B+B�, resulta:AoPmy(k) = B�z�d[Mu(k) +Gy(k)]Esta ecuaci�on puede verse como el modelo de un proceso, en el que los polinomiosdel controlador M y G aparecen directamente. Teniendo en cuenta esto, puedeescribirse el algoritmo de control adaptativo con identi�caci�on impl��cita siguiente:Dados: Rm1, Ao, Pm, d1. Estimar M , G y B� en el modelo,AoPmy(k) = B�z�d[Mu(k) +Gy(k)]

Page 112: Control Adaptativo y Robusto

96 Propiedad de autosinton��a2. Calcular la se~nal de control mediante,u(k) = 1M (Sw(k)�Gy(k)) S = AoRm13. Ir al paso 1.Hay que hacer notar que el modelo a identi�car en este caso es bilineal en lospar�ametros, por lo que la identi�caci�on no es trivial. Para el caso en que B� = 1, osea que tengamos un sistema de fase m��nima que tiene todos sus ceros estables, elalgoritmo se reduce notablemente, ya que la identi�caci�on del modelo resultante nopresenta ning�un problema.Ventajas e inconvenientes de uno y otro algoritmoEn el caso de la identi�caci�on expl��cita se necesitan m�as c�alculos en cada paso.Por otro lado se tienen directamente los par�ametros de la planta, lo que es par-ticularmente interesante para poder realizar la supervisi�on del control. As�� mismo,como se ha mencionado anteriormente, permitir un �unico algoritmo en el que puedecambiarse el controlador en cada caso.En el caso de la identi�caci�on impl��cita se necesitan menos c�alculos en cada paso,pero la identi�caci�on es en general m�as complicada. Se necesita reescribir el modeloen cada caso particular, y ello no siempre es posible.5.9 Propiedad de autosinton��aSe ilustra aqu��, la propiedad de autosinton��a de los controladores autoajustablespara el caso del regulador de m��nima varianza. Este regulador que se estudi�o en unapartado anterior, tiene como resultado que :u(k) = G(z�1)zB(z�1)F (z�1)y(k)utilizandose la identidad :C(z�1) = A(z�1)F (z�1) + z�(d+1)G(z�1)

Page 113: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 97con; F (z�1) = 1 + f1z�1 + :::+ fdz�dG(z�1) = go + g1z�1 + :::+ gn�1z�(n�1)As�� mismo vimos que el modelo del sistema puede escribirse como:y(k + d+ 1) = G(z�1)C(z�1)y(k) + zF (z�1)B(z�1)C(z�1) u(k) + F (z�1)v(k + d+ 1)que para el caso en que C(z�1) = 1, o sea, no se consideran las perturbaciones, elalgoritmo de identi�caci�on se reduce notablemente, quedando el modelo:y(k + d+ 1) = A0(z�1)y(k) +B0(z�1)u(k) + v(k + d+ 1)donde A0(z�1) es de orden n� 1 y B0(z�1) de orden n+ d� 1. Este �ultimo modelopuede utilizarse para estimar los par�ametros de A0 y B0 por m��nimos cuadrados yde esta forma la ley de control de m��nima varianza resulta simplemente:u(k) = A0(z�1)B0(z�1)y(k)donde A0(z�1) = a0o + a01z�1 + :::+ a0n�1z�(n�1)B0(z�1) = b0o + b01z�1 + :::+ b0n+d�1z�(n+d�1)que coincidir��a con el regulador calculado para el caso del conocimiento exacto delos par�ametros de la planta.Para el caso en que C(z�1) 6= 1, cabe esperar que los par�ametros sufran desvia-ciones, sin embargo, como veremos a continuaci�on, el regulador converge al reguladorcalculado con par�ametros conocidos.Si utilizamos el regulador: u(k) = A0B0y(k)

Page 114: Control Adaptativo y Robusto

98 Procedimiento de s��ntesisAl sustituir dicho regulador en el modelo de la planta y operando se obtiene lafunci�on de transferencia en bucle cerrado de la forma:y(k) = CB0AB0 +BA0z�d v(k)As�� mismo, como el control es de m��nima varianza, esta funci�on debe ser de laforma: y(k) = F (z�1)v(k)Luego igualando las dos expresiones anteriores y reordenando la ecuaci�on resul-tante se obtiene, C = AF + z�dFBA0B0que comparando con la identidad:C = AF + z�(d+1)Gse obtiene la expresi�on del regulador obtenida anteriormente (5.23),A0B0 = GzBFCuando utilizamos la propiedad de autosinton��a podemos utilizar un algoritmode identi�caci�on de m��nimos cuadrados, mucho m�as simple que el que ser��a necesariopara identi�car los polinomios A,B y C del modelo original, y el regulador que seobtiene converge al �optimo.5.10 Procedimiento de s��ntesisA continuaci�on se dan resumidos los pasos del procedimiento a seguir para el c�alculodel control, en el que se suponen conocidos los grados de los polinomios A, B y C,as�� como el retardo (d) del sistema.� 1er paso :

Page 115: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 99Identi�car usando m��nimos cuadrados el siguiente modelo:y(k) = A0(z�1)z�(d+1)y(k) +B0(z�1)z�(d+1)u(k) + e(k)donde A0 y B0 est�an de�nidos por:A0(z�1) = a0o + a01z�1 + :::+ a0n�1z�(n�1)B0(z�1) = b0o + b01z�1 + ::: + b0n+d�1z�(n+d�1)e(k) es el residuo de la identi�caci�on y b0o se �ja de antemano por condicionesde identi�cabilidad.� 2o paso :Calcular la se~nal de control por la expresi�on,u(k) = �A0(z�1)B0(z�1)y(k)Los pasos descritos anteriormente son efectuados en cada periodo de muestreo, cons-tituyendo un procedimiento de s��ntesis de los controladores autoajustables.5.11 Ejemplos ilustrativos5.11.1 Ejemplo de m��nima varianzaDado el sistema, y(k) + ay(k � 1) = bu(k � 1) + e(k) + ce(k � 1)donde a = �0:5, b = 3 y c = 0:7. El regulador de m��nima varianza para este sistemaes: u(k) = a� cb y(k) = �0:4y(k)Un regulador con esta estructura puede obtenerse empleando un algoritmo decontrol adaptativo autoajustable, como el descrito en las secciones precedentes,basado en el modelo: y(k) + �y(k � 1) = �u(k � 1) + "(k � 1)La �gura 5.6 muestra la evoluci�on del par�ametro � cuando � = 1. Puede versecomo este converge al valor de �0:4.

Page 116: Control Adaptativo y Robusto

100 Ejemplos ilustrativos

-1

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

-0.2

-0.1

0

0 50 100 150 200 250 300 350 400

tiempo

para

met

ro

Figura 5.6: Par�ametro estimado5.11.2 Control adaptativo PIVamos a ver un ejemplo de control adaptativo suponiendo que el sistema se modelacomo un sistema de primer orden y el regulador que se va a emplear es un PI. Apartir de las entradas y salidas (u e y), se identi�car�an los par�ametros del modelo ymediante un m�etodo de dise~no se actualizar�an los par�ametros del regulador PI.En un primer paso se utilizar�a como m�etodo de dise~no la regla de Ziegler-Nichols.Dicha regla se basa en los par�ametros de la respuesta a un escal�on de un sistema deprimer orden con retardo, G(s) = K1 + �se��ds (5:39)Si se elige un tiempo de muestreo (Tm) tal que �d = Tmd, el equivalente discretoviene dado por, G(z�1) = bz�11� az�1 z�d (5:40)

Page 117: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 101siendo la correspondencia entre ambas representaciones,a = e�Tm=� ; � = Tmln a ; K = b1� aLuego con este sistema de control adaptativo, en primer lugar se estiman lospar�ametros a y b, a partir de estos se calculan � y K, y aplicando las reglas deZiegler-Nichols, se obtendrian los par�ametros del regulador PI. Como dichas reglasson para el sistema continuo, la realizaci�on pr�actica, conllevar��a la discretizaci�on delregulador PI.Veamos otro m�etodo de dise~no: el basado en la t�ecnica de asignaci�on de polos.En este caso, al igual que en el anterior, se identi�car�a el sistema dado por 5.40y suponiendo que estos par�ametros son los correctos se dise~nar�a un regulador PIdiscreto, el cual viene dado por:GR(z�1) = q0 + q1z�11� z�1 (5:41)Para el caso en que d = 0, la funci�on de transferencia total del conjunto reguladory planta en bucle cerrado viene dada por:GT (z) = bq0(z + q1=q0)(z � a)(z � 1) + bq0(z + q1=q0) (5:42)Sistema de segundo orden, donde se pueden �jar los dos polos (con q0 y q1),aunque no se puede �jar el cero.Una forma de asignar los polos, puede ser cancelando el polo en a (puede hacersesi el sistema es estable), con q1=q0 = �a. De esta forma s�olo habr��a que �jar unpolo. La funci�on de transferencia total quedar��a:GT (z) = bq0(z � 1) + bq0 (5:43)Luego si el polo deseado es p quedar��an como ecuaciones del regulador adaptativo:q0 = 1� pb q1 = �q0a (5:44)

Page 118: Control Adaptativo y Robusto

102 Ejemplos ilustrativosA la vista de estas ecuaciones est�a claro, que cuanto mayor se elija p mayor ser�ael esfuerzo de control (u). Luego no puede ponerse el polo todo lo cerca del ceroque se quiera. Puede elegirse, por ejemplo como p = 0:9 � a, con lo que estamosespeci�cando que la respuesta del sistema controlado sea m�as r�apida que la delsistema original.Puede observarse que las ecuaciones del controlador adaptativo que se obtieneen este caso son muy simples, as�� como los par�ametros a identi�car que ser��an a, b yun t�ermino para evitar las componentes de continua. La ecuaci�on del sistema paraidenti�car ser��a: yk = ayk�1 + buk�1 + Constante (5:45)5.11.3 Control de robot m�ovilCon este ejemplo se pretende estudiar el comportamiento de un controlador adap-tativo aplicado al seguimiento de trayectorias de un robot m�ovil. Como se ver�a,el problema presenta algunas caracter��sticas que lo hacen adecuado para el controladaptativo y los resultados que se obtienen parecen corroborar esta adecuaci�on.Modelo del SistemaSup�ongase un robot m�ovil (veh��culo) y un sistema de referencia asociado a �el (ver�gura 5.7). El robot se desplaza a lo largo del eje vertical de este sistema.Se tiene como referencia un punto objetivo que se desea alcanzar y que se suponeest�a sobre la trayectoria que debe seguir el robot. Conforme el robot se desplaza alo largo del eje OY, debe anularse el error a lo largo del eje OX, desde la posici�onoriginal hasta el objetivo. El desplazamiento a lo largo del eje OX se controla graciasa las maniobras sobre la rueda de direcci�on del robot, que de�nir�an la curvatura delarco que describir�a en su desplazamiento.El sistema que se desea analizar y controlar es el de la evoluci�on de la mencionadadistancia horizontal hasta el punto objetivo, usando como se~nal accionadora la cur-vatura comandada por la direcci�on del veh��culo.La relaci�on b�asica entre arco y �angulo establece que,dS = r d� ) d� = dS

Page 119: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 103dΦ

dΦOX

OY

ds

dx’

r

dy’r

objetivo

centro girovehiculoFigura 5.7: Esquema de robot m�ovil y trayectoria objetivodonde es la curvatura ( = 1=r).Observando la �gura anterior, se pueden deducir las siguientes relaciones:dx0 = �r (1� cos d�)dy0 = r send�Como ya se ha indicado, se ha considerado un sistema de referencia ligado alm�ovil. Pasando a un sistema de referencia absoluto, respecto al cual, el sistemalocal forma un �angulo �, se tiene,dx = cos � dx0 � sen� dy0dy = sen� dx0 + cos � dy0Si se hace la suposici�on de que d� es su�cientemente peque~no:send�! d�; cos d�! 1;De forma que, dx0 = 0; dy0 = r d� = dS;

Page 120: Control Adaptativo y Robusto

104 Ejemplos ilustrativosY, por tanto: dx = �sen� dS; dy = cos � dS;Introduciendo la velocidad en las ecuaciones:dxdt = �V sen�dydt = V cos �El sistema de inter�es es el que involucra el desplazamiento horizontal en funci�onde la curvatura. dxdt = �V sen�d�dt = V Por otro lado, se asume que la curvatura real del robot se obtiene a partir dela curvatura comandada (a la que llamaremos se~nal de control u) a trav�es de unacierta din�amica que se puede expresar como:d dt = 1� (u� )Resumiendo, el sistema din�amico que se deber�a controlar es:dxdt = �V sen�d�dt = V (5.46)d dt = 1� (u� )Donde la se~nal de control es u(t) y la se~nal de salida es x(t).Este sistema puede linealizarse tomando el sistema de referencia absoluto talque la orientaci�on del veh��culo en todo instante (�) sea peque~na. Haciendo laaproximaci�on del peque~no �angulo, se obtiene el siguiente sistema linealizado:dxdt = �V �

Page 121: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 105d�dt = V (5.47)d dt = 1� (u� )Algoritmo de controlEl sistema descrito resulta adecuado para el control adaptativo debido principal-mente a dos motivos. En primer lugar, se trata de un sistema no lineal, por lo que elcontrol adaptativo posibilitar�a la obtenci�on de aproximaciones lineales apropiadaspara cada punto de trabajo y por otro lado el sistema es variable en el tiempo.Adem�as en el caso de que se pudiera linealizar mediante la mencionada aproxi-maci�on del peque~no �angulo, se tratar��a de un sistema lineal variable, puesto que lavelocidad (V ) que aparece en las expresiones no permanece constante a lo largo deldesplazamiento del robot.La t�ecnica de control que se va aplicar es Control Adaptativo Autoajustable me-diante Asignaci�on de Polos.El ciclo de control consta de tres pasos fundamentales:1. Identi�caci�on de un sistema lineal aproximado al sistema real en el punto detrabajo actual.2. C�alculo del regulador apropiado para el sistema identi�cado.3. Obtenci�on y aplicaci�on de la se~nal de control producida por el regulador, apartir del error entre la referencia y la salida del sistema.La identi�caci�on se realizar�a por M��nimos Cuadrados Recursivos, considerandoun modelo de tercer orden de la forma:G(z�1) = Y (z�1)U(z�1) = b1z�1 + b2z�2 + b3z�31 + a1z�1 + a2z�2 + a3z�3Como se ha descrito en el cap��tulo 3 el algoritmo b�asico de identi�caci�on, sueleser insu�ente en las aplicaciones pr�acticas por lo que hay que incluir una serie demejoras. Po ello se ha incluido un factor de olvido variable, en el rango entre 0.96y 1. Al mismo tiempo se ha incluido acotaci�on inferior y superior de la matriz

Page 122: Control Adaptativo y Robusto

106 Ejemplos ilustrativosde covarianza. Para acotar inferiormente esta matriz se le suma una matriz R1constante y para acotarla superiormente se ha impuesto una cota superior a la trazade dicha matriz.En cada ciclo del algoritmo de control, se redise~na el controlador. Se ha optadopor dise~nar el controlador usando asignaci�on de polos y forzando a que el sistemacompleto resultante en bucle cerrado posea error estacionario nulo. En la �gura 5.8se puede observar la disposici�on de �este controlador.AB1

ST

R

r e xu

Figura 5.8: Estructura del controladorEn el m�etodo de asignaci�on de polos se pretende que el sistema en bucle cerrado,incluyendo al controlador, posea una din�amica especi�cada. Para ello se exige quela funci�on de transferencia posea un denominador igual a un polinomio deseadoP (z�1). La funci�on de transferencia del bucle cerrado de la �gura 5.8 es:GBC(z�1) = T (z�1) B(z�1)A(z�1) S(z�1) +B(z�1) R(z�1)y se desea que tenga la forma: GBCd(z�1) = P (1)B(1) B(z�1)P (z�1)En este caso el sistema resultante no incluye ceros adicionales a los de la planta(como ocurre en otras variantes del m�etodo de asignaci�on de polos), y tampoco seintenta cancelar ninguno de los ceros del sistema original (esto signi�ca que el m�etodoser�a aplicable con independencia de que el sistema original posea ceros inestables).Por �ultimo, se exige que el sistema tenga ganancia est�atica unitaria.Los polinomios R(z�1); S(z�1) se obtienen resolviendo la ecuaci�on polin�omica:A(z�1) S(z�1) +B(z�1) R(z�1) = P (z�1)

Page 123: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 107Adem�as, como ya se ha indicado, se desea un integrador en el paso directo paragarantizar que el error estacionario sea cero. Para ello, se exige que S(z�1) sea dela forma: S(z�1) = (1� z�1) S 0(z�1) (5:48)T (z�1) debe cumplir:T (1) = P (1)B(1) = A(1) S(1) +B(1) R(1)B(1)Aplicando (5.48), resulta que S(1) = 0, con lo cual, T (1) = R(1).Para especi�car el polinomio deseado P (z�1) se ha optado por indicar directa-mente los polos deseados y asignarlos en funci�on de los del sistema original. Enprimer lugar, se ha realizado la identi�caci�on del sistema din�amico del robot m�ovil,resultando que los polos son:p0 = 1:0012 + 0:0233i; p1 = 1:0012� 0:0233i; p2 = 0:8163Los polos deseados se especi�can en:p0 = 0:8 + 0:0233i; p1 = 0:8� 0:0233i; p2 = 0:8163Con estos valores se consiguen unos buenos m�argenes de estabilidad, que seestiman en: M� � 39:27 gradosMG � 6:98 dBSe ha supuesto que en el sistema existe una saturaci�on debida al actuador y/oconvertidores, por lo que �esta debe tenerse en cuenta en el controlador. Es decir,que a la se~nal uk obtenida a partir del regulador se le aplica: uk = satura(uk). Deesta forma, el regulador usar�a los valores exactos que se aplicaron al sistema. En la�gura 5.9 se expone el esquema completo del sistema de control implementado.Simulaciones RealizadasLos par�ametros del modelo utilizado han sido:

Page 124: Control Adaptativo y Robusto

108 Ejemplos ilustrativos1S

IdentificadorDiseñoControladorDeseada

ActuacionAB

1

11

1

T

R

r u Planta

P

e

xAux

rAux x

Figura 5.9: Bucle de control completo� Periodo de muestreo: h = 0:3 s� Velocidad inicial: V = 1:2 m=s. En el caso de las simulaciones que se hagancon velocidad constante, �este ser�a el valor que tenga la velocidad durante todala simulaci�on.� Constante de tiempo del control de la curvatura: � = 5 h� Saturaci�on de la se~nal de control: usat = 10En la mayor��a de los casos, se ha utilizado como entrada de referencia unasucesi�on de pulsos positivos o negativos, de amplitud y anchura aleatorias dentro deunos rangos. Como estimaci�on inicial del sistema, se usa una identi�caci�on hechapreviamente para el sistema linealizado.En la �gura 5.10 se muestra el resultado para el caso de usar un controlador�jo, considerando que el sistema es lineal pero variable. La velocidad se var��a enescalones de amplitud 0.1. Se puede observar que cuando la velocidad se distanciasigni�cativamente de la inicial, no se consigue un control aceptable.

Page 125: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 109

0 100 200 300 400 500 600 700 800 900 1000−5

−4

−3

−2

−1

0

1

2

3

4

5ReferenciaSalida Velocidad

Figura 5.10: Sistema lineal variable con controlador �joEn la �gura 5.11 se muestra el resultado para el caso de control adaptativo con elalgoritmo de identi�caci�on completo comentado previamente. Puede observarse queel comportamiento del sistema es bastante bueno. A t��tulo ilustrativo, se muestraen la �gura 5.12 la evoluci�on de los coe�cientes del numerador de la funci�on detransferencia identi�cada.Para forzar m�as la variaci�on del sistema, se someti�o a la velocidad a un creci-miento continuo en forma de rampa de pendiente 0.01. En la �gura 5.13, se puedeobservar el resultado con el regulador adaptativo.Por �ultimo se comprueba el comportamiento del controlador frente a la presenciatanto de la no-linealidad como de la variaci�on de la velocidad. En la �gura 5.14,se muestra la respuesta del sistema variando la velocidad, como ya se hizo anterior-mente en forma de rampa con pendiente 0.01. Puede apreciarse que, el considerarambas caracter��sticas, no afecta signi�cativamente al comportamiento del sistema.En este caso la referencia son escalones con un �ltro de primer orden para suavizarla se~nal de referencia, ello tiene como consecuencia que el punto de trabajo cambiem�as suavemente.

Page 126: Control Adaptativo y Robusto

110 Ejemplos ilustrativos

0 100 200 300 400 500 600 700 800 900 1000−5

0

5

10

ReferenciaSalida Velocidad

Figura 5.11: Sistema lineal variable con control adaptativo

0 100 200 300 400 500 600 700 800 900 1000−0.2

−0.15

−0.1

−0.05

0

0.05

0.1

0.15

0.2

0.25

0.3b1b2b3

Figura 5.12: Evoluci�on de algunos de los par�ametros identi�cados

Page 127: Control Adaptativo y Robusto

Reguladores autoajustables (STR) 111

0 100 200 300 400 500 600 700 800 900 1000

−4

−2

0

2

4

6

8

10

12

ReferenciaSalida Velocidad

Figura 5.13: Sistema lineal variable con control adaptativo

0 100 200 300 400 500 600 700 800 900 1000−10

−8

−6

−4

−2

0

2

4

6

8

10ReferenciaSalida Velocidad

Figura 5.14: Sistema no lineal variable.

Page 128: Control Adaptativo y Robusto

112 Ejemplos ilustrativos

Page 129: Control Adaptativo y Robusto

Cap��tulo 6Autoajuste y ajuste por tabla decontroladores6.1 Introducci�onLos esquemas de control adaptativos como mrac y str necesitan de informaci�ona priori acerca de la din�amica del proceso. Es importante conocer las escalas detiempo, las cuales son cr��ticas para determinar los intervalos de muestreo y �ltros.La importancia de la informaci�on a priori tambi�en apareci�o en conexi�on con intentosde desarrollar t�ecnicas para ajuste autom�atico de reguladores PID. Tales reguladoresson usados para sistemas de control con un amplio rango de constantes de tiempo.Desde el punto de vista del usuario ser��a ideal disponer de una funci�on mediantela cual el regulador pudiera ser ajustado. Aunque los esquemas adaptativos con-vencionales parecen ser herramientas ideales para el ajuste autom�atico, resultaroninadecuadas porque requer��an conocimiento previo de las escalas de tiempo.Los reguladores simples (como PIDs), con dos o m�as par�ametros pueden ser ajus-tados manualmente si no hay demasiada interacci�on entre los diferentes par�ametros,pero el ajuste manual no es posible para reguladores m�as complejos.Tradicionalmente, el ajuste de tales reguladores ha tomado la via de la modeli-zaci�on o identi�caci�on y dise~no del regulador. Esto requiere un consumo de tiempoelevado, adem�as de ser un procedimiento costoso, que s�olo puede ser aplicado a sis-temas cr��ticos en tama~no o en importancia o a sistemas que van a ser manufacturados113

Page 130: Control Adaptativo y Robusto

114 Introducci�onen grandes cantidades.Algunos fabricantes estan incorporando funciones de autoajuste en sus regulado-res, que obtienen la informaci�on a priori que requiere todo especialista para poderajustar un regulador manualmente, y con ello llegan a realizar un ajuste autom�aticode los par�ametros del regulador.Todas las t�ecnicas adaptativas pueden ser usadas para el ajuste autom�atico decontroladores. En tales aplicaciones, el bucle de adaptaci�on opera durante un tiempoy puede conmutarse entre �este y el controlador �jo. Normalmente se a~naden se~nalesde perturbaci�on para mejorar la estimaci�on de los par�ametros. El regulador adap-tativo est�a operativo hasta que el funcionamiento es satisfactorio, entonces el buclede adaptaci�on es desconectado y el sistema se deja correr con los par�ametros �josdel regulador.El autoajuste puede ser considerado como un camino conveniente para incorporarmodelado y dise~no autom�atico en un regulador. Simpli�ca el uso del regulador yampl��a la clase de problemas en que los m�etodos de dise~no autom�atico pueden serusados con un coste razonable.Como se coment�o en el cap��tulo 2, otra alternativa a los sistemas de controladaptativos son los controladores ajustables por tabla. En muchas situaciones sesabe como cambia la din�amica de un proceso con las condiciones de operaci�on delmismo. Una fuente de cambio en la din�amica pueden ser las no linealidades que sepresentan, es entonces posible cambiar los par�ametros del controlador observandolas condiciones de operacion del proceso.Esta idea recibe el nombre de ajuste por tabla (en la terminolog��a inglesa, gainsheduling), y consiste en una realimentaci�on no lineal que cambia los par�ametros enfunci�on de las condiciones de operaci�on de una manera previamente programada.La idea de relacionar los par�ametros del controlador a variables auxiliares noes reciente, pero el hardware necesario para implementarlo f�acilmente no ha estadodisponible hasta hace poco tiempo. El ajuste por tabla es muy costoso llevarloa cabo con t�ecnicas anal�ogicas, sin embargo es f�acil de implementar en sistemascontrolados por computadoras, con un software adecuado.Esta t�ecnica es muy buena para compensar las variaciones de los par�ametros delproceso o de no linealidades conocidas. Es controvertido si un sistema con ajustepor tabla puede ser considerado como sistema adaptativo, porque los par�ametros secambian en bucle abierto. Es un m�etodo muy adecuado para manejar las variaciones

Page 131: Control Adaptativo y Robusto

Autoajuste y ajuste por tabla de controladores 115de par�ametros en sistemas de control de vuelo.A continuaci�on se van a comentar algunas de las t�ecnicas de ajuste de contro-ladores que pueden utilizarse para obtener aproximaciones de los procesos din�amicos.Los m�etodos pueden utilizarse para ajuste autom�atico de reguladores del tipo PID ocomo preajustes para algoritmos de control adaptativos m�as so�sticados. As�� mismose comentar�a la t�ecnica de ajuste por tabla y se ilustrar�a mediante algunos ejemplos.6.2 Control PIDMuchos problemas de control pueden ser manejados muy bien mediante contro-ladores PID. Este algoritmo es muy conocido y es un est�andar para el control deprocesos. La versi�on acad�emica del algoritmo es:u(t) = Kc e(t) + 1Ti Z to e(�)d� + Tddedt! (6:1)donde u es la variable de control, e el error de�nido como e = r � y, donde r es elvalor de referencia, e y la salida del proceso. Los algoritmos utilizados actualmentecontienen varias modi�caciones. Es pr�actica est�andar dejar que la acci�on derivadas�olo opere sobre la variable de salida. Puede ser ventajoso dejar la parte proporcionalactuar s�olo una fracci�on del valor de referencia. La acci�on derivada es sustitu��da poruna aproximaci�on que reduce la ganancia en alta frecuencia. La acci�on integraltambi�en se modi�ca para que no mantenga la integraci�on cuando la variable decontrol se sature (anti-windup). Se toman precauciones para que no se produzcantransitorios cuando el regulador se conmuta de control manual a control autom�aticoo cuando los par�ametros se cambian. Una versi�on razonable del regulador PID puedeser descrita por: u(t) = P (t) + I(t) +D(t) (6.2)donde P (t) = Kc(uc(t)� by(t))dIdt = KcTi (uc(t)� y(t)) + 1Tt (v(t)� u(t)) (6.3)TdN dDdt +D = �KcTddydt

Page 132: Control Adaptativo y Robusto

116 M�etodos de respuesta transitoriaEl �ultimo t�ermino en la expresi�on dI=dt se introduce para mantener la integrallimitada cuando la variable de salida se satura. La variable v es una se~nal deseguimiento, la cual es igual a la salida saturada del actuador, y el par�ametro Tt esuna constante de tiempo para la acci�on de seguimiento. Los par�ametros esencialespara ser ajustados son Kc, Td y Ti. El par�ametro N puede ser �jo; un valor t��picoes N = 10. La constante de tiempo de seguimiento es t��picamente una fracci�on deltiempo de integraci�on Ti.6.3 M�etodos de respuesta transitoriaVarios m�etodos sencillos de ajuste para controladores PID est�an basados en experi-mentos de respuesta transitoria. Muchos procesos industriales tienen una respuestaante entrada en escal�on del tipo mostrado en la �gura 6.1. En la cual, la respuesta63.2 %

t2

28.3 %

t1

L TFigura 6.1: Respuesta al escal�on unitario de un proceso industrial t��picoescal�on es mon�otona despu�es de un tiempo inicial. Un sistema con una respuestaescal�on de este tipo puede ser aproximado por la funci�on de transferencia:G(s) = k1 + Ts e�sL (6:4)donde k es la ganancia est�atica, L el tiempo aparente de retraso, T la constante detiempo aparente y a es el punto de corte de la tangente con el eje de ordenadas.

Page 133: Control Adaptativo y Robusto

Autoajuste y ajuste por tabla de controladores 117Hay que hacer notar que la distancia desde el origen al corte de la prolongaci�on dela recta tangente a la curva (a), cumple la relaci�on,a = k LT (6:5)6.3.1 M�etodo de respuesta en escal�on de Ziegler-NicholsUna manera simple de determinar los par�ametros de un regulador PID basada enlos datos de respuesta en escal�on fue desarrollada por Ziegler y Nichols y publicadaen 1942. El m�etodo usa s�olo dos de los par�ametros rese~nados anteriormente, a y L.Los par�ametros del regulador se dan en la siguiente tabla.Controlador Kc Ti TdP 1/aPI 0.9a 3LPID 1.2/a 2L L/2La regla de ajuste Ziegler-Nichols fue desarrollada a partir de simulaciones emp��ricasde muchos sistemas diferentes. La regla tiene el inconveniente de que se obtienensistemas en bucle cerrado que est�an pobremente amortiguados. Sistemas con mejoramortiguamiento pueden obtenerse por modi�caci�on de los valores num�ericos de latabla.Mediante el uso de par�ametros adicionales es posible determinar si la regla deZiegler-Nichols es aplicable. Si la constante de tiempo T est�a determinada, una reglaemp��rica es establecer que la regla de Ziegler-Nichols es aplicable si 0:1 < L=T < 1.Para valores grandes de L=T es ventajoso usar leyes de control que compensan eltiempo muerto. Para valores peque~nos de L=T , puede obtenerse un procedimientomejorado con compensadores de alto-orden. Es tambi�en posible usar reglas de ajustem�as so�sticadas basadas en los tres par�ametros.6.3.2 Caracterizaci�on de la respuesta en escal�onLos par�ametros k, L y T pueden ser determinados a partir de una construcci�ongr�a�ca tal como la indicada en la �gura 6.1. Tal m�etodo es dif��cil de automatizar.El par�ametro k puede ser obtenido de la relaci�on de cambios est�aticos de entrada

Page 134: Control Adaptativo y Robusto

118 M�etodos basados en realimentaci�on con rel�ey salida en r�egimen permanente. Hay un m�etodo siemple, basado en mediciones de�area, para determinar L y T (�gura 6.2). Determinando el �area A0 y A1 se tiene:T + L = A0k (6.6)yT = eA1k (6.7)donde e es la base del logaritmo natural. Los inconvenientes esenciales al m�etodoson que puede ser dif��cil conocer el tama~no del escal�on en la se~nal de control ydeterminar si se ha alcanzado el r�egimen permanente. El escal�on deber��a ser deltama~no su�ciente como para que la respuesta del sistema sufra variaciones, y nodemasiado grande como probocar perturbaciones.0

0.5

1

0 20 40 60 80 100 120 140 160

L+T t

|||||||||||||||||

A0

A1

k

Figura 6.2: M�etodo del �area para la determinaci�on de L y TRe�namiento en lineaSi se obtiene un ajuste razonable del regulador, el amortiguamiento y la frecuen-cia natural del sistema en bucle cerrado pueden determinarse a partir de la respuestatransitoria en bucle cerrado, pudiendose mejorar el ajuste del regulador.6.4 M�etodos basados en realimentaci�on con rel�eLos principales inconvenientes de los m�etodos de respuesta transitoria es que sonsensibles a las perturbaciones, porque se basan en experimentos en bucle abierto. Losm�etodos basados en rel�es evitan esta di�cultad porque los experimentos necesariosson ejecutados en bucle cerrado.

Page 135: Control Adaptativo y Robusto

Autoajuste y ajuste por tabla de controladores 119La idea b�asica es que muchos procesos tendr�an oscilaciones de ciclo l��mite bajorealimentaci�on con rel�e. Las propiedades esenciales del proceso pueden determinarsede los par�ametros del ciclo l��mite, y los par�ametros de un regulador PID pueden portanto calcularse. La �gura 6.3 muestra un diagrama de bloque para la aplicaci�on deeste m�etodo. Cuando se requiere un ajuste, el conmutador se coloca en la posici�onT, lo cual signi�ca que la realimentaci�on por rel�e es activada y el regulador PID sedesconecta. Cuando se alcanza un ciclo l��mite, los par�ametros PID son calculadosy el controlador PID es entonces conectado al proceso. Deber��a usarse en primerlugar un m�etodo aproximado para hacerse una idea de la informaci�on que puedeobtenerse de un experimento con realimentaci�on por rel�e.-����

--

cc!!! - -6PIDRel�e

AT u yr ProcesoFigura 6.3: Diagrama de bloque de autoajuste por rel�e6.4.1 El m�etodo del balance arm�onicoA continuaci�on se va a comentar un m�etodo aproximado llamado m�etodo de balancearm�onico o el m�etodo de la funci�on descriptiva. Considerando un sistema realimen-tado simple, compuesto de una parte lineal con la funci�on de transferencia G(s) yla realimentaci�on con un rel�e ideal. El diagrama de bloques se muestra en la �gura6.4.Se asume que r = 0. Una condici�on de aproximaci�on para las oscilaciones puedeser determinada como sigue: Asumiendo que hay un ciclo l��mite con per��odo Tuy frecuencia wu = 2�=Tu tal que la salida de rel�e es una onda sim�etrica peri�odicacuadrada. Si la amplitud del rel�e es d, por expansi�on en serie de Fourier de lasalida de rel�e, se muestra que el primer arm�onico tiene la amplitud 4d=�. Se asume

Page 136: Control Adaptativo y Robusto

120 M�etodos basados en realimentaci�on con rel�e-����- - -6r e u yProcesoRel�eFigura 6.4: Sistema lineal con control por rel�eadem�as que los procesos din�amicos tienen car�acter paso bajo y que la contribuci�ondel primer arm�onico domina la salida. La se~nal de error tiene entonces la amplitud:a = 4d� jG(jwu)j (6:8)La condici�on para la oscilaci�on es tal que:argG(jwu) = �� y Ku = 4d�a = 1jG(jwu)j (6:9)donde Ku puede interpretarse como la ganancia equivalente del rel�e para transmisi�onde se~nales sinusoidales con amplitud a. La condici�on es adem�as que el sistema linealen la �gura 6.4, tenga una curva Nyquist que intersecte el eje real negativo. Laamplitud a y la frecuencia de oscilaci�on wu son f�acilmente deducibles de la ecuaci�on6.9. La frecuencia del ciclo l��nmite es adem�as autom�aticamente ajustada a la fre-cuencia wu en la cual el proceso din�amico en bucle abierto tiene un retraso de fase de180o. F��sicamente Ku es la ganancia que lleva el sistema al l��mite de estabilidad bajocontrol proporcional. Un experimento con realimentaci�on por rel�e dar�a adem�as elper��odo y la amplitud de la funci�on de transferencia en bucle abierto del proceso enla frecuencia en la cual el retardo de fase es 180o. Hay que hacer notar tambi�en queuna se~nal de entrada cuyo contenido de energ��a est�a concentrado en wu es generadaautom�aticamente en el experimento.Se pueden utilizar varios re�namientos o mejoras del m�etodo. La amplitud delas oscilaciones del ciclo l��mite pueden especi�carse por introducci�on de una reali-mentaci�on que ajuste la amplitud del rel�e. Por otro lado, una hist�eresis en el rel�ees �util para hacer al sistema menos sensible al ruido. Se va a mostrar a contin-uaci�on como determinar los par�ametros de un regulador PID. El m�etodo puede serinsensible a las perturbaciones por comparaci�on y promediado de varios per��odos deoscilaci�on.

Page 137: Control Adaptativo y Robusto

Autoajuste y ajuste por tabla de controladores 1216.4.2 El m�etodo de Ziegler-Nichols en bucle cerradoUna regla simple para escoger los par�ametros de los reguladores PID est�a idealmenteemparejada a la determinaci�on de Ku y Tu por el m�etodo del rel�e. Los valores delcontrolador est�an dados en la tabla adjunta. Estos par�ametros dan un sistemaen bucle cerrado con amortiguamiento bajo. Sistemas con mejor amortiguamientopueden obtenerse por ligeras modi�caciones de los valores de la tabla.Controlador Kc Ti TdP 0.5 KuPI 0.4 Ku 0.8 TuPID 0.6 Ku 0.5 Tu 0.12 TuEstimaciones mejoradasA partir del experimento del rel�e se han obtenido s�olo dos par�ametros (Ku yTu). Cambiando el punto de trabajo durante el experimento es posible determinarla ganancia est�atica (k) del proceso. El producto kKu puede utilizarse para evaluarsi el ajuste del regulador PID mediante las reglas de Ziegler Nichols es adecuado.Si 2 < kKu < 20 entonces puede utilizarse el m�etodo. Valores m�as peque~nosindican que se necesita una ley de control que admita compensaci�on del tiempomuerto. Valores m�as grandes indican que debe utilizarse un algoritmo de controlm�as complejo.6.4.3 Oscilaciones de rel�eDado que los ciclos l��mites con realimentaci�on por rel�e es una idea clave de losm�etodos de autoajuste por rel�e, es importante comprender por qu�e un sistema linealoscila en estas condiciones y cuando la oscilaci�on es estable. Es importante tambi�entener m�etodos para la determinaci�on del per��odo y la amplitud de las oscilaciones.Considerando el sistema mostrado en la �gura 6.4, e introduciendo la realizaci�on enel espacio de estados de la funci�on de transferencia G(s):dxdt = A x+B uy = C x (6.10)

Page 138: Control Adaptativo y Robusto

122 M�etodos basados en realimentaci�on con rel�eEl rel�e puede ser descrito por: u = ( d; si e > 0�d; si e < 0 (6:11)donde e = r - y.A continuaci�on se va analizar el periodo del ciclo l��mite. Para ello asumiendoque el sistema de�nido en la �gura 6.4 y las ecuaciones 6.10 y 6.11 tiene un ciclol��mite sim�etrico con per��odo T . El per��odo T es entonces el valor m�as peque~no deT > 0 que satisface la ecuaci�on, C(I + �)�1� = 0 (6:12)donde � = eAT=2y � = Z T=20 eAsds BHay que hacer notar que la condici�on de la ecuaci�on 6.12 puede escribirse tambi�encomo, HT=2(�1) = 0 (6:13)dondeHT=2(z) es la funci�on de transferencia impulsional obtenida cuando se muestreael sistema de ecuaci�on 6.10 con per��odo T=2.Habiendo obtenido la f�ormula exacta de la ecuaci�on 6.12 para T , es posibleinvestigar la precisi�on de la aproximaci�on de la funci�on descriptiva. Considerandoel caso sim�etrico e introduciendo h = T=2. La funci�on de transferencia impulsionalobtenida cuando se muestrea el sistema de ecuaci�on 6.10 con per��odo h est�a dadapor: Hh(esh) = 1h 1Xn=�1 1s + jhws (1� e�h(s+jnws))G(s+ jnws)donde ws = 2�=h. Haciendo sh = j�Hh(�1) = 1X�1 2j(� + 2n�)G�j � + 2n�h �= 1X0 4�(1 + 2n)Im �G�j � + 2n�h �� = 0

Page 139: Control Adaptativo y Robusto

Autoajuste y ajuste por tabla de controladores 123El primer t�ermino de la serie da,Hh(�1) � 4� Im �G�j �h�� = 4� Im �G�j 2�T �� = 0que es el mismo resultado para el c�alculo de T obtenido del an�alisis de la funci�ondescriptiva. Esto implica que la aproximaci�on de la funci�on descriptiva es correctas�olo si G(s) tiene un car�acter de paso-bajo.6.5 Ajuste por tablaAlgunas veces es posible encontrar variables auxiliares que correlacionan bien loscambios en la din�amica de un proceso. Es entonces posible reducir los efectos de lasvariaciones de los par�ametros simplemente cambiando los par�ametros del reguladorcomo funci�on de las variables auxiliares.-����- - -6r e ControladorAjustable u Planta yCC

CCW��MecanismodeAdaptaci�on Medida dela Variableauxiliar MedioAmbiente

Figura 6.5: Controlador ajustable por tablaComo se observa en la �gura 6.5, el ajuste por tabla puede verser por tantocomo un sistema de control realimentado, en el que las ganancias de realimentaci�onson ajustadas usando una compensaci�on de prealimentaci�on. Como ejemplo, en lossistemas de vuelo se usan como variables auxiliares el n�umero de Mach y la presi�ondin�amica, que pueden medirse mediante sensores.El problema principal en el dise~no de sistemas con ajuste por tabla es encon-trar las variables auxiliares apropiadas. Esto se hace normalmente bas�andose en el

Page 140: Control Adaptativo y Robusto

124 Dise~no de reguladores con ajuste por tablaconocimiento f��sico del sistema. En control de procesos, el caudal de producci�onpuede escogerse frecuentemente como variable auxiliar, puesto que las constantes detiempo y tiempo de retardo son inversamente proporcional a dicho caudal.Cuando se determinan las variables auxiliares, los par�ametros del regulador secalculan para un determinado n�umero de condiciones de operaci�on, usando alg�unm�etodo de dise~no adecuado. El regulador es por tanto sintonizado o calibrado paracada condici�on de operaci�on. La estabilidad y actuaci�on del sistema son evalua-dos por simulaci�on; teniendo una atenci�on especial a la transici�on entre diferentescondiciones de operaci�on.Algunas veces es posible obtener ajuste por tabla introduciendo las transforma-ciones no lineales de tal manera que el sistema transformado no depende de lascondiciones de operaci�on. Las medidas auxiliares se usan junto con las medidas delproceso para calcular las variables transformadas. La variable de control transfor-mada se calcula y se retransforma antes de ser aplicada al proceso. El reguladorresultante puede considerarse compuesto de dos transformaciones no lineales con unregulador lineal en medio. Otras veces la transformaci�on se basa en las variablesobtenidas indirectamente a trav�es de estimaci�on de estados.El ajuste por tabla tiene la ventaja de que los par�ametros del regulador puedencambiarse muy r�apidamente en respuestas a los cambios del proceso. Puesto queno existe estimaci�on de los par�ametros, la limitaci�on depende de como de r�apidoresponden las medidas auxiliares a los cambios del proceso.6.6 Dise~no de reguladores con ajuste por tablaEs dif��cil dar reglas generales para dise~nar este tipo de reguladores. La cuesti�on clavees determinar las variables que pueden usarse como variables de ajuste. Es claroque estas se~nales auxiliares deben re ejar las condiciones de operaci�on de la planta.Idealmente tendr��amos una expresi�on que relaciona los par�ametros del regulador conlas variables de ajuste. Es necesario por tanto tener una buena informaci�on de ladin�amica del proceso, si se utiliza el ajuste por tabla. Como ideas generales debemostener en cuenta:� Linealizaci�on de actuadores no lineales.� Ajuste por tabla basado en medida de variables auxiliares.

Page 141: Control Adaptativo y Robusto

Autoajuste y ajuste por tabla de controladores 125� Ajuste de tiempo basado en el caudal de producci�on.� Transformaciones no lineales.6.6.1 Actuador no linealConsiderando el sistema no lineal de la �gura 2.6, comentado en el cap��tulo 2, conun regulador PI cuyo actuador es una v�alvula con la caracter��stica,v = f(u) = u4; u � 0Sea f�1 una aproximaci�on de la inversa de la caracter��stica de la v�alvula. Paracompensar la no linealidad, la salida del regulador se lleva a trav�es de esta funci�onantes de ser aplicada a la v�alvula.-����- - - - -6 PI f�1 f Govucr y

Figura 6.6: Compensaci�on no lineal del actuadorEsto da la relaci�on, v = f(u) = f(f�1(c))donde c es la salida del regulador PI. La funci�on f(f�1(c)) deber��a tener menosvariaci�on en ganancia que f . Si f�1 es la inversa exacta, entonces v = c.Si consideramos que f(u) = u4 puede ser aproximada por dos lineas: unaconectando los puntos (0,0) y (1.3,3), y otra conectando este punto y el (2,16),entonces tenemos la �gura 6.7. en dondef�1(c) = ( 0:433c 0 � c � 30:0538c+ 1:139 3 � c � 16

Page 142: Control Adaptativo y Robusto

126 Dise~no de reguladores con ajuste por tabla0

5

10

15

20

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2

u

v

Figura 6.7: Caracter��stica no lineal de la v�alvulaLa �gura 6.8 muestra los cambios en la se~nal de referencia en cuatro condicionesde operaci�on diferentes cuando utilizamos la aproximaci�on de la inversa de la v�alvula.Al comparar las respuestas con el sistema sin compensar de la �gura 2.7, seobserva una considerable mejora en la respuesta del sistema. Con esta mejora esposible hacer al proceso m�as insensible a la nolinealidad de la v�alvula.Este ejemplo nos muestra una idea muy �util y simple para compensar no linea-lidades conocidas. En la pr�actica es a menudo su�ciente aproximar la no linealidadmediante unos poco segmentos lineales. Hay varios controladores comerciales quepueden hacer esta clase de compensaci�on.6.6.2 Tanque de secci�on variableConsideremos un tanque donde la secci�on A varia con la altura h. El modelo es,ddt(A(h)h) = qi � aq2ghdonde qi es el ujo de entrada y a es la secci�on de la tuber��a de salida. Si qi es laentrada y h la salida del sistema, el modelo linealizado en un punto de operaci�on,q0in y h0, viene dado por la funci�on de transferencia,G(s) = �s+ �donde � = 1A(h0)

Page 143: Control Adaptativo y Robusto

Autoajuste y ajuste por tabla de controladores 127

0

0.1

0.2

0.3

0.4

0 10 20 30 40 50 60 70 80 90 100

0

0.5

1

0 10 20 30 40 50 60 70 80 90 100

0

2

4

6

0 10 20 30 40 50 60 70 80 90 100

0

5

10

0 10 20 30 40 50 60 70 80 90 100Figura 6.8: Respuesta a escal�on del sistema compensado

Page 144: Control Adaptativo y Robusto

128 Dise~no de reguladores con ajuste por tablaUn controlador PI del tanque viene dado por,u(t) = K �e(t) + 1Ti Z (e�)d��donde K = 2�! � ��y Ti = 2�! � �!2Esto nos da un sistema de bucle cerrado con una frecuencia natural ! y unamortiguamiento relativo �.Introduciendo las expresiones de � y � se tiene el siguiente controlador ajustablepor tabla, K = 2�!A(h0)� q0in2h0Ti = 2�! = q0in2A(h0)h0!2Los valores num�ericos son frecuentemente tal que � � 2�!, por lo que lasexpresiones pueden simpli�carse entonces a:K = 2�!A(h0)Ti = 2�!En este caso, es por tanto su�ciente hacer la ganancia proporcional a la secci�ondel tanque. En la �gura 6.9 se muestra la respuesta de este regulador para un tanquepiramidal con secci�on variable igual a hl.Este ejemplo pone de mani�esto que algunas veces se pueden medir una o dosvariables en un proceso y usarlas como entradas para el ajuste de la ganancia. Fre-cuentemente no es tan f�acil como aparece en este ejemplo, determinar los par�ametrosdel controlador como funci�on de las variables medidas. El dise~no del regulador debeentonces rehacerse para diferentes puntos de trabajo del proceso. Tambi�en debe te-nerse cuidado con las se~nales que se miden por si tienen ruidos, en este caso pueden�ltrarse antes de ser utilizadas como variables de ajuste.

Page 145: Control Adaptativo y Robusto

Autoajuste y ajuste por tabla de controladores 1290.5

0.6

0.7

0.8

0.9

1

0 10 20 30 40 50 60 70 80 90

0.3

0.4

0.5

0.6

0.7

0 10 20 30 40 50 60 70 80 90Figura 6.9: Respuesta del sistema en diferentes puntos de trabajo6.6.3 Transformaci�on no linealEs de gran inter�es encontrar las transformaciones que hacen al sistema transformadolineal e independiente de las condiciones de operaci�on. En algunos procesos �estopuede hacerse mediante escalas de tiempos. Todos los procesos asociados con el ujo de material tienen esta propiedad: molinos rodantes, bandas transportadoras, ujo en tuber��as, etc.Un sistema de la forma x(t) = f(x(t)) + g(x(t))u(t)puede ser transformado en un sistema lineal, con tal de que todos los estados delsistema puedan ser medidos y darse las condiciones de observabilidad generalizada.El dise~no se hace en primer lugar transformando el sistema en un sistema lineal�jo. La transformaci�on es generalmente no lineal y depende de los estados delproceso. Entonces se dise~na un regulador para el modelo transformado, y las se~nalesde control del modelo son retransformadas en las se~nales de control originales. Elresultado es un controlador no lineal de tipo especial, que puede ser interpretado

Page 146: Control Adaptativo y Robusto

130 Dise~no de reguladores con ajuste por tablacomo un controlador de ajuste por tabla. El controlador se construye a partir delconocimiento acerca de las no linealidades en el modelo.Transformaci�on no lineal de segundo ordenConsideremos el sistema, dx1dt = f1(x1; x2)dx2dt = f2(x1; x2; u)Supongamos que las variables de estado pueden ser medidas y que queremosencontrar una realimentaci�on tal que la respuesta de la variable x1 a al se~nal demando viene dada por la funci�on de transferencia,G(s) = !2s2 + 2&!s+ !2 (5) (6:14)Introduciendo nuevas coordenadas z1 y z2 de�nidas como,z1 = x1z2 = dx1dt = f1(x1; x2)y la nueva se~nal de control v, de�nida porv = F (x1; x2; u) = @(f1)@(x1)f1 + @(f1)@(x2)f2 (6:15)De estas transformaciones resulta un sistema lineal,dz1dt = z2dz2dt = v (6.16)F�acilmente se observa que la realimentaci�on linealv = !2(uc � z1)� 2&!z2 (6:17)da la funci�on de transferencia en bucle cerrado (6.14) de uc a z1 = x1 para el sistemalineal de la ecuaci�on (6.16), se continua para transformar a las variables originales.De las ecuaciones (6.15) y (6.17) se tiene para las variables originales:v = F (x1; x2; u) = !2(uc � x1)� 2&!f1(x1; x2)

Page 147: Control Adaptativo y Robusto

Autoajuste y ajuste por tabla de controladores 131Resolviendo esta ecuaci�on para u se obtiene la realimentaci�on deseada. Del teo-rema de la funci�on impl��cita, una condici�on para la soluci�on local es que la derivadaparcial @F@u sea diferente de cero. La generalizaci�on del ejemplo requiere una soluci�onal problema general de transformar un sistema no lineal en uno lineal mediante rea-limentaci�on no-lineal. Una versi�on simple del problema tambi�en se da en el controlde robots industriales. En este caso la ecuaci�on b�asica puede escribirse comoJ d2'dt2 = Tedonde J es el momento de inercia, ' un �angulo de una uni�on, y Te un par quedepende de la corriente del motor, los �angulos de par, y sus dos derivadas. Lasecuaciones son por tanto de la forma considerada y la realimentaci�on no lineal seobtiene determinando las corrientes que dan el par deseado. El problema se llamatransformaci�on de par.

Page 148: Control Adaptativo y Robusto

132 Dise~no de reguladores con ajuste por tabla

Page 149: Control Adaptativo y Robusto

Cap��tulo 7Aplicaci�on de control adaptativo7.1 Introducci�onDesde la introducci�on del regulador autoajustable (self-tuning) por Astrom y Wit-tenmark (1973), han aparecido en la literatura muchos trabajos, poniendo de mani-�esto las propiedades del control adaptativo (Astrom, 1983 y Landau, 1974). Estostrabajos son en su mayor parte te�oricos y aunque se han realizado algunas apli-caciones (Borisson 1976, Buchholt 1979, Kallstrom 1979, Narendra 1980, Dumont1982, Rubio 1982, etc.), todav��a no est�a bien aceptado a nivel industrial. En estecap��tulo se presenta una aplicaci�on de un controlador adaptativo al control de la tem-peratura de salida en un campo de colectores distribuidos de una Central El�ectricaTermosolar (CETS).Desde hace alg�un tiempo y fundamentalmente tras la crisis energ�etica, se hapuesto de mani�esto un creciente inter�es por el aprovechamiento de fuentes ener-g�eticas no exploradas hasta ahora, o que lo han sido insu�cientemente. Tal es elcaso de la energ��a solar, siendo una de las m�as prometedoras las plantas el�ectricastermosolares.Las Centrales El�ectricas Termosolares, son sistemas empleados para obtener laenerg��a el�ectrica a partir de la energ��a solar mediante la transformaci�on previa de�esta en energ��a t�ermica. El dise~no de este tipo de centrales no comienza hasta 1977(Ru��z y G�omez 1982), y no es hasta 1981 cuando se ponen en marcha las primeras.

133

Page 150: Control Adaptativo y Robusto

134 Descripci�on de la plantaLa diferencia fundamental entre una planta convencional y una planta solar, esque la energ��a primaria no puede ser manipulada por el hombre, es intermitente ycuando se tiene, resulta cara de transformar. Por todo ello, en una planta solar serequiere un so�sticado sistema de control capaz de mantener unas especi�cacionesm�as rigurosas que un control cl�asico.Fundamentalmente existen dos tipos de CETS, seg�un el n�umero de componentesque transforman la energ��a solar en t�ermica, si es solo uno, se denominan sistemasde receptor central (CRS) y si cada captador dispone de su propio dispositivo detransformaci�on, se denominan sistemas de colectores distribuidos (DCS). Esta apli-caci�on se centrar�a en las CETS de colectores distribuidos y particularmente en elsistema de control necesario para conseguir un aprovechamiento �optimo de la energ��adisponible.7.2 Descripci�on de la plantaLa central en concreto a la que se ha aplicado el control adaptativo, es la plantaSSPS situada en el municipio de Tabernas (Almer��a). En dicha planta se disponede un campo de captadores cilindroparab�olicos con seguimiento solar en elevaci�ondel tipo ACUREX. Una fotograf��a de este campo puede verse en la �gura 7.1.Los tubos receptores, situados en la l��nea focal, emplean el ujo solar concen-trado para calentar un aceite t�ermico, proviniente de la parte inferior de un tanquede almacenamiento por estrati�caci�on t�ermica a cuya parte superior es devuelto elaceite una vez aumentada su temperatura. El tanque est�a conectado a varios sis-temas para utilizar la energ��a almacenada en �el. Tambi�en aprovechando el principiode estrati�caci�on t�ermica, para lo cual el aceite se toma caliente de la parte superiory se devuelve fr��o a la inferior. Un diagrama simpli�cado del campo de colectoressolares puede verse en la �gura 7.2.Como puede comprenderse, las condiciones ambientales a que est�a sometida unaCETS son en general distintas de las condiciones de dise~no mencionadas. Por supropia naturaleza, la disponibilidad de energ��a solar depende de la fecha y hora, delas condiciones meteorol�ogicas y dem�as perturbaciones existentes.La planta est�a sometida a perturbaciones en la energ��a de entrada, que puedenser lentas, debidas a variaciones de insolaci�on a la largo de un d��a claro, o bienbruscas, causadas fundamentalmente por la aparici�on de nubes y por variaciones dela temperatura de entrada al campo en la puesta en marcha del sistema de conversi�on

Page 151: Control Adaptativo y Robusto

Aplicaci�on de control adaptativo 135

Figura 7.1: Campo de colectores distribuidos ACUREXp p p p ? 6�������XXX�@ �@ HH���A HH��6-� �6

Campo acurex Tanque AlmacenamientoBomba Bu�er

-� HaciaGeneradorVaporoPlantaDesalinizadora

Figura 7.2: Diagrama esquem�atico del campo de colectores

Page 152: Control Adaptativo y Robusto

136 Modelo din�amico del campode potencia. Todas estas perturbaciones nos obligan a variar continuamente el ujode control, lo que a su vez provoca que el tiempo de residencia del uido en el camposea variable.De todo lo expuesto, se desprende que el proceso a controlar es un sistemafuertemente no-lineal con retardo variable en el tiempo, y por tanto desde el puntode vista de control, en el que se considera un modelo lineal, ser�a un proceso conpar�ametros variables y retardo tambi�en variable.7.3 Modelo din�amico del campoCon el objeto de poder evaluar m�as facilmente y con m�as rapidez los distintos con-troladores posibles, es de inter�es disponer de un modelo din�amico de la planta, quepermita simular una gran variedad de comportamientos as�� como de perturbaciones.En un primer paso se dise~n�o un modelo concentrado simpli�cado del campo,pas�andose posteriormente a un modelo de par�ametros distribuido que permite teneruna mayor exactitud del comportamiento del campo.7.3.1 Modelo concentradoSupuesta una representaci�on concentrada de la planta, el cambio de energ��a internadel campo puede ser dada por:CdTdt = NoRI � _V Pcp(T � Ti)�Hl(Tm � Ta) (7:1)El producto Pcp es una funci�on de la temperatura y puede ser aproximado a 1924KJ/l oC. A partir de los datos experimentales el coe�ciente de p�erdidas t�ermicas esde 1.05 Kw/ oC.Para identi�car el resto de los par�ametros pueden utilizarse varios m�etodos,sometiendo al campo a varios tests. En este caso se ha sometido al campo a unase~nal cuadrada y los datos tomados se han utilizado para ajustarlos al modelo dadoanteriormente, mediante un m�etodo de m��nimos cuadrados conocido como el m�etodode Powell (Camacho 1977). Del resultado de la identi�caci�on, se estima el par�ametroC=2267 Kw/ oC y NoR = 1322m2.

Page 153: Control Adaptativo y Robusto

Aplicaci�on de control adaptativo 1377.3.2 Modelo distribuidoEl campo Acurex est�a formado por colectores solares distribuidos del tipo Acurex,modelo 3001. Estos colectores son parab�olicos y con seguimiento del sol en un soloeje (elevaci�on). El campo est�a dispuesto en 20 �las de colectores, las cuales forman10 lazos paralelos. En total en el campo hay 480 m�odulos orientados de este a oestey la super�cie total de espejos es 2674 m2.Los tubos receptores, situados en la l��nea focal, emplean el ujo solar concen-trado para calentar un aceite t�ermico, proveniente de la parte inferior de un tanquede almacenamiento por estrati�caci�on t�ermica a cuya parte superior es devueltoel aceite caliente. El tanque puede almacenar, en el punto de dise~no, 2.7 Mwthde energ��a en aceite t�ermico proveniente de los campos de colectores distribuidos.El tanque est�a conectado con un generador de vapor o una planta desalinizadora,tambi�en aprovechando el principio de estrati�caci�on t�ermica. El aceite se toma aelevada temperatura de la parte superior del tanque, se enfr��a al ceder su calor, yse devuelve frio a la parte inferior.El colector Acurex posee una super�cie parab�olica para concentrar la radiaci�onsolar directa sobre el tubo receptor, que est�a localizado en la zona focal de lapar�abola. El aceite t�ermico es bombeado a trav�es de la tuber��a receptora y recogeel calor transferido a trav�es de las paredes del tubo.El sistema est�a provisto con un sistema de seguimiento del sol que mueve los es-pejos alrededor de un eje paralelo a aquel en el que se situa la tuberia. El mecanismode seguimiento puede alcanzar tres posibles estados:� Seguimiento ('track'): El mecanismo sigue el sol y los colectores enfocan sobrela tuberia.� Desenfocado ('desteer'): El mecanismo sigue el sol, pero desenfoca el colectorvarios grados, de forma que el tubo receptor se situa fuera de la zona focal yel uido no se calienta.� Bocabajo ('stow'): El mecanismo lleva al colector a una posici�on invertida, noexistiendo nig�un tipo de seguimiento del sol. A este estado se llega al �nal deld��a o si una alarma grave se produce.Un bucle ACUREX est�a formado por cuatro colectores de doce m�odulos, conec-tados en serie de forma apropiada. El bucle tiene 172 m. de longitud, siendo de 142

Page 154: Control Adaptativo y Robusto

138 Modelo din�amico del campom. la parte activa del bucle y el resto 30 m. pasiva. Debido a la complejidad delsistema y a la existencia de no-linealidades, se ha desarrollado un modelo num�ericopara la simulaci�on de dicho sistema, habi�endose hecho las siguientes hip�otesis:� Las propiedades del aceite son consideradas como funciones de la temperatura,varian con el tiempo y el espacio.� El ujo incidente de calor en cada secci�on se supone que es circunferencialmenteuniforme e igual al valor medio.� Las variaciones de temperatura radial en la pared del tubo son despreciadas.Esta suposici�on es razonable para una pared �na que tiene una buena conduc-tividad t�ermica.� El ujo de aceite y la irradiancia son consideradas como funciones del tiempoy en cada instante son las mismas en cada momento. (Se supone uido incom-prensible).� Las p�erdidas por conducci�on de calor axial en ambos lados de la pared y del uido son despreciadas. La conducci�on axial en el tubo debe ser peque~na yaque la pared es �na, teniendo una alta resistencia t�ermica. En el uido laconducci�on axial es relativamente peque~na porque la conductividad del aceitees pobre.Con las hip�otesis anteriores y aplicando la conservaci�on de la energ��a en el tubode metal de un volumen de control de longitud dx sobre un intervalo de tiempo dt,se tiene: �mCmAm@Tm@t = InoD �HlG(Tm � Ta)� LHt(Tm � Tf) (7:2)Similarmente para un elemento de uido:�fCfAf @Tf@t + �fCf _V @Tf@x = LHt(Tm � Tf ) (7:3)En la ecuaciones anteriores el sub��ndice m se re�ere al metal y el f al uido y:� = densidadc = calor espec���coA = �area transversalT = temperatura

Page 155: Control Adaptativo y Robusto

Aplicaci�on de control adaptativo 139I = irradiaci�onno = coe�ciente de re ectividadH1 = funci�on de las pe�erdidas metal-ambienteD = anchura espejosHt = coe�ciente de transmisi�on metal uidoG = Di�ametro exterior del tuboL = Di�ametro interior del tubo_V = caudal de aceiteLas ecuaciones que describen el comportamiento en un elemento pasivo son si-milares, excepto que la entrada de energ��a solar es cero y el coe�ciente de p�erdidases mucho menor.Estas ecuaciones han sido resueltas utilizando un procedimiento iterativo endiferencias �nitas. Las temperaturas del uido y del tubo absorbedor son calculadaspara cada intervalo de tiempo y para cada elemento de longitud. La longitud de cadasegmento es de 1 m y el intervalo de integraci�on es de 0,5 segundos. Este intervalo deintegraci�on se ha elegido como un compromiso entre el tiempo de c�alculo necesarioy la precisi�on obtenida.Se ha elegido un algoritmo en dos etapas para resolver las ecuaciones de lastemperaturas. En la primera etapa se calculan las temperaturas del uido y delmetal suponiendo que el uido est�e en r�egimen estacionario. En la segunda etapa latemperatura del uido es corregida en funci�on de la energ��a neta transportada porel uido.� 1a EtapaTm(n; k) = Tm(n; k � 1) + �tR�mCmAm (InoD �HlG(Tm(n; k � 1)� Ta)�LHt1(Tm(n; k � 1)� T1f (n; k � 1))Tf (n; k) = T1f (n; k � 1) + Ht1�tR�fCfAf (Tm(n; k � 1)� T1f (n; k � 1))� 2a Etapa T1f (n; k) = Tf (n; k � 1)� V�tAf�x(Tf (n; k)� Tf (n� 1; k))

Page 156: Control Adaptativo y Robusto

140 Control en adelantoEn estas ecuaciones en diferencias, Tf (n; k) y Tm(n; k) son las temperaturas enel segmento n durante el intervalo de tiempo k. T1f es la temperatura del uidosantes de la correcci�on mientras que Tf es la temperatura del uido despu�es de lacorrecci�on.A partir de datos reales de la planta se han determinado las distintas constantesy coe�cientes que aparecen en las ecuaciones anteriores, siendo ajustados muchos deellos a funciones polinomiales de la temperatura, mediante un m�etodo de m��nimoscuadrados.7.4 Control en adelantoA partir de la representaci�on concentrada de la planta, ecuaci�on 7.1, se tiene en elr�egimen permanente: _V = NoRI �Hl(Tm � Ta)Pcp(Tr � Ti)Esta �ultima ecuaci�on puede ser aproximada por:_V = K1RI �K2Tr � TiEsta expresi�on constituye el c�alculo del ujo como funci�on de la temperaturade referencia, temperatura de entrada, re ectancia y de la irradiancia, siendo uti-lizada para el control en adelanto (feedforward). Las constantes K1 y K2 , han sidodeterminadas experimentalmente, teniendo los valores de K1 = 0:93 y K2 = 155(Carmona, 1983).7.5 Control en bucle cerradoEs necesario compensar el error que pueda producirse mediante un regulador en buclecerrado. Dado que el ujo calculado en bucle abierto, es una buena estimaci�on, elvalor de la se~nal de control del bucle cerrado se ha saturado a m�as, menos un 20%del valor de bucle abierto, con ello se consigue mejor estabilidad en los transitorios,ya que se ha reducido la banda de regulaci�on.

Page 157: Control Adaptativo y Robusto

Aplicaci�on de control adaptativo 141-� �� - - - -6 � ??? ? ? ?��������3 Radiaciontemp. entrada (Tin)P.I. SerieCompensaci�on PlantaIdenti�cadorAdaptaci�onMecanismo-Tref e u us To = yFigura 7.3: Estructura de control con compensaci�on serie7.5.1 Controlador PILa planta en consideraci�on presenta un retardo muy grande (del orden de 2 a 8minutos), y variable con el ujo de entrada. Para este tipo de sistemas en que elretardo es mucho mayor que el orden del sistema, puede considerarse (Isermann,1981) un tipo particular de controlador.Suponiendo que la planta se modela por la ecuaci�on y(k) = bu(k � d), donde des el retardo en per��odos de muestreo y b la ganancia del sistema, el controlador queresulta por control en tiempo m��nimo tiene por expresi�on:u(k) = u(k � d) + e(k)=b (7:4)Si en vez de utilizar este controlador directamente, se aproxima un regulador P.I.para que tenga la misma respuesta, se obtiene:u(k) = u(k � 1) + qoe(k) + qie(k � 1) (7:5)donde : qo = 1=(2b)qi = �qo(d� 2)=d (7.6)Para este regulador, puede demostrarse (Isermann, 1981), que es menos sensibleal error en la exactitud del retardo, por ello resulta m�as conveniente su utilizac��on

Page 158: Control Adaptativo y Robusto

142 Control en bucle cerradoque el controlador 7.4, dada las caracteristicas del proceso. Por todo ello en elbucle de realimentaci�on se ha utilizado un P.I. Tambi�en ha de tenerse en cuenta quecuando exista un error en la determinaci�on del retardo, es mejor considerarlo mayordel que se prevea, en orden a asegurar la estabilidad.7.5.2 Controlador PI por asignaci�on de polosDesde el punto de vista de dise~no del controlador adaptativo autoajustable, el pro-ceso puede modelarse como un sistema de primer orden, que relaciona los cambiosen el ujo de aceite con la temperatura de salida. Observando la respuesta al escal�onobtenida de la planta, indica que en tiempo cont��nuo, puede aproximarse por unafunci�on de transferencia de primer orden con un retardo:g(s) = K(1 + �s)e�s�d (7:7)El retardo �d, constante de tiempo � y ganancia K del sistema varia con el ujode aceite y en el punto de operaci�on a bajo ujo el retardo es aproximadamente eldoble que el retardo a ujo m�aximo. Puede verse (Rubio 1989), que un camino paraadaptar esta variaci�on en el tiempo de retardo es usar un modelo de la forma,g(z) = (bo + b1z�1)(1� az�1) z�2 (7:8)El per��odo de muestreo se escoge igual al tiempo de retardo m��nimo. De estaforma el m��nimo retardo est�a representado por el modelo con el par�ametro b1 = 0.Cuando b0 = 0, el modelo representa el m�aximo tiempo de retardo de dos per��odos.Para los valores del tiempo de retardo donde �d no sea un multiplo entero del per��odode muestreo, por ejemplo T < �d < 2T , el factor (bo + b1z�1) actua como unaaproximaci�on discreta de Pade de primer orden del retardo. Basado en este modelose dise~na el siguiente algoritmo autoajustable por asignaci�on de polos.La funci�on de transferencia de un controlador PI viene dada por:k(z) = go(1� g1z�1)(1� z�1) (7:9)Escogiendo el cero del controlador que cancele el polo de la planta, o sea haciendoa = g1, El polinomio caracter��stico en bucle cerrado, P (z), es de la forma:P (z) = z3 � z2 + goboz + gob1

Page 159: Control Adaptativo y Robusto

Aplicaci�on de control adaptativo 143Si al sistema en bucle cerrado se le especi�ca que tenga un polo en z = A,entonces del polinomio caracter��stico P (z) evaluado en A, se deduce que go hay queelegirlo tal que: go = A2(1� A)(boA + b1) (7:10)Entonces conociendo a; bo and b1 del modelo, los par�ametros del controlador goy g1 pueden calcularse especi�cando un polo dominante en bucle cerrado en z = A.Analizando P(z) puede deducirse la localizaci�on de los otros dos polos del sistema.P (z) = [z2 � (1� A)z + gobo � A(1� A)](z � A)A partir del lugar de las raices del sistema, se tiene que aparte del polo en z = A,el sistema tendr�a otros dos polos reales, uno negativo y otro positivo. ResolviendoP(z) se puede validar la localizaci�on de estos polos, comprob�andose que efectiva-mente corresponden a modos que decaen r�apidamente y que el polo en z = A es elpolo dominante.Algunos valores t��picos de simulaciones han sido:A g0 g10:9 a 1:539 �1:38510:95 a 1:2398 �1:1778Los coe�cientes del regulador g0 y g1 se saturan para evitar sobreoscilaciones enlas ocasiones en que el identi�cador no funcione correctamente, debido al paso denubes u otras perturbaciones.7.5.3 Controlador autoajustableSe ha desarrollado un algoritmo de control adaptativo autoajustable, versi�on expl��citamediante el m�etodo de asignaci�on de polos desarrollado en la secci�on anterior. Lospar�ametros del modelo del sistema se determinan en l��nea mediante el m�etodo dem��nimos cuadrados recursivos. El algoritmo de estimaci�on de par�ametros incorporafactorizaci�on UDU (Bierman 1977) y factor de olvido variable (Fortescue 1981). Lafunci�on de transferencia en z del modelo puede representarse mediante la ecuaci�onen diferencias de la forma:y(n) = a y(n� 1) + bo u(n� 2) + b1 u(n� 3) + d

Page 160: Control Adaptativo y Robusto

144 Control en bucle cerradoEl t�ermino d es una constante introducida para tener en cuenta los valores mediosde las se~nales de entrada y salida. Las perturbaciones del sistema son tales que puedeemplearse un modelo determinista.Desde el punto de vista de la identi�caci�on el sistema anterior tiene cuatropar�ametros a determinar: [a bo b1 d].Un rasgo particular del sistema es que se necesita incluir un t�ermino de adelantoen el bucle de control. El modelo de la planta descrito est�a basado en la relaci�onentre los cambios de la temperatura de salida y los cambios en el ujo de aceite.Pero la temperatura de salida de la planta est�a in uida por los cambios de otrasvariables del sistema, tales como, la irradiancia solar y la temperatura de entradadel aceite. Si cualquiera de estas variables cambia durante la fase de indenti�caci�on,ello introduce un cambio en la salida del sistema que no est�a motivado por cambiosen el ujo, por que las variaciones que se producir��an en los par�ametros estimadosser��an innecesarias y el modelo se desajustar��a.Dado que la irradiaci�on solar y la temperatura de entrada pueden medirse, esteproblema puede reducirse mediante la incorporaci�on de un t�ermino de adelanto,calculado para las condiciones de regimen permanente, el cual realiza un ajuste enel ujo de entrada, encaminado a eliminar el cambio en la temperatura de salidacausado por la variaci�on en la irradiancia solar y la temperatura de entrada.Si el t�ermino en adelanto fuese perfecto los cambios en la temperatura de salidas�olo serian debido a los cambios en la se~nal de entrada. Evidentemente la eliminaci�onexacta de estos cambios es imposible, pero este t�ermino reduce considerablementelos mayores problemas inherentes en el modelo planteado y permite una mejor iden-ti�caci�on de los par�ametros de este.La se~nal del t�ermino en adelanto tambi�en produce bene�cios cuando hay per-tubaciones en la irradiancia solar y en la temperatura de entrada, pero la principalraz�on para incluir este t�ermino es para preservar la validez del modelo del sistemaasumido en el algoritmo de control adaptativo autoajustable.7.5.4 Controlador PID adaptativoSe ha realizado un desarrollo te�orico paralelo al del regulador P.I. por asignaci�on depolos con el �n de ensayar un regulador P.I.D. adaptativo.La funci�on de transferencia en el dominio del tiempo puede escribirse:

Page 161: Control Adaptativo y Robusto

Aplicaci�on de control adaptativo 145Gpid(s) = Kpid(1 + 1Tis + Tds)Para pasar al dominio discreto se utiliza la aproximaci�on de Euler para el t�erminointegral y la rectangular hacia detr�as (Backward) para el derivativo (Astrom 1984).uk = Kpid(1 + TmTi(z � 1) + ( TdTm + TdN )( z � 1z � Td(NTm+Td) ))eik = 1z � 1ekedk = z � 1z � Td(NTm+Td) ekPara calcular los par�ametros caracter��sticos (ganancia del controlador, tiempointegral y derivativo) se han utilizado las reglas de Ziegler-Nichols (Z-N) en bucleabierto. Los dos mecanismos de adaptaci�on usados han sido:1. Usar tiempos integral y derivativo �jos, adaptando s�olo la ganancia del contro-lador (dado que no se puede con un modelo del sistema de primer orden esti-mar el retardo puro), pero tom�andola un cuarto (para evitar comportamientooscilatorio) de la usada por el m�etodo de Z-N en bucle abierto.2. Se adapta la ganancia, tiempo integral y derivativo a~nadiendo un cero a lafunci�on de transferencia para estimar un retardo variable, como se indica en(Camacho 1992). g(z) = z�2 (b0 + b1z�1)(1� az�1)Dado que el per��odo de muestreo se escoge igual al m��nimo valor del retardo,�este se representa en el modelo con b1 = 0. Cuando b0 = 0 el modelo tieneun retardo m�aximo de dos per��odos de muestreo. Para valores del retardono m�ultiplos enteros del per��odo de muestreo, el numerador act�ua como unaaproximaci�on discreta de Pade a un retraso.

Page 162: Control Adaptativo y Robusto

146 Control en bucle cerrado7.5.5 Controlador predictivo generalizadoEn esta secci�on se expone un m�etodo sencillo para aplicar GPC adaptativo. Unadescripci�on detallada del m�etodo puede encontrarse en (Camacho 1993, 1994, 1995).Este m�etodo simpli�cado disminuye la complejidad de c�alculos que hay que realizara la hora de aplicar un controlador predictivo adaptativo. El m�etodo hace uso delhecho de que un controlador predictivo generalizado da lugar a una ley de control conpocos par�ametros. Estos par�ametros pueden ser calculados en el rango de inter�es delos par�ametros del proceso. Se usa una funci�on que aproxima los par�ametros realesdel controlador y que implica menor esfuerzo computacional.Como se vi�o en el apartado 5.6, este controlador minimiza una funci�on de costede la forma:J(N1; N2; N3) = Ef N2Xj=N1 �(j)[y(t+j j t)�w(t+j)]2+ N3Xj=1�(j)[4u(t+j�1)]2g (7:11)De acuerdo con el m�etodo descrito en (Camacho 1993,1995) y los requerimientospara control adaptativo se escoge un modelo CARIMA.A(z�1)y(t) = B(z�1)u(t� 1)z�d + C(z�1)"(t)4 (7:12)que para el caso concreto que nos ocupa, A;B y C son los polinomios:A(z�1) = 1� az�1 ; B(z�1) = b ; C(z�1) = 1Con d = 1. Este esquema permite acci�on integral para eliminar o�sets en lase~nal de salida. (1� az�1)y(t) = bz�1u(t� 1) + "(t)4 (7:13)Considerando el retardo d, se escogen N1 = d + 1, N2 = d + N y N3 = N . Ennuestro caso N1 = 2 y N2 = 16. El rango de posibles valores de � se ha obtenidovia simulaci�on (Camacho 1995) y es (3 � � � 7). Si � disminuye se obtienencontroladores m�as r�apidos.Si y(t+ j j t) y y(t+ j�1 j t) son conocidas, como las componentes de los ruidosest�an todas en el futuro, el mejor valor esperado para y(t+ j+1 j t) viene dado por:y(t+ j + 1 j t) = (1 + a)y(t+ j j t)� ay(t + j � 1 j t) + b4 u(t+ j � 1) (7:14)

Page 163: Control Adaptativo y Robusto

Aplicaci�on de control adaptativo 147Como se deduce en (Camacho 1995), si la secuencia de referencias futuras, w(t+j), no se conoce y se considera igual a la referencia actual r(t), el incremento decontrol 4u(t) puede escribirse como:4 u(t) = l1y(t+ 1 j t) + l2y(t) + l3r(t) (7:15)Donde qP = [l1l2] y l3 = 15Pi=1 qj 15Pj=1 rij.Si las referencias futuras fueran conocidas l3 = qR ser��a un vector de gananciasque las multiplicaria. Los coe�cientes l1, l2, l3; son funciones de a; b, �(i) y �(i).Si se dise~na el GPC considerando que la planta tiene ganancia est�atica unidad, loscoe�cientes en (7.15) depender�an s�olo de �(i) y �(i) (que se suponen �jos) y delpolo de la planta que variar�a en el caso de control adaptativo. Haciendo esto, se usauna secuencia de ponderaci�on normalizada que se corregir�a de forma adecuada ensistemas con ganancia est�atica distinta de la unidad.El valor de y(t + 1 j t) se obtiene usando el predictor descrito en (7.14). Elesquema de control propuesto puede verse en la �gura 7.4. Los par�ametros estimadosde la planta se usan para calcular los par�ametros del controlador (l1; l2; l3) via unmecanismo de adaptaci�on.^

^+

+++

+

ba

b

1 - a y(t)

1

2

3

l

l

l

-1Z

ADAPT

IDENT

Inlet oil temperature

Solar radiation

FORWARD

FEEDPLANT

^

r(t)

PREDICTORFigura 7.4: Esquema de control adaptativoLa forma est�andar de calcular los par�ametros del controlador ser��a calculandouna serie de matrices y resolviendo una ecuaci�on matricial seguido de la generaci�onde la ley de control de la ecuaci�on (7.15). Esto trae consigo la triangularizaci�on deuna matriz N �N , que es prohibitivo en aplicaciones en tiempo real.

Page 164: Control Adaptativo y Robusto

148 Control en bucle cerradoComo se sugiere en (Camacho 1993, 1994), los coe�cientes del controlador sepueden calcular por interpolaci�on en un conjunto de valores conocidos previos.En el libro (Camacho 1995), se calculan estos coe�cientes para �(i) = 1, �(i) = 5y N = 15. El polo del sistema se cambia en pasos de 0.0005 de 0.85 a 0.95, queson los valores que garantizan la estabilidad del sistema si la identi�caci�on de losmismos no es muy precisa. Es importante rese~nar que como la ganancia del buclecerrado debe ser igual a la unidad, la suma de los tres par�ametros debe ser cero, ypor tanto s�olo dos de ellos deben ser conocidos.En el caso de �(i) = 5, �(i) = 1 y para un horizonte de control de 15 loscoe�cientes del controlador vienen dados por:l1 = 0:4338� 0:6041a=(1:11� a)l2 = �0:4063 + 0:4386a=(1:082� a) (7.16)l3 = �l1 � l2Estas expresiones dan una buena aproximaci�on de los par�ametros reales del con-trolador (error inferior al 0.6 por ciento).En cada per��odo de muestreo el controlador adaptativo debe realizar los siguien-tes pasos (�gura 7.4):1. Estimar los par�ametros del modelo lineal a partir de entradas y salidas de laplanta.2. Ajustar los par�ametros del controlador usando las expresiones obtenidas parali (ecu. 7.16).3. Calcular y(t+ d j t) usando el predictor (ecu. 7.14).4. Calcular la se~nal de control usando (ecu. 7.15).5. Supervisar el perfecto funcionamiento del control.7.5.6 Supervisi�onUn requerimiento b�asico del algoritmo de control adaptativo es que el bucle cerradoes estable si los par�ametros estimados convergen a ciertos valores. Para garantizar

Page 165: Control Adaptativo y Robusto

Aplicaci�on de control adaptativo 149dicha convergencia deben cumplirse ciertas condiciones, las cuales dependen del tipode perturbaciones y de si la entrada es lo su�cientemente rica.Como se ha comentado se pueden conseguir una serie de mejoras en el compor-tamiento del sistema en bucle cerrado si paralelamente al algoritmo se mantiene uncierto nivel de supervisi�on que chequee los par�ametros fundamentales del proceso:� los par�ametros estimados.� La variable de control.� La evoluci�on del identi�cador.En el caso concreto de la planta solar las medidas tomadas son las siguientes:1. En cuanto a la identi�caci�on de la planta, sabemos que la ganancia del sis-tema es negativa e inferior a un cierto valor. Por ello la ganancia identi�cadaes �ltrada antes de considerarla como v�alida, para evitar una identi�caci�onerronea, que se puede producir en los casos en que la irradiancia (principalpar�ametro de la planta que var��a), disminuye y por tanto la ganancia iden-ti�cada aparentemente ser��a positiva, dado que a una disminuci�on de ujo lecorresponder��a una disminuci�on de temperatura.b(k) < Co y bf(k + 1) = rbf (k) + (1� r)b(k + 1)El identi�cador trabaja con las variaciones de temperatura y ujo con res-pecto a los valores de r�egimen permanente, estando dados estos valores porla temperatura de referencia y por el ujo calculado por el controlador enadelanto.M�as concretamente, el polo estimado del sistema en bucle abierto debe variarentre 0.85 y 0.95 y la ganancia est�atica del sistema entre 0.9 y 1.2. Estosm�argenes se han escogido analizando la respuesta din�amica del sistema, y sonnecesarios pues si se produce una estimaci�on err�onea de los par�ametros puedellegar a hacerse inestable el proceso.La temperatura de referencia para el control por adelanto se �ltra antes de serusada por el identi�cador para cancelar din�amicas no modeladas.Este �ltro es de la forma: tfff = 0:5 tff + 0:5 tfff

Page 166: Control Adaptativo y Robusto

150 Estudios de simulaci�ondonde tff es la temperatura de referencia para el controlador por adelantocalculada por el regulador del sistema en bucle cerrado (predictivo, etc.) ytfff es la temperatura de referencia al control por adelanto �ltrada, que es laque se da como entrada al identi�cador.2. La traza de la matriz de covarianza del identi�cador es chequeada en cadainstante, acotandola de la forma,Traza de P (k) < Po =) P (k) = P (k) +R3. La variable de control est�a saturada en m�as o menos un 20% del valor de ujo calculado en bucle abierto (feedforward). Adem�as se utiliza un control PIcauteloso al comienzo del control, modi�cando la expresi�on 7.6 por:qo = 1(2 � b + traza(P (k)) � b)4. Como se ha comentado el mecanismo de estimaci�on de par�ametros s�olo fun-ciona cuando la se~nal de entrada contiene su�ciente informaci�on din�amica.Estas consideraciones pueden tenerse en cuenta chequeando el cumplimientode las siguientes condiciones: j 4u j� Ak=0Xk=�N j 4u(k) j� BSi una de estas condiciones es verdadera, se activa el identi�cador. En otrocaso se usa el �ultimo conjunto de par�ametros identi�cados. Los valores t��picosde A, B y N escogidos en simulaci�on son: A = 9, 7 � B � 9 y N = 5.5. Respecto a los mecanismos de adaptaci�on, s�olo funcionan cuando los valoresestimados se encuentran contenidos en los rangos (0:85 � a � 0:95 y 0:9 �kest � 1:2, donde kest es la ganancia estimada de la planta b=(1�a)) para evitarinestabilidad en casos de no convergencia del estimador. Un controlador �jose usa en situaciones en que no se cumplen estas condiciones (por ejemplo enel comienzo de la operaci�on).7.6 Estudios de simulaci�onSe han realizado estudios de simulaci�on para evaluar la capacidad del modelo, laidenti�caci�on de los par�ametros y la actuaci�on del controlador autoajustable. Elcontrolador se ha evaluado mediante el modelo no lineal desarrollado.

Page 167: Control Adaptativo y Robusto

Aplicaci�on de control adaptativo 151

600

650

700

750

800

850

900

950

10 11 12 13 14 15 16 17

Tiempo (Horas)

Rad

iaci

on (

w/m

^2)

<-- Radiacion

Temperatura (grados C) -->

277

280

285

290

grC

295

Figura 7.5: Respuesta simulada a cambios de referencia con compensaci�on serieLa �gura 7.5 corresponde a la simulaci�on de un per��odo de 8 horas con radiaci�onsolar en forma senoidal con una se~nal de ruido sumada para simular peque~nas nubesdispersas. La temperatura de referencia es una onda cuadrada con cambios entre280 oC y 285 oC. En este caso el controlador utilizado es un PI adaptativo, comoel que se ha descrito en los apartados anteriores.Como se ha comentado anteriormente la caracter��stica din�amica del campo var��acon el ujo. Como puede verse en la �gura 7.5, durante el per��odo de test, el nivel deirradiancia varia entre 600 y 900watts=m2. La variaci�on necesaria en el ujo nominalpara mantener la temperatura de salida en el rango de 280-285, se mostrar��a similara la de la irradiancia I, (un decremento en la irradiancia I, requiere un decrementoen el ujo de aceite para mantener una temperatura de salida �ja y viceversa).El tiempo de retardo se reduce y la velocidad de respuesta de la planta aumentacon el incremento de ujo de aceite. Por lo tanto, comparando con valores bajosde la irradiancia I, cuando la irradiancia I es alta, (correspondiendo un ujo alto),el tiempo de retardo se reducir�a, as�� como la constante efectiva del modelo de laplanta. Esto �ultimo se corresponde con un valor bajo del polo a. Puede verse comola variaci�on en el polo a, en el per��odo de test, sigue las variaciones en la irradianciaI.

Page 168: Control Adaptativo y Robusto

152 Resultados en plantaReferente a la funci�on de transferencia del modelo de la planta, el valor m��nimodel retardo viene dado cuando b1 = 0, y el m�aximo retardo cuando b0 = 0. Por lotanto, el t�ermino normalizado jb0=(b0 + b1)j, se incrementar�a con un valor alto delnivel de irradiancia, I, (incremento de ujo y decremento del tiempo de retardo).La respuesta simulada muestra que jb0=(b0 + b1)j sigue la variaci�on en I, y d�a unaindicaci�on de como el modelo se acomoda a las variaciones en el tiempo de retardo.Las variaciones de los par�ametros simulados muestra que para el caso de com-pensaci�on serie, se ha obtenido la tendencia esperada en los valores. Sin embargoen el caso de compensaci�on en paralelo, la variaci�on en escalones de la tempera-tura de referencia provoca variaciones en el ujo que no son vistas por el estimadory d�a valores err�oneos de los par�ametros estimados. Los valores estimados de a yjb0=(b0 + b1)j, varian sustancialmente, y cada cambio de referencia provoca saltosconsiderables en los valores estimados y la tendencia hacia los valores correctos nose sigue durante el per��odo de test. Este efecto puede aliviarse si se introduce un�ltro al controlador en adelanto, para evitar estos cambios r�apidos en la se~nal deadelanto, correspondientes a los cambios de referencia.7.7 Resultados en plantaLas estructuras de control mencionadas anteriormente han sido probadas en elcampo acurex de la planta solar de Tabernas (Almer��a), ello ha demostrado quelos controladores pueden operar en presencia de cambios en la din�amica del procesocausados por cambios en las condiciones de operaci�on de la planta.Como se ha mencionado anteriormente, el campo de colectores distribuidos puedeser utilizado para diferentes prop�ositos, en diferentes modos de operaci�on y concondiciones de operaci�on variables (diferentes muestras de radiaci�on solar, tempe-ratura de entrada de aceite, temperatura de referencia, etc). Todos estos factorestienen, de esta forma, que ser tenidos en cuenta para evaluar las capacidades de lasposibles estrat�egias de control. Aunque los estudios de simulaci�on mencionados enla secci�on anterior ayudan considerablemente en esta tarea, se han realizado unaserie de tests en la planta real.Como se ha inferido anteriormente, las caracter��sticas din�amicas de la plantavarian signi�cativamente a lo largo del rango de operaci�on, lo cual hace dif��cil obtenerun buen control con un regulador PI �jo. Esto puede verse en la �gura 7.6 donde laactuaci�on es buena a nivel bajo de ujo (�gura 7.7) de 8 litros/seg aproximadamente,pero a alto nivel de ujo sobre 11 litros/seg la respuesta es signi�cativamente m�as

Page 169: Control Adaptativo y Robusto

Aplicaci�on de control adaptativo 153

230

235

240

245

250

255

260

10 10.5 11 11.5 12 12.5 13 13.5 14

Tiempo (Horas)

Tem

pera

tura

(gr

ados

C)

Fijo

FijoFijo

Adap.

Adap.

Adap.

Figura 7.6: Respuesta con regulador P.I. �jo. Temperatura de salida

700

750

800

850

900

950

10 10.5 11 11.5 12 12.5 13 13.5 14

Tiempo (Horas)

Rad

iaci

on (

w/m

^2)

<-- Radiacion

flujo (l/s) -->

7.0

8.3

9.6

11

12.3

l/s

13.6

Figura 7.7: Respuesta con regulador P.I. �jo. Irradianza y ujo.

Page 170: Control Adaptativo y Robusto

154 Resultados en plantaoscilante y tiene mayor tiempo de establecimiento.Las �guras 7.8, 7.9 y 7.10 muestran resultados de la planta utilizando el contro-lador PI autoajustable con incorporaci�on del controlador en adelanto en serie. Losresultados son signi�cativos ya que se muestra la actuaci�on durante unas 3 horas deoperaci�on cuando el nivel de irradiancia est�a cambiando sustancialmente, debido ala presencia de nubes dispersas.Las perturbaciones injectadas son en la forma de cambios en escalones en latemperatura de referencia. Esto genera informaci�on din�amica para la estimaci�on, as��mismo el resultado en la respuesta de la temperatura de salida sirve para demostrarla calidad de la actuaci�on del sistema de control.

200

300

400

500

600

700

800

11.5 12 12.5 13 13.5 14 14.5

...............

...........................

...........

................

.....................

...........................................

...................................

.................................

......................................

..................................

....

Tiempo (Horas)

Rad

iaci

on (

w/m

^2)

<-- Radiacion

Temperatura (grados C) -->

220

235

grC

250

265

280

295

310

-- PI fijo.. Adaptativo

Figura 7.8: Salida con control PI adaptativoEl per��odo desde las 11:39 a las 12:46 corresponde a la fase de puesta en marchade la planta, cuando el aceite est�a recirculando, y el controlador est�a en per��odo deautoajuste. Despu�es de este per��odo, se obtiene un buen seguimiento a la respuestaen escal�on, permaneciendo la temperatura de referencia muy pr�oxima a la se~nalde referencia, a pesar de los cambios signi�cativos en el nivel de irradiancia deesta experiencia. Esto �ultimo demuestra los efectos bene�ciosos del controlador poradelanto en serie, el cual no solo sirve para reducir las variaciones no esperadas enla temperatura de salida sino que tambi�en reduce las desviaciones erroneas en los

Page 171: Control Adaptativo y Robusto

Aplicaci�on de control adaptativo 155

0.82

0.84

0.86

0.88

0.9

0.92

0.94

11.5 12 12.5 13 13.5 14 14.5

Tiempo (Horas)

Pol

o a

<-- a

|b0/(b0+b1)| -->

0.0

0.2

0.4

0.6

0.8

1.0

1.2

Figura 7.9: Evoluci�on de los par�ametros-0.05

0

0.05

11.5 12 12.5 13 13.5 14 14.5

Tiempo (Horas)

b0

0

0.02

0.04

0.06

0.08

0.1

11.5 12 12.5 13 13.5 14 14.5

Tiempo (Horas)

b1

Figura 7.10: Evoluci�on de los par�ametros

Page 172: Control Adaptativo y Robusto

156 Resultados en plantapar�ametros estimados.Esto puede verse en la respuesta de los par�ametros estimados de la �gura 7.9en la que el par�ametro estimado (a), muestra cambios suaves durante el per��ododel experimento. Este sigue las variaciones experadas necesarias para igualar loscambios en la respuesta caracter��stica del sistema. Los niveles de irradiancia y latemperatura de salida requerida determinan el ujo de aceite necesario, el cual a suvez determina la velocidad de la respuesta del sistema y el tiempo de retardo.Mediante los tests de control realizados en la planta, es dif��cil demostrar lasventajas relativas de un controlador con respecto a otro. Dado que las condicionesexactas de nivel de irradiancia y de temperatura de entrada nunca pueden ser re-producidas. Sin embargo, en orden a dar una indicaci�on de la mejora producida porel esquema de control PI adaptativo autoajustable sobre un controlador �jo tipoPI, las condiciones de irradiancia para el test correspondiente a la �gura 7.7 (paraun controlador �jo PI), son aplicadas en un estudio de simulaci�on al controladorautoajustable. La respuesta de la temperatura de salida para el caso adaptativo sesuperpone como se muestra en la �gura 7.6.Puede verse que el regulador de par�ametros �jo PI trabaja bien para las condi-ciones correspondientes al primer escal�on, pero para los otros escalones, donde elnivel de irradiaci�on es mayor, el comportamiento se deteriora. El controlador autoa-justable por otro lado, una vez que los par�ametros se han ajustado, proporciona uncomportamiento mejor el cual se mantiene a pesar de los cambios en las condicionesde operaci�on.Tambi�en, para las condiciones del experimento de la �gura 7.8, las condicionesde irradiancia se han aplicado al modelo de simulaci�on incorporando el controladorde par�ametros �jos PI. Otra vez puede verse que el controlador �jo PI, el cualest�a ajustado para las condiciones de ujo medio, tiende a oscilar cuando el nivelde ujo es bajo, caso que se produce al �nal del test cuando la temperatura dereferencia es alta (270 oC) coincidiendo con nivel bajo de irradiancia (alrededor de600 watts=m2). El esquema de control adaptativo autoajustable funciona muchomejor que el controlador �jo, ante los cambios en la caracter��stica din�amica de laplanta, que corresponden a un d��a de operaci�on con variaciones grandes del nivel deirradiancia.La �gura 7.11 muestra la temperatura de salida del aceite y la referencia cuandose aplica el GPC adaptativo. El valor de � escogido fue 5, y, como se aprecia seobtiene una respuesta muy r�apida ante cambios en la referencia (tiempo de subidadel orden de 7 minutos). Para tener menor sobreoscilaci�on el factor de ponderaci�on

Page 173: Control Adaptativo y Robusto

Aplicaci�on de control adaptativo 157

11.0 11.5 12.0 12.5 13.0 13.5 14.0 14.5local time (hours)

160.0

170.0

180.0

190.0

set p

oint

/out

let t

empe

ratu

res

( C

)

Figura 7.11: GPC Adaptativo: Temperatura de salida del aceite11.0 11.5 12.0 12.5 13.0 13.5 14.0 14.5

tiempo local (horas)

630.0

650.0

670.0

690.0

710.0

730.0

Radia

cion s

olar (W

/m2 )

11.0 11.5 12.0 12.5 13.0 13.5 14.0 14.5tiempo local (horas)

4.5

5.0

5.5

6.0

6.5

7.0

flujo d

e acei

te (l/s)

Figura 7.12: GPC Adaptativo: Radiaci�on solar y caudal de aceite

Page 174: Control Adaptativo y Robusto

158 Resultados en plantadebe aumentarse. La evoluci�on de la radiaci�on en este test se puede comprobar en la�gura 7.12. Corresponde a un d��a con peque~nas nubes. El caudal de aceite, cambi�odesde 4.5 l/s a 7 l/s, y el controlador pudo mantener un buen comportamiento antecambios en la din�amica del proceso.Debido al hecho de que las condiciones de un ensayo no se pueden reproducirde forma exacta, para comparar el comportamiento de los esquemas de controlpropuestos, se utilizaron los datos de un d��a de operaci�on con un controlador PI �jopara simular el comportamiento de todos los esquemas de control comentados.La �gura 7.13 muestra los resultados obtenidos aplicando el controlador PI �joa la planta y los resultados obtenidos aplicando los dos controladores adaptativosPID y el GPC. El PI �jo funciona bien para las condiciones en las que fue dise~nado,pero no muy bien fuera de ellas.

10.2 10.7 11.2 11.7 12.2 12.7 13.2 13.7 14.2tiempo local (horas)

240.0

245.0

250.0

255.0

260.0

refe

renc

ia/te

mpe

ratu

ra d

e sa

lida

(C)

temperatura de referenciacontrollador PI fijocontrolador PID Z-N adaptativocontrolador Z-N PID adaptativo completocontrolador GPC adaptativo

Figura 7.13: PI �jo, PID adaptativo y GPC adaptativo

Page 175: Control Adaptativo y Robusto

Cap��tulo 8El problema del control robusto8.1 Introducci�onLas caracter��sticas del dise~no de un sistema de control van a depender en gran me-dida, de la �delidad con la que el modelo empleado describa el comportamiento delsistema. Uno de los principios del modelado de sistemas es el de simpli�caci�on;consistente en que de la forma m�as simple posible el modelo capte los rasgos funda-mentales bajo an�alisis del proceso.Un proceso real puede ser extremadamente complejo para ser descrito de formaabsolutamente precisa por un modelo matem�atico, en cuyo caso se habla de erroresde modelado. Si se a~nade el hecho de que se trata de describir al sistema conun modelo lineal e invariante en el tiempo, ello implica otro conjunto de hip�otesissimpli�cadoras que incrementan los errores de modelado originales o residuales.Se puede considerar por tanto, que cualquier modelo matem�atico de un procesoreal va a ser en mayor o menor grado impreciso, o dicho de otra forma va a contarcon incertidumbres o errores de modelado.Si se desea controlar de manera e�ciente un proceso real, se deber�a de tenerinformaci�on sobre las posibles fuentes de incertidumbres, evaluando su efecto sobreel comportamiento del sistema completo.La necesidad de cumplir unas especi�caciones de dise~no cada vez m�as exigentes,ha llevado a tener en consideraci�on aspectos de importancia pr�actica en el desarrollo159

Page 176: Control Adaptativo y Robusto

160 Introducci�onde los sistemas de control. De forma que el comportamiento del sistema se mantengaaceptable en un ambiente realista, en el que las incertidumbres van a estar siemprepresentes.Entre los principales factores causantes de los errores de modelado pueden des-tacarse:1. Modi�caciones en el punto de trabajo de la planta o con respecto al modelonominal.2. Din�amica no lineal no considerada.3. Din�amica de alta frecuencia no modelada.4. Retardos de tiempo no contemplados.5. Imprecisiones en los par�ametros, debidas al m�etodo de identi�caci�on y/o mo-delado empleado.Estos factores se pueden agrupar en dos grandes grupos: las incertidumbresparam�etricas (1) y (5) y las estructurales (2), (3) y (4). Con respecto al conoci-miento disponible sobre las causas de las incertidumbres puede distinguirse entreincertidumbre estructurada y no estructurada.En el caso de incertidumbre no estructurada s�olo se conoce que existen discre-pancias entre el modelo y la planta real, y posiblemente puede conocerse tambi�en eltama~no de las desviaciones de determinadas medidas entrada/salida (por ejemplo, ladiscrepancia en la respuesta frecuencial causada por la din�amica de alta frecuenciano modelada y/o diferencia en la respuesta temporal debido a la no consideraci�onde un elemento no lineal).Si se conoce de la incertidumbre que en cierta medida se debe a algunos elementosdiferenciados de la planta, en la forma de tolerancias de sus valores (por ejemplo,la incertidumbre en el valor de un polo y/o un cero), en ese caso se trata de unaincertidumbre estructurada.Es posible tambi�en, que se tenga un conocimiento parcial y separado de lasfuentes de incertidumbre, en cuyo caso tambi�en podr�a hablarse de incertidumbreparcialmente estructurada (por ejemplo, el hecho pr�actico de que las incertidumbresexistentes en distintos actuadores sean independientes entre s��).A la hora de plantearse el dise~no de un sistema de control robusto para un procesocon incertidumbres, surgen una serie de cuestiones escalonadas:

Page 177: Control Adaptativo y Robusto

El problema del control robusto 1611. C�omo modelar tales procesos.2. C�omo analizar el sistema de control.3. C�omo dise~nar el controlador.Para resolver los 3 puntos anteriores, se hace necesario la introducci�on de nuevosconceptos y herramientas de c�alculo para el an�alisis y dise~no de sistemas de control.El campo de aplicaci�on de esta nueva disciplina denominada control robusto, abarcatodos aquellos problemas que se caractericen por considerar incertidumbres en elmodelo que sean tolerables por un controlador �jo lineal e invariante en el tiempo;limitando con aquellos que necesitan un controlador variable (control adaptativo,control por plani�caci�on de la ganancia).Los objetivos de control tratan en cualquier caso, de que el controlador dise~nadofuncione bien cuando se implante en el proceso real. Este objetivo, a su vez puedeconsiderarse compuesto en una serie de subobjetivos. De �estos, el principal es queel sistema sea estable en lazo cerrado, para unas condiciones de trabajo dadas onominales. Es lo que se denomina Estabilidad Nominal (NS).Por otro lado, una vez conseguida la estabilidad es necesario que ciertas variablesdel sistema presenten un comportamiento adecuado y en algunos casos �optimo res-pecto a una funci�on de costes o ��ndice de comportamiento. Esto se tiene en cuentareferenci�andolo como Comportamiento Nominal (NP).Es tambi�en muy importante, de cara a la aplicaci�on industrial, que se tenga encuenta en el dise~no el conocimiento que se posea de la incertidumbre en el modelo.Otro requerimiento que se va pedir a un sistema de control es que sea estable en lazocerrado, para el conjunto de posibles plantas que se puedan dar como consecuenciade la incertidumbre en el modelo de la planta. El objetivo perseguido se denominaEstabilidad Robusta (RS).Si adem�as se considera que para todas las plantas posibles no basta con queel sistema de control permanezca estable sino que han de cumplirse unas especi-�caciones de funcionamiento, se considerar�a que se est�a aludiendo al concepto deComportamiento Robusto (RP).En la �gura 8.1 queda resumido el problema de dise~no y los diferentes niveles deexigencia que se establecen sobre un sistema de control, tal y como se ha descritoanteriormente.El control de sistemas con incertidumbres entra dentro del campo de estudio de la

Page 178: Control Adaptativo y Robusto

162 Introducci�onPROCESOREAL Complejo

����

?? ?

?

Simpli�cacionesModelomatem�atico Incertidumbres

Sistemade Control�-

-

EstabilidadNominal(NS) ComportamientoNominal(NP) EstabilidadRobusta(RS) ComportamientoRobusto(RP)????Figura 8.1: Planteamiento del problema de control

Page 179: Control Adaptativo y Robusto

El problema del control robusto 163disciplina conocida como Control Robusto. La d�ecada de los ochenta se considera elper��odo de desarrollo de dicha teor��a, pudi�endose destacar entre otros los desarrolloste�oricos realizados durante este per��odo: 1) M�etodos H1 (Zames y Francis, 1983;Doyle et al, 1989); 2) m�etodos LTR (Loop Transfer Recovery) (Doyle y Stein, 1981,Stein y Athans, 1987); 3) m�etodo de dise~no IMC (Internal Model Control) (Morariet al, 1989); 4) m�etodos de Kharatinov (Barmish, 1993); 5) m�etodo de S��ntesis-�(Balas et al, 1991); 6) m�etodo GPC (Generalized Predictive Control) (Clarke et al,1989); 7) m�etodo QFT (Quantitative Feedback Theory) (Horowitz, 1982).Las principales aplicaciones de la teor��a de control robusto realizadas en los�ultimos a~nos se han llevado a cabo en las �areas de control de procesos qu��micos,rob�otica, estructuras exibles y control de aeronaves (Dorato, 1993). Como con-secuencia de los buenos resultados obtenidos, y del inter�es despertado en la comu-nidad cient���ca y t�ecnica por la nueva disciplina, han surgido diferentes paquetes deCACSD (Dise~no de Sistemas de Control Asistido por Computador) para el dise~node sistemas de control robusto, como ejemplos signi�cativos se pueden citar: Pro-gram CC (Thompson, 1988), Robust-Control Toolbox (Chiang y Safonov, 1992)y �-Analysis and Synthesis Toolbox (Balas et al, 1991) ambos para Matlab. Estecap��tulo se centra en los m�etodosH2, LTR yH1, habi�endose empleado para el dise~noy an�alisis de los controladores, los dos paquetes de CASCD citados anteriormenteen primer lugar.8.2 Relaciones fundamentalesLa calidad de un dise~no va a depender en gran manera, del grado de aproximaci�oncon el que se recojan, de forma matem�atica, los deseos de c�omo se quiere que funcioneel sistema bajo ciertas condiciones. Y por tanto, del conocimiento que se tenga dela planta, as�� como de lo que se le exija al sistema de control. Esto �ultimo, quedar�are ejado como las especi�caciones de dise~no a cumplir por el controlador.Relaciones fundamentales de controlUn sistema de control gen�erico puede verse representado en la �gura 8.2, donde:G representa la planta, K el controlador, di; do las perturbaciones que afectan alproceso, r la referencia o consigna, y la respuesta del sistema y n el ruido ligado alas medidas de los sensores.

Page 180: Control Adaptativo y Robusto

164 Relaciones fundamentales- h - h? - h? -r?h�6 nydoGdiK uer -

Figura 8.2: Sistema de control y se~nales signi�cativasPara caracterizar el comportamiento de un sistema de control resulta �util de�niruna serie de operadores, o matrices (funciones en el caso escalar) de transferencia:� Lazo Abierto o Raz�on de Retorno:Li = KG ; Lo = GK� Diferencia de Retorno:Fi = I + Li ; Fo = I + Lo� Sensibilidad: Si = F�1i ; So = F�1o� Sensibilidad Complementaria:Ti = I � Si ; To = I � So� Sensibilidad del Control: N = KSodonde los sub��ndices fi; og hacen referencia a que el operador se de�na a la entradao a la salida de la planta respectivamente.Del diagrama de bloques de la �gura 8.2, pueden obtenerse las siguientes fun-ciones (matrices en el caso de sistemas multivariables) de transferencia que van adeterminar las propiedades m�as relevantes a tener en cuenta para el dise~no de unsistema de control:

Page 181: Control Adaptativo y Robusto

El problema del control robusto 1651. Estabilidad interna: El sistema es internamente estable si son estables (verap�endice B.1) cada uno de los elementos de la matriz R, que relaciona losvectores r; di con y; u, siendo: " yu # = R " rdi #donde: R = " GK(I +GK)�1 (I +GK)�1GK(I +GK)�1 �K(I +GK)�1G #2. Comportamiento entrada-salida:y = To(r � n) + Sodo + SoGdi (8:1)e = r � y= So(r � do � n)� SoGdi (8.2)3. Sensibilidad del sistema a peque~nos cambios en los par�ametros de la planta:Si la funci�on (matriz) de transferencia en lazo abierto L0o(s) sufre una desviaci�oncon respecto a la nominal Lo(s) debido a peque~nas variaciones en los par�ame-tros de la planta y/o del regulador, la correspondiente desviaci�on de la funci�on(matriz) de sensibilidad complementaria To(s) viene dada por (MacFarlane,1970): T�1o (s)�To(s) = So(s)L�1o (s)�Lo(s) (8:3)que es la generalizaci�on matricial de la relaci�on escalar de Bode (Kwakernaak,1972): d lnTd lnL = dT=TdL=L = S4. Demanda de control: u = KSo(r � n� do) + Sidi (8:4)El conjunto de ecuaciones 8.1-8.4 resumen los bene�cios fundamentales y ob-jetivos de dise~no inherentes a los sistemas de control realimentados. De ellas sedesprende la existencia de una serie de objetivos contrapuestos:1. De 8.2, se deriva que los errores de seguimiento del sistema e en presencia decambios de consigna r y el efecto de perturbaciones do actuando a la salida de laplanta pueden hacerse "peque~nos", procurando que el operador de sensibilidadSo sea\peque~no" tambi�en (o equivalentemente Lo lo bastante grande). Paraatenuar convenientemente las perturbaciones que act�uen a la entrada de laplanta di ser�a necesario que el producto SoG se mantenga lo menor posible.

Page 182: Control Adaptativo y Robusto

166 Relaciones fundamentales2. De la ecuaci�on 8.3, se deriva la conveniencia de mantener So(s) lo menorposible, ( Lo(s) lo mayor posible), a �n de que el efecto de peque~nas variacionesde par�ametros en la planta no afecten de manera sensible al comportamientodel sistema en lazo cerrado.3. Sin embargo, el aumentar excesivamente la ganancia en lazo abierto (Lo) oequivalentemente disminuir So, hace que dada la relaci�on existente entre So yTo se provoque un aumento de la magnitud de To, produciendo dos consecuen-cias negativas:(a) Una posible ampli�caci�on del ruido de medida n y su transmisi�on a lasalida del sistema.(b) Una mayor sensibilidad del sistema a los efectos de la din�amica no mo-delada de alta frecuencia.4. El esfuerzo de control u requerido para rechazar las perturbaciones actuantessobre el sistema y conseguir una buena regulaci�on depende de las magnitudesde Si; So; K. Por tanto si se pretende que u no sea excesivo ser�a necesario man-tener So, y Si lo su�cientemente bajas. Pero dado que a su vez �estas dependeninversamente de K, disminuir las primeras supone aumentar la �ultima.Se presentan pues objetivos contradictorios, debi�endose llegar en cada problemade dise~no a una soluci�on de compromiso. Habitualmente la din�amica inmodelada dealta frecuencia es la que da lugar a los mayores niveles de incertidumbre. Teniendoen cuenta que el ruido de medida suele ser tambi�en de alta frecuencia, y que lascaracter��sticas de los sistemas din�amicos pueden muy bien asemejarse a �ltros pasabajo, una forma de resolver el problema planteado con los objetivos contrapuestosanteriores, es procurando que cada uno se cumpla en un rango de frecuencias deinter�es.Se pueden establecer tres zonas de frecuencias, de forma que dentro de cada unase trata de conseguir unos objetivos primordiales (ver �gura 8.3):� Zona de baja frecuencia: En la que se requiere alta ganancia para conseguir:{ Buen seguimiento de la referencia.{ Adecuado rechazo de perturbaciones.{ Reducci�on de la sensibilidad del sistema a peque~nos cambios en los par�a-metros de la planta.

Page 183: Control Adaptativo y Robusto

El problema del control robusto 167QQQQQQQQQQQQQQQBBBBBBBBB

ZONA DE BAJA FRECUENCIA- Seguimiento de consigna- Rechazo de perturbaciones- Peque~nos cambios en parmetros- Comportamiento RobustoZONA FRECUENCIA DE CRUCE- Estabilidad- Velocidad de respuesta

ZONA DE ALTA FRECUENCIA- Rechazo ruido en sensores- Estabilidad Robusta! (rad/s)

kLk0(db)

Figura 8.3: Zonas de frecuencias de inter�es� Zona de frecuencia intermedia: Va a ser determinante de propiedades talescomo:{ Estabilidad y m�argenes de estabilidad.{ Velocidad de respuesta y ancho de banda.� Zona de alta frecuencia: Se va a requerir baja ganancia para:{ Rechazo del ruido de los sensores.{ Estabilidad robusta.Las especi�caciones de control pueden darse en el dominio frecuencial. Unaforma de hacerlo es empleando funciones dependientes de la frecuencia, o de pon-deraci�on, para acotar las magnitudes de los operadores de sensibilidad y sensibilidadcomplementaria. Para el caso de un sistema escalar pueden venir dados de la forma:j S(j!) j� wS(!) y j T (j!) j� wT (!) 8 !Se pueden obtener las siguientes aproximaciones:j L j� 1() ( j S j� 1j T j� 1 )

Page 184: Control Adaptativo y Robusto

168 Relaciones fundamentalesj L j� 1() ( j S j� 1j T j� 1 )Para el rango de frecuencias donde j L j� 1, las propiedades del sistema en lazocerrado dependen cr��ticamente del valor de la fase del lazo abierto; as�� se tendr�aque: j L j � 1 j S j� 1()argL(j!) � �180� j T j� 1Reglas pr�acticas para el dise~noLas aproximaciones anteriores llevan a una serie de reglas �utiles a la hora de realizarla s��ntesis de un sistema de control:� Alta ganancia en lazo abierto lleva a baja sensibilidad y buenas propiedadesde rechazo de perturbaciones y seguimiento de la referencia (np).� Peque~na ganancia en lazo abierto es adecuada para que la respuesta debida alruido en sensores sea considerablemente baja, y para mantener la estabilidaddel sistema frente a incertidumbres en la planta (rs).� A frecuencias cercanas a la frecuencia de cruce de ganancia, la fase del sistemadebe permanecer acotada lo su�cientemente alejada de �180�, para propor-cionar unos adecuados m�argenes de estabilidad y para prevenir la ampli�caci�onde perturbaciones y ruidos.El conjunto de reglas anteriores constituyen la base del dise~no cl�asico en el do-minio frecuencial (Freudenberg et al, 1988, Maciejowski, 1989), consistente en quea partir del ajuste de la ganancia en lazo abierto se consiguen unas especi�cacionesde dise~no dadas en lazo abierto y/o cerrado. Otras t�ecnicas realizan tambi�en elproceso de ajuste en frecuencia, pero empleando directamente las funciones (matri-ces) de transferencia en lazo cerrado. En el cap��tulo 9 se presentan algunas t�ecnicasde ajuste de las ganancias en lazo abierto (ltr), mientras que en el cap��tulo 10 sedescriben algunos m�etodos para el ajuste de las ganancias en lazo cerrado (H2; H1)1.1La t�ecnica de ajustar las formas de las respuestas en frecuencia de ciertas funciones (matrices)de transferencia se conoce en general como Loop Shaping, en terminolog��a inglesa.

Page 185: Control Adaptativo y Robusto

El problema del control robusto 169Extensi�on de conceptos a sistemas multivariablesEl concepto de ganancia de un sistema puede extenderse a sistemas multivariableshaciendo uso de las relaciones entre las normas (ver ap�endice B.2) de las se~nalesvectoriales de salida y entrada al sistema.En general, si k x k representa a cualquier norma de un vector x, se de�ne lanorma inducida de la matriz G por:k G k= supx6=0k Gx kk x ky en particular si se elige la norma Eucl��dea (de un vector complejo x):k x k= pxHx(donde xH representa el vector traspuesto conjudado de x), la norma inducida de lamatriz es la norma espectral o de Hilbert:k G ks= �donde �2 es el autovalor m�aximo de la matriz GHG o de su traspuesta GGH , dondeGH es la matriz traspuesta conjugada de G (ver ap�endice B.3).Si se tiene una matriz de transferenciaG(s), con s = j!, y (0 � ! � 1), entoncessu norma espectral va ser una funci�on de !. Por tanto la norma k G(s)u(s) k va adepender de la direcci�on del vector u(s) y de la frecuencia !. Para cada valor defrecuencia es posible hallar unas cotas de la magnitud:k G(s)u(s) kk u(s) kque reemplazan el concepto de ganancia simple por el de rango de ganancias, estando�este acotado (superior e inferiormente). Estas cotas son las denominadas gananciasprincipales extremas: �[G(j!)], �[G(j!)], que pueden calcularse a partir de losvalores singulares m�aximo (�) y m��nimo (�) de la matriz de transferencia G(j!)(ver ap�endice B.3) para cada frecuencia !.Para el caso de un sistema multivariable, las especi�caciones de dise~no puedendarse empleando las ganancias principales extremas:�[S(j!)] � wS(!)

Page 186: Control Adaptativo y Robusto

170 Relaciones fundamentales�[T (j!)] � wT (!)donde igual que para el caso escalar, las funciones de ponderaci�on (wS(!); wT (!))se eligen de forma que se tengan en cuenta los objetivos a cumplir en cada intervalode frecuencias de inter�es:1. Baja frecuencia: �(S)� 1�i(T ) � 12. Frecuencia intermedia: j �i(j!) j� �i(j!)con mg,mf satisfactorios (ver ap�endice B.4).3. Alta frecuencia: �(T )� 1Teniendo en cuenta que para cualquier matriz arbitraria Q y su matriz unitaria Ise cumple: maxf0; �(Q)g � �(Q+ I) � �(Q) + 1maxf0; �(Q)g � �(Q+ I) � �(Q) + 1se pueden transformar las especi�caciones anteriores, empleando las ganancias prin-cipales extremas en lazo abierto:1. A baja frecuencia: �(L) � 1�(S) si �(L)� 12. A alta frecuencia: �(L) � �(T ) si �(L)� 1Las aproximaciones anteriores proporcionan una forma de transformar las especi-�caciones sobre �(T ) y �(S), en expresiones de la matriz de transferencia en lazoabierto (ver �gura 8.4): 1=�[L(j!)] � wS(!)�[L(j!)] � wT (!)

Page 187: Control Adaptativo y Robusto

El problema del control robusto 171

0

dB

(L)

NP

RST

S

(L)

-1

Figura 8.4: Correspondencia especi�caciones lazo cerrado-lazo abierto8.3 Descripci�on de las incertidumbresUn diagrama de bloques general de un sistema de control de una planta con incer-tidumbres queda representado en la �gura 8.5, donde E representa los errores demodelado existentes en la planta.De las posibles formas de representar el conocimiento impreciso que se tiene en elcaso de un proceso escalar (incertidumbre tipo aditivo, multiplicativo etc.), cuandose trata de un sistema multivariable hay que considerar algunos otros casos; pueshabr�a que tener en cuenta su situaci�on en el lazo de control. As�� por ejemplo, laincertidumbre de tipo multiplicativo podr�a estar a la entrada o a la salida, o inclusopodr�an coexitir ambas simult�aneamente. En cada caso habr�a que analizar el sistemaen concreto y tratar de plasmar los errores de modelado de la forma m�as conveniente.Las incertidumbres multiplicativas son las m�as frecuentemente empleadas, debidoa que satisfacen las propiedades intuitivas de ser peque~nas a baja frecuencia (dondeel modelo de la planta nominal es generalmente bien conocido), y por otro lado sonelevadas para alta frecuencia (donde el modelo es siempre m�as impreciso). Habitual-mente el nivel de incertidumbre aumenta con la frecuencia, debido principalmente a

Page 188: Control Adaptativo y Robusto

172 Descripci�on de las incertidumbres-� �� K -� �� G -� �� -?? ?� ���6

dodir n- yue E6 ?Figura 8.5: Sistema de control con incertidumbres en la plantala din�amica no modelada de alta frecuencia (sensores, actuadores, modelos de ordenreducido de la planta). Si bien, hay diversas formas de caracterizar la incertidumbreque exista en un sistema de control, como se pasa a describir a continuaci�on.La planta actual o real, G0, puede expresarse de forma gen�erica como:G0 = G+�G (8:5)donde G es el modelo nominal de la planta, y �G representa la incertidumbre oerrores de modelado presentes en el sistema.El tratamiento que se hace es considerar que el conjunto de incertidumbres queafectan al sistema puede ser representado por una incertidumbre equivalente, que semani�esta de alguna forma espec���ca en un lugar localizado. En ocasiones ello noes posible, en cuyo caso se habla de incertidumbres simult�aneas (dos o m�as).Los modelos de incertidumbres m�as empleados son: aditiva (iA), multiplicativaa la entrada/salida (iMi y iMo) de la planta, de realimentaci�on a la planta (iRp),como bucle realimentado a la entrada/salida de la planta (iRi, iRo), (ver �gura 8.3).A continuaci�on se dan las expresiones correspondientes a cada una de ellas:1. iA: G0 = G+ E�G = E

Page 189: Control Adaptativo y Robusto

El problema del control robusto 173- e-?- -e-6 K E Gr y - -?- -e-6 K EGr yeiMi iMoe- K E Gr y�e6 -- -6 e- K EGr y�e6 --6iRi iRpe- K EGr y�e6 --6 - ?-e-6 K EGr ye- -iRo iAFigura 8.6: Algunos tipos de incertidumbres

Page 190: Control Adaptativo y Robusto

174 Descripci�on de las incertidumbres2. iMi: G0 = G(I + E)�G = GE3. iMo: G0 = (I + E)G�G = EG4. iRp: G0 = (I +GE)�1G�G = [(I +GE)�1 � I]G5. iRi: G0 = G(I + E)�1�G = G[(I + E)�1 � I]6. iRo: G0 = (I + E)�1G�G = [(I + E)�1 � I]GEn general, a la hora de la descripci�on anal��tica de las incertidumbres en la planta�estas pueden englobarse en dos grandes grupos: estructuradas y no estructuradas.Incertidumbres no estructuradasPara este tipo de incertidumbre, lo que se conoce de E(s) puede consistir en unacota de su magnitud, generalmente dependiente de la frecuencia:�[E(j!)] � �(!) 8 ! (8:6)Resulta interesante de cara a posteriores an�alisis el factorizar E(s) en la forma:E(s) = e(s)�(s) ; �[�(s)] � 1 8! (8:7)Todas estas descripciones albergan la posibilidad de acoplamiento entre distintasfuentes de incertidumbres (por ejemplo, entre diferentes actuadores), considerandoel caso m�as desfavorable (E(s) es una matriz con elementos no nulos fuera de ladiagonal principal). Pudiendo ocurrir, que se contemplen ciertas posibilidades que

Page 191: Control Adaptativo y Robusto

El problema del control robusto 175en la pr�actica nunca se produzcan. Si �eso ocurriera, el dise~no realizado se caracteri-zar��a por ser excesivamente conservador.Incertidumbre estructuradaSi de alguna manera se localizan las fuentes de las incertidumbres del sistema,se tendr�a una descripci�on m�as ajustada o estructurada de los errores de modelado.Esta puede estar constituida a su vez por m�ultiples incertidumbres localizadas e in-dependientes no estructuradas (Ei(s)). Las cuales pueden corresponder a din�amicasno modeladas de los actuadores, de los sensores, o de la propia planta. As��, paracada uno de los bloques independientes Ei(s) se realiza la factorizaci�on:Ei(s) = ei(s)�i(s) ; �[�i(s)] � 1 8! (8:8)La incertidumbre completa E(s) del sistema queda de la forma:E(s) = diag fEi(s)g i = 1; : : : ; psiendo p el n�umero de bloques.Los errores de modelado tambi�en podr��an consistir en imprecisiones en algunospar�ametros del proceso, suponiendo en este caso una incertidumbre totalmente es-tructurada o param�etrica. Este �ultimo caso se dar��a por ejemplo, si existe unaincertidumbre acotada en uno o varios polos y/o ceros de la planta, as�� como en lacuanti�caci�on de los elementos de retardo.Ejemplo: Incertidumbres aditiva y multiplicativaConsid�erese un proceso en el que la din�amica de alta frecuencia no se ha consi-derado en el modelo nominal G, de forma que el modelo completo o real de la plantaviene dado porG0(s) = G(s)Es(s); con: Es(s) = 100(s2 + 2:4s+ 144)144(s2 + s+ 100)donde Es es la incertidumbre en el modelo nominal. Esta se puede interpretar a suvez como una incertidumbre de tipo multiplicativo, aditivo, u otros. En el primercaso se tendr�a: G0 = G(1 + Em); con Em = Es � 1

Page 192: Control Adaptativo y Robusto

176 Estabilidad robusta

-70

-60

-50

-40

-30

-20

-10

0

10

10-1 100 101 102

rad/s

Ince

rtid

umbr

e m

ultip

licat

iva

(dB

)

Figura 8.7: Magnitud de la incertidumbre multiplicativay para el caso de incertidumbre aditiva:G = G + Ea; con Ea = G(Es � 1)En las �guras 8.7 y 8.8 se muestran respectivamente las respuestas en frecuencia(magnitudes) para cada tipo de incertidumbre. Puede verse c�omo la incertidumbremultiplicativa es peque~na a baja frecuencia, donde el modelo es bien conocido, y seincrementa a medida que aumenta la frecuencia.8.4 Estabilidad robustaSi el sistema de control dise~nado con el modelo nominal es estable, interesa saber siel sistema mantendr�a la estabilidad para cada uno de los elementos G0 del conjuntoG de plantas posibles: G = fG0gPara el an�alisis del problema anterior, es �util obtener una representaci�on delsistema como la de la �gura 8.9.

Page 193: Control Adaptativo y Robusto

El problema del control robusto 177

-80

-70

-60

-50

-40

-30

-20

-10

10-1 100 101 102

rad/s

Ince

rtid

umbr

e ad

itiva

(dB

)

Figura 8.8: Magnitud de la incertidumbre aditiva-

�EMa b

Figura 8.9: Sistema de interconexi�on

Page 194: Control Adaptativo y Robusto

178 Estabilidad robustaTeorema de la Peque~na GananciaEste teorema ha jugado un importante papel en el desarrollo de la teor��a del con-trol robusto (Dorato et al, 1987), y establece una condici�on su�ciente que garantizala robustez de la estabilidad de un sistema (Lunze, 1989):Teorema: Dado el sistema representado en la �gura 8.9, donde M y E repre-sentan sistemas cuadrados (mismo n�umero de entradas que de salidas) y estables,entonces el sistema en lazo cerrado ser�a estable si:k EM k< 1siendo k : k cualquier norma matricial compatible con el sistema (ver ap�endice B.2).Tanto M como E pueden ser sistemas no lineales y/o invariables en el tiempo.Sin embargo, el teorema establece solo una condici�on su�ciente para la estabilidaddel sistema en lazo cerrado.Particularizando para el caso de sistemas lineales e invariantes en el tiempo (lti),el sistema de la �gura 8.9 ser�a estable si se cumple:�[E(j!)M(j!)] < 1 8!La idea de aplicar este teorema, para analizar la robustez de un sistema decontrol con incertidumbres, se basa en el empleo de M(s) como el sistema visto porla incertidumbre E(s). Al sistema M(s) se le denomina Sistema de Interconexi�on,debido al hecho de que conecta la entrada "a" y la salida "b" de la incertidumbreE(s).En el caso de tratarse de sistemas lti, las se~nales externas, tales como pertur-baciones y se~nales de referencia, no van a afectar a la estabilidad del sistema y decara al an�alisis de robustez solo interesa la forma de c�omo es visto el sistema por laincertidumbre.Para llegar a la representaci�on anterior, se parte de la representaci�on convencionalde la planta y controlador, junto con los bloques de las incertidumbres que se tenganlocalizadas, se realizan las transformaciones equivalentes necesarias de forma que elresultado sea la separaci�on de la incertidumbre por un lado E(s) y del resto delsistema M(s) (sistema de interconexi�on) por otro.

Page 195: Control Adaptativo y Robusto

El problema del control robusto 179Ejemplo: An�alisis de robustezConsid�erese un sistema de control con realimentaci�on unitaria, donde la planta nom-inal G y el controlador K (regulador 1) est�an dados porG(s) = 1s2 ; K(s) = 10(s+ 1)s+ 5El modelo real de la planta (incluida la incertidumbre) viene dado por,G0(s) = G(s)[1 + Em(s)]siendo, Em(s) = s(�0:30556 + 0:6667)s2 + s+ 100Para este caso (incertidumbre de tipo multiplicativo) el sistema de interconexi�oncoincide, salvo en signo, con la funci�on de sensibilidad complementariaM = �Ty aplicando el teorema de la peque~na ganancia, la m�axima incertidumbre admisibleo tolerable viene dada por: j E j� 1jM j = 1j T jEn la �gura 8.10 se muestran tanto la incertidumbre j Em j (l��nea a trazos),as�� como la tolerancia del sistema de control a incertidumbres multiplicativas (l��neacontinua). Como puede verse, el sistema veri�ca la condici�on exigida por el teoremade la peque~na ganancia, y por tanto tendr�a una estabilidad robusta. En la �gura 8.11pueden verse las respuestas obtenidas para la planta nominal y la real, observ�andoseel efecto de la incertidumbre.Si se modi�ca el controlador (regulador 2), de modo que �este sea ahora,K(s) = 32(s+ 1)s+ 2el test de la estabilidad robusta derivado del teorema de la peque~na ganancia no secumple, tal y como puede verse en la �gura 8.12. Sin embargo, dicho teorema s�oloaporta una condici�on su�ciente, y como se observa a partir de la respuesta temporaldel sistema con la incertidumbre dada en la �gura 8.13, el sistema realmente s��

Page 196: Control Adaptativo y Robusto

180 Estabilidad robusta

-80

-60

-40

-20

0

20

40

60

10-1 100 101 102

rad/s

Ince

rtid

umbr

e y

tole

ranc

ia (

dB)

Figura 8.10: Tolerancia e incertidumbre multiplicativa con el regulador 1

0

0.2

0.4

0.6

0.8

1

1.2

1.4

0 1 2 3 4 5 6 7 8 9 10

tiempo (seg)

resp

uest

as

Figura 8.11: Respuestas con regulador 1 del sistema nominal y del real

Page 197: Control Adaptativo y Robusto

El problema del control robusto 181

-80

-60

-40

-20

0

20

40

60

10-1 100 101 102

rad/s

Ince

rtid

umbr

e y

tole

ranc

ia (

dB)

Figura 8.12: Tolerancia e incertidumbre multiplicativa con el regulador 2

0

0.5

1

1.5

2

2.5

0 1 2 3 4 5 6 7 8 9 10

tiempo (seg)

resp

uest

as

Figura 8.13: Respuestas con regulador 2 del sistema nominal y del real

Page 198: Control Adaptativo y Robusto

182 Estabilidad robustaveri�ca la condici�on de estabilidad robusta, ya que aunque la respuesta temporalsea poco amortiguada, s�� es estable.Si se considera E(s) una incertidumbre no estructurada y el sistema es lineal einvariante en el tiempo, se tiene el siguiente teorema que da condiciones necesariasy su�cientes para la robustez de la estabilidad (rs) del sistema de control en lazocerrado (Freudenberg et al, 1988; Morari et al, 1989)Teorema: Supuesto el sistema de interconexi�on M(s) estable, y que la incer-tidumbre E(s) es de tal clase que el sistema en lazo cerrado es estable si y solo si laproyecci�on del determinante det[I�M(s)E(s)] a lo largo del contorno de Nyquist Dno envuelve al origen. Entonces, el sistema en lazo cerrado ser�a estable para todaslas incertidumbres E(s) tales que: �[E(j!)] � 1 si y solamente si, se cumple algunade las siguientes condiciones equivalentes :det[I �M(j!)E(j!)] 6= 0 8 ! = �[E(j!)] � 1, �[M(j!)E(j!)] < 1 8 ! = �[E(j!)] � 1, �[M(j!)] < 1 8!, kMk1 < 1En el caso de que la incertidumbre tenga una estructura diagonal de bloques,de�nida por el conjunto:X� = fE(s) = diag fEi(s)g = �[Ei(s)] � �g (8:9)el an�alisis de la robustez de la estabilidad (rs) con el resultado del teorema anteriorpuede dar un resultado potencialmente conservativo, en el sentido de que supongasolo una condici�on su�ciente. Se tiene sin embargo, el siguiente teorema de robustezde la estabilidad (rs) menos conservador, al tener en cuenta la estructura de E(s)(Morari et al, 1989; Freudenberg et al, 1988):Teorema: Supuesto el sistema de interconexi�on M(s) estable, y que la in-certidumbre E(s) es de tal clase que el sistema en lazo cerrado es estable si y solosi la la proyecci�on del determinante det[I �M(s)E(s)] a lo largo del contorno deNyquist D no envuelve al origen. Entonces, el sistema ser�a estable en lazo cerradopara todas las incertidumbres E(s) 2 X�=1 si y solo si:�[M(j!)] < 1 8!La de�nici�on de �(M) (valor singular estructurado ssv, ap�endice B.3) suponeuna generalizaci�on del radio espectral �(M) y del m�aximo valor singular �(M).

Page 199: Control Adaptativo y Robusto

El problema del control robusto 183An�alisis de robustez con los valores singularesComo se ha presentado en apartados anteriores, hay diversas causas que originan laexistencia de incertidumbre en el modelo de la planta. Siendo de inter�es pr�acticoel que, a la hora de plantear las especi�caciones de dise~no, se tenga en cuenta elconocimiento que se posea sobre la incertidumbre.El planteamiento de un m�etodo, para el an�alisis de robustez de la estabilidad deun sistema de control, puede establecerse de modo gen�erico como sigue:1. Supuesta un tipo de incertidumbre en el modelo del proceso, se sit�ua en ellugar del lazo donde se presuma que act�ue o pueda quedar re ejado su efecto.2. El conocimiento que se tiene sobre la incertidumbre puede consistir en un cotasuperior de la magnitud de la incertidumbre como funci�on de la frecuencia (noestructurada): �[E(j!)] < e(!)3. Se realizan las transformaciones adecuadas para llegar a la forma est�andar dean�alisis (�gura 8.9), con el sistema de interconexi�on y la incertidumbre en dosbloques.4. Por el teorema de la peque~na ganancia se tiene que una condici�on su�ciente (nonecesaria) para que el sistema sea estable para ciertos niveles de incertidumbreses que: �(EM) < 1 8!o tambi�en: �(E) < 1�(M)As�� por ejemplo, para una incertidumbre multiplicativa considerada a la salidade la planta, el sistema de interconexi�on es: M = GK(I +GK)�1 y el test para larobustez se reduce a: �(E) < �[I + (L)�1]Se demuestra en la pr�actica, que los tests para robustez de la estabilidad bajociertas caracter��sticas de la incertidumbre dan condiciones excesivamente conser-vadoras.

Page 200: Control Adaptativo y Robusto

184 Estabilidad robustaPara el caso de un sistema 2 � 2 el an�alisis con �i(M) supone impl��citamenteque la incertidumbre actuante sobre el sistema sea en el caso m�as desfavorable de laforma:caso a) " e11(s) e12(s)e21(s) e22(s) #Mientras que la incertidumbre podr��a darse de una forma m�as estructurada,donde las incertidumbres en cada canal sean independientes entre s��, sin que seafectaran con t�erminos de acoplamiento:caso b) " e1(s) 00 e2(s) #O incluso que dichas incertidumbres fueran iguales en ambos canales:caso c) " e(s) 00 e(s) #Tambi�en, en algunos casos, puede ocurrir que el conocimiento que se tenga de laincertidumbre consista en posibles intervalos donde se encuentren los par�ametros conincertidumbres del modelo del sistema, en cuyo caso se tratar��a de una incertidumbremuy estructurada o param�etrica:caso d) 2664 k1 0 : : : 0... . . . ...0 0 : : : kn 3775En los sistemas reales puede darse en general una combinaci�on de los distintostipos de incertidumbre, pudiendo ser considerada parte como estructurada y partecomo no estructurada. Seg�un el conocimiento que se posea del tipo de incertidumbreal que est�e sometido el sistema, se emplear�a unas determinadas herramientas dec�alculo para el an�alisis de la robustez de la estabilidad. As�� para estimar los niveles(o tolerancias) de incertidumbre permitidos, para los que el sistema mantiene suestabilidad, se propone emplear en cada caso:

Page 201: Control Adaptativo y Robusto

El problema del control robusto 185caso a) El valor singular m�aximo del sistema de interconexi�on (M):1�(M)caso b) El valor singular estructurado de M :1�(M)caso c) El radio espectral de M : 1�(M)caso d) El valor singular estructurado real de M (Packard y Doyle, 1993):1�R(M)Se comprueba, que el conservadurismo decrece de a) hacia d), con lo que el co-nocimiento (a priori) que se suministre sobre el tipo de incertidumbre existente enel modelo del sistema va a ser de suma importancia.Ejemplo: Robustez frente a incertidumbre param�etricaConsid�erese un sistema de control con realimentaci�on unitaria, cuya planta G ysu regulador proporcional K est�an dados respectivamente por,G(s) = s+ bs2(s+ a) ; K(s) = kLos valores de los par�ametros b; a; k se consideran constantes durante largosper��odos de tiempo, pero por otro lado son desconocidos. Estando caracterizada laincertidumbre por los intervalos,3 � b � 5; �0:5 � a � 0:5 5 � k � 15Que puede a su vez ponerse de una forma conveniente para el c�alculo del sistemade interconexi�on M , as�� como para que la incertidumbre est�e normalizada, es decir,�(E) � 1; 8 !

Page 202: Control Adaptativo y Robusto

186 Estabilidad robustaPara ello, se hace: b = bo + b1�1; j �1 j� 1; bo = 4; b1 = 1a = ao + a1�2; j �2 j� 1; ao = 0; a1 = 0:5k = ko + k1�3; j �3 j� 1; ko = 10; k1 = 5De esta forma, el bloque de incertidumbre E es una matriz diagonal constituidapor n�umeros reales con valor absoluto inferior o igual a la unidad,E = diagf�1;�2;�3g

0

0.2

0.4

0.6

0.8

1

1.2

10-1 100 101 102

rad/s

sv(M

), m

u_re

al(M

)

sv(M)

mu_real(M)

Figura 8.14: An�alisis de robustez para incertidumbre param�etricaLos valores de bo; b1; ao; a1; ko; k1 se han incluido en M , y dado que �(E) � 1, lacondici�on su�ciente para que el sistema tenga una estabilidad robusta es que,�(M) � 1; (caso m�as conservador)o si se tiene en cuenta el car�acter param�etrico de la incertidumbre, la condici�on es�R(M) � 1; (caso de incertidumbre param�etrica)

Page 203: Control Adaptativo y Robusto

El problema del control robusto 187En la �gura 8.14 se tienen ambos valores; observ�andose que mientras a partirdel an�alisis con �(M) no se cumple la condici�on su�ciente de estabilidad robusta,�esta s�� se veri�ca si se emplea �R(M). En el primer caso se est�a considerando unasituaci�on excesivamente conservadora e irreal, mientras que en el segundo caso seest�a expl��citamente considerando que la incertidumbre es de tipo param�etrica.8.5 Comportamiento robustoDentro de las especi�caciones de dise~no hay que considerar el comportamiento nomi-nal (np) deseado del sistema en lazo cerrado. Este alude a aspectos relacionados conel rechazo a perturbaciones externas actuantes sobre el sistema, a la reducci�on delos errores de seguimiento, al esfuerzo de control y a un comportamiento adecuadoa�un en el caso de peque~nas variaciones en los par�ametros del modelo nominal de laplanta.Como se ha visto anteriormente, una forma anal��tica de expresar los requerimien-tos anteriores es mediante una relaci�on frecuencial basada en el modelo nominal dela planta, de la forma: �[WS(j!)S(j!)] � 1 (8:10)donde WS(j!) es una funci�on (matriz) de ponderaci�on que pone de mani�esto losper�les deseados de la funci�on de sensibilidad S(j!) en las distintas regiones defrecuencia. Si el per�l deseado es el mismo en todos los canales (especi�caci�onhomog�enea) entonces: WS(s) = wS(s)I y queda:�[S(j!)] � 1j wS(j!) jEl problema de an�alisis del comportamiento robusto (rp), consiste en determinarsi el sistema en lazo cerrado satisface las especi�caciones de comportamiento paratodas las posibles plantas G0(s) 2 G. Ser�a determinar si se cumple:�[WS(j!)S 0(j!)] � 1supuesto que se veri�ca 8.10 para la planta nominal G(s).Dada la representaci�on del sistema de la �gura 8.15, en la que se tienen carac-terizadas las incertidumbres por ET (s); y donde se especi�ca un np para el sistemanominal expresado mediante una relaci�on entre dos se~nales (vectores) v y w, por

Page 204: Control Adaptativo y Robusto

188 Comportamiento robustoMET

--�

-w vFigura 8.15: An�alisis del comportamiento robustomedio de: v = E�1S w. Se tiene el siguiente teorema de robustez del comportamiento(rp) (Freudenberg et al, 1989; Morari et al, 1989):Teorema: Dado el sistema M(s) de la �gura 8.15, supuesto estable y obtenidocon el modelo nominal de la planta, sujeto a la incertidumbre ET , con �(ET ) � 1.El sistema satisface la condici�on de comportamiento robusto si y solo si:�(M) < 1 8!donde �(M) se calcula con respecto a la incertidumbre estructurada de forma diago-nal E = diag fET ; ESg; siendo ES(s) una incertidumbre �cticia con �[ES(j!)] � 1,la cual est�a relacionada con el comportamiento nominal deseado.En el teorema anterior se realiza la transformaci�on del problema de rp en uno ders equivalente, con un bloque adicional de incertidumbre. Se hace al transformar laespeci�caci�on de np en lazo cerrado (expresada como una relaci�on entre dos se~nalesw y v), en una incertidumbre �cticia representada por ES (ver �gura 8.16) (Doyle1983, Morari et al. 1989, Freudenberg 1989).Con lo expuesto hasta ahora, los requerimientos para un sistema de controlpueden escalonarse en cuatro niveles de complejidad o exigencia:1. El primero es el m�as elemental e imprescindible: la estabilidad del sistemanominal (ns).2. A continuaci�on est�a el conseguir un comportamiento nominal (np) deseado.3. El tercer objetivo consiste en gozar de una estabilidad robusta (rs).

Page 205: Control Adaptativo y Robusto

El problema del control robusto 189

METES

E--

��w vFigura 8.16: Equivalencia entre comportamiento robusto y estabilidad robusta4. Y �nalmente, que el comportamiento deseado se mantenga a�un con la existen-cia de incertidumbres, lo que supone un comportamiento robusto (rp).Si se realiza una partici�on del sistema de interconexi�on (caso de rs para in-certidumbres simult�aneas, o rp para un tipo de incertidumbre actuando sobre laplanta): M(s) = " M11 M12M21 M22 #de forma que M(s) incluye el escalado apropiado para que la incertidumbre est�enormalizada: �[E(s)] < 1, los objetivos anteriores pueden analizarse a partir deM(s) empleando en cada caso (Skogestad et al, 1988; Freudenberg, 1989):� ns: M es estable� np: �(M22) < 1 8 !� rs: Seg�un sea estructurada o no estructurada la incertidumbre ET :�(M11) < 1 �o �(M11) < 1 8 !� rp: �(M) < 1 8 !

Page 206: Control Adaptativo y Robusto

190 Robustez de plantas con fuerte ganancia direccional8.6 Robustez de plantas con fuerte ganancia di-reccionalA diferencia de los sistemas escalares, un proceso multivariable se caracteriza porquela ganancia que el sistema mani�esta para una determinada perturbaci�on y/o consig-na va a depender de la direcci�on espacial que �esta tenga, dado su car�acter vectorial.Potencialmente puede haber una fuerte discrepancia entre las ganancias de laplanta para dos se~nales actuando en distintos canales o lazos. Una medida de ladireccionalidad de la planta se obtiene del n�umero de condici�on de su matriz detransferencia G(s), de�nido como:�[G(j!)] = �[G(j!)]�[G(j!)]un valor elevado de �(G) implica una fuerte dependencia direccional de G.Las matrices con elevados n�umeros de condici�on est�an num�ericamente mal condi-cionadas para el c�alculo de su inversa. Empleando este resultado, se dice que unsistema est�a mal condicionado para ciertas frecuencias si su matriz de transferencia,a esas frecuencias, tiene un n�umero de condici�on elevado. Si �este es pr�oximo a uno,se dice que el sistema est�a bien condicionado. Los valores singulares de las matricesno son independientes de escalados, por lo que el n�umero de condici�on de una plantava a depender de las unidades empleadas a la entrada y a la salida de la planta.Un controlador que compense la direccionalidad acusada de una planta, apli-cando se~nales de control elevadas en la direcci�on donde la ganancia del sistema esbaja, puede dar buenos resultados si el modelo del proceso es muy preciso. Pero sidebido a las incertidumbres, la direcci�on del vector de control, de elevada magnitud,generado no coincide exactamente con la direcci�on de baja ganancia de la planta,entonces la ampli�caci�on de las se~nales de control pueden ser mucho mayores quelas esperadas con el modelo; resultando un comportamiento nada satisfactorio delsistema de control.Los problemas para el control de una planta con incertidumbres y una direcciona-lidad acusada, se ponen especialmente de mani�esto, cuando se analiza la robustezde la estabilidad frente a incertidumbres simult�aneas y/o la robustez del compor-tamiento del sistema de control. Como se ha visto en el apartado anterior, enambos casos la herramienta de an�alisis es el valor singular estructurado del sistemade interconexi�on M(s).

Page 207: Control Adaptativo y Robusto

El problema del control robusto 191Cuando se tienen dos fuentes de incertidumbre separadas, o cuando se especi�caun comportamiento deseado para un proceso con una incertidumbre dada, el sistemade interconexi�on queda de la forma:M(s) = " M11(s) M12(s)M21(s) M22(s) #y la incertidumbre equivalente:E(s) = " E11(s) E12(s)E21(s) E22(s) #dado que si �(E) � �, la condici�on de estabilidad robusta para el sistema es:�(M) < 1� 8 !entonces como: �(M) � maxi f�(Miigocurre que el margen de estabilidad frente a incertidumbres simult�aneas no va a sermejor que los m�argenes frente a cada tipo de incertidumbre actuando sola.Resulta interesante obtener cotas de �(M) expresadas en funci�on de los valoressingulares de los elementos Mij, de forma que puedan emplearse para facilitar eldise~no y an�alisis. Con este objetivo, se dan los siguientes resultados (Freudenber1989): �(M) � [�(M12)�(M21)]1=2 �max f�(M11); �(M22)g�(M) � [�(M12)�(M21)]1=2 +max f�(M11); �(M22)gEn las ecuaciones anteriores puede verse la dependencia de la robustez del sistemade los elementos Mij; i 6= j . Si ocurre que:[�(M12)�(M21)]1=2maxf�(M11)�(M22)g � 1 (8:11)el sistema ser�a mucho m�as sensible a incertidumbres simult�aneas que a las mismasactuando de forma individual. Por ello, aunque se tenga garantizada la robustezfrente a cada incertidumbre individual (elementos Mii, �(Mii) < 1) pueden exi-stir un par de peque~nas incertidumbres que actuando simult�aneamente causen lainestabilidad del sistema, siempre que:[�(M12)�(M21)]1=2 � 1 (8:12)

Page 208: Control Adaptativo y Robusto

192 Robustez de plantas con fuerte ganancia direccional- h- -r- - h?- - h r�? r -6r- K EI G ES y

Figura 8.17: Incertidumbres para problema de comportamiento robusto.y por tanto: �(M) � [�(M12)�(M21)]1=2 � 1Los sistemas que, al menos potencialmente, pueden llevar con m�as facilidad ala condici�on anterior, son aquellos que tengan plantas mal condicionadas; especial-mente si no se toman algunas precauciones a la hora del dise~no.El problema de analizar la robustez en la estabilidad de un sistema con incer-tidumbres multiplicativas a la entrada y a la salida actuando simult�aneamente, oel de an�alisis del comportamiento robusto de un sistema con incertidumbre multi-plicativa a la entrada, son especialmente cr��ticos, y ponen de mani�esto lo dichoanteriormente.Para el sistema de la �gura 8.17 se trata de analizar la robustez en el compor-tamiento del sistema. Se supone que los errores de modelado de la planta puedenexpresarse como una incertidumbre multiplicativa a su entrada:EI(s) = wI(s)�I(s) �[�I(j!)] � 1 8!y que la especi�caci�on de comportamiento nominal puede expresarse mediante unaincertidumbre �ct��cia equivalente (ver �gura 8.18):ES(s) = wS(s)�S(s) �[�S(j!)] � 1 8!Se obtiene que: " a1a2 # =M " b1b2 #

Page 209: Control Adaptativo y Robusto

El problema del control robusto 193

M(s)�I(s)�S(s)--

��a1a2 b1b2

Figura 8.18: Problema de estabilidad robusta equivalente.siendo el sistema de interconexi�on:M = " �TIwI �KSowSSoGwI SowS #si G(s) es invertible, el t�ermino M12 puede ponerse como: M12 = TIG�1. Si sesupone que los elementos M12;M21 cumplen las condiciones 8.11 y 8.12 se tendr�aque �(M)� 1, y como:[�(M)]1=2 � �(SowIG)�(TIwSG�1) � �(SowI)�(TIwS)�(G)se pone de mani�esto el hecho de que si la planta tiene una acusada ganancia direc-cional (�(G) elevado), la estabilidad del sistema experimentar�a una mayor sensibi-lidad a incertidumbres simult�aneas.Otras relaciones de inter�es, que ponen de relieve lo anterior, a la vez que tambi�enincluyen el efecto de la ganancia direccional del controlador dise~nado, se dan acontinuaci�on (Freudenberg 1989, Morari et al. 1989):�(M) � �(wSSo) + �(wITo)�(M) � �(wITI) + �(wSSI)�(M) � �(wITI) + (1 +p )�(wSSo)

Page 210: Control Adaptativo y Robusto

194 Robustez de plantas con fuerte ganancia direccional�(M) � maxf�(wITI); �(wSSo)g+q�(wITI)�(wSSo) = min f�(G); �(K)gLas expresiones anteriores pueden ayudar durante el dise~no, pero hay que teneren cuenta que si se emplean para analizar directamente la robustez del sistema,pueden llevar a dise~nos muy conservadores, debido a que para plantas con marcadaganancia direccional la cota puede estar excesivamente sobre-estimada. Ser�a conve-niente por tanto, de cara al dise~no �nal, calcular el valor de �(M) de forma directa.Ejemplo: Planta con fuerte ganancia direccionalSea la siguiente matriz de transferencia G(s), correspondiente a un proceso mul-tivariable compuesto de dos entradas y dos salidasG(s) = 175s+ 1 " 0:878 0:8641:082 1:096 #Este sistema reune especialmente las caracter��sticas anteriormente citadas sobrela fuerte ganancia direccional. Con la peculiaridad de que su n�umero de condici�ontoma un valor elevado y constante, de 141.3, para todo el rango de frecuencias. Espues, un ejemplo de lo que se denomina una planta mal condicionada, o sea convalores de �(G)� 1en el rango de frecuencias de inter�es. En la �gura 8.19 pueden verse sus gananciasextremas o valores singulares en funci�on de la frecuencia. Tambi�en se muestran laparte real (curva continua) y la parte imaginaria (curva de trazos) de los elementosde la matriz de ganancia relativa (rga) (ver ap�endice B.5) en la �gura 8.20.

Page 211: Control Adaptativo y Robusto

El problema del control robusto 195

-120

-100

-80

-60

-40

-20

0

20

10-5 10-4 10-3 10-2 10-1 100 101 102

rad/s

Gan

anci

as e

xtre

mas

de

G

Figura 8.19: Ganancias extremas para planta con fuerte ganancia direccional-40

-20

0

20

40

10-5 10-2 101 104

rad/s

RGA(G_11)

-40

-20

0

20

40

10-5 10-2 101 104

rad/s

RGA(G_12)

-40

-20

0

20

40

10-5 10-2 101 104

rad/s

RGA(G_21)

-40

-20

0

20

40

10-5 10-2 101 104

rad/s

RGA(G_22)

Figura 8.20: Parte real e imaginaria de los elementos de la matriz de gananciarelativa (rga).

Page 212: Control Adaptativo y Robusto

196 Robustez de plantas con fuerte ganancia direccional

Page 213: Control Adaptativo y Robusto

Cap��tulo 9M�etodos de dise~no LTR9.1 Introducci�onEl m�etodo de dise~no de sistemas de control denominado Recuperaci�on de la funci�onde Transferencia del Lazo abierto (ltr),1 surgi�o como consecuencia del objetivode mejorar la robustez de los controladores basados en el procedimiento LinealCuadr�atico Gaussiano (lqg) (Doyle y Stein, 1979). Posteriormente, la teor��a entorno a ltr ha transcendido de sus or��genes, constituyendo una metodolog��a dedise~no sistem�atica y exible para sistemas de control tanto escalares como multiva-riables. Durante la d�ecada de los ochenta tuvo su �epoca de desarrollo e implantaci�on(Athans, 1986; Stein y Athans, 1987; Maciejowski, 1985), y sigue siendo un temade investigaci�on y estudio (Zhang y Freudenberg, 1993; Saberi et al, 1993; Saeki,1992).Como se ha presentado en el cap��tulo anterior, las especi�caciones de dise~nopueden plantearse en el dominio de la frecuencia. En este cap��tulo se trata el pro-blema del ajuste de las ganancia del sistema en lazo abierto, a �n que cumplan unasespeci�caciones de dise~no dadas. El m�etodo de dise~no basado en la teor��a lqg, juntocon un procedimiento para recuperar cierta funci�on de transferencia en lazo abiertoespeci�cada, constituye la t�ecnica conocida como lqg/ltr.Un controlador basado en observador (cbo) cumple el Principio de Separaci�on,proporcionando a la hora del dise~no la divisi�on de �este en dos problemas indepen-dientes:1Loop Transfer Recovery en terminolog��a inglesa197

Page 214: Control Adaptativo y Robusto

198 Propiedades del regulador LQR1. Dise~no del controlador por realimentaci�on de estados.2. Dise~no del observador para reconstruir el estado a partir de la medida de larespuesta del sistema.Por tanto, si el sistema de control con realimentaci�on de estados (lqsf)2 esestable en lazo cerrado y tiene un comportamiento nominal adecuado, ello garan-tiza las mismas propiedades para el sistema nominal con cbo. Sin embargo, conla presencia de incertidumbres en el modelo, el regulador con el vector de esta-dos estimado (lqsef)3 no lleva necesariamente al mismo comportamiento obtenidopor realimentaci�on de estados, as�� como tambi�en puede haber un deterioro de laspropiedades de robustez con respecto al regulador lqsf (Doyle y Stein, 1981).Surge de esta forma, la motivaci�on de desarrollar estructuras de control basadasen observador (cbo), u otras no basadas en observador (cnbo), que mantengan oal menos conserven la parte esencial, de las propiedades que caracterizan al dise~nobasado en la realimentaci�on de estados (lqsf), o a su problema dual, el �ltro deKalman (kbf).En este cap��tulo se presentan dos estructuras empleadas en el dise~no ltr. Unabasada en observador (cbo) y otra no basada en observador (cnbo).9.2 Propiedades del regulador LQRComo se ha visto en el cap��tulo 8, para un proceso que pueda describirse por unmodelo lineal e invariante en el tiempo, el comportamiento del sistema en lazocerrado y su robustez van a depender de ciertas funciones (matrices) de transferenciaasociadas al sistema de control, tales como la funci�on de sensibilidad S(s) y sucomplementaria T (s). A la vez, como se ha descrito en el cap��tulo anterior, �estasse pueden expresar a partir de la funci�on (matriz) de transferencia en lazo abiertoL(s).Basado en lo anterior, una manera de formular las especi�caciones de dise~no con-siste en de�nir la funci�on (matriz) de transferencia en lazo abierto deseada (ftlad)Lt(s). El problema ser�a encontrar un controlador con una estructura determinadaque proporcione la ftlad.2linear quadratic state feedback en la terminolog��a inglesa.3linear quadratic state estimated feedback en la terminolog��a inglesa.

Page 215: Control Adaptativo y Robusto

M�etodos de dise~no LTR 199En la literatura se han sugerido dos m�etodos para obtener Lt(s) que proporcio-nan unas caracter��sticas muy aceptables. Una se basa en el empleo de la teor��a decontrol �optimo cuadr�atico (lqr), y la otra est�a basada en la teor��a del �ltro Kalman(kbf). La ventaja esgrimida para el empleo de estos m�etodos es que el sistemaadquiere, de forma autom�atica, ciertas propiedades muy estimables desde el puntode vista del comportamiento nominal y de la robustez de la estabilidad.Obtenci�on de la ftlad a trav�es de lqrSuponiendo que se conoce un modelo de la planta, expresado en el espacio deestados por el conjunto de ecuaciones:_x = A x+B uy = C x (9.1)donde se supone tambi�en, que las ecuaciones anteriores incluyen posibles escaladosy/o ampliaciones realizadas sobre el modelo de la planta, a f��n de adecuarla para eldise~no.El comportamiento deseado del sistema puede especi�carse de forma convenientemediante la optimizaci�on de una funci�on de coste J . Si se de�ne el vector:z =Mxen el que sus componentes son combinaciones lineales de las variables de estado (Mes una matriz constante de dimensiones adecuadas); y las matrices de ponderaci�on:Q = QT � 0 Rc = RTc > 0se trata de minimizar: J = Z 10 (zTQz + uTRcu)dt= Z 10 (xTMTQMx + uTRcu)dt (9.2)El problema anterior es el llamado lqr, cuya soluci�on es de la forma:u = �Kcxdenomin�andose a Kc matriz de realimentaci�on de estados. A partir de la soluci�onPc de la ecuaci�on algebraica de Riccati de control (AREc) siguiente:ATPc + PcA� PcBR�1c BTPc +Qc = 0 (9:3)

Page 216: Control Adaptativo y Robusto

200 Propiedades del regulador LQR-� �� - �(s)B C -Kc �6 G(s) y

x- s sabrFigura 9.1: Estructura regulador lqr (lqsf)con Qc = MTQMse obtiene: Kc = R�1c BTPcsiendo: Pc = P Tc � 0El problema tendr�a soluci�on Pc y ser�a �unica, si el par (A;B) es estabilizable(todos los modos inestables son controlables).Se de�ne Hc(s), como la funci�on (matriz) de transferencia en lazo abierto entrela entrada a la planta y la se~nal de retorno. Es la relaci�on entre la se~nal que entrapor el punto\a" y la que retorna por el punto\b" de la �gura 9.1. Se denominaFunci�on de Relaci�on del Retorno o de Lazo Abierto:Hc(s) = Kc�(s)Bdonde: �(s) = (sI �A)�1, y la correspondiente Funci�on de Diferencia del Retorno:Fc(s) = I +Hc(s)A partir de la ecuaci�on AREc y de algunas manipulaciones algebraicas (MacFar-lane 1979), se obtiene:F Tc (�s)RcFc(s) = Rc +GTc (�s)QGc(s) (9:4)con: Gc(s) =M(sI � A)�1B

Page 217: Control Adaptativo y Robusto

M�etodos de dise~no LTR 201En el caso de que: Rc = �Ise obtiene: F Tc (�s)Fc(s) � I (9:5)mostrando Safonov y Athans (1977) que la desigualdad anterior garantiza para elsistema un margen de fase (MF) m��nimo de 60� (se admite un cambio de fase deal menos 60� simult�aneamente en cada canal sin que produzca la inestabilidad delsistema), un margen de ganancia (MG) in�nito (frente a variaciones en forma devalor real � > 1, o modi�caci�on de la ganancia en continua, generados de formasimult�anea en todos los canales sin que el sistema pierda su estabilidad nominal)y un margen de tolerancia para reducci�on de la ganancia (TRG) de hasta �6db(reducci�on simult�anea de la ganancia 0:5 � � < 1, o sea de hasta el 50% de su valornominal, en cada canal sin que desestabilice al sistema de control).De 9.5 se desprende que: �i(FHc Fc) � 1y por tanto: �(FHc Fc) � 1como: �(FHc Fc) � �(FHc )�(Fc) = �2(Fc)se tendr�a que: �2(Fc) � 1 ) �(Fc) � 1dada la relaci�on Si = F�1c , y teniendo en cuenta la propiedad de los valores singularesde una matriz no singular P �(P�1) = 1�(P )se obtiene: �(Si) � 1 (9:6)lo cual tiene la interpretaci�on f��sica en el caso escalar, de que el sistema no ampli�car�alas perturbaciones actuantes a la salida de la planta.Por otro lado teniendo en cuenta que:Ti(s) = I � Si(s)con lo que: �(Ti) � �(I) + �(F�1c )� 1 + 1�(Fc)� 1 + 1=1 = 2 (9.7)

Page 218: Control Adaptativo y Robusto

202 Propiedades del regulador LQRLa desigualdad 9.7, puede interpretarse como una medida de la robustez de laestabilidad para el caso de incertidumbre multiplicativa no estructurada existente ala entrada de la planta. De forma que, a partir del teorema de peque~na ganancia(ver cap��tulo 8), una condici�on su�ciente para que el sistema permanezca establepara una incertidumbre no estructurada E(s) es que:�(E) � 1�(Ti)ya que en este caso, M(s) = Ti(s), y por tanto:�(E) � 12lo que f��sicamente equivale a decir que el sistema de control puede aceptar hasta un50% de incertidumbre relativa en la planta, manteniendo la estabilidad.Otra caracter��stica de Hc(s) es que para alg�un par de n�umeros reales f�; !og secumple: �(Hc) � �! ; 8 ! > !olo que se traduce en la propiedad de una ca��da de la ganancia del sistema de�20 db=dec a alta frecuencia.En resumen, puede decirse que el controlador lqr tiene las siguientes propiedades:� Ley de control �optima.� Amplios m�argenes de fase (MF) y ganancia (MG), (TRG).� Robustez de la estabilidad (rs) frente a incertidumbres de tipo multiplicativosituadas a la entrada de la planta.� Respuesta en frecuencia en lazo abierto con una pendiente de ca��da suave aalta frecuencia.Las propiedades anteriores son todas, salvo la �ultima, muy atractivas para unsistema de control. Ser��a deseable adem�as, si ello fuera posible, que manteniendo lastres primeras casi sin alteraci�on, se consiguiera un aumento de la pendiente de ca��daa alta frecuencia. Es en esa zona donde se mani�estan fundamentalmente los erroresde modelado, con lo que se reforzar��a la robustez frente a la din�amica inmodeladade alta frecuencia.

Page 219: Control Adaptativo y Robusto

M�etodos de dise~no LTR 203Ajuste de las ganancias principalesComo se ha visto para el problema lqr la matriz de transferencia de diferenciade retorno Fc(s) cumple la igualdad 9.4; si se supone, sin p�erdida de generalidad(bastar��a con escalar la entrada al sistema), que Rc = �I, queda:F Tc (�s)Fc(s) = Rc +GTc (�s)QGc(s)=�de la cual se deduce que (Doyle et al. 1981, Maciejouski 1989):�i(Fc) = "1 + �2i� (Q1=2Gc)#1=2 (9:8)y de esta se obtienen las siguientes expresiones para los valores singulares extremos:�(F�1c ) = "1 + �� (Q1=2Gc)#�1=2�(F�1c ) = "1 + �� (Q1=2Gc)#�1=2De las ecuaciones anteriores se deriva la posibilidad de modi�car los valoressingulares o ganancias principales de F�1c = Si, actuando sobre la matriz Q y elescalar �. Si en el rango de frecuencias de inter�es ! 2 D! se cumple:�(Hc)� 1la expresi�on 9.8 se reduce a: �i(Hc) � �i(Q1=2Gc)p� (9:9)la relaci�on 9.9 puede emplearse para realizar ajustes de Hc(s) en una doble vertiente:a) El valor del par�ametro � modi�ca de forma simult�anea todas las gananciasprincipales.b) La matriz Q puede emplearse para modi�car s�olo una de las ganancias prin-cipales dejando el resto inalteradas, por medio del empleo de las propiedadesde los valores y vectores singulares (ver ap�endice B.3).

Page 220: Control Adaptativo y Robusto

204 El controlador LQGAjuste de �i(Hc) para un\i" dadoDado el producto de matrices de orden m� pQ1=2Gc(j!)para una frecuencia particular ! = !1, es posible descomponerla en sus valoressingulares: Q1=2Gc(j!1) = U�V H = rXi=1 ui�ivHi ; r = minfm; pgsi se modi�ca Q1=2 en la forma:Q1=2 = Q1=2(I + �ujuHj )teniendo en cuenta la propiedad de los vectores singularesujuHi = ( 0 si i 6= j1 si i = j )se obtiene: Q1=2Gc(j!1) = (I + �ujuHj )Pri=1 ui�ivHi= Pri6=j ui�ivHi + (1 + �)uj�jvHjcon lo que �unicamente se modi�ca la ganancia principal �j que pasa de �j a (1+�)�j.Por tanto, bajo la hip�otesis 9.9 se tiene una forma expl��cita de manipular los �i(Hc)de forma independiente o unilateral para un\i" dado.9.3 El controlador LQGEl regulador lineal cuadr�atico gausiano (lqg) es un procedimiento b�asicamente for-mulado en el dominio temporal, y con tratamiento en lazo cerrado. Sin embargo,puede tambi�en plantearse como un procedimiento de optimizaci�on en el dominio fre-cuencial, tal y como se presenta en esta secci�on, as�� como siguiendo el enfoque dadoen el ap�endice A.3. En este apartado se describe en primer lugar el procedimientode dise~no lqg, y a continuaci�on se pasa al principal inter�es de este cap��tulo: losm�etodos de dise~no de control robusto denominados en general ltr. Se realiza paraello una formulaci�on en el espacio de estados, y un tratamiento en el dominio de lafrecuencia a la hora de formular los objetivos de dise~no.

Page 221: Control Adaptativo y Robusto

M�etodos de dise~no LTR 205- is i i

s --s �?���6

� �r - u Planta yu Kc �(s) BKo- 6C -

Figura 9.2: Estructura regulador lqg/ltr-iSi el sistema se encuentra sometido a perturbaciones estoc�asticas y/o el vectorde estado no es accesible, se emplea un observador para estimar los estados. Casode elegir como observador el �ltro de Kalman (kbf), se denomina al m�etodo lqg.Este tiene la ventaja de que minimiza la varianza del error de estimaci�on a partirde la caracterizaci�on de los ruidos, de los que se suponen conocidas las matrices decovarianza. En la �gura 9.2 se muestra la estructura del controlador lqg.Si el modelo de la planta junto con las perturbaciones estoc�asticas se puederepresentar por el conjunto de ecuaciones:_x = A x+B u+ � v1y = C x+ v2 (9.10)siendo v1; v2 realizaciones de ruido blanco gausiano caracterizados por:E[v1; vT1 ] = W � 0 ; E[v2; vT2 ] = Ro > 0 ; E[v1; vT2 ] = 0donde W;�; Ro son conocidos, estimados o elegidos de forma arbitraria de cara aldise~no del observador.La soluci�on del problema lqg se hace dividi�endolo en dos subproblemas inde-pendientes (Principio de Separaci�on) (Gopal, 1982):1. El problema de control: resuelto como lqr. Suponiendo que el vector deestados estimado coincide con el del proceso.

Page 222: Control Adaptativo y Robusto

206 El controlador LQG2. Y el problema del observador: resuelto como kbf.Para un modelo exacto de la planta, la estabilidad del sistema controlado por rea-limentaci�on de estados (lqr, o tambi�en nombrado como lqsf) garantizar�a tambi�enla del sistema empleando el vector de estados estimado (lqsef).Para resolver el subproblema del observador (�ltro Kalman):_x = A x+B u+Ko (y � y)y = C x (9.11)se necesita encontrar la matriz de ganancia del observador Ko. Para ello se resuelvela ecuaci�on algebraica de Riccati del observador (AREo):APo + PoAT � PoCTR�1o CPo +Qo = 0 (9:12)con: Qo = �V1�T ; Ko = PoCTR�1oPara (A;C) detectable (todos los modos inestables son observables) hay unasoluci�on Po �unica de 9.12, con Po = P To � 0De las ecuaciones del modelo de la planta 9.1, del observador 9.11, y la ley decontrol: u = �Kcxse puede de�nir el error de estimaci�on �:� = x� xresultando " _x_� # = " A�BKc BKc0 A�KoC # " x� #lo que indica que los polos del sistema en lazo cerrado son la uni�on de los poloscorrespondientes a la ley de control (lqr) y los polos del observador (kbf).El compensador lqg queda:K(s) = Kc(sI � A+BKc +KoC)�1Ko (9:13)y la ftla de�nida a la entrada de la planta:L(s) = K(s)G(s)

Page 223: Control Adaptativo y Robusto

M�etodos de dise~no LTR 207Es un hecho remarcado en la literatura, que el empleo de estimadores de estadospuede deteriorar la robustez del sistema, as�� como su comportamiento en lazo cerradosi no se tienen modelos muy precisos de la planta.La circunstancia de tratar de mejorar la robustez de un sistema lqg fu�e loque originalmente provoc�o el desarrollo de la metodolog��a lqg/ltr. Al incluir elestimador de estados, potencialmente pueden deteriorarse las propiedades del controllqr, o lo que es lo mismo de la ftla (L(s)) con respecto a la ftlad (Lt(s)).9.4 Controlador LTR basado en observadorComo se describe en el cap��tulo 8, las especi�caciones de dise~no pueden realizarsea trav�es de expresiones o cotas para ciertas funciones (matrices) de transferenciaen lazo abierto (ftla). Dependiendo de en qu�e puntos se de�nan tales ftla, nor-malmente a la entrada o a la salida de la planta, se emplear�a una estrategia dedise~no diferente. El m�etodo se denominar�a lqg/ltr-i, si se considera a la entradade la planta, y lqg/ltr-o si es a la salida, o tambi�en conocidos como m�etodos ltrbasados en observador, por derivarse tales m�etodos de la teor��a relacionada con losreguladores lqg, la cual emplea un �ltro de Kalman (observador de estado) paraestimar el vector de estado.9.4.1 M�etodo LQG/LTR-iExisten diferentes m�etodos para realizar la llamada recuperaci�on de la funci�on detransferencia en lazo abierto (Saberi et al, 1993), en este apartado se emplea elprocedimiento introducido por Doyle y Stein (1979); y que consiste en modi�carlos par�ametros libres de dise~no del observador, de forma que la ftla recupere lascaracter��sticas frecuenciales de la ftlad. Esto se consigue, en el caso de sistemasde fase m��nima (todos sus ceros se encuentran en el semiplano izquierdo), haciendodepender la matriz de covarianza del ruido en el proceso de un par�ametro escalar\q",llamado ganancia de recuperaci�on (gain recovery):Qo = Qo + qZsiendo Z = ZT � 0 una matriz arbitraria. Para el caso de sistema de fase m��nima(ver ap�endice A.2), se demuestra (Stein y Athans, 1987) que:limq!1K(s)G(s) = Kc(sI � A)�1B = Hc(s)

Page 224: Control Adaptativo y Robusto

208 Controlador LTR basado en observadorEl controlador lqg/ltr: K(s), sustituye la din�amica de la planta por la din�amicadeseada, y de�nida por Hc(s). Los ceros de K(s) corresponden a los ceros de Hc(s),y algunos de sus polos se emplean para cancelar los ceros de la planta G(s). Espor �esto, que el m�etodo s�olo garantiza una recuperaci�on asint�otica para plantascon modelos inversos estables. La presencia de ceros inestables tiene el efecto delimitar las caracter��sticas del comportamiento obtenible, independientemente de lametodolog��a de dise~no que se emplee. Sin embargo, si los ceros inestables de laplanta est�an lo su�cientemente alejados del ancho de banda del sistema de control,entonces es posible una recuperaci�on parcial en el rango de frecuencias de inter�es,y a efectos pr�acticos la presencia de tales ceros no afectan de manera sensible a larobustez y comportamiento del sistema a baja frecuencia.Es posible, que para alcanzar un nivel de recuperaci�on deseado, las demandasdel controlador sean excesivamente elevadas. Para un sistema con peque~nos erroresde modelado �ello no es cr��tico, sin embargo para sistemas donde las incertidumbresjuegan un importante papel, puede darse el caso extremo de que se provoque lainestabilidad del sistema de control. Basado en esta idea, se han propuesto pordiferentes autores (Athans, 1986; L�opez y Rubio, 1994) controladores lqg con re-cuperaci�on parcial (zonas de baja y media frecuencia) (ltr-i), el cual exhibir�a unascaracter��sticas de comportamiento similares al lqg en el rango de frecuencias deinter�es, y que adicionalmente presenta unas mejores propiedades de robustez frentea la presencia de din�amica inmodelada de alta frecuencia.Ejemplo: Dise~nos lqr, lqg, lqg/ltrSea el sistema dado por las siguientes ecuaciones:_x = Ax +Bu+ �wy = Cx + vdonde las matrices A, B, C, y � vienen dadas por:A = 0 1�3 �4 ! ; B = 01 ! ; C = � 2 1 � ; � = 35�61 !Dicho sistema corresponde a una funci�on de transferencia de la forma:G(s) = y(s)u(s) = s+ 2(s+ 1)(s+ 3)Se considera en primer lugar el control lqr. Para ello se trata de encontrar elregulador �optimo que minimice el siguiente criterio cuadr�atico o funci�on de coste:J = Z 10 (xTMTMx + u2) dt

Page 225: Control Adaptativo y Robusto

M�etodos de dise~no LTR 209donde se emplean:M = � 52:915 8:944 � ; Rc = 1; Q = diagf1; 1gCon estos datos puede ser calculado el regulador lineal cuadr�atico (lqr), bien apartir de la descripci�on por variables de estado, tal y como se detalla a lo largo deeste cap��tulo, o mediante el uso de funciones de transferencia, como se describe en elap�endice A. Siguiendo el primer m�etodo, y resolviendo la correspondiente ecuaci�onde Riccati de control se tendr�a que la matriz de realimentaci�on de estados es,Kc = [ 50 10 ]Las correspondientes funciones de transferencia implicadas en el desarrollo sonrespectivamente: Gc(s) =M�(s)B = 8:944s+ 52:915(s+ 1)(s+ 3)Hc(s) = 50 + 10s(s+ 1)(s+ 3)La funci�on de transferencia correspondiente al bucle cerrado se obtiene de laexpresi�on general: Gbc(s) = C(sI � A+BKc)�1Bo en el caso de tratarse de un sistema de simple entrada-salida, tambi�en puedeobtenerse de, Gbc(s) = G(s)1 +Gc(s) = s+ 2s2 + 14s+ 53 (9:14)Con este regulador lqr se cumplen las especi�caciones del sistema en buclecerrado (regulador �optimo, que sit�ua los polos del sistema en lazo cerrado en lasposiciones �7:0� 2:0j), y la funci�on de transferencia del bucle abierto Hc(s), tienecomo era de esperar muy buenas caracteristicas de robustez: margen de fase de 86�y margen de ganancia in�nito. Sin embargo, si el estado no es accesible es necesariodise~nar un observador de estado o �ltro de Kalman para estimarlo, con lo cualse obtiene el correspondiente controlador lqg. Para ello se tendr�an las siguientesmatrices de covarianza: Qo = ��T ; Ro = 1que tras resolver la correspondiente ecuaci�on algebraica de Riccati se obtiene lamatriz de ganancia del �ltro de KalmanKo. Una vez conocidasKc yKo, el reguladorse puede obtener de forma general a partir de la expresi�on,K(s) = Kc(sI � A+BKc +KoC)�1Ko

Page 226: Control Adaptativo y Robusto

210 Controlador LTR basado en observadorde donde se obtiene: K(s) = 1000(s+ 2:6)(s� 18:66)(s+ 42:7)Si se calcula la funci�on de transferencia en bucle cerrado con el regulador lqg,se obtiene la misma obtenida anteriormente (ecuaci�on 9.14), dado que la inclusi�ondel observador no modi�ca el lazo cerrado del sistema de control. Sin embargo, si seanaliza la funci�on de transferencia en lazo abierto K(s)G(s), se obtiene un margende fase de 15� y un margen de ganancia de �1:9 db. Los cuales son sensiblementeinferiores a los obtenidos con el regulador lqr. Por lo que la robustez del sistemacon el regulador lqg sufre un serio deterioro.A �n de mejorar la robustez, a continuaci�on se dise~na un regulador lqg/ltr.Para ello, se modi�ca la matriz de covarianza en la forma:Qo = ��T + qBBTPara dise~nar el regulador lqg/ltr se va incrementando q desde cero (reguladorlqg) hasta un valor razonable para tener un compromiso entre la estimaci�on y larobustez. Este proceso se puede ver en la �gura 9.3, donde se representa el diagramade Nyquist de la funci�on de transferencia en bucle abierto para distintos valores delpar�ametro q; as�� mismo en la tabla adjunta se dan los valores de los m�argenes deestabilidad obtenidos en cada caso.Margen de Margen deq ganancia (db) fase (grados)0 -1.9 15.0100 -2.6 20.0500 -5.2 32.51000 -8.0 42.510000 1 74.59.4.2 M�etodo LQG/LTR-oLa t�ecnica consiste en explotar la dualidad existente entre los problemas lqr y kbf.Esta lleva a demostrar que si se establecen las equivalencias:AT ! A ; CT ! BBT ! C ; �!MV1 ! Q ; Ro ! Rc

Page 227: Control Adaptativo y Robusto

M�etodos de dise~no LTR 211

-2

-1.5

-1

-0.5

0

0.5

1

-3 -2.5 -2 -1.5 -1 -0.5 0

Real G(jw)

Imag

G(jw

)

q=0

q=100

q=500

q=1000

q=10000

Glqr

Figura 9.3: Diagrama de Nyquist para diferentes qla funci�on (matriz) de transferencia en lazo abierto del observador (kbf):Ho(s) = C(sI � A)�1Ko = C�(s)Kogoza de las mismas propiedades analizadas para el controlador lqr. Con la diferen-cia, de que ahora se presentan para una ftlad de�nida a la salida de la planta envez de la entrada (ver �gura 9.4).Para el caso de planta de fase m��nima se conseguir�a la recuperaci�on asint�otica-� �� - �(s)Ko C6-r y -ss baFigura 9.4: Estructura de Ho(s) (kbf)

Page 228: Control Adaptativo y Robusto

212 Controlador LTR no basado en observador- m-� ��- Ko - m �(s) -KcB �?C66r- - Planta -y

Figura 9.5: Estructura regulador lqg/ltr-ode la ftlad a la salida de la planta:limq!1G(s)K(s) = C(sI � A)�1Ko = Ho(s)donde ahora el par�ametro\q" (ganancia de recuperaci�on) se emplea para modi�carla matriz de ponderaci�on del estado, Qc en 9.2, de la forma:Qc = Qc + qZsiendo Z = ZT � 0 una matriz arbitraria. En la �gura 9.5 se muestra la estructuradel regulador lqg/ltr-o.9.5 Controlador LTR no basado en observadorEl compensador obtenido con el m�etodo lqg/ltr-i tiene la forma 9.13, la ftlatomada a la entrada es: L(s) = K(s)G(s), y la ftlad especi�cada es: Lt(s) =Hc(s). El error entre ambas (error de recuperaci�on):E(s) = Lt(s)� L(s) (9:15)puede expresarse como:E(s) = N(s)[I +N(s)]�1[I +Hc(s)] (9:16)Se de�ne el nivel de recuperaci�on como el tama~no de E(s):�[E(s)] (9:17)

Page 229: Control Adaptativo y Robusto

M�etodos de dise~no LTR 213El error de recuperaci�on se anula si y solo si:N(s) = 0 ; 8 !siendo: N(s) = Kc(sI � A+KoC)�1B (9:18)En ese caso, se dice que se produce una recuperaci�on exacta de la ftlad a laentrada de la planta (eLTRi). En otro caso, se dir�a que la recuperaci�on ha sido soloaproximada (aLTRi), si el tama~no de N(s) se hace su�cientemente peque~no paracualquier !. Se tratar�a de encontrar una matriz Ko(q) que consiga:N(s) = Kc(sI � A+Ko(q)C)�1B ! 0 (9:19)Para mantener la independencia entre los dise~nos de la realimentaci�on de estados yel observador, para una matriz Kc dada, se cumplir�a la relaci�on 9.19 si:(sI � A +Ko(q)C)�1B ! 0q ! 1Se puede comprobar, que a medida que el par�ametro\q" aumenta, tambi�en lo haceel tama~no de Ko(q), de forma que:si q !1 entonces kKo(q)kF !1donde se de�ne: kKokF = qtraza(KoKTo )La dependencia anterior ocasiona que para conseguir una recuperaci�on aprox-imada con �[N(s)] lo su�cientemente peque~no, tenga a veces que aumentar Koexcesivamente, provocando un incremento del ancho de banda del compensador, locual va a ser contraproducente en algunas situaciones pr�acticas.Si se considera u la se~nal a la salida del compensador, y u(s) la se~nal de controlde entrada a la planta, puede obtenerse:u(s) = �N(s)u(s)�Kc(sI � A+KoC)�1y(s)Motivado por la relaci�on anterior y dado que la condici�on de eLTRi se consigueanulando N(s), o equivalentemente haciendo que u(s) no dependa expl��citamente deu(s), Chen y col. (Chen et al. 1991) desarrollan una estructura para controlador nobasada en observador (cnbo), donde la se~nal que genera el controlador no depende

Page 230: Control Adaptativo y Robusto

214 Controlador LTR no basado en observador- j

j- -

- 6���6r -u Kc �(s) Koxc -u y

CPlanta

Figura 9.6: Estructura del cnbo ltr-ide manera expl��cita de la se~nal de control a la planta (ver �gura 9.6). Se eliminade esta forma la dependencia de la matriz de distribuci�on B de la se~nal de control,caracter��stica de las estructuras convencionales basadas en observador.Las ecuaciones descriptivas del cnbo son:_xc = (A�KoC)xc +Koyyc = Kcxcu = yc (9.20)y equivalentemente la representaci�on entrada-salida:K(s) = Kc(sI � A +KoC)�1Ko (9:21)Si se compara su estructura con la cbo (ecuaci�on 9.13), se comprueba que�unicamente di�eren en que no aparece el t�ermino BKc.Para obtener Ko y Kc se pueden resolver de forma similar a la realizada con elcontrolador basado en observador convencional. El controlador se desea estable, deforma que hay que examinar los autovalores �i(A � KoC) para cada Ko obtenido

Page 231: Control Adaptativo y Robusto

M�etodos de dise~no LTR 215durante el proceso de dise~no. Para este regulador no se cumple el principio deseparaci�on, por lo que para garantizar la estabilidad del sistema nominal en lazocerrado se analiza si la matriz:Alc = " A�KoC KoC�BKc A #cumple: Re[�i(Alc)] < 0Se demuestra (Chen et al. 1991), que existe un valor de la ganancia de recu-peraci�on qo tal que 8q � qo, el sistema nominal en lazo cerrado y el controlador sonasint�oticamente estables.El error de recuperaci�on 9.15 obtenido con el cnbo es:Ec(s) = N(s) (9:22)Si se toma la misma matriz Ko para cnbo y cbo, y se comparan 9.16 y 9.22,se obtiene que el nivel de recuperaci�on (9.17) obtenido para el primero es superior.As��, si se cumple: �[Lt(s)]� 1 8! 2 D!y se supone un cierto nivel de recuperaci�on:�[N(s)]� 1siendo Lt(s) = Hc(s) y D! la regi�on de frecuencias de inter�es. La relaci�on entre elerror de recuperaci�on del cbo (E(s)) y del cnbo (Ec(s)) se obtiene de:�(E) = �[M(I +M)�1(I +Hc)]� �(M)�[(I +M)�1]�(I +Hc)= �(M)�(I +Hc)�(I +M) = �(Ec)�(I +Hc)�(I +M)� �(Ec)[�(Hc)� 1]�(M) + 1 � �(Ec)�(Hc)1 � �(Ec)concluyendo: �(E)� �(Ec) 8 ! 2 D!Se obtiene que un cnbo consigue mayor nivel de recuperaci�on que empleando uncbo para el mismo valor de Ko(q) (y por tanto para el mismo valor de la ganancia

Page 232: Control Adaptativo y Robusto

216 Controlador LTR no basado en observador-� �� Ko �(s) -Kc

B6r y- Planta� ��? xc u --

Figura 9.7: Estructura ltr-o (cnbo)de recuperaci�on\q"). Una consecuencia inmediata de gran utilidad pr�actica, es quepara un mismo grado de recuperaci�on el cnbo necesita matrices Ko con tama~nos(kKokF ) menores que los obtenidos con el cbo; y consecuentemente el reguladortendr��a un ancho de banda menor, protegiendo de esa forma al sistema de demandasde control excesivas, y en algunos casos de la posible saturaci�on de los actuadores.Otra ventaja consiste en que de esa forma se evita la ampli�caci�on innecesaria delruido de medida; y �nalmente una mayor robustez frente a la din�amica no modeladade alta frecuencia.En el desarrollo anterior se ha analizado la s��ntesis ltr-i con el cnbo. Tambi�enes posible realizar un dise~no ltr-o especi�cando una ftlad a la salida de la planta.En este caso la estructura del regulador es la representada en la �gura 9.7, con lasecuaciones descriptivas del cnbo ltr-o dadas por:_xc = (A� BKc)xc +Ko(y � r)yc = �Kcxcu = yc (9.23)y la representaci�on entrada-salida del regulador:K(s) = Kc(sI � A+BKc)KoSi se compara con la estructura cbo (ecuaci�on 9.13), se comprueba que �unicamentedi�eren en que no aparece el t�ermino KoC. Representa el caso dual del regulador

Page 233: Control Adaptativo y Robusto

M�etodos de dise~no LTR 217ltr-i (cnbo), por lo que los resultados anteriores obtenidos para �este, son igual-mente v�alidos (Saberi et al, 1993).Como se comenta brevemente en la introducci�on y se ha planteado a lo largode la exposici�on de este cap��tulo, el procedimiento ltr constituye una metodolog��ade dise~no sistem�atica que ha transcendido de sus or��genes, y aunque por tradici�onsigue denomin�andose lqg/ltr, se ha independizado del problema lqg. Dado que,el m�etodo ltr consiste en de�nitiva en especi�car una funci�on (matriz) de trans-ferencia en lazo abierto (que cumpla las especi�caciones de dise~no deseadas), y atrav�es del ajuste de uno de los par�ametros de dise~no se realiza la recuperaci�on oaproximaci�on de la ftlad por medio de un regulador ltr.Ejemplo: Dise~no ltr-i con estructura no basada en observadorA continuaci�on se comparan las recuperaciones obtenidas mediante un regula-dor lqg/ltr-i convencional (cbo), y un regulador ltr-i no basado en observador(cnbo), para el mismo ejemplo visto anteriormente. Para ello, se parte del mismosistema dado en el ejemplo anterior. El procedimiento de recuperaci�on, al igualque antes se indicara, consiste en hacer depender la matriz de covarianza Qo delpar�ametro q, o tambi�en llamado ganancia de recuperaci�on, en la formaQo = ��T + qBBTEl regulador lqg/ltr-i convencional se obtiene de,K(s) = Kc(sI � A+BKc +KoC)�1Komientras que el regulador ltr-i con estructura no basada en observador est�a dadopor, K(s) = Kc(sI � A+KoC)�1KoLos niveles de recuperaci�on, o grados de aproximaci�on a la funci�on de transferen-cia en lazo abierto obtenida con el regulador lqr, conseguidos por ambos reguladores(cbo y cnbo) pueden verse en las �guras 9.8 a 9.13, para diferentes valores de q(las curvas continuas corresponden al control lqr, y las de trazos al ltr). Puedeverse c�omo la recuperaci�on obtenida con el cnob es sensiblemente superior al cbo.Ello genera una consecuencia positiva de cara a la robustez frente a la din�amicainmodelada de alta frecuencia, as�� como la menor sensibilidad frente a las perturba-ciones. Ya que a medida que aumenta q se incrementa la ganancia del observadory consecuentemente el ancho de banda del regulador. De forma que para alcanzar

Page 234: Control Adaptativo y Robusto

218 Controlador LTR no basado en observador-60

-40

-20

0

20

40

10-3 100 103

CBO q= 0

w (rad/s)

mag

(L)

(db)

-60

-40

-20

0

20

40

10-3 100 103

CNBO q= 0

w (rad/s)

mag

(L)

(db)

-200

-150

-100

-50

0

10-3 100 103

w (rad/s)

fase

(L)

(gr)

-200

-150

-100

-50

0

10-3 100 103

w (rad/s)

fase

(L)

(gr)

Figura 9.8: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q1-100

-50

0

50

10-3 100 103

CBO q= 500

w (rad/s)

mag

(L)

(db)

-100

-50

0

50

10-3 100 103

CNBO q= 500

w (rad/s)

mag

(L)

(db)

-200

-150

-100

-50

0

10-3 100 103

w (rad/s)

fase

(L)

(gr)

-200

-150

-100

-50

0

10-3 100 103

w (rad/s)

fase

(L)

(gr)

Figura 9.9: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q2

Page 235: Control Adaptativo y Robusto

M�etodos de dise~no LTR 219-100

-50

0

50

10-3 100 103

CBO q= 2500

w (rad/s)

mag

(L)

(db)

-100

-50

0

50

10-3 100 103

CNBO q= 2500

w (rad/s)

mag

(L)

(db)

-200

-150

-100

-50

0

10-3 100 103

w (rad/s)

fase

(L)

(gr)

-200

-150

-100

-50

0

10-3 100 103

w (rad/s)

fase

(L)

(gr)

Figura 9.10: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q3-100

-50

0

50

10-3 100 103

CBO q= 3600

w (rad/s)

mag

(L)

(db)

-100

-50

0

50

10-3 100 103

CNBO q= 3600

w (rad/s)

mag

(L)

(db)

-400

-300

-200

-100

0

10-3 100 103

w (rad/s)

fase

(L)

(gr)

-400

-300

-200

-100

0

10-3 100 103

w (rad/s)

fase

(L)

(gr)

Figura 9.11: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q4

Page 236: Control Adaptativo y Robusto

220 Controlador LTR no basado en observador-60

-40

-20

0

20

40

10-3 100 103

CBO q= 25000

w (rad/s)

mag

(L)

(db)

-60

-40

-20

0

20

40

10-3 100 103

CNBO q= 25000

w (rad/s)

mag

(L)

(db)

-200

-150

-100

-50

0

10-3 100 103

w (rad/s)

fase

(L)

(gr)

-200

-150

-100

-50

0

10-3 100 103

w (rad/s)

fase

(L)

(gr)

Figura 9.12: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q5-60

-40

-20

0

20

40

10-3 100 103

CBO q= 1e+005

w (rad/s)

mag

(L)

(db)

-60

-40

-20

0

20

40

10-3 100 103

CNBO q= 1e+005

w (rad/s)

mag

(L)

(db)

-200

-150

-100

-50

0

10-3 100 103

w (rad/s)

fase

(L)

(gr)

-200

-150

-100

-50

0

10-3 100 103

w (rad/s)

fase

(L)

(gr)

Figura 9.13: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q6

Page 237: Control Adaptativo y Robusto

M�etodos de dise~no LTR 221- Lt(s) - jE(s)- ?L(s) -rr ba

Figura 9.14: El error de recuperaci�on como una incertidumbre aditivauna recuperaci�on adecuada, sea necesario incrementar de forma excesiva el valor delpar�ametro q o ganancia de recuperaci�on.Se extrae por tanto del an�alisis anterior, que la ventaja b�asica del regulador ltr(cnbo) es que consigue una aproximaci�on o recuperaci�on mejor que un reguladorlqg/ltr (cbo) para un mismo valor de q. Lo cual tiene mucha relevancia de caraa la implementaci�on f��sica del regulador en un ambiente real.9.6 Controlador LTR=H1En el cap��tulo siguiente se trata ampliamente la teor��a relacionada con el controlH1.Sin embargo, a continuaci�on se plantea un problema particularmente interesante: setrata de encontrar un regulador lqg/ltr-i, tal que una medida de la aproximaci�onde la respuesta en frecuencia en lazo abierto conseguida por el regulador ltr al lqrest�e acotada superiormente. Dicha medida se va a caracterizar mediante una cotaH1, tal y como se describe a continuaci�on.En este apartado se presenta un procedimiento para obtener un controladorlqg/ltr que consigue aproximar la respuesta en frecuencia en lazo abierto (ftla)a una especi�cada (ftlad), con un determinado grado de aproximaci�on o de re-cuperaci�on. La soluci�on se obtiene resolviendo un problema de control sub�optimoH1. Como ya se ha descrito en este cap��tulo, el procedimiento lqg/ltr-i consisteen encontrar un controlador K(s) que consiga acercar a la ftla: L(s) = K(s)G(s)a una ftlad: Lt(s) = Hc(s) dada.

Page 238: Control Adaptativo y Robusto

222 Controlador LTR=H1Para el an�alisis del problema de la recuperaci�on, puede interpretarse a L(s) comosi se tratara de Lt(s) con una incertidumbre aditiva (ver �gura 9.14):E(s) = L(s)� Lt(s)Se de�ne el grado de recuperaci�on (Saeki 1992), como:�E = kE(s)[I + Lt(s)]�1k1 (9:24)Si se emplea un cbo, se obtiene un error de recuperaci�on que puede expresarse:E(s) = Kc(sI � A+BKc +KoC)�1B[I +Hc(s)] (9:25)como se desea que E(s) sea lo menor posible (al menos en el rango de frecuencias deinter�es), se puede plantear el problema de conseguir un grado de recuperaci�on pordebajo de un m��nimo deseable �E, y expresarlo como una cota H1.Teniendo en cuenta la de�nici�on 9.24 y la expresi�on 9.25 queda:�E = kKc(sI � A+BKc +KoC)�1B[I +Hc(s)][I +Hc(s)]�1k1 < �E (9:26)lo que equivale a encontrar una matriz Ko(q) que satisfaga:kKc(sI � A +BKc +KoC)�1Bk1 < �E (9:27)Para obtener la soluci�on del problema anterior, se tiene el siguiente teorema(Saeki, 1992):Teorema: Existe una matriz Ko, que satisface la ecuaci�on 9.27, si y solo si laecuaci�on algebraica de Riccati:(A�BKc)X +X(A�BKc)T �X(1�CTC � 1�2EKTc Kc)X + �Q+BBT = 0 (9:28)tiene una soluci�on X = XT > 0, para un n�umero real � > 0, lo su�cientementepeque~no y una matriz arbitraria Q = QT > 0. Obteni�endose como soluci�on:Ko = 12�XCTEl papel desempe~nado por � es similar al de 1=q2 en el procedimiento de recu-peraci�on descrito en apartados anteriores. El resultado anterior es v�alido tanto paraplantas de fase m��nima as�� como para plantas de fase no m��nima. A continuaci�on seda un procedimiento a seguir para el c�alculo del regulador LTR=H1:

Page 239: Control Adaptativo y Robusto

M�etodos de dise~no LTR 2231. Se elige una matriz arbitraria sim�etrica de�nida positiva Q, un valor de �Edentro del intervalo 0 < �E < 1y un valor lo su�cientemente peque~no de � = �1 > 02. Se resuelve la ecuaci�on de Riccati 9.28.3. Si su soluci�on X no es de�nida positiva se incrementa el valor de �E y sevuelve al paso 2.4. Si X es de�nida positiva se resuelve la ecuaci�on 9.28 para distintos valores de� 2 (0; �1), para todos los cuales la ecuaci�on de Riccati tiene soluci�on de�nidapositiva.5. Se elige la matriz Ko para un valor de � del intervalo anterior, para el cual seobtiene el valor inferior de la norma de Frobenius de la matriz Ko,kKkF = qtraza (KTo Ko)Con el procedimiento anterior, se consigue el grado de recuperaci�on deseado, ala vez que se evita incrementar el tama~no de Ko, y con ello el que el ancho de bandaaumente en exceso, protegiendo por tanto al sistema frente a la din�amica inmode-lada de alta frecuencia, de las perturbaciones y ruidos de medida de los sensores.Ejemplo: Controlador LTR=H1Se van a considerar dos casos, el primero correspondiente a una planta de fasem��nima (caso 1), y el segundo (caso 2) que trata con una planta de fase no m��nima;a �n de ver la validez del procedimiento para ambos tipos de plantas.Para ambos casos se emplea,A = " 0 1�3 �4 # ; B = " 01 #la matriz de realimentaci�on de estados es Kc = [ 50 10 ], y la matriz Q se elige dela forma, Q = " 1 00 1 #

Page 240: Control Adaptativo y Robusto

224 Controlador LTR=H1Para caso 1 (fase m��mina):C = h 2 1 i ; y se elige �E = 0:1Para caso2 (fase no m��nima):C = h 2 �0:1 i ; y se elige �E = 0:35En las �guras 9.15 y 9.16 se muestra la dependencia de la norma de Frobeniusde la matriz de ganancia del observador Ko en funci�on del par�ametro �. Para todoslos valores de � mostrados en dichas �guras se consiguen respectivamente�E < 0:1 (fase m��nima)�E < 0:35 (fase no m��nima)Sin embargo, se elige el valor de � para el que se obtiene el valor de kKokF inferior.Y por tanto, el regulador consigue el objetivo pre�jado, pero con un ancho de bandainferior; protegiendo as�� al sistema frente a las incertidumbres, perturbaciones yruidos que afectan a la planta.

Page 241: Control Adaptativo y Robusto

M�etodos de dise~no LTR 225

0

200

400

600

800

1000

1200

1400

1600

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6

x10-5epsilon

Nor

ma

de F

robe

nius

de

Ko

Figura 9.15: Norma de Frobenius en funci�on de � para sistema de fase m��nima

3

3.2

3.4

3.6

3.8

4

4.2

4.4x105

1 2 3 4 5 6 7 8 9

x10-9epsilon

Nor

ma

de F

robe

nius

de

Ko

Figura 9.16: Norma de Frobenius en funci�on de � para sistema de fase no m��nima

Page 242: Control Adaptativo y Robusto

226 Controlador LTR=H1

Page 243: Control Adaptativo y Robusto

Cap��tulo 10Controladores H110.1 Introducci�onComo se ha descrito en el cap��tulo 8, una forma de establecer las especi�caciones dedise~no, consiste en la minimizaci�on de determinada funci�on de coste formulada en eldominio frecuencial. Dos medidas de comportamiento, ampliamente empleadas enlos problemas de control �optimo y robusto, son las normas H2 y H1. La soluci�onal problema de control de optimizaci�on H2 (tambi�en denominado de Wiener-Hopf)fue desarrollada durante las d�ecadas de los 60 y 70; mientras que el dise~no con H1se inici�o en el decenio de los 80 y contin�ua a�un su desarrollo.La formulaci�on del problema de control �optimo H1 fu�e realizada por Zames en1981 para el caso escalar y basada en una representaci�on entrada-salida, obteniendola soluci�on del problema en 1984 (Zames y Francis, 1984). Posteriormente los mismosautores obtienen la soluci�on para el caso multivariable.Los primeros algoritmos para la resoluci�on de los problemas H1, desarrolladosdesde 1984 a 1988, ten��an el inconveniente de que el controlador obtenido era, engeneral, de un orden elevado (Francis, 1987) comparado con el de la planta, porlo que como paso previo a la implementaci�on f��sica del regulador era convenienterealizar un intenso trabajo para obtener reguladores de menor dimensi�on.Es a partir del trabajo de Doyle y colaboradores (1989), cuando se da un fuerteimpulso para la soluci�on algor��tmica de los problemas de control H1, obteni�endoseun controlador de la misma dimensi�on que la planta ampliada, o tambi�en deno-227

Page 244: Control Adaptativo y Robusto

228 Justi�caci�on del control H1minada planta generalizada, (constituida por el modelo del proceso junto con lasmatrices de ponderaci�on que constituyen las especi�caciones de dise~no). Con ello,da comienzo la llamada segunda generaci�on de algoritmos en el espacio de estadosde la teor��a H1. Caracterizada por el planteamiento del problema de optimizaci�onformulado en el espacio de estados y resuelto, de forma m�as simple, a partir dedos ecuaciones algebraicas de Riccati desacopladas. En este cap��tulo se tratan enprimer lugar las t�ecnicas inicialmente desarrolladas para la soluci�on de los problemasde control H1, pasando a continuaci�on a describir las t�ecnicas basadas en el espaciode estados.10.2 Justi�caci�on del control H1En este apartado se trata de justi�car la utilidad del control H1 en la teor��a decontrol. Para ello, se ha elegido el planteamiento de dos problemas de controlesenciales: el problema del comportamiento nominal �optimo, y el problema de laestabilidad robusta. En ambos casos, y a �n de simpli�car la exposici�on, as�� comopara que el lector familiarizado con la teor��a cl�asica de control lo encuentre m�asameno, se trata en ambos casos el problema escalar. Tambi�en se presenta la conexi�onentre la teor��a de juegos diferencial y el control H1.10.2.1 Interpretaci�on H1 del comportamiento nominalEl m�etodo de optimizaci�on de sistemas de control H1 est�a relacionado con la mini-mizaci�on del valor de pico de la respuesta en frecuencia de cierta funci�on en buclecerrado. Para aclarar y profundizar en el signi�cado de la aseveraci�on anterior,consid�erese el ejemplo del sistema b�asico de control de la �gura 10.1; donde la plantatiene la funci�on de transferencia G(s) y el controlador K(s), la se~nal d representalas perturbaciones actuando sobre el sistema y la se~nal y la salida del sistema.A partir de la �gura 10.1, puede obtenerse la dependencia de la respuesta delsistema y la variable de control, con el resto de variables que act�uan sobre el sistema.Queda: y(s) = T (s) r(s) + S(s) d(s)� T (s) n(s) (10.1)u(s) = K(s) S(s) [r(s)� n(s)� d(s)] (10.2)Como puede verse en la ecuaci�on 10.1, la funci�on de sensibilidad S caracteriza

Page 245: Control Adaptativo y Robusto

Controladores H1 229-� �� - - -� �� -

�� ��66

?K(s) G(s)r u ydnFigura 10.1: Estructura de un sistema de control convencionalel comportamiento del sistema de control con respecto a las perturbaciones (d). Unproblema de dise~no puede consistir en obtener un controlador K que consiga unrechazo o atenuaci�on considerable de las perturbaciones,S � 0al menos en la zona de frecuencias de actuaci�on de la perturbaci�on.El problema original considerado por Zames (1981) consiste en encontrar uncompensador K que haga al sistema de control estable y minimice el valor de picode�nido como, k S k1= max! jS(j!)j (10:3)Dado que para algunas funciones el valor de pico puede no existir, se reemplaza�este por el supremo o menor de las cotas superiores, as�� que,jjSjj1 = sup! jS(j!)j (10:4)En general, para el caso multivariable, signi�ca minimizar el supremo del valorsingular m�aximo. k S k1= sup! �[S(j!)]La justi�caci�on de este problema reside en que si el valor de pico de la funci�on desensibilidad es peque~no, entonces la magnitud de S necesariamente es peque~na para

Page 246: Control Adaptativo y Robusto

230 Justi�caci�on del control H1todas las frecuencias, y por tanto las perturbaciones ser�an atenuadas para todaslas frecuencias. La minimizaci�on de jjSjj1 es la optimizaci�on del peor caso, porqueello equivale a la minimizaci�on del efecto sobre la salida de la peor perturbaci�on (esdecir, una perturbaci�on arm�onica a la frecuencia donde jSj tiene el valor de pico).El problema del peor caso tiene una interpretaci�on matem�atica muy signi�cativa,tal y como se expone a continuaci�on. Supuesto que la pertubaci�on d es desconocidapara las frecuencias de inter�es, pero tiene energ��a �nita, el valor,jjdjj2 = sZ 1�1 jd(t)j2dt (10:5)se conoce como la norma-2 de la perturbaci�on d. La energ��a de d es el cuadrado dela norma-2. Entonces, la norma jjSjj del sistema S con entrada d y salida y inducidapor la norma-2, se de�ne como,jjSjj = supd:jjdjj2<1 jjyjj2jjdjj2 (10:6)De aqu��, se deriva que la norma est�a directamente relacionada con la gananciade energ��a para la entrada con la distribuci�on frecuencial peor posible. Utilizandoel teorema de Parseval se llega a que,jjSjj = jjSjj1 (10:7)Por ello, el valor de pico es precisamente la norma del sistema inducida por lasnormas-2 sobre las se~nales de entrada y salida. La norma es conocida como norma-1del sistema.La optimizaci�on del peor caso sugiere un paradigma de la teor��a de juegos: eldise~nador desea determinar el compensador K que ofrece la mejor protecci�on contrala peor pertubaci�on que se puede dar u ocurrir sobre el sistema. Esto explica porqu�een algunos trabajos te�oricos la optimizaci�on H1 es tratada desde el punto de vistade la teor��a de juegos diferencial.Si se realiza una breve re exi�on, se observa que la minimizaci�on de jjSjj1 comotal no es una herramienta �util de dise~no. La respuesta en frecuencia de cada plantay compensador f��sico decrece a alta frecuencia. Esto signi�ca que a menudo lasensibilidad S puede hacerse peque~na a baja frecuencia pero eventualmente tiendea un valor asint�otico a alta frecuencia. Por ello, un valor peque~no de S a bajafrecuencia no se re eja en el valor de pico, pero es de considerable importancia para

Page 247: Control Adaptativo y Robusto

Controladores H1 231las especi�caciones del sistema de control. Por esta raz�on, es habitual introduciruna funci�on de peso dependiente de la frecuencia W y considerar la minimizaci�onde, jjWSjj1 = sup! jW (j!)S(j!)j (10:8)La forma habitual de elegir W es que sea grande a baja frecuencia, y vayadecreciendo a medida que aumente la frecuencia. El problema de minimizaci�onde la sensibilidad ponderada as�� de�nido, tiene ciertos aspectos interesantes. Sinembargo, no tiene en cuenta las limitaciones f��sicas en la variable de control delsistema. Por lo que habr��a que modi�car la funci�on de coste a minimizar, de formaque �ello se tuviera en consideraci�on.10.2.2 Interpretaci�on H1 de la estabilidad robustaA continuaci�on se ilustra la conexi�on entre la minimizaci�on del valor de pico y eldise~no para obtener una estabilidad robusta. Para ello se va a considerar el diagramade Nyquist mostrado en la �gura 10.2, que corresponde a la funci�on en lazo abiertoL = GK de un sistema de control escalar gen�erico como el de la �gura 10.1. Enparticular, se analiza si el sistema realimentado permanece estable bajo la existenciade una incertidumbre que modi�ca la funci�on de transferencia desde su valor nominalLo al valor actual o real L.En el desarrollo siguiente se supone que el sistema es estable en bucle abierto (osea, L representa a un sistema estable). Tambi�en se asume que el sistema nominalen lazo cerrado est�a bien dise~nado, en el sentido de que es estable. Por lo que eldiagrama de Nyquist del sistema nominal, Lo, no rodea al punto cr��tico (�1; 0j) delplano complejo. El sistema real ser�a tambi�en estable en lazo cerrado si el corres-pondiente diagrama de Nyquist de L tampoco rodea a dicho punto. Se demuestraque el diagrama de Nyquist no rodea al punto -1 si,jL(j!)� Lo(j!)j < jLo(j!) + 1j 8 ! 2 < : (10:9)Esto es equivalente a,jL(j!)� Lo(j!)jLo(j!) : jLo(j!)jjLo(j!) + 1j < 1 8 ! 2 < : (10:10)De�niendo la funci�on de sensibilidad complementaria To del sistema nominal enbucle cerrado como, To = 1� So = 1� 11 + Lo = Lo1 + Lo (10:11)

Page 248: Control Adaptativo y Robusto

232 Justi�caci�on del control H1(0,0)

(-1,0j)

Im

Re

L(jw)

L (jw)o

Figura 10.2: Interpretaci�on de la estabilidad robusta con el diagrama de Nyquistsiendo So la funci�on de sensibilidad nominal. Entonces, a partir de la ecuaci�on(10.10) se tendr�a que si,jL(j!)� Lo(j!)jLo(j!) :jTo(j!)j < 1; 8 ! (10:12)el sistema con incertidumbre (o sistema real) ser�a estable en bucle cerrado.El factor jL(j!)� Lo(j!)j=jLo(j!)j en esta expresi�on, representa el tama~no rela-tivo de la incertidumbre frente al valor nominal Lo. Supuesto que este valor relativoes una funci�on de la frecuencia y que al menos se conoce una cota de la misma dadapor, jL(j!)� Lo(j!)jjLo(j!)j � jWT (j!)j; 8 ! (10:13)Entonces, jL(j!)� Lo(j!)jLo(j!) � jTo(j!)j == jL(j!)� Lo(j!)j=jLo(j!)jjWT (j!)j � jWT (j!)To(j!)j < jWT (j!)To(j!)j (10:14)

Page 249: Control Adaptativo y Robusto

Controladores H1 233de aqu��, si se cumple, jWT (j!)To(j!)j < 1; 8 ! 2 < : (10:15)por (10.12) el sistema en bucle cerrado es estable para toda incertidumbre limitadapor (10.13). Se puede demostrar que la condici�on (10.13) es una condici�on necesariay su�ciente para la estabilidad robusta del sistema (Morari et al. 1989).Se ha obtenido la condici�on (10.15) bajo la hip�otesis de que el sistema en bucleabierto es estable. Puede probarse que tambi�en es v�alida para sistemas inestablesen bucle abierto, con tal de que el sistema nominal y el pertubado en bucle abiertotengan el mismo n�umero de polos en la parte derecha del plano complejo.Utilizando la notaci�on de normas introducida anteriormente la condici�on paraestabilidad robusta puede reescribirse como,jjWT (j!)To(j!)jj1 < 1; (10:16)Esto demuestra explicitamente la relevancia de la norma-1, o sea el valor delpico de la respuesta en frecuencia para caracterizar la robustez. Como se ha visto enel procedimiento seguido, el criterio del valor de pico surge en este caso del criteriode estabilidad de Nyquist, el cual restringe el diagrama de Nyquist de la funci�on debucle abierto a no cortar el punto -1 del plano complejo.Por tanto, para que un sistema tenga garantizada la estabilidad robusta ser�asu�ciente que se dise~ne de forma que jjWTTojj1 sea menor que uno. Un posibleproblema que se puede plantear es el de minimizaci�on de la norma jjWTTojj1 conrespecto a todos los compensadores que estabilizan al sistema en bucle cerrado comoun problema de optimizaci�on de la estabilidad robusta. Sin embargo, la estabilidadraramente es el �unico objetivo de dise~no, por lo que en la funci�on de coste a minimizaraparecen otros elementos que hacen alusi�on a otros subobjetivos, como por ejemploal comportamiento nominal deseado.10.2.3 Control H1 y la teor��a de juegos diferencialComo se ha mencionado anteriormente, el problema de control H1 est�a estrecha-mente relacionado con la teor��a de juegos diferencial. Para verlo, debemos pensar enel dise~nador por un lado, y en el medio ambiente por otro, como si de dos jugadoresse trataran. El objetivo del dise~nador es elegir un controlador que estabilice al sis-tema y sea �optimo con respecto a un criterio dado; mientras que el medio exterior

Page 250: Control Adaptativo y Robusto

234 Planteamiento del problema general de controltiene como objetivo el desbaratar o hacer fracasar la estrategia del dise~nador, pormedio de la elecci�on de la perturbaci�on peor posible que act�ue sobre la planta acontrolar. As��, se de�ne un ��ndice de comportamientoJ(K;w) = Z 10 (zT z � 2wTw)dtsiendo K el regulador, w la perturbaci�on actuante sobre el sistema tal que w 2 H2(ver ap�endice C.1), z una medida para evaluar el comportamiento en lazo cerradodel sistema, y un par�ametro arbitrario. La soluci�on, si existe, dar�a un controlador�optimo K� que estabiliza al sistema de control para la peor perturbaci�on w� 2 H2actuante sobre el sistema.10.3 Planteamiento del problema general de con-trolEn el cap��tulo 8 se ha planteado la necesidad de que a la hora de dar las especi�ca-ciones de dise~no, se hagan de forma que se planteen unos requerimientos f��sicamenterealizables. Determinadas exigencias de dise~no se pueden plantear como un pro-blema de optimizaci�on en el dominio frecuencial, a trav�es del empleo de unas fun-ciones (matrices) de ponderaci�on, que suponga una soluci�on de compromiso para elconjunto de objetivos contrapuestos que aparecen en todo problema de control.Consid�erese el diagrama de bloques de la �gura 10.3, donde el conjunto de se~nalesactuantes sobre el sistema: r; di; do; n, quedan caracterizadas o ponderadas en fre-cuencia respectivamente por:Wr(j!); Wdi(j!); Wdo(j!); Wn(j!)En dicho diagrama adem�as se incluyen las medidas ponderadas de las se~nales deerror (e), control (u) y se~nal a controlar (y), empleando respectivamente,WS(j!); WU(j!); WT (j!)El conjunto de funciones (matrices) de ponderaci�on junto con la planta y regu-lador puede transformarse en un diagrama de bloques equivalente m�as compacto,como el de la �gura 10.4.

Page 251: Control Adaptativo y Robusto

Controladores H1 235- Wr - m K - m G - m -Wdi Wdo?? ?m Wn� �6

? ?dodir n- yueWS WU

WT? ?

---z1 z2

z3rr t

Figura 10.3: Ponderaciones en frecuencia de vectores de entrada y salida- - h- - h-- - h - - h -r?

--6

---r?

-

WSWUWTe6WrWnWdoWdi

rndodi GKu

z3z2z1

e6

- PyFigura 10.4: Estructura general para problemas de control H1; H2.

Page 252: Control Adaptativo y Robusto

236 Planteamiento del problema general de controlA partir del sistema dado en la �gura 10.5, se plantea el siguiente problema dedise~no: obtener un regulador ( K ) que minimice alg�un tipo de medida 1 de lafunci�on (matriz) de transferencia Tzw,z = Tzwwque relaciona el vector de salida z (vector de se~nales requeridas para caracterizar elcomportamiento del sistema en lazo cerrado),z = [z1 z2 z3]Tz1 = WSe z2 = WUu z3 =WTycon el vector de entrada w w = [r n do di]TA partir de las expresiones dadas en el cap��tulo 8, que relacionan: e; u; y conr; n; do; di, y del diagrama de bloques de la �gura 10.4 se obtiene:264 z1z2z3 375 = 264 WSSoWr �WSSoWn �WSSoWdo �WSSoGWdiWUKSoWr �WUKoSoWn �WUKSoWdo �WUSiWdiWTToWr �WTToWn WTSoWdo �WTSoGWdi 375 26664 rndodi 37775Si s�olo se considera r, con Wr = I y WU = 0, queda:" z1z3 # = " WSSoWTTo # rde forma similar, si se considera �unicamente do, queda:" z1z3 # = " �WSSo�WTTo # doy en estos casos, el problema de optimizaci�on es conocido como: problema de sensi-bilidad mixta (Green y Limebeer, 1995).Se puede obtener una partici�on de la planta generalizada P de la siguiente formaP = " P11 P12P21 P22 #1Las normas m�as empleadas en control son las normas H2, y H1, ver ap�endice B.2

Page 253: Control Adaptativo y Robusto

Controladores H1 237P (s) -K(s) �-- zwu e

Figura 10.5: Planta generalizada y reguladordonde se tiene que z = P11w + P12ue = P21w + P22u (10.17)u = Key al sustituir queda: z = [P11 + P12K(I � P22K)�1P21]wPor tanto, se tiene la funci�on (matriz) de transferencia que relaciona z con w:z = Tzwwdonde la funci�on (matriz) de transferenciaTzw = P11 + P12K(I � P22K)�1P21se conoce como transformaci�on lineal fraccionaria (lft)2. A partir de esta relaci�onse plantea el problema est�andar: encontrar un regulador K (que sea propio) queminimice la norma H1 de la funci�on (matriz) de transferencia que relaciona w conz, bajo la restricci�on de que K estabilice a P (en el sentido de que consiga unsistema de control con estabilidad interna). A continuaci�on se dan dos ejemplos deproblemas de control t��picos, y c�omo �estos pueden transformarse en el problema decontrol est�andar de la �gura 10.5.10.3.1 Problema de seguimientoEn primer lugar se describe el problema de seguimiento de la se~nal de referencia.Sea el sistema de la �gura 10.6, en el que se presenta el problema de minimizar la2lft: Linear Fractional Transformation, en terminolog��a inglesa.

Page 254: Control Adaptativo y Robusto

238 Planteamiento del problema general de controlj- - -- 6 -�K2GuK1rw yWFigura 10.6: Planta generalizada para problema de seguimientosiguiente funci�on de costes: (kr � yk22 + k�uk22)1=2donde � es un par�ametro de ajuste, que pondera la magnitud de control, de maneraque al disminuirlo aumenta el ancho de banda del sistema de control.La equivalencia con el problema est�andar se puede establecer a partir de lassiguientes relaciones: e = " ry # ; K = h K1 K2 iz = " r � y�u # = " Ww �Gu�u #e = " WwGu # = " W0 #w + " 0G # uque al identi�car t�erminos con la expresi�on general de P (s) dada en la ecuaci�on10.17 queda:P11 = " W0 # ; P12 = " �G� # ; P21 = " W0 # ; P22 = " 0G #

10.3.2 Problema de estabilidad robustaOtro problema t��pico es el que plantea una estabilidad robusta del sistema de control.Sea el sistema de la �gura 10.7, para el que la incertidumbre en la planta est�acaracterizada de la forma:G0 = G+�G; k�G(j!)k <j E(j!) j; 8!

Page 255: Control Adaptativo y Robusto

Controladores H1 239GKj- - -�6r y

Figura 10.7: Planta generalizada para problema de estabilidad robustaSi se aplica el teorema de la peque~na ganancia, la condici�on para que el sistemasea estable para todo el conjunto de plantas es:kEK(I +GK)�1k1 � 1comparando esta condici�on con la forma del problema est�andar,Tzw= = P11 + P12K(I � P22K)�1P21e identi�cando t�erminos, queda que en este caso la planta generalizada es,P = " O EII �G #10.4 Parametrizaci�on de los controladoresEn primer lugar se va a introducir el concepto de factorizaci�on coprima. Para elcaso de dos polinomios f(s); g(s), se dice que son coprimos entre s��, si su m�aximocom�un divisor es 1. A su vez �esto ocurre si existen sendos polinomios x(s); y(s) talesque se veri�ca la condici�on de Bezout o ecuaci�on diof�antica:f(s)x(s) + g(s)y(s) = 1Extendiendo este concepto a matrices F (s); G(s) 2 RH1 (ver ap�endice C), sedice que son coprimas por la derecha, si tienen el mismo n�umero de columnas yexisten las matrices X(s); Y (s) 2 RH1 tales que:[X Y ] " FG # = XF + Y G = I

Page 256: Control Adaptativo y Robusto

240 Parametrizaci�on de los controladoreslo que equivale a decir que la matriz [F G]T es invertible por la izquierda en RH1.De forma similar se de�ne coprima por la izquierda: Las matrices F;G tienen elmismo n�umero de �las, y existen X; Y 2 RH1, tales que:[F G] " XY # = FX +GY = Ise dice entonces que la matriz [F G] es invertible por la derecha en RH1.Si G(s) es una matriz de transferencia propia, una factorizaci�on coprima por laderecha de G es una factorizaci�on de la forma:G(s) = N(s)M�1(s)donde N y M son matrices coprimas entre s�� en RH1. Igualmente, se obtiene lafactorizaci�on coprima por la izquierda:G(s) = M�1(s)N(s)Se demuestra que para cada matriz de transferencia G(s) se cumple:G = NM�1 = M�1N ; " X �Y�N M # " M YN X # = Ilo que constituye una doble factorizaci�on coprima de G. A continuaci�on se dansendos algoritmos para obtener las factorizaciones coprimas anteriores.Factorizaci�on coprima por la derecha.1. Se tiene una realizaci�on en el espacio de estados de G:G(s) � (A;B;C;D); con: (A;B) estabilizable y (C;A) detectable2. Se calcula una matriz Kc que haga que A +BKc sea estable.3. Se calculan las matricesAc = A+BKc; Cc = C +DKc

Page 257: Control Adaptativo y Robusto

Controladores H1 2414. Se obtienen la siguientes realizaciones de M;N :M(s) � [Ac; B;Kc; I]; N(s) � [Ac; B; Cc; D]5. Finalmente, G(s) = N(s)M�1(s)Factorizaci�on coprima por la izquierda.1. Se tiene una realizaci�on en el espacio de estados de G:G(s) � (A;B;C;D); con: (A;B) estabilizable y (C;A) detectable2. Se calcula Ko tal que A+KoC sea estable.3. Se calculan las matricesAo = A+KoC; Bo = B +KoD4. Se obtienen las siguientes realizaciones de M; N :M(s) � [Ao; Ko; C; I]; N(s) � [Ao; Bo; C;D]5. Finalmente, G(s) = M�1(s)N(s)El resto de matrices de la doble factorizaci�on coprima de G est�an dadas por:X(s) � [Ac;�Ko; Co; I]; Y (s) � [Ac;�Ko; Kc; O]X(s) � [Ao;�Bo; Kc; I]; Y (s) � [Ao;�Ko; Kc; O]Dada la planta generalizada P del problema est�andar, la cual se supone propia:P = NM�1 = M�1N ; " X �Y�N M # " M YN X # = Iy un regulador K, cuya factorizaci�on coprima est�a dada porK = UV �1 = V �1U

Page 258: Control Adaptativo y Robusto

242 Parametrizaci�on de los controladoresuna forma de determinar si K estabiliza a la planta P es veri�cando si se cumple:" M UN V # 2 RH1o equivalentemente, " M UN V # 2 RH1El conjunto de reguladoresK que estabilizan a la planta P se pueden parametrizaren funci�on de una funci�on (matriz) de transferencia Q 2 RH1, de la forma:K = (Y �MQ)(X �NQ)�1 = (X �QN)�1(Y �QM)Para el caso especial, P 2 RH1, se tendr�a que:N = N = P; X =M = I; X = M = I; Y = O; Y = Oy por tanto, K = �Q(I � PQ)�1 = �(I �QP )�1QSe puede demostrar (Francis 1987), que K estabiliza a P si y solo si K estabilizaa P22 (siendo �esta estrictamente propia). Por ello, a continuaci�on se emplea dichoresultado. Si se realiza la doble factorizaci�on coprima de P22,P22 = N2M�12 = M�12 N2; " X2 �Y2�N2 M2 # " M2 Y2N2 X2 # = Ise tendr�a que el conjunto de reguladores que estabilizan a P22 vendr�a dado por:K = (Y2 �M2Q)(X2 �N2Q)�1 = (X2 �QN2)�1(Y2 �QM2) (10:18)10.4.1 El problema de ajuste del modeloSi se de�nen las siguientes funciones (matrices) de transferencia:T1 = P11 + P12M2Y2P21; T2 = P12M2; T3 = M2P21se demuestra que T1; T2; T3 2 RH1, y para K dado por la expresi�on 10.18, lafunci�on (matriz) de transferencia que relaciona z con w en el problema est�andarser�a: Tzw = T1 � T2QT3

Page 259: Control Adaptativo y Robusto

Controladores H1 243- --

- 6w T3 Q T2 j? -zT1 �Figura 10.8: Interpretaci�on del problema de ajuste del modelo (M-M).y el objetivo de minimizar kTzwk1 corresponde a un problema de ajuste o aproxi-maci�on de modelos (M-M)3.En la �gura 10.8 se hace una interpretaci�on del problema M-M, donde T1 es elmodelo a ajustar, T2 y T3 est�an dados, o son conocidos, y Q 2 RH1 hay queencontrarlo, de forma que se realice el mejor ajuste a partir de la minimizaci�on dela norma H1 del error de ajuste: kT1 � T2QT3k1Si se comparan las expresiones del problema est�andar,z = [P11 + P12K(I � P22K)�1P21]wy del ajuste del modelo (ver �gura 10.8),z = [T1 � T2QT3]wse tienen las siguientes equivalencias:P11 = T1; P12 = T2; P22 = O; T3 = P21; K = �QPor tanto, dado un problema de dise~no, lo primero ser�a transformarlo a la formadel problema est�andar, y a continuaci�on identi�car las funciones (matrices) de trans-ferencia T1; T2; T3 que corresponden al problema M-M. A continuaci�on se da el al-goritmo cT1T2T3P para obtener T1; T2; T3 a partir del problema est�andar:1. Se obtiene una realizaci�on m��nima de la planta generalizada.P (s) � (Ap; Bp; Cp; Dp)3Model Matching en terminolog��a inglesa (M-M).

Page 260: Control Adaptativo y Robusto

244 Parametrizaci�on de los controladores2. Seg�un las dimensiones de w; u; z; e se particiona en la formaBp = [B1 B2]; CTp = [C1 C2]; Dp = " D11 D12D21 D22 #con D22 = 0, dado que P22 es estrictamente propia.3. Se calculan T1; T2; T3:T1(s) � (A0; B0; C 0; D11); T2(s) � (Ac; B2; C1 +D12Kc; D12)T3(s) � (Ao; B1 +KoD21; C2; D21)con Ac = Ap +B2Kc; Ao = Ap +KoC2; C 0 = [C1 +D12Kc �D12Kc]A0 = " Ac �B2KcO Ao # ; B0 = " B1B1 +KoD21 #10.4.2 Aplicabilidad del teorema de NehariEn esta secci�on se presenta el teorema de Nehari, el cual juega un importante papelen la soluci�on de los problemas H1. Como se ver�a a continuaci�on, este teoremaestablece un resultado empleando para ello la norma de Hankel. La norma de Hankelde un sistema F (s) � (A;B;C;D) , la cual se representa mediante kFkH o tambi�enpor medio de k�Fk, se puede obtener a partir de los grammianos de controlabilidadWc y observabilidad Wo del sistema F (s). Para dicho c�alculo se siguen los siguientespasos:1. Para calcular Wc se resuelve la ecuaci�on de Lyapunov,AWc +WcAT = BBT2. Con la siguiente ecuaci�on de Lyapunov se obtiene Wo.ATWo +WoA = CTC3. Finalmente se calcula k�Fk = qj �max(WcWo) j

Page 261: Control Adaptativo y Robusto

Controladores H1 245El teorema de Nehari es de gran utilidad para resolver los problemas de opti-mizaci�on H1. Este teorema determina el grado de aproximaci�on entre dos funcioneso matrices de transferencia; donde una de ellas R 2 L1 (es propia y sin polos enel eje imaginario), y la otra X 2 H1 (es propia y estable). Para una funci�on omatriz de transferencia R 2 L1 se de�ne la distancia en H1 como:dist(R;H1) = inffkR�Xk1 : X 2 H1; R 2 L1gEn t�erminos de sistemas, se trata de aproximar un sistema inestable R(s) porotro estable X(s). El teorema de Nehari establece que existe una matriz detransferenciaX 2 H1, para una matriz de transferencia dada R 2 L1, que satisface:kR�Xk1 = k�RkSe deriva que si para una R 2 RL1 dada, se obtiene una factorizaci�on de laforma, R(s) = R1(s) +R2(s)donde R1 es estrictamente propia y anal��tica en Re s � 0, y R2 es propia y anal��ticaen Re s � 0, entonces se cumple que,�R = �R1O sea, se hace una expansi�on en fracciones parciales donde R1 contiene la parteinestable y R2 la parte estable de R; y posteriormente se emplea R1 para calcular,dist(R;H1) = k�Rk = k�R1kAs�� por ejemplo, si se tiene,R(s) = 2664 1s2 � 1 41s2 � s+ 1 s+ 1s� 1 3775y se realiza una expansi�on en fracciones parciales, quedan:R1(s) = 2664 0:5s� 1 01s2 � s+ 1 2s� 1 3775 ; R2(s) = 24 �0:5s+ 1 40 1 35

Page 262: Control Adaptativo y Robusto

246 Soluciones al problema de ajuste del modeloUna realizaci�on de R1(s) � (A;B;C;D) es:A = 26664 2 �2 1 01 0 0 00 1 0 00 0 0 1 37775 ; B = 26664 1 00 00 00 2 37775 ; C = " 0:5 �0:5 0:5 00 1 �1 1 #Para obtener los grammianos, Wc y Wo; de R1 se resuelven las ecuaciones deLyapunov correspondientes, obteni�endose �nalmente quedist(R;H1) = k�Rk = k�R1k1 = qj �max(WcWo) j = 1:2695Hasta ahora, se ha obtenido la aproximaci�on alcanzable, por el teorema de Ne-hari, pero no se ha tratado el problema de calcular X.10.5 Soluciones al problema de ajuste del mo-deloEn este apartado se tratan las soluciones al problema de encontrar una Q 2 RH1que minimice el error de ajuste kT1 � T2QT3k1 para unas T1; T2; T3 �jadas. O sea,se aborda el problema de encontrar:� = inffkT1 � T2QT3k1 : Q 2 RH1g10.5.1 El problema escalarSe considera a continuaci�on el planteamiento realizado para el caso escalar; para elque s�� es conmutativo el producto de funciones de transferencia, por lo que se puedeponer T1 � T2T3Q, y por tanto, sin p�erdida de generalidad, basta con considerar elcaso T3 = 1 (pues en otro caso se llama al producto T2T3 como T2):inffkT1 � T2Qk1gEl caso trivial corresponde a la soluci�on Q = T1=T2, s�olo v�alida si T1 es estable,y T2 es de fase m��nima. Si T2 tiene un �unico cero inestable z1, la soluci�on tambi�en

Page 263: Control Adaptativo y Robusto

Controladores H1 247es sencilla, obteni�endose en ese caso:Q(s) = T1(s)� T1(z1)T2(s) ; kT1 � T2Qk1 =j T1(z1) jUna funci�on de transferencia T (s) 2 RH1, se dice que es interior (inner) siT (�s)T (s) = 1Por ejemplo, 1; 1� ss+ 1 ; 1� s+ s21 + s+ s2son funciones de transferencia interiores. Los ceros de una funci�on de transferenciainterior caen todos dentro del semiplano complejo de la derecha, Re s > 0, de ah��que se le d�e el adjetivo de interior. Se dice que una funci�on de transferencia esexterior (outer) si no tiene ceros en Re s > 0 (o sea que quedan en el exterior dedicho semiplano complejo de la derecha). Desde el punto de vista de sistemas, unafunci�on de transferencia interior es un sistema estable de fase no m��nima y pasa-todocon ganancia unidad; y una exterior es estable y de fase m��nima.Toda funci�on (matriz) de transferencia T 2 RH1 tiene una factorizaci�onT = TiTosiendo Ti interior y To exterior. Para obtenerlas se pueden emplear por ejemplolas funciones\iofr.m y iofc.m" para Matlab de Robust Control Toolbox (Chiang ySafonov, 1992), o las funciones\inner y outer" del Program CC (Thompson, 1988).Para resolver el caso general, se transforma el problema de la siguiente forma:kT1 � T2Qk1 = kR�Xk1con R = T�12i T1 2 RL1; X = T2oQ 2 RH1donde se ha obtenido la factorizaci�on T2 = T2iT2o, siendo T2i una funci�on de trans-ferencia interior y T2o una exterior (conviene tener en cuenta que T2i f��sicamenteequivale a un �ltro pasa-todo de ganancia unidad).Aplicando el teorema de Nehari, se obtiene que,� = inffkR�Xk1 : R 2 RL1; X 2 RH1g = k�Rk

Page 264: Control Adaptativo y Robusto

248 Soluciones al problema de ajuste del modeloA continuaci�on se da un algoritmo (alfaQ) para calcular � y el �optimo Q(s),para el caso escalar:kT1 � T2Qk1; con: T2 T2T3; o tambi�en si: T3 = 11. Realizar la factorizaci�on interior-exterior de T2,T2 = T2iT2o2. Calcular, R = T�12i T1se obtiene una realizaci�on m��nima,R(s) � (A;B;C;D)3. Se resuelven las ecuaciones de Lyapunov,AWc +WcAT = BBTATWo +WoA = CTC4. Se obtiene el valor propio m�aximo, � del producto de grammianos WcWo, y sucorrespondiente vector propio v.5. Calcular,f(s) � (A; v; C; 0); g(s) = (�AT ; ��1Wov; BT ; 0); X = R � �f=g6. Se obtienen, � =j � j; Q = T�12o XUna vez calculado Q, se puede obtener el regulador �optimo K a partir de laecuaci�on 10.18.10.5.2 Optimizaci�on del comportamiento nominalA �n de ver la aplicabilidad de los resultados y m�etodos anteriores se plantea elproblema de conseguir una especi�caci�on de comportamiento nominal (np) dada.

Page 265: Control Adaptativo y Robusto

Controladores H1 249j- - -6w z� K GFigura 10.9: Problema de comportamiento nominal.Sea el sistema de la �gura 10.9, en la que se emplea una nomenclatura para lasse~nales de acuerdo con la empleada en el problema est�andar. As��, se tiene que,z = Sw; S = 1=1 +GKSe plantea el problema de conseguir un seguimiento adecuado, al menos en elrango de frecuencias [0; !1]. Para ello se propone la siguiente especi�caci�on:j S(j!) j< �; 8 ! 2 [0; !1]as�� por ejemplo, con � = 0:01 se requiere un error de seguimiento inferior al 1%en dicho rango de frecuencias. Esto mismo se puede realizar de forma aproximadaempleando una funci�on de ponderaci�on W y la condici�onkWSk1 < � (10:19)Una posible elecci�on para W es la siguiente:W (s) = (0:01w�11 s+ 1)k(0:1w�11 s+ 1)kTeniendo en cuenta la forma general del problema est�andar, se tiene que P22 =�G, ya que: z = w � y = Gue = w �Guu = Key por tanto, P = " 1 �G1 �G #

Page 266: Control Adaptativo y Robusto

250 Soluciones al problema de ajuste del modeloSi se realiza una factorizaci�on coprima de P22,P22 = N=M; MX �NY = 1los reguladores que estabilizan al sistema vendr�an dados por,K = Y �MQX �NQ; Q 2 RH1al sustituir en S se obtiene, S =MX �MNQcon lo que el problema de comportamiento nominal 10.19 equivale akT1 � T2Qk1 < �con: T1 = WMX; T2 = WMN . Se tratar�a de obtener un valor de �� = inffkT1 � T2Qk1 : Q 2 RH1tal que � < �, dependiendo el valor de � del exponente k de W (s); por lo que seindicar�a por �k.Algoritmo (KNP)A continuaci�on se da un para resolver este problema de np.1. Realizar la factorizaci�on coprima de �G:�G = N=M; MX �NY = 12. Se de�ne la funci�on de ponderaci�on,W (s) = (0:01w�11 s+ 1)k(0:1w�11 s+ 1)kse toma inicialmente el valor k = 1.3. Se obtiene T1 = WMX; T2 = WMN; V (s) = (s+ 1)ldonde el exponente l es el grado relativo de G.

Page 267: Control Adaptativo y Robusto

Controladores H1 2514. Se sustituye T2 T2V , y por medio del algoritmo alfaQ, ya descrito, calcula�k, �k = minfkT1 � T2Q1k1 : Q1 2 RH1Si �k � �, se incrementa k en uno, y se vuelve al paso 3. En otro caso,continuar.5. Por medio del algoritmo alfaQ, calcular Q1 2 RH1, tal que,�k = kT1 � T2Q1k16. Se calcula �nalmente el regulador,K = Y �MQaX �NQacon Qa(s) = V (s)Q1(s)=(0:1w�11 s + 1)l.Ejemplo:Con el siguiente ejemplo, se ilustra el procedimiento anterior para una planta defase no m��nima G(s) = (s� 1)(s� 2)(s+ 1)(s2 + s+ 1)Para las especi�caciones de comportamiento nominal se emplean w1 = 0:01; � =0:1 (�20 db). Por tanto, se desea conseguir un error de seguimiento inferior al 10%para se~nales de referencia con ancho de banda inferior a 0:01 rad/s.1. Como la planta es estable, se toman:N = �G; M = 1; X = 1; Y = 12. Se elige W (s) = � s+ 110s+ 1�k3. Se calculan T1(s) = � s+ 110s+ 1�k ; V (s) = s+ 1T2(s) = �� s+ 110s+ 1�k (s� 1)(s� 2)(s+ 1)(s2 + s+ 1)

Page 268: Control Adaptativo y Robusto

252 Soluciones al problema de ajuste del modelo4. Se obtienen: �1 = 0:2299; �2 = 0:0511, y por tanto �2 < �; k = 2.5. Se calcula Q1(s) = �6:114(s+ 0:3613)(s2 + s+ 1)(s+ 4:656)(s+ 1)26. Y �nalmente Qa(s) = �6:114 (s+ 0:3613)(s2 + s+ 1)(s+ 4:656)(s+ 1)(10s+ 1)K(s) = 0:6114 (s+ 0:3613)(s+ 1)(s2 + s+ 1)(s+ 0:004698)(s+ 0:5280)(s2 + 5:612s+ 9:599)En la �gura 10.10 pueden verse las magnitudes de las funciones de sensibilidadj S(j!) j y sensibilidad complementaria j T (j!) j obtenidas; la respuesta temporalpara consigna escal�on unidad se tiene en la �gura 10.11, puede comprobarse elcomportamiento de fase no m��nima que presenta el sistema.

-45

-40

-35

-30

-25

-20

-15

-10

-5

0

5

10-4 10-3 10-2 10-1 100 101 102

rad/s

mag

nitu

d (d

B)

Sensibilidad

Sensibilidad complementaria

Figura 10.10: Magnitudes de j S(j!) j; j T (j!) j, problema de np

Page 269: Control Adaptativo y Robusto

Controladores H1 253

-0.2

0

0.2

0.4

0.6

0.8

1

0 10 20 30 40 50 60 70 80

segundos

resp

uest

a la

zo c

erra

do

Figura 10.11: Respuesta temporal a escal�on unidad, problema de np10.6 Problemas de control H2; H1 en el espaciode estadosEn la primera parte de este cap��tulo se ha presentado una forma de resolver el pro-blema de control H1 para el caso de sistemas de una entrada y una salida (planta es-calar), el cual sigue el tratamiento original realizado por Francis (1987). Igualmente,siguiendo un procedimiento similar, aunque bastante m�as elaborado y complejo, esposible obtener los correspondientes algoritmos para resolver el problema multiva-riable. Si bien, para ello resulta m�as ventajoso emplear el tratamiento en el espaciode estados que se presenta a continuaci�on; el cual es general y v�alido independien-temente del car�acter escalar o vectorial de la planta a controlar, consituyendo unm�etodo m�as compacto.A pesar de ello, se ha comenzado este cap��tulo con el procedimiento entrada-salida descrito en los apartados anteriores; a �n de presentar los or��genes del pro-blema, as�� como el planteamiento seguido para su resoluci�on. Se trata con ello queel lector se sit�ue ante el problema de control H1 con una perspectiva que va desdesu enfoque cl�asico al planteamiento actual.

Page 270: Control Adaptativo y Robusto

254 Problemas de control H2; H1 en el espacio de estadosLos algoritmos desarrollados en el espacio de estado se caracterizan en general porestar basados en la soluci�on de dos ecuaciones algebraicas de Riccati desacopladas,partiendo de las matrices de estado de la planta ampliada o generalizada. A partirdel trabajo de Doyle et al.(1989) se inicia la etapa actual del desarrollo de algoritmospara la resoluci�on de los problemas de control H1.Consid�erese una realizaci�on en el espacio de estados de la planta ampliada P (s)(ver �gura 10.5) expresada como:_xp = Apxp +B1w +B2uz = C1x+D11w +D12u (10.20)e = C2x+D21w +D22uo en forma abreviada como, P (s) � (Ap; Bp; Cp; Dp)con, Bp = [B1 B2] ; CTp = [C1 C2]Dp = " D11 D12D21 D22 #De forma general, el problema de dise~no se puede expresar de la siguiente forma:dado el sistema de la �gura 10.5, se tratar�a de encontrar un regulador K(s) 4,asint�oticamente estable que haga al sistema en lazo cerrado Tzw internamente establey que minimice la norma H2 (problema H2) o la norma H1 (problema H1) de Tzw.En el tratamiento que hacen Doyle et al.(1989) de ambos problemas (H2; H1),en el espacio de estados se tienen en cuenta algunas suposiciones, que sirven parasimpli�car la formulaci�on, y van a constituir las hip�otesis de trabajo del problemade control �optimo H1 que a continuaci�on se desarrolla.Las condiciones supuestas para las matrices de estado de la planta ampliada P (s)son las siguientes:1. Los pares (Ap; B1) y (Ap; B2) son estabilizables.2. Los pares (C1; Ap) y (C2; Ap) son detectables.4Los controladores racionales propios, detectables y estabilizables que dotan al sistema en lazocerrado de estabilidad interna son denominados controladores admisibles.

Page 271: Control Adaptativo y Robusto

Controladores H1 2553. DT12C1 = 0 y DT12D12 = I4. B1DT21 = 0 y D21DT21 = I5. D11 = 0 y D22 = 0Las suposiciones (1) y (2) garantizan la existencia de la soluci�on de las ecuacionesde Riccati de control y del observador. La suposici�on (3) implica la ortogonalidadentre C1x y D12u, lo cual en la formulaci�on de un problema lqg implica que lafunci�on de costes no tendr�a ponderaci�on cruzada entre el estado x y la entradade control u, a la vez que la matriz de ponderaci�on del vector de control ser�a lamatriz unidad. La (4) equivale a la (3) para las matrices de covarianza de los ruidosactuantes sobre el proceso y sobre la medida (ruido en sensores). La suposici�on(5) se hace para simpli�car la formulaci�on, y no supone p�erdida de generalidad, yaque un problema determinado puede transformarse en uno equivalente que satisfagatales requerimientos (Green y Limebeer, 1995, Safonov et al.1989).10.6.1 Controlador �optimo H2Como se ha descrito en el apartado anterior, una forma de expresar algunas de lasespeci�caciones de dise~no es mediante la minimizaci�on de la norma H2 de la funci�on(matriz) de transferencia Tzw. O expresado en t�erminos de se~nales: se trata deencontrar un controlador K(s) asint�oticamente estable que estabilice al sistema enlazo cerrado y que minimice la norma H2 de la se~nal de respuesta del sistema a unase~nal de entrada caracterizada por ser ruido blanco con intensidad unidad. Estoexpresado en forma anal��tica supone la minimizaci�on de la funci�on de coste:JH2 = 12� Z 10 traza[T Tzw(�j!)Tzw(j!)]d! = kTzwk22 (10:21)Una forma de calcular la norma H2 es mediante:kTzwk22 = traza(CTWcCTT ) = traza(BTTWoBT ) (10:22)donde las matrices (AT ; BT ; CT ; DT ) determinan una realizaci�on en el espacio deestados del sistema Tzw; y las matrices Wc y Wo son sus respectivos grammianosde controlabilidad y observabilidad. Estos se pueden obtener resolviendo las corres-pondientes ecuaciones de Lyapunov:ATWc +WcATT +BTBTT = 0

Page 272: Control Adaptativo y Robusto

256 Problemas de control H2; H1 en el espacio de estadosATTWo +WoAT + CTTCT = 0El controlador �optimo K(s) que minimiza kTzwk2 se calcula resolviendo el parde ecuaciones algebraicas de Riccati independientes:ATpX2 +X2Ap �X2B2BT2 X2 � CT1 C1 = 0 (10:23)ApY2 + Y2ATp � Y2CT2 C2Y2 �B1BT1 = 0 (10:24)que teniendo en cuenta la de�nici�on del operador de Riccati (ver ap�endice C.2)puede ponerse de forma equivalente como:X2 = Ric(HX2)Y2 = Ric(HY 2)siendo las matrices Hamiltonianas asociadas:HX2 = " Ap �B2BT2�CT1 C1 �ATp #HY 2 = " ATp �CT2 CT2�B1BT1 �Ap #A partir de las soluciones X2; Y2 respectivas de 10.23 y 10.24 se tiene el compen-sador �optimo: K(s) = Kc(sI � Ap +B2Kc +KoC2)�1Ko (10:25)donde: Kc = BT2 X2 ; Ko = Y2CT2son las matrices de realimentaci�on de estados y de ganancia del observador, en laestructura convencional del controlador lqg.El m��nimo de JH2 se obtiene de :min kTzwk22 = kGcB1k22 + kKcGok22 = kGcKok22 + kC1Gok22 (10:26)con: Gc(s) = (C1 +D12Kc)(sI � Ap � B2Kc)�1Go(s) = (sI � Ap �KoC2)�1(B1 +KoD21)

Page 273: Control Adaptativo y Robusto

Controladores H1 25710.6.2 Relaci�on entre LQG/LTR y H2Los problemas de dise~nos lqg/ltr-i y lqg/ltr-o pueden interpretarse como doscasos particulares del problema de optimizaci�on H2 de sensibilidad mixta (Stein etal. 1987). A continuaci�on de pone de mani�esto dicha correspondencia.Consid�erese la planta a controlar G(s) representada por las ecuaciones de estado_x = Ax+Bu+ �v1y = Cx+ �Iv2z = Mxdonde: G(s) = C�(s)B; �(s) = (sI � A)�1 y los ruidos sobre el proceso(v1) y sobre los sensores (v2) se consideran ruidos gausianos con intensidad unidade incorrelados entre s��. Un regulador �optimo lqg minimiza la funci�on de costeJLQG = E ( 1T Z T0 (zT z + �2uTu)dt) (10:27)Teniendo en cuenta que se tienen las siguientes relaciones" y(s)z(s) # = " G(s) C�(s)� �IM�(s)B M�(s)� 0 # 264 u(s)v1(s)v2(s) 375u(s) = �K(s)y(s)se obtiene: " z�u # = Tzw " v1v2 #donde, Tzw = " T11 T12T21 T22 # (10:28)con, T11 = M�(s)��M�(s)K(s)[I +G(s)K(s)]�1C�(s)�T12 = �M�(s)BK(s)[I +G(s)K(s)]�1T21 = ��K(s)[I +G(s)K(s)]�1C�(s)�T22 = ��K(s)[IG(s)K(s)]�1Sustituyendo la ecuaci�on 10.28 en la 10.27 y teniendo en cuenta el teorema deParseval (Stein y Athans, 1987) se obtiene que la funci�on de coste dada en 10.27 se

Page 274: Control Adaptativo y Robusto

258 Problemas de control H2; H1 en el espacio de estadospuede expresar en el dominio de la frecuencia comoJLQG = 12� Z 10 tr [TzwTHzw]d!Lo cual establece la relaci�on entre los problemas de optimizaci�on H2 y lqg. Acontinuaci�on se avanza m�as en dicha relaci�on, estableci�endose las condiciones bajolas cuales el problema de dise~no lqg/ltr se puede transformar en un problema decontrol �optimo H2 de sensibilidad mixta.� Caso lqg/ltr-i. Si se consideran las siguientes condiciones:W (s) = M�(s)B(1=�)� = B� 0queda:Tzw(s) � " W (s)[I +K(s)G(s)]�1 0�[I +K(s)G(s)]1K(s)G(s) 0 # = � " W (s)Si(s) 0�Ti(s) 0 #A partir de lo cual se concluye que el problema lqg/ltr-i equivale a unproblema de sensibilidad mixta H2.� Caso lqg/ltr-o. Si se consideran las siguentes condiciones:W (s) = C�(s)�(1=�)M = C� 0queda:T Tzw(s) � " [I +G(s)K(s)]�1W (s) 0�G(s)K(s)[I +G(s)K(s)]1 0 # = � " So(s)W (s) 0�To(s) 0 #Y por tanto, al igual que para el caso anterior, tambi�en se obtiene que elproblema lqg/ltr-o equivale a un problema de sensibilidad mixta H2.

Page 275: Control Adaptativo y Robusto

Controladores H1 25910.6.3 Controlador H1En un determinado problema de control, puede que se est�e interesado en minimizarel m�aximo alcanzable por la respuesta frecuencial de Tzw, en vez de minimizar alg�untipo de promedio, como se hace en la optimizaci�on H2. En ese caso, se plantea unproblema de optimizaci�on H1, en el que se trata de obtener el m��nimo de:kTzwk1 = sup! �(Tzw) (10:29)Para contrastar los problemas H1 y H2, consid�erese el caso monovariable (es-calar) en el que se tenga: kTzwk1 � esto equivale a que para una se~nal w con kwkrms � 1, el sistema dar�a una respuestaz = Tzww tal que kTzwwkrms � ; mientras que si:kTzuk2 � ello equivale a que para una se~nal particular w de ruido blanco de intensidad unidad,el sistema dar�a una respuesta z = Tzww con kTzwwkrms � . Por lo tanto unproblema de minimizaci�on H1 es m�as general que uno H2, al abarcar el primero laposibilidad de una gama m�as amplia de se~nales de entrada.Otra distinci�on la supone el hecho de que H2 minimiza el valor cuadr�atico mediode la magnitud sobre todas las frecuencias, no haciendo alusi�on directa alguna ala existencia de posibles picos de peque~na anchura (resonancias pronunciadas peromuy estrechas), pues su efecto sobre el c�alculo del promedio ser�a poco apreciable.Sin embargo, la optimizaci�on H1 es el m�aximo de esos posibles picos el que tieneen cuenta (Stoorvogel, 1992).Para remarcar el aspecto distintivo entre los reguladoresH2 yH1, a continuaci�onse va a utilizar el problema de sensibilidad mixta anteriormente de�nido. Como sedescribe en el cap��tulo 8, a partir de la relaci�on:�(WSSo) � 1se especi�ca un comportamiento nominal deseado (np) y con:�(WTTo) � 1

Page 276: Control Adaptativo y Robusto

260 Problemas de control H2; H1 en el espacio de estadosse especi�ca una robustez de la estabilidad (rs) del sistema de control frente aincertidumbres multiplicativas situadas a la salida de la planta. 5Una forma de que se veri�quen simult�aneamente las desigualdades anteriores eshaciendo que se cumpla: kTzwk1 = WSSoWTTo 1 � 1 (10:30)El regulador �optimo H1 minimizar��a dicho valor, mientras que el regulador�optimo H2 minimizar��a la norma kTzwk2; por lo que el primero trata directamentecon el problema de maximizar la robustez del sistema de control, y de ah�� su atractivoy utilidad en los problemas de control robusto.El c�alculo de la norma H1 se puede hacer directamente a partir de su de�nici�on(10.29), o de forma indirecta. As��, si se tiene una realizaci�on de Tzw dada por lasmatrices (AT ; BT ; CT ; DT ), se de�ne la matriz Hamiltoniana asociada H como:H = " AT BTBTT = 2�CTTCT �ATT #y se establecen las siguientes equivalencias (Doyle et al. 1989):1. Tzw cumple: kTzwk1 < (10:31)2. H no tiene autovalores en el eje imaginario.3. H 2 dom (Ric) (ver ap�endice C.2)4. H 2 dom (Ric) y Ric(Tzw) > 0 si (C;A) es observable.Teniendo en cuenta (1) y (2) se puede derivar un m�etodo para calcular kTzwk1:1. Se selecciona un escalar > 0.2. Se forma la matriz H y se testea si tiene autovalores en el eje imaginario.3. Se aumenta o disminuye de acuerdo con el resultado del paso 2.5En ese caso el sistema de interconexi�on coincide con la funci�on de sensibilidad complementaria:M(s) = To(s) (ver cap��tulo 8).

Page 277: Control Adaptativo y Robusto

Controladores H1 2614. Se repite el proceso, iterando con hasta encontrar un valor cr��tico o que concierta precisi�on cumpla la condici�on del paso 2, en ese caso se consigue unacota ajustada kTzwk1 < o.Para encontrar un controlador asint�oticamente estableK(s), que consiga kTzwk1 < , se resuelven el par de ecuaciones algebraicas de Riccati siguientes (Doyle et al,1989): ATpX1 +X1Ap �X1[(1= 2)B1BT1 �B2BT2 ]X1 + CT1 C1 = 0 (10:32)ApY1 + Y1ATp � Y1[(1= )2CT1 C1 � CT2 C2]Y1 +B1BT1 = 0 (10:33)o teniendo en cuenta la de�nici�on del operador de Riccati (ver ap�endice C.2):X1 = Ric(HX1)Y1 = Ric(HY1)con las matrices Hamiltonianas asociadas:HX1 = " Ap (1= 2)B1BT1 � B2BT2�CT1 C1 �ATp #HY1 = " ATp (1= 2)CT1 C1 � CT2 C2�B1CT1 �Ap #El controlador resultante es:K(s) = Kc[sI � Ap � (1= 2)B1BT1 X1 � B2Kc � ZKoC2]�1Ko (10:34)donde:Kc = BT2 X1; Ko = Y1CT2 ; Z = [I � (1= 2)Y1X1]�1; K1 = B1BT1 X1(1= 2)El compensador 10.34 consigue kTzwk1 < , sin embargo la soluci�on no ser�a v�alida(es decir: el sistema en lazo cerrado no ser�a asint�oticamente estable) a menos quese cumplan las condiciones siguientes: X1 � 0Y1 � 0 (10.35)j �max(X1Y1) j < 2

Page 278: Control Adaptativo y Robusto

262 Problemas de control H2; H1 en el espacio de estadosAunque no sea tan evidente como en el caso H2, el controlador H1 tiene unaestructura constituida por una realimentaci�on de estados y un observador (ver �gura10.12). La din�amica del compensador queda descrita por el conjunto de ecuaciones:_x = Apx+B2u+ ZKo(y � y) +B1wy = C2xu = Kcx (10.36)w = (1= 2)BT1 X1xdonde Kc representa la matriz de realimentaci�on de estados, ZKo la matriz deganancia del observador y w supone un estimado de la peor perturbaci�on que pudieradarse sobre el sistema, en el sentido de que maximizar�a la magnitud (Doyle et al,1989): kzk22 � 2kwk22El c�alculo para obtener la soluci�on de un problema de optimizaci�on H1 requiereun proceso iterativo, inici�andose con un valor inicial para el par�ametro , probandosi se cumplen todas las condiciones necesarias (10.31,10.35) y modi�c�andolo hastaencontrar una soluci�on adecuada. El proceso de b�usqueda puede terminar con elvalor m��nimo min, o en una soluci�on sub�optima ( o > min).10.6.4 Algoritmo de c�alculo del regulador H1A la hora de aplicar el algoritmo de c�alculo del regulador H1 anteriormente descrito,pueden aparecer algunos problemas num�ericos que di�culten o hagan imposible suresoluci�on. Por ello, se han desarrollado, y a�un se siguen desarrollando en la actua-lidad, diferentes algoritmos de c�alculo que tratan de mejorar y facilitar la resoluci�onnum�erica de las ecuaciones. En la bibiliograf��a especializada pueden encontrarsediferentes opciones para dicho c�alculo (Green y Limebeer, 1995). A continuaci�on seda un algoritmo alternativo al descrito anteriormente, que mejora las propiedadesnum�ericas para el c�alculo del controlador H1.La ley de control se obtiene de u = �Kcxy el estimador del estado se calcula a partir de las ecuaciones_x = Apx+B2u+B1w + Z1Ko(y � y)

Page 279: Control Adaptativo y Robusto

Controladores H1 263-� ��-� ��- ZKo -� ��- �p(s)B2

K1 KcC2

-�?�6

�6 G(s) -6r y- x u

Figura 10.12: Estructura del controlador H1w = BT1 X1x(1= 2)y = C2x+D21BT1 X1x(1= 2)Las matrices Kc; Ko; Z1 se obtienen respectivamente de,Kc = D012(BT2 X1 +DT12C1); D012 = (DT12D12)�1Ko = (Y1CT2 +B1DT21)D021; D021 = (D21DT21)�1Z1 = (I � �2Y1X1)�1Las matrices X1; Y1 son soluciones de las correspondientes ecuaciones de Ric-cati, o de forma equivalente (ver ap�endice C.2):X1 = Ric " Ap �B2D012DT12C1 �2B1BT1 �B2D012BT2�C 0T1 C 01 �(Ap �B2D012DT12C1)T #Y1 = Ric " (Ap � B1DT21D021C2)T �2CT1 C1 � CT2 D021C2�B01D0T1 �(Ap �B1DT21D021C2) #donde, C 01 = (I �D12D012DT12)C1; B01 = B1(I �DT21D021D21)

Page 280: Control Adaptativo y Robusto

264 Problemas de control H2; H1 en el espacio de estadosFinalmente, se dan las matrices del regulador K,K(s) � [Ar; Br; Cr; Dr]con, Ar = Ap � B2Kc � Z1KoC2 + �2(B1BT1 � Z1KoD21BT1 )X1Br = Z1Ko; Cr = �Kc; Dr = 0as�� como la realizaci�on de Tzw:" _x_x # = " Ap �B2KcZ1KoC2 T22 # " xx # + " B1Z1KoD21 #w" zy # = " C1 �D12KcC2 0 #+ " 0D21 #wdonde se tiene que,T22 = Ap � B2Kc + �2B1BT1 X1 � Z1Ko(C2 + �2D21BT1 X1)10.6.5 Ejemplos ilustrativosEjemplo: Dise~no H1 de sistema doble integradorSea el sistema compuesto por la planta nominal a controlar (�gura 10.13),G(s) = 1s2 = y(s)u(s)la perturbaci�on d, y el ruido de medida n actuantes sobre el sistema, cuyo conjuntoqueda descrito por las ecuaciones siguientes:_x1 = d+ u_x2 = x1y = x2 + nSe desea dise~nar un regulador H1 que consiga atenuar el efecto de d y n sobre elsistema, a la vez que la se~nal de control no tome valores excesivos a �n de evitar en loposible la saturaci�on de los actuadores. Para lo cual, se incluir�a la se~nal de control,junto con la propia variable de estado x2, en las variables empleadas para evaluar

Page 281: Control Adaptativo y Robusto

Controladores H1 265u -���� - - -?������?d 1s 1sx1 x2y nFigura 10.13: Diagrama de bloques

-���� - - -����1s 1sx1 x2 ? -s -6�

syu

w z

K(s)Figura 10.14: Diagrama de bloques para H1

Page 282: Control Adaptativo y Robusto

266 Problemas de control H2; H1 en el espacio de estadosel comportamiento del sistema en lazo cerrado; o sea, como elementos de z. Por loque los respectivos vectores w; z implicados en los desarrollos te�oricos comentadosanteriormente (�gura 10.14), son en este caso:w = " dn # ; z = " x2u #Para la elecci�on realizada, queda que las matrices que componen la realizaci�onde la planta generalizada son de la forma:

P (s) = 26666664 0 0 1 0 11 0 0 0 00 1 0 0 00 0 0 0 10 1 0 1 037777775O sea, Ap = " 0 01 0 #B1 = " 1 00 0 # ; B2 = 264 10 375C1 = " 0 10 0 # ; C2 = h 0 1 iD11 = " 0 00 0 # ; D12 = " 01 #D21 = h 0 1 i ; D22 = h 0 iSiguiento los pasos dados en este apartado, y tras un proceso iterativo de b�usquedapara el valor de , se obtiene que el algoritmo da una soluci�on factible para = 2:62,el cual est�a pr�oximo pero no coincide con el valor �optimo. Para obtener el �optimose pueden emplear algoritmos m�as so�sticados; tales y como se dan en el RobustControl Toolbox (funci�on\hinfsyn"), o en el �-Synthesis Toolbox (funci�on\hinfopt"),para Matlab. Para = 2:62 se obtiene el siguiente regulador H1:

Page 283: Control Adaptativo y Robusto

Controladores H1 267K(s) = 578:3(s+ 0:39)(s+ 2:33)(s+ 220:72)que equivale b�asicamente a un compensador de adelanto con un polo situado a altafrecuencia, incluido para mejorar la robustez del sistema. Para este regulador seobtienen: un margen de fase de 44.6 grados, un margen de ganancia de 44.3 db, yun porcentaje de incertidumbre multiplicativa tolerable (1/max(T )) del 70%.Para analizar el comportamiento del controlador dise~nado frente a la din�amicainmodelada, se considera que la planta real viene dada porG0 = G(1 + Em)con, Em(s) = s(�0:30556s+ 0:6667)s2 + s+ 100

-80

-60

-40

-20

0

20

40

60

80

10-1 100 101 102

rad/s

Tol

eran

cia

e in

cert

idum

bre

(dB

)

Tolerancia

Incertidumbre multiplicativa

Figura 10.15: Incertidumbre tolerable e incertidumbre existenteEn la �gura 10.15 se muestran el nivel de tolerancia a incertidumbre multiplica-tiva del sistema de control, as�� como la magnitud de Em(j!). La respuesta temporal

Page 284: Control Adaptativo y Robusto

268 Problemas de control H2; H1 en el espacio de estados

0

0.2

0.4

0.6

0.8

1

1.2

1.4

0 2 4 6 8 10 12 14

tiempo (seg)

resp

uest

a

Figura 10.16: Comportamientos con planta nominal y planta realpuede verse en la �gura 10.16, en la que se muestra el comportamiento para el mo-delo nominal de la planta G, y para el modelo real G0. Como puede verse, en estecaso el efecto de la din�amica inmodelada es muy poco apreciable, cosa que ponede mani�esto la robustez del comportamiento del sistema de control, al menos paraeste tipo de incertidumbre.Ejemplo: Dise~no de controladores H2; H1 de tiempo discretoEn este ejemplo se plantea el problema de controlar una planta, cuyo modelomatem�atico es de tiempo continuo G(s), por medio de un regulador de tiempodiscreto K(z), empleando un per��odo de muestreo de Tm = 0:01 segundos. En la�gura 10.17 se muestra el diagrama de bloques del sistema de control.El procedimiento de dise~no empleado sigue los pasos siguientes:1. Se obtiene un modelo discreto de la planta G(z), empleando para ello la aprox-imaci�on del mantenedor de orden cero (ZOH).

Page 285: Control Adaptativo y Robusto

Controladores H1 269i �� �� ZHO -6- K(z) G(s)r Tm Tm y�Figura 10.17: Controlador H1 de tiempo discreto2. Se realiza la transformaci�on bilineal inversa, obteni�endose un sistema continuoen el plano-w G(w).3. Se dise~na el controlador H2; H1, obteniendo K(w)4. Se emplea la transformaci�on bilineal para obtener el regulador equivalente detiempo discreto K(z).En forma sint�etica, dicho proceso de dise~no consiste en:G(s) ZOH�! G(z) bilin�1�! G(w) H2;H1�! K(w) bilin�! K(z)donde el operador bilin empleado realiza una trasformaci�on del plano w al plano zconsistente en: w = 2(z � 1)Tm(z + 1)La transformaci�on inversa bilin�1 se emplea para dise~nar un regulador de tiempodiscreto con t�ecnicas de tiempo continuo en el plano-w.La funci�on de transferencia de la planta a controlar es,G(s) = 900s3 + 30s2 + 700s+ 1000En la �gura 10.18 pueden verse las respuestas en frecuencia de G(s) y G(w) paraun per��odo de muestreo de Tm = 0:01 seg:Las especi�caciones de dise~no para el sistema de control son:

Page 286: Control Adaptativo y Robusto

270 Problemas de control H2; H1 en el espacio de estados

-250

-200

-150

-100

-50

0

50

10-3 10-2 10-1 100 101 102 103 104 105

rad/s

|G(s

)|, |

G(w

)| (

db)

|G(s)|

|G(w)|

Figura 10.18: Respuestas en frecuencia de G(s)yG(w)� Especi�caci�on de comportamiento nominal (NP): reducci�on de la sensibilidadde al menos 1=100 hasta una frecuencia de aproximadamente 1 rad=seg. Loanterior puede conseguirse mediante una funci�on de ponderaci�on WS de laforma, W�1S = 0:01(s+ 1)2�(s=30 + 1)2� Especi�caci�on de estabilidad robusta (RS): un ancho de banda de unos 30 rad=s,una tolerancia a incertidumbre multiplicativa superior al 32 %, y una ca��da dej T j inferior a �20 db para frecuencias superiores a 2000 rad=s. Estas especi-�caciones se pueden tener en cuenta eligiendo una funci�on de ponderaci�on WTde la forma, W�1T (s) = 3:16(s=300 + 1)(s=10 + 1)El par�ametro � empleado en WS tiene el sentido f��sico de que al aumentarlo seimpone al sistema de control una especi�caci�on de npm�as exigente (un valor inferiorde j S j a baja frecuencia). El proceso de dise~no consiste en �jar WT y variar �, deforma que se cumpla la condici�on de estabilidad robusta, as�� como que se optimiceel comportamiento nominal simult�aneamente para el valor mayor de � posible. Enla �gura 10.19 se muestran las formas de W�1T y W�1S para � = 1:5.

Page 287: Control Adaptativo y Robusto

Controladores H1 271

-50

-40

-30

-20

-10

0

10

20

10-3 10-2 10-1 100 101 102 103 104 105

rad/s

|1/W

_S|,

|1/W

_T|

(db)

|1/W_S|

|1/W_T|

Figura 10.19: Respuesta en frecuencia de funciones de ponderaci�on inversasW�1S ;W�1TSe plantea por tanto un problema de control H1 de sensibilidad mixta (np +rs): kTzwk1 = WSSWTT 1 < 1 (10:37)Se inicia el proceso de dise~no con � = 1, obteni�endose un regulador H1 para elque se cumplen las especi�caciones de dise~no. A �n de mejorar las prestaciones delregulador, se inicia un proceso iterativo dando valores al par�ametro �. Se concluye�nalmente, que el objetivo de dise~no 10.37 se veri�ca con un regulador H1 para unvalor de hasta � = 1:5, no cumpli�endose para un regulador H2. En la �gura 10.20pueden compararse las respuestas en frecuencia de Tzw para ambos reguladores.Como puede comprobarse, el regulador H2 no consigue el objetivo kTzwk1 < 1,mientras s�� se alcanza con el regulador H1.En las �guras 10.21, 10.22, 10.23 y 10.24 se muestran respectivamente las res-puestas en frecuencia de W�1S con S, W�1T con T , para el regulador H2 y el H1.Finalmente en la �gura 10.25 se muestra la curva de Nichols (de la funci�on de trans-ferencia en lazo abierto L = GK) obtenida con el regulador H1. A partir de ella,puede obtenerse que el controlador dise~nado proporciona un margen de ganancia de

Page 288: Control Adaptativo y Robusto

272 Problemas de control H2; H1 en el espacio de estados

-16

-14

-12

-10

-8

-6

-4

-2

0

2

4

10-3 10-2 10-1 100 101 102 103 104 105

rad/s

|T_z

w| (

db)

H_inf

H_2

Figura 10.20: Respuesta en frecuencia de Tzw para reguladores H2 y H112 decibelios, y un margen de fase de 43 grados. Por otro lado, a partir de 1= j T jse obtiene una tolerancia a incertidumbre multiplicativa superior al 60 % en el peorde los casos. El regulador H1 obtenido, K(z), es de orden 6, el mismo de la plantageneralizada. Ya que la planta a controlar es de orden 3, la funci�on de ponderaci�onWS es de orden 2, y WT es de primer orden.K(z) = 16:7016z6 � 40:2747z5 + 13:4628z4 + 35:544z3 � 31:404z2 + 3:7234z + 2:2497z6 � 1:5311z5 + 0:1799z4 + 0:2894z3 + 0:0413z2 + 0:0169z + 0:0037En las �guras 10.26 y 10.27 se muestran respectivamente la se~nal de control y larespuesta obtenida con el regulador H1.

Page 289: Control Adaptativo y Robusto

Controladores H1 273

-50

-40

-30

-20

-10

0

10

20

10-3 10-2 10-1 100 101 102 103 104 105

rad/s

|S|,

|1/W

_S|

(db) |S|

|1/W_S|

Figura 10.21: Magnitudes de W�1S y S para regulador H2

-60

-50

-40

-30

-20

-10

0

10

20

10-3 10-2 10-1 100 101 102 103 104 105

rad/s

|T|,

|1/W

_T|

(db)

|T||1/W_T|

Figura 10.22: Magnitudes de W�1T y T para regulador H2

Page 290: Control Adaptativo y Robusto

274 Problemas de control H2; H1 en el espacio de estados

-50

-40

-30

-20

-10

0

10

20

10-3 10-2 10-1 100 101 102 103 104 105

rad/s

|S|,

|1/W

_S|

(db) |S|

|1/W_S|

Figura 10.23: Magnitudes de W�1S y S para regulador H1

-60

-50

-40

-30

-20

-10

0

10

20

10-3 10-2 10-1 100 101 102 103 104 105

rad/s

|T|,

|1/W

_T|

(db)

|T|

|1/W_T|

Figura 10.24: Magnitudes de W�1T y T para regulador H1

Page 291: Control Adaptativo y Robusto

Controladores H1 275

-80

-60

-40

-20

0

20

40

60

-450 -400 -350 -300 -250 -200 -150 -100 -50 0

arg(L) (gra)

|L|

(db)

Figura 10.25: Curva de Nichols para regulador H1

-20

-15

-10

-5

0

5

10

15

20

5 10 15 20 25 30 35 40 45 50

muestras (Tm=0.01 seg.)

cont

rol

Figura 10.26: Se~nal de control para cambio en escal�on unidad, con regulador H1

Page 292: Control Adaptativo y Robusto

276 Problemas de control H2; H1 en el espacio de estados

0

0.2

0.4

0.6

0.8

1

1.2

1.4

5 10 15 20 25 30 35 40 45 50

muestras (Tm=0.01 seg.)

resp

uest

a

Figura 10.27: Respuesta a escal�on unidad, con regulador H1

Page 293: Control Adaptativo y Robusto

Cap��tulo 11Aplicaci�on de control robusto11.1 Introducci�onHasta la d�ecada de los ochenta las aplicaciones de las t�ecnicas de control moderno enlos buques hab��a sido algo bastante inusual. A pesar de la amplia aceptaci�on y �exitosconseguidos en otras ramas de la ingenier��a (probablemente el contrapunto sea la in-dustria aeron�autica), donde los avances de la teor��a de control han sido r�apidamenteincorporados en la b�usqueda de la mejora del funcionamiento y seguridad.Las razones de la inercia presentada por la industria naval hay que buscarlas endiversos factores, tales como: la mayor duraci�on de los barcos comparados con losaviones, la resistencia a intentar nuevas t�ecnicas cuando los m�etodos tradicionaleshan demostrado tener un funcionamiento v�alido, as�� como la ca��da en la industriade construcci�on naval, entre otros.En muchos casos, la innovaci�on ha consistido en la sustituci�on directa de losantiguos sistemas de control anal�ogicos por otros equivalentes digitales, y el aprove-chamiento de la potencia de computaci�on del ordenador empleado, para incorporaro mejorar tareas de monitorizaci�on y alarma; m�as que para explotar los bene�ciosque podr��a reportar el empleo de algoritmos de control avanzado.Los primeros autopilotos para el guiado autom�atico de barcos eran simples dis-positivos en los que el error de rumbo se utilizaba para producir una orden al ser-vosistema del tim�on proporcional al error del rumbo. Posteriormente se modi�c�oincluyendo el efecto derivativo para mejorar la respuesta transitoria y el efecto inte-277

Page 294: Control Adaptativo y Robusto

278 Introducci�ongral para corregir los errores estacionarios debidos a las perturbaciones ambientales.Debido a su simplicidad, �abilidad y bajo coste, los autopilotos pid a�un semantienen en la mayor��a de barcos. Uno de los principales inconvenientes es lanecesidad de sintonizaci�on por parte del operador, para adaptarse al cambio decondiciones de navegaci�on.Ha sido el per��odo de �nales de los setenta y durante la d�ecada de los ochenta,cuando la mejora del sistema de control de los buques ha experimentado un notableincremento en investigaci�on y desarrollo. La justi�caci�on se debe primordialmentea razones tales como:1. Las elevadas subidas del precio del petr�oleo y la b�usqueda de la reducci�on delcoste en los transportes.2. La exigencia de mejora en la seguridad del transporte mar��timo.3. La transferencia tecnol�ogica acelerada por los recientes avances de la micro-electr�onica, inform�atica y telecomunicaciones.4. El �exito obtenido en otras ramas de la industria, en la aplicaci�on de los �ultimosdesarrollos de la teor��a de control.El impulso proporcionado en la �ultima d�ecada se pone de mani�esto, en el hechode que todos los buques de nueva construcci�on incorporan un sistema autom�aticom�as o menos so�sticado para el control del rumbo.Por otro lado, ha demostrado ser de gran utilidad, tanto para buques de laMarina Mercante como para los de la Armada, el que adicionalmente al problemadel control del rumbo de un buque (escalar o monovariable), se considere el empleode sistemas activos de estabilizaci�on para la regulaci�on del movimiento de balance;lo cual da lugar a un problema de control multivariable (sistema con dos entradasy dos salidas). Si bien en la mayor��a de sistemas instalados a bordo se tratan comodos problemas de control independientes, en el sentido de que los reguladores sedise~nan de forma independiente entre s��, sin tener en cuenta el car�acter vectorial dela planta.El problema del control de un buque puede interpretarse seg�un la �losof��a delcontrol robusto, dado la gran cantidad de factores que van a in uir en la incertidum-bre del modelo de la planta. La din�amica de un buque va a depender de una seriede factores, entre los que cabe destacar (L�opez et al, 1995):

Page 295: Control Adaptativo y Robusto

Aplicaci�on de control robusto 279Din�amicadel buque

? ?6 6OtrosfactoresPerturbacionesambientales

de cruceroVelocidad de cargaCondiciones

Figura 11.1: Factores que afectan a un buque1. Velocidad de crucero.2. Estado de carga.3. Estado del mar, vientos y corrientes.4. Profundidad.5. Densidad del agua del mar.Un sistema de control e�caz ha de tener en cuenta los errores de modelado quese pueden acumular debido al efecto de diferentes factores. Por lo que el an�alisis derobustez del sistema es esencial, dadas las diversas circunstancias que van a in uirsobre la din�amica de la planta y por tanto sobre el comportamiento del sistema decontrol. En este cap��tulo se describen los dise~nos de controladores LTR, H2 y H1multivariables para el control del rumbo y balance de un buque, proponi�endose unconjunto de indicadores de robustez para su evaluaci�on.

Page 296: Control Adaptativo y Robusto

280 Descripci�on de la planta11.2 Descripci�on de la plantaLa complejidad de la din�amica de un buque, as�� como el alto coste econ�omico y detiempo para la realizaci�on de pruebas de mar experimentales, puso de mani�estola necesidad del empleo de modelos que captaran el comportamiento de un barcoen diversas condiciones de navegaci�on. A partir de �nales de los setenta el empleode modelos matem�aticos hizo que se avanzara en el dise~no y aplicaci�on de nuevossistemas de control en la industria naval, gracias a los avances conseguidos en loscomputadores digitales empleados para realizar las simulaciones.A partir de las leyes de la mec�anica, para un s�olido r��gido con seis grados de liber-tad (3 rotaciones y 3 traslaciones), se pueden obtener las ecuaciones que gobiernanel movimiento de un buque, referidas a un sistema de referencia �jado en el propiobarco:Para la traslaci�on (fuerzas):X = m[ _u+ qw � rv � xG(q2 + r2) + yG(pq � _r) + zG(pr + _q)]Y = m[ _v + ru� pw � yG(r2 + p2) + zG(qr � _p) + xG(qp+ _r)] (11.1)Z = m[ _w + pv � qu� zG(p2 + q2) + xG(rp� _q) + yG(rq + _p)]y para el giro (pares o momentos de fuerza):K = Ix _p+ (Iz � Iy)qr +m[yG( _w + pv � qu)� zG( _u+ ru� pw)]M = Iy _q + (Ix � Iz)rp+m[zG( _u+ qw � rv)� xG( _w + pv � qu)] (11.2)N = Iz _r + (Iy � Ix)pq +m[xG( _v + ru� pw)� yG( _u+ qw � rv)]El sistema de referencia est�a situado en el buque y no tiene por qu�e coincidircon el centro de gravedad del mismo (a veces se emplea el centro de simetr��a). Lasmagnitudes que aparecen en las ecuaciones anteriores son:� m: masa del barco.� Ix; Iy; Iz: momentos de inercia respecto a cada eje coordenado.� xG; yG; zG: posici�on del centro de masas.� �; �; : �angulos de giro respecto a los ejes coordenados (x; y; z).� r = _ ; p = _�; q = _�: velocidades angulares respecto a los tres ejes.

Page 297: Control Adaptativo y Robusto

Aplicaci�on de control robusto 281� u; v; w: componentes del vector velocidad referidos a los ejes coordenados(x; y; z). Tambi�en se emplean como: Vx = u; Vy = v; Vz = w.� X; Y; Z: componentes en cada eje de las fuerzas actuantes sobre el barco.� K;M;N : componentes en cada eje de los pares o momentos actuantes sobreel buque.En las �guras (11.2),(11.3) y (11.4) se muestra el signi�cado f��sico de las variablesm�as signi�cativas del modelo.

X

Y

Z

Figura 11.2: Sistema con 6 grados de libertadSi s�olo se consideran el desplazamiento en el plano horizontal y los giros respectoa los ejes (x; z), el sistema se reduce a un problema de cuatro grados de libertad.Las ecuaciones del movimiento quedan en ese caso:26664 (1�X 00G) 0 0 00 (1� Y 00_v ) �L(z00G + Y 00_p ) L(x00G � Y 00_r )0 �(z00G +K 00_vv) L(k00xx �K 00_p ) �L(z00Gx00G +K 00_r )0 (x00G �N 00_v ) �L(z00Gx00G +N 00_p ) L(k002zz �N 00_r ) 37775 26664 _u_v_p_r 37775 = 26664 XtotYtotKtotNtot 37775(11:3)

Page 298: Control Adaptativo y Robusto

282 Descripci�on de la plantaVx

Vy

V

Figura 11.3: Variables: �; ; u = Vx; v = Vy; V

Figura 11.4: Variables: �; �

Page 299: Control Adaptativo y Robusto

Aplicaci�on de control robusto 283Donde el sub��ndice \tot" indica las fuerzas y pares totales actuando sobre el casco,debidos a los efectos: hidrodin�amicos, viento, olas y corriente; y el resto de variablesson las magnitudes f��sicas del buque as�� como sus coe�cientes hidrodin�amicos.Para buques de grandes dimensiones, la consideraci�on anterior es razonable, yaque los movimientos m�as signi�cativos son los que afectan al gobierno del barco(rumbo y movimiento en el plano), y al movimiento de balance (giro con respectoa un eje axial al buque); despreci�andose el desplazamiento vertical y el giro conrespecto a un eje transversal conocido como movimiento de cabeceo. En ese caso, elmodelo, desde el punto de vista del control, se caracteriza por una o dos entradas decontrol (�angulos de tim�on y aletas estabilizadoras) y dos salidas (�angulos de rumboy balance); trat�andose por tanto de un sistema multivariable. Si �unicamente se est�ainteresado en el control del rumbo (por ejemplo, para el caso de grandes petroleros,en los que el movimiento de balance es menos apreciable), el modelo matem�atico sereduce a un sistema escalar de una entrada y una salida (ver ejemplo del control delrumbo dado en el cap��tulo 4, apartado 4.4).Entre las razones que justi�can el empleo de sistemas de control del movimientode balance pueden destacarse:1. Medida de seguridad en navegaci�on; ya que un corrimiento o desplazamientode la carga, causado por un �angulo de escora excesivo, puede poner en seriopeligro la estabilidad del buque.2. No tener que desviarse en exceso de una ruta dada debido a unas condicionesambientales adversas.3. Mejora en las condiciones de trabajo de la tripulaci�on.4. Aumento de la comodidad del pasaje, en su caso.5. Conseguir una plataforma estable adecuada, para el disparo y aterrizaje abordo, en los buques de la Armada.Para ello, se pueden emplear diferentes t�ecnicas: 1) sistemas de dep�ositos otanques de agua; 2) utilizaci�on del tim�on como sistema de estabilizaci�on del balance(rrs); y 3) la que ha resultado ser m�as e�caz, al menos para velocidades superioresa 12 nudos, que utiliza super�cies de control o aletas estabilizadoras.Al considerar el problema de control de los �angulos de rumbo ( ) y balance (�),empleando como variables de control los �angulos de tim�on (�) y de las aletas (�),se plantea un problema de control de un sistema multivariable. En determinados

Page 300: Control Adaptativo y Robusto

284 Descripci�on de la plantaBUQUE ----

balance (�)�angulo de�angulo derumbo ( )

estabilizadores (�)�angulo de�angulo detim�on (�)Figura 11.5: Componentes de entrada-salida del problema multivariablebuques, existe una fuerte interacci�on entre las distintas variables de entrada y salida,por lo que el empleo de dos controladores independientes puede no dar buenosresultados. En ese caso, si se quiere conseguir un buen comportamiento, se haceaconsejable el empleo de t�ecnicas de control de sistemas multivariables.Desde el punto de vista del control de un buque se puede decir que hay dos condi-ciones de navegaci�on bien diferenciadas (L�opez et al, 1995). La primera, se trata delcaso en que el problema es el realizar una determinada maniobra que conlleve esfuer-zos grandes y prolongados de las variables de control (tim�on y aletas estabilizado-ras), en cuyo caso los efectos no lineales dominan el comportamiento del sistema.La otra, se da en situaciones de mantenimiento del rumbo, o cuando el proceso deregulaci�on para un cambio de consigna requiere unas desviaciones de las super�ciesde control (pala de tim�on y aletas estabilizadoras) que no sean excesivas en tiempoy magnitud. Bajo dichas condiciones el sistema se puede aproximar por un mo-delo lineal. Ello puede hacerse linealizando las ecuaciones del movimiento en tornoa una soluci�on estacionaria, para unas condiciones nominales de funcionamiento.Otra posible forma es realizando una identi�caci�on de la planta por algunos de losm�etodos dados en el cap��tulo 3; o una identi�caci�on en el dominio de la frecuencia,como se hizo para obtener el modelo matem�atico lineal mlmv19 que se describe acontinuaci�on.Para ilustrar el dise~no de controladores multivariables, se emplean los modeloslineales o linealizados multivariables (dos entradas y dos salidas) para unas condi-ciones de operaci�on de dos buques. Se emplean por un lado el modelo matem�aticoque denominaremos mlmv19 (modelo lineal de orden elevado obtenido por identi�-caci�on); y por otro modelo no lineal y variable en el tiempo que llamaremos modnl.En el primer caso, (mlmv19) el modelo matem�atico corresponde a un buque

Page 301: Control Adaptativo y Robusto

Aplicaci�on de control robusto 285ss -- - m6 -

- m -6--

�(s) �(s) (s)�(s)

G11(s)G12(s)G22(s)G21(s)Figura 11.6: Diagrama de bloque del sistema multivariabletipo fragata para unas condiciones nominales de funcionamiento y una velocidad de18 nudos1. Fue obtenido por (Freeman et al, 1982) empleando t�ecnicas de respuestaen frecuencia, a partir de las cuales se obtuvieron las cuatro funciones de transfe-rencia (G11; G12; G21; G22) que caracterizan la matriz de transferencia del sistemamultivariable.Las ecuaciones descriptivas de la planta vienen dadas por:" �(s) (s) # = " G11(s) G12(s)G21(s) G22(s) # " �(s)�(s) # (11:4)G11(s) = 19:92(1:54s2 + 0:976s+ 0:0077)(19:84s4 + 24:34s3 + 7:69s2 + 5:34s+ 0:234)(s2 + 3:645s+ 13:28)G12(s) = 13:916(0:965s2 + 0:61s� 0:176)(15:66s4 + 21:32s3 + 6:87s2 + 3:81s+ 0:193)(s2 + 9:402s+ 7:952)G21(s) = 0:1(s2 + 3:645s+ 13:28)(21:5s2 + s)G22(s) = 0:4266(s2 + 9:402s+ 7:952)(18:1s2 + s)La variable a controlar y1 corresponde al �angulo de balance �, la variable acontrolar y2 es el �angulo de rumbo , la variable de control u1 corresponde al �angulo1Navegaci�on: 1 Nudo = 1852 metros/hora.

Page 302: Control Adaptativo y Robusto

286 Descripci�on de la plantade aletas estabilizadoras �, y la variable de control u2 corresponde al �angulo detim�on �.Dado que una realizaci�on m��nima en el espacio de estados de este modelo es dedimensi�on elevada (diecinueve), se va a emplear un modelo de orden reducido de laplanta, a �n de obtener un controlador de menor dimensi�on y para hacer un an�alisisposterior de la robustez del sistema de control frente a la din�amica inmodelada dealta frecuencia (debida en este caso a la diferencia entre el modelo de orden completoy el modelo de orden reducido). Si se calculan los valores singulares de Hankel delmodelo completo de la planta:�Hi para: i = 1; 2; : : : ; 19se obtiene que: �H7 < 0:1�H6y dado que �Hi+1 � �Hi , se elige un modelo reducido de sexto orden. En la �gura 11.7se muestran las ganancias principales del modelo completo y del modelo reducido,como puede verse se consigue una buena aproximaci�on hasta una frecuencia de 3radianes/segundo. Dado que esta frecuencia va a ser muy superior al ancho de bandadel sistema en lazo cerrado, puede considerarse una aproximaci�on aceptable en elrango de frecuencias de inter�es.Las matrices de estado obtenidas para el modelo reducido de la planta son:A = 0BBBBBBBB@ 0:049 �0:015 �0:255 �0:442 0:986 0:0940:012 0:279 0:211 0:632 �0:112 0:357�0:010 0:151 0:228 0:443 �0:182 �0:555�0:092 �0:482 �0:213 �0:118 �0:896 �0:017�0:053 �0:179 �0:080 0:067 �0:569 �0:117�0:001 �0:203 0:307 0:010 �0:034 �0:178

1CCCCCCCCABT = �0:001 0:001 0:013 0:004 �0:039 0:0170:025 0:035 0:031 0:102 �0:106 0:033 !C = 0:011 �0:796 0:478 �1:149 0:113 �0:4800:023 �0:001 �0:001 0:001 �0:000 �0:000 !Para la s��ntesis del regulador se emplea el modelo reducido, sin embargo la eva-luaci�on de la respuesta temporal se realiza con el modelo de orden completo. En la�gura 11.8 se muestra el n�umero de condici�on, �(G), de la planta, a partir del cualpuede comprobarse que la planta tiene una fuerte direccionalidad en la ganancia,puesto que �(G)� 1 para todas las frecuencias (ver cap��tulo 8).

Page 303: Control Adaptativo y Robusto

Aplicaci�on de control robusto 287

-200

-150

-100

-50

0

50

100

10-4 10-3 10-2 10-1 100 101 102

G

G

Gp

Gp

w (rad/s)

sv (

db)

Figura 11.7: Respuestas en frecuencia de modelos completo (Gp) y reducido (G)

0

10

20

30

40

50

60

70

80

90

100

10-3 10-2 10-1 100

w (rad/s)

k(G

)

Figura 11.8: N�umero de condici�on de la planta

Page 304: Control Adaptativo y Robusto

288 Descripci�on de la plantaEn el segundo caso (modnl), el modelo matem�atico corresponde al desarrolladopor (Kallstrom et al, 1982), y corresponde a un buque mercante del tipo ro/ro-pasajeros. Este modelo es multivariable, no lineal y variable en el tiempo, sirviendopara caracterizar el comportamiento del buque tanto en operaci�on de mantenimientode rumbo, como en grandes maniobras. La validaci�on experimental de este modelofue realizada de forma exhaustiva por sus autores, ajustando sus par�ametros hastaconseguir una excelente correspondencia entre los resultados experimentales y lassimulaciones.Por ello, se puede considerar el modnl como un buen banco de pruebas paraevaluar los dise~nos de sistemas de control desarrollados tanto escalares como multiva-riables (L�opez y Rubio, 1995a; Messer y Grimble, 1992; Kallstrom et al, 1982). Lasexpresiones correspondientes a cada uno de los t�erminos que aparecen en la ecuaci�on11.3, correspondientes a los pares y fuerzas debidos a los factores hidrodin�amicos ylas perturbaciones ambientales, pueden encontrarse en (Kallstrom et al, 1982; L�opez,1994).Los �angulos de tim�on � y aletas � que se generan como magnitudes de mandoa trav�es de un controlador, ya sea autom�atico o manual, han de ser ejecutados porlas respectivas m�aquinas del tim�on y de las aletas estabilizadoras. Las din�amicas de�estos dispositivos se modelan como sistemas de primer orden, dados por:_� = (�c � �)=�R ; j _� j� _�max ; j � j� �max_� = (�c � �)=�F ; j _� j� _�max ; j � j� �maxsiendo �c y �c los �angulos de mando de consigna que se remiten como orden a lasala de m�aquinas (con las constantes de tiempo �R y �F ).Para mostrar la naturaleza no lineal del modnl, se presentan a continuaci�onalgunas pruebas de simulaci�on. En las �guras 11.9 y 11.10 puede verse la p�erdidasustancial de velocidad que experimenta el sistema si se somete a una prolongadaactivaci�on de la variable de control � (�angulo de tim�on). En dichas �guras se mues-tran la derivada del rumbo (o velocidad angular) r, y la velocidad V , para �angulosde tim�on de 20 y 10 grados respectivamente. Se representan as�� mismo el �angulo debalance �, y su derivada p. La velocidad nominal o de crucero inicial es en amboscasos de 15 nudos. Se observa, que a mayor �angulo de tim�on mayor es la p�erdida develocidad. Y dado que la din�amica del buque depende fuertemente y de forma nolineal de dicha velocidad, as�� como tambi�en de otras magnitudes,_ ; �; _�; �; �se tendr�a que durante dicha operaci�on el sistema tendr�a un comportamiento nolineal y variable en el tiempo.

Page 305: Control Adaptativo y Robusto

Aplicaci�on de control robusto 289-1

-0.8

-0.6

-0.4

-0.2

0

0 500

r (g

rad/

seg)

t (seg)

5

6

7

8

0 500

V (

m/s

)

t (seg)

-2

0

2

4

6

8

0 500

fi (g

rad)

t (seg)

-0.4

-0.2

0

0.2

0.4

0.6

0 500

p (g

rad/

s)

t (seg)Figura 11.9: r(t); V (t); �(t); p(t) para � = 20�; V = 15 nudos-1.5

-1

-0.5

0

0 500

r (g

rad/

seg)

t (seg)

3

4

5

6

7

8

0 500

V (

m/s

)

t (seg)

-5

0

5

10

15

0 500

fi (g

rad)

t (seg)

-0.5

0

0.5

1

0 500

p (g

rad/

s)

t (seg)Figura 11.10: r(t); V (t); �(t); p(t) para � = 10�; V = 7:72 m=s

Page 306: Control Adaptativo y Robusto

290 Descripci�on de la plantapolos � (seg)0-0.02825 � 0.30494j 3.27-0.0081 123.17-0.1403 7.12Tabla 11.1: Polos y constantes de tiempo de modnl linealizado para V = 7:72m=sPara realizar el dise~no de los reguladores es necesario que se disponga de unmodelo lineal de la planta. Para ello, el modnl se linealiza en torno a la soluci�onestacionaria u = V; v = r = � = p = � = � = 0donde V es la velocidad de crucero.A continuaci�on se dan las matrices de una representaci�on de estado del modelo(modnl) linealizado para una velocidad V = 15 nudos, as�� como la tabla 11.1con los polos y constantes de tiempo (�) asociados (no se considera la din�amicade los actuadores). Como puede verse el sistema tiene un par de polos complejosconjugados muy poco amortiguados.A = 0BBBBBB@ �0:02720 0:15048 0:00443 0:26255 00:00250 �0:04043 �0:39268 �0:09381 0�0:00128 �0:00129 �0:13732 �0:00204 00 1 0 0 00 0 1 0 0

1CCCCCCAB = 0BBBBBB@ 0:06466 0:1747�0:01426 �0:01319�0:0007 �0:005540 00 0

1CCCCCCA ; CT = 0BBBBBB@ 0 00 00 01 00 11CCCCCCA

Page 307: Control Adaptativo y Robusto

Aplicaci�on de control robusto 29111.3 Evaluaci�on de los controladoresCuando se realiza el dise~no de un regulador utilizando para ello alg�un criterio de opti-mizaci�on, o siguiendo una determinada t�ecnica, conviene evaluar las caracter��sticasde dicho regulador frente a diferentes indicadores de comportamiento y robustez,que proporcionen una visi�on m�as global de las prestaciones del regulador. A con-tinuaci�on se proponen un conjunto de indicadores para evaluar los dise~nos que serealicen.� An�alisis de la respuesta temporal y se~nales de control.� Caracterizaci�on del rechazo de las perturbaciones actuantes a la salida (do) ya la entrada (di) de la planta, por medio de:Ido = �[So(j!)]; Idi = �[SoG(j!)]� Indicador de Comportamiento Nominal (una medida del grado de recuperaci�ona una frecuencia ! = !o dada):INP = min( �[L(j!o)]�[Lt(j!o)] ; �[L(j!o)]�[Lt(j!o)])� M�argenes de Estabilidad (extensi�on al caso multivariable de los m�argenes defase y ganancia cl�asicos, se emplean para ello los valores propios, �i de lamatriz de transferencia en lazo abierto):MG = mini fMG(�i)g ; MF = mini fMF (�i)gEn el caso de un sistema multivariable, los m�argenes de fase y ganancia as��obtenidos no proporcionan la utilidad que tienen en el caso de los sistemasescalares para caracterizar la robustez del sistema. Pero s�� pueden utilizarsecomo indicadores de robustez cualitativos (Lunze, 1989; Doyle y Stein, 1981),en el sentido de que si se obtienen valores poco satisfactorios de MG y MF,ello ser�a indicativo de la falta de robustez.� Indicadores de Estabilidad Robusta (estimaci�on del tanto por ciento de incer-tidumbre tolerable para la que el sistema mantiene su estabilidad): 22El sub��ndice\i" indica que se trata de un indicador con respecto a incertidumbre de tipomultiplicativo que se considera re ejada a la entrada de la planta, mientras que con el sub��ndice\o"se indica que se considera a la salida.

Page 308: Control Adaptativo y Robusto

292 Dise~no de controladores LTR multivariables{ Incertidumbre multiplicativa no estructurada: 3I11i : M = Ti; I11o : M = Tomin! f1=�[M(j!)]g 100%{ Incertidumbre multiplicativa con estructura diagonal:I12i : M = Ti; I12o : M = Tomin! f1=�[M(j!)]g 100%{ Incertidumbres multiplicativas simult�aneas con estructuras diagonales:I1s : min! f1=�[M(j!)]g 100%M = " �Ti �SiKSoG �To #� Indicadores de Comportamiento Robusto (estima el tanto por ciento de in-certidumbre de tipo multiplicativo con estructura diagonal tolerable para laque el sistema cumple una especi�caci�on de comportamiento dada de la forma�(SoWS) � 1): I3i : M = " �Ti �KSoWSSoG SoWS #I3o : M = " �To �ToWSSo �ToWS #min! f1=�[M(j!)]g 100%11.4 Dise~no de controladores LTR multivaria-blesEn este apartado se realiza el dise~no de controladores LTR (LTR-o y LTR-i) conla estructura convencional, as�� como para la estructura no basada en observador,ambas descritas en el cap��tulo 9.3�; � representan los valores singulares extremos, y � el valor singular estructurado. M repre-senta el sistema de interconexi�on correspondiente a cada caso.

Page 309: Control Adaptativo y Robusto

Aplicaci�on de control robusto 29311.4.1 Dise~no LTR-oPara el dise~no del regulador se sigue el procedimiento descrito en el cap��tulo 9.El par�ametro\q" (ganancia de recuperaci�on) se incrementa s�olo lo necesario pararealizar una recuperaci�on aceptable en el rango de frecuencias de inter�es del sistema(zonas de baja y media frecuencia). As�� se evita incrementar la sensibilidad delsistema a la din�amica no modelada de alta frecuencia (rs), y se aproximan lasespeci�caciones de dise~no (np). Se desea que el sistema consiga un buen rechazode las perturbaciones y unos errores de seguimiento lo su�cientemente peque~nos(aproximaci�on de la acci�on integral). Para ello, se toman los siguientes par�ametrosde dise~no:Ro = " 10 00 1 # ; Qo = �aW�Ta ; W = " 0:9817 �0:1342�0:1342 0:0184 #Rc = I2; Qc = CTa Ca; Ca = [C O2]; BTa = [B O2]Aa = " A BO2�n ��I2�2 # ; �a = " On�2I2�2 # ; q = q1 = 103donde Aa; Ba y Ca son las matrices de la planta ampliada.En la �gura 11.11 se muestran las ganancias principales de L(s) para el con-trolador lqg/ltr-o (cbo); como puede verse, el controlador no consigue una re-cuperaci�on adecuada. Si se incrementa q hasta 1000q1, se obtiene el nivel de recu-peraci�on deseado a baja frecuencia, pero a costa de un incremento en el ancho debanda del regulador. Esto produce como consecuencia que las �ordenes generadaspor el controlador sean de magnitudes mayores, con lo que se puede provocar la sat-uraci�on de los actuadores de una forma m�as frecuente, una mayor sensibilidad a lasincertidumbres y a las perturbaciones ambientales, as�� como la posible generaci�onde �ordenes de control irrealizables f��sicamente por el sistema.Si se emplea un controlador ltr-o (cnbo) con los mismos par�ametros de dise~nodados arriba, se observa la mejora en el grado de recuperaci�on conseguida a bajafrecuencia con respecto al cbo ( �gura 11.12); puede comprobarse que es el mismoque el obtenido con la estructura est�andar (cbo) para q = 1000q1. El efecto deincrementar el valor de q puede verse al comparar las �guras 11.13 y 11.14, dondese muestran las respuestas temporales y demandas de control para ambos contro-ladores: cbo, q = 1000q1 y cnbo, q = q1.En la �gura 11.15 se puede observar c�omo el regulador dise~nado cumple lasespeci�caciones deseadas para el rechazo de las perturbaciones actuantes tanto a lasalida (�i(So)), como a la entrada (�i(SoG)) de la planta. En la misma �gura se

Page 310: Control Adaptativo y Robusto

294 Dise~no de controladores LTR multivariables

-150

-100

-50

0

50

100

150

10-5 10-4 10-3 10-2 10-1 100 101 102

w (rad/s)

sv(L

) (d

b)

q=1000 (cbo)

LTR

KBF

KBF

LTR

LTR

KBF

Figura 11.11: Valores singulares de Ho(s) y L(s), para q = q1 = 103, cbo

-150

-100

-50

0

50

100

150

10-5 10-4 10-3 10-2 10-1 100 101 102

w (rad/s)

sv(L

) (d

b)

q=1000 (cnbo)

KBF

LTR

Figura 11.12: Valores singulares de Ho(s) y L(s), para q = q1 = 103, cnbo

Page 311: Control Adaptativo y Robusto

Aplicaci�on de control robusto 295-2

0

2

4

6

8

0 50 100 150 200 250 300

t (seg)

y (g

ra)

y1

y2

-40

-20

0

20

40

60

0 10 20 30 40 50 60 70 80 90 100

t (seg)

u (g

ra)

u1

u2

q=1e6, (cbo)

Figura 11.13: Respuesta temporal para cbo, q = 103q1-2

0

2

4

6

8

0 50 100 150 200 250 300

t (seg)

y (g

ra)

y1

y2

-40

-20

0

20

40

60

0 10 20 30 40 50 60 70 80 90 100

t (seg)

u (g

ra)

u1

u2

q=1e3, (cnbo)

Figura 11.14: Respuesta temporal para cnbo, q = q1

Page 312: Control Adaptativo y Robusto

296 Dise~no de controladores LTR multivariables-80

-60

-40

-20

0

20

10-5 10-2 101

rad/s

sv(S

o) (

db)

-80

-60

-40

-20

0

20

10-5 10-2 101

rad/s

sv(S

oG)

(db)

-20

0

20

40

60

10-5 10-2 101

rad/s

1/[s

v(M

),ss

v(M

)] (

db)

iMi

iMies

-20

0

20

40

60

10-5 10-2 101

rad/s

1/[s

v(M

),ss

v(M

)] (

db)

iMo

iMoes

Figura 11.15: Caracter��stica rechazo perturbaciones y niveles de incertidumbre tol-erablesrepresentan tambi�en unas estimaciones de las tolerancias del sistema de control aincertidumbres de tipo multiplicativo, que se den a la entrada (iMi) o a la salida dela planta (iMo) respectivamente. Para incertidumbre no estructurada se representa:1=�[M(j!)]y para el caso de incertidumbres con estructura diagonal (a la entrada de la plantapuede corresponder a la din�amica no modelada de los actuadores: iMies, y si seconsidera a la salida de la planta se podr��a representar la din�amica de los sensores(iMoes), se representa: 1=�[M(j!)]donde M(j!) es el sistema de interconexi�on. Con 1=�[M(j!)] se obtienen unasestimaciones de las tolerancias a las incertidumbres mayores que con 1=�[M(j!)],o lo que es lo mismo: se obtiene una estimaci�on de la robustez de la estabilidadsuperior. Esto es l�ogico, al suponer la primera una condici�on menos conservativaque la �ultima. Puede comprobarse tambi�en, que el sistema es m�as robusto frente aincertidumbres situadas a la salida de la planta que frente a incertidumbres situadasa la entrada; ello es consecuencia de que el dise~no realizado es ltr-o.En la tabla 11.2 se resumen los valores de los indicadores de robustez consegui-

Page 313: Control Adaptativo y Robusto

Aplicaci�on de control robusto 297Controlador I11i I12i I11o I12o I1s MG MF I3o I3i% % % % % db gra % %cbo: q = 1000q1 23.0 27.5 76.1 76.1 22.0 26.9 59.8 38.3 24.5cnbo: q = q1 25.3 62.1 74.9 74.9 34.3 18.9 51.8 53.5 40.9Tabla 11.2: Indicadores de robustez de los controladores LTR-o (mlmv19)dos por ambos controladores ltr-o para el mismo grado de recuperaci�on (inp) 4.Finalmente, se puede realizar una implementaci�on del regulador en tiempo discreto,empleando un per��odo de muestreo de hasta 1 segundo, con el cual el regulador detiempo discreto proporciona un comportamiento en lazo cerrado equivalente al detiempo continuo.11.4.2 Dise~no LTR-iEn este apartado se presentan los resultados de simulaci�on obtenidos con el modelono lineal multivariable; a �n de evaluar los controladores que se dise~nan a partir demodelos linealizados para distintas condiciones de trabajo. En la secci�on anterior seha realizado un dise~no ltr-o, en �esta se hace uno ltr-i, para as�� ilustrar aplicacionesde ambas metodolog��as. Una discusi�on m�as amplia sobre el dise~no y an�alisis dereguladores ltr-i para distintas condiciones de funcionamiento puede encontrarseen (L�opez, 1994; L�opez y Rubio, 1995a).Con el modelo linealizado de la planta (modnl) para una velocidad de V =15 nudos y los par�ametros de dise~no:Rc = " 0:1 00 1 # Qc = CTQC Q = " 10 00 1 #Ro = I2 Qo = BBT q = 106se obtiene un regulador lqg/ltr-i. En la �gura 11.16 se tiene la respuesta obtenidacon el modelo lineal, que puede compararse con la obtenida para el modelo no linealdada en la �gura 11.17.El controlador se ha calculado para una condici�on de trabajo dada, por lo queinteresa ver el comportamiento del sistema en otras condiciones diferentes. Esto se4Los valores de la tabla 11.2 est�an expresados: MF en grados, MG en decibelios y el resto deindicadores en tanto por ciento de incertidumbre tolerable.

Page 314: Control Adaptativo y Robusto

298 Dise~no de controladores LTR multivariables-2

0

2

4

6

8

0 20 40 60 80 100 120 140 160 180 200

t (seg)

y (g

ra)

y1

y2

-10

-5

0

5

10

0 20 40 60 80 100 120 140 160 180 200

t (seg)

u (g

ra)

u1

u2

Figura 11.16: Respuesta con modelo linealizado de modnl-2

0

2

4

6

8

0 20 40 60 80 100 120 140 160 180 200

t (seg)

y (g

ra)

y1

y2

-10

-5

0

5

10

0 20 40 60 80 100 120 140 160 180 200

t (seg)

u (g

ra)

u1

u2

Figura 11.17: Respuesta con modelo no lineal (modnl)

Page 315: Control Adaptativo y Robusto

Aplicaci�on de control robusto 299hace analizando las respuestas temporales del sistema a cambio de consigna tipoescal�on de 5 grados, para velocidades de crucero de V1 = 10 nudos y V2 = 21 nudosrespectivamente, que se muestran en la �gura 11.18. Como puede verse, ambasrespuestas son satisfactorias.0

2

4

6

0 50 100 150 200

t (sec)

head

ing

(deg

)

V1

V2

-0.4

-0.2

0

0.2

0.4

0 50 100 150 200

t (sec)

roll

(deg

)

V1

V2

-6

-4

-2

0

2

0 50 100 150 200

t (sec)

rudd

er (

deg)

V1

V2

-4

-2

0

2

0 50 100 150 200

t (sec)

fin (

deg)

V1

V2

Figura 11.18: Respuestas temporales para diferentes condiciones de navegaci�onSe ha visto que, para excursiones moderadas del vector de control, el sistema nolineal (modnl) responde adecuadamente con el regulador lineal dise~nado. Sin em-bargo, el modelo es fuertemente no lineal, por ello se trata de evaluar al controladoren una situaci�on en la que los efectos no lineales dominen el comportamiento delsistema. Esta circunstancia se da en el caso de grandes cambios de consigna, en losque el vector de control puede llegar a saturarse o tomar valores elevados, duranteper��odos de tiempo relativamente largos; con las consiguientes p�erdidas de velocidady cambios en la planta que ello produce.En la �gura 11.19 se muestra la respuesta del sistema para un cambio de consignade 180 grados; como puede verse, el comportamiento es excelente: no produce unasobreoscilaci�on apreciable y la interacci�on con la otra variable a controlar es muybaja, si se compara con los resultados obtenidos para la misma maniobra empleandoun controlador monovariable (ver �gura 11.20). La importancia de este controladorestriba en que al reducir el �angulo de inclinaci�on o balance (tambi�en denominado de

Page 316: Control Adaptativo y Robusto

300 Dise~no de controladores LTR multivariablesescora) durante la maniobra, se mejora la robustez del sistema frente a un �angulo deescora excesivo, que circunstancialmente puede a su vez provocar un desplazamientode la carga y por tanto un fuerte cambio en las caracter��sticas que determinan laestabilidad del buque, aumentando el peligro de vuelco.0

50

100

150

200

0 500 1000

t (seg)

y2 (

gra)

-40

-20

0

20

40

0 500 1000

t (seg)

u2 (

gra)

-10

0

10

0 500 1000

t (seg)

y1 (

gra)

-40

-20

0

20

40

0 500 1000

t (seg)

u1 (

gra)

Figura 11.19: Respuesta modnl controlador multivariable, ltr-iEl regulador anterior se ha desarrollado para conseguir un funcionamiento ade-cuado para cambios en la referencia. Como ya se ha dicho, otra importante condici�onde funcionamiento se re�ere a la situaci�on de mantenimiento del rumbo y reducci�ondel movimiento de balance. La exigencia anterior no est�a garantizada en presenciade perturbaciones para el controlador LTR-i anterior (ver �gura 11.21). En dicha�gura se muestran las tolerancias a incertidumbres y la caracter��stica en frecuenciapara el rechazo de las perturbaciones que se den tanto a la entrada como a la salidade la planta.El comportamiento esperado del sistema frente a perturbaciones, se puede de-terminar a partir de las respuestas en frecuencia de So(s)G(s) y So(s), dadas enla �gura 11.21; de la que se deduce que las perturbaciones no van a ser atenuadasindependientemente de la direcci�on en que �estas se den. Para ello se propone modi-�car las matrices de ponderaci�on y ampliar el modelo de la planta para el dise~no delcontrolador ltr-i; incorporando una caracter��stica de alta ganancia en lazo abierto

Page 317: Control Adaptativo y Robusto

Aplicaci�on de control robusto 3010

50

100

150

200

0 500 1000

t (seg)

y2 (

gra)

-40

-20

0

20

40

0 500 1000

t (seg)

u2 (

gra)

-10

0

10

0 500 1000

t (seg)

y1 (

gra)

-40

-20

0

20

40

0 500 1000

t (seg)

u1 (

gra)

Figura 11.20: Respuesta modnl controlador monovariablea baja frecuencia (aproximaci�on de la acci�on integral).Para ello se emplea un modelo linealizado de la planta para una velocidad decrucero de 21 nudos. Los par�ametros de dise~no tomados para el regulador ltr-i 5son los siguientes:Aa = A On�2�C O2�2 ! ; Ba = BO2�2 ! ; CTa = CO2�2 !Rc = 5 " 1 00 1 # Qc =MTa QMaQ = " 100 00 1 # Ma = "C 0:1 00 0:1 # � = BaRo = I2 Qo = ��T ; q = 106donde las matrices Aa; Ba y Ca corresponden al modelo de la planta ampliada uti-lizado para el c�alculo del regulador.5Se emplea la versi�on no basada en observador, dado que a baja frecuencia se produce unarecuperaci�on del lazo abierto sensiblemente superior que con un regulador lqg/ltr-i est�andar.

Page 318: Control Adaptativo y Robusto

302 Dise~no de controladores LTR multivariables-20

0

20

40

60

80

10-4 10-1 102

w (rad/s)

1/sv

_max

(M)

(db)

iMi

-20

0

20

40

60

80

10-4 10-1 102

w (rad/s)

1/sv

_max

(M)

(db)

iMo

-80

-60

-40

-20

0

20

10-4 10-1 102

w (rad/s)

sv(S

o) (

db)

-80

-60

-40

-20

0

20

10-4 10-1 102

w (rad/s)

sv(S

oG)

(db)

Figura 11.21: Caracter��sticas de la tolerancia a incertidumbres y rechazo de lasperturbacionesEn la �gura 11.22 se muestran los valores singulares extremos de So(j!) ySo(j!)G(j!). Como puede verse, �[So(j!)G(j!)] < 1 (�4:96db) para toda !;as�� mismo, �[So(j!)G(j!)] y �[So(j!)] son ambos lo su�cientemente peque~nos enla zona de baja frecuencia, como es deseable. Con este controlador se obtienenlos siguientes indicadores de robustez: I11i = 62%; I12i = 70%; I11o = 61%; I12o =63%; I1s = 38%.La �gura 11.23 muestra las respuestas temporales del sistema para el controla-dor LTR-i (NOBC) multivariable, y para un controlador que no tiene en cuenta elcar�acter vectorial de la planta. En las simulaciones se emplea una altura signi�cativade olas de 4m y un �angulo de incidencia de 45� relativo al curso de referencia delbuque. Puede verse que hay una mejora notable en la reducci�on del movimiento delbalance si se emplea el controlador LTR-i multivariable.La �gura 11.24 muestra el rumbo (heading) y el balance (roll) para condiciones develocidad no nominales (18 nudos y 16:5 nudos); se observa que el comportamientoes adecuado, lo cual representa otra prueba de la robustez del controlador dise~nado.Debido a las din�amicas asociadas a la planta y a los reguladores, �estos se puedenimplementar directamente en un computador digital con un per��odo de muestreo de

Page 319: Control Adaptativo y Robusto

Aplicaci�on de control robusto 303-20

0

20

40

60

80

10-4 10-1 102

w (rad/s)

1/sv

_max

(M)

(db)

iMi

-20

0

20

40

60

80

10-4 10-1 102

w (rad/s)

1/sv

_max

(M)

(db)

iMo

-80

-60

-40

-20

0

20

10-4 10-1 102

w (rad/s)

sv(S

o) (

db)

-80

-60

-40

-20

0

20

10-4 10-1 102

w (rad/s)

sv(S

oG)

(db)

Figura 11.22: Caracter��sticas de la tolerancia a incertidumbres y rechazo de lasperturbaciones-10

-5

0

5

10

0 500

t (sec)

roll

(deg

)

SISO controller

-10

-5

0

5

10

0 500

t (sec)

head

ing

(deg

)

SISO controller

-10

-5

0

5

10

0 500

t (sec)

roll

(deg

)

MIMO controller

-10

-5

0

5

10

0 500

t (sec)

head

ing

(deg

)

MIMO controller

Figura 11.23: Operaci�on con rumbo constante bajo acci�on de las olas

Page 320: Control Adaptativo y Robusto

304 Dise~no de controladores H2 y H1 multivariables-10

-5

0

5

10

0 500

t (sec), V=9.5m/s

roll

(deg

)

-10

-5

0

5

10

0 500

t (sec), V=9.5m/s

head

ing

(deg

)

-10

-5

0

5

10

0 500

t (sec), V=8m/s

roll

(deg

)

-10

-5

0

5

10

0 500

t (sec), V=8m/s

head

ing

(deg

)

Figura 11.24: Comportamiento para condiciones de trabajo no nominales0:1 segundos, sin tener en cuenta de una manera expl��cita el car�acter muestreado delsistema de control. Todas las implementaciones de los algoritmos LTR-i empleadosen las simulaciones con el modelo no lineal (modnl) se realizan de esta forma (L�opezy Rubio, 1995a). Otra posibilidad ser��a utilizar un regulador de tiempo discretoequivalente, empleando por ejemplo un per��odo de muestreo de 0.5 segundos.11.5 Dise~no de controladores H2 y H1 multiva-riablesPara obtener un conjunto (WH) de matrices de ponderaci�on implicadas en los pro-blemas de dise~no H2 y H1 (ver cap��tulo 10):WH = fWS(s);WU(s);WT (s);Wr(s);Wn(s);Wdo(s);Wdi(s)g (11:5)que den una soluci�on f��sicamente realizable y satisfactoria, se pueden emplear dosprocedimientos:

Page 321: Control Adaptativo y Robusto

Aplicaci�on de control robusto 3051. Empezar sin informaci�on previa sobre la di�cultad del problema de dise~no atratar, e interpretar las especi�caciones de dise~no en el dominio frecuencialcomo elementos de WH . Ensayar distintas combinaciones, hasta conseguirunos resultados adecuados.2. Comenzar a partir de unos resultados previos, obtenidos con alguna t�ecnicade dise~no, que pongan de mani�esto la di�cultad del problema de control, denuna interpretaci�on en frecuencia de los resultados y sirvan para sugerir posiblesmejoras, a partir de una adecuada selecci�on de los elementos de WH .En este cap��tulo se emplea el segundo procedimiento, de forma que se aprovechanlos resultados de una primera fase de dise~no de un controlador ltr, a partir delos cuales se sugieren los elementos de WH , comparando �nalmente los resultadosobtenidos por los reguladores ltr, H2 y H1.La metodolog��a de dise~no propuesta tiene dos etapas o fases. La primera fase esopcional y consiste en el dise~no de un controlador H2. En la segunda fase se obtieneun regulador H1 basado en los resultados de la primera etapa. Si as�� se considera,s�olo se realiza la segunda etapa (L�opez y Rubio, 1995c; L�opez 1994). El algoritmopropuesto sigue los siguientes pasos:1. Seleccionar los elementos de WH .2. Resolver el problema del regulador �optimo H2 (cap��tulo 10).3. Ver si las respuestas temporal y frecuencial son adecuadas (analizar los indi-cadores de comportamiento y robustez); si no es as��, se vuelve al paso 1.4. Calcular el valor 2: kTzwk1 = 25. Hacer: = 26. Resolver el problema del regulador H1 para el valor de (ver cap��tulo 10).7. Si no se encuentra soluci�on para el valor de empleado, se toma uno mayory se vuelve al paso 6. Para encontrar el valor de para el que se consigue elregulador �optimoH1, se puede emplear, por ejemplo, el m�etodo de la bisecci�oncomo procedimiento iterativo de b�usqueda del �optimo.8. Calcular el valor 1: kTzwk1 = 1

Page 322: Control Adaptativo y Robusto

306 Dise~no de controladores H2 y H1 multivariables9. Ver si las respuestas temporal y frecuencial son adecuadas; si no es as��, seaumenta el valor de y se vuelve al paso 6.10. Disminuir el valor de y volver al paso 6.El proceso iterativo anterior, se interrumpe cuando se llega al valor �optimo = opt, o a un valor de > opt, para el que al disminuir su valor el regulador H1obtenido no da una respuesta temporal adecuada (por ejemplo: un excesivo aumentode la magnitud de control comparado con el reguladorH2 previo); o si ocurre que a�una pesar de disminuir el valor de kTzwk1, el controlador obtenido tiene globalmenteunos indicadores de robustez menos satisfactorios. Puede igualmente darse el caso,de que al calcular el regulador H1 �optimo directamente empleando algunas de lasfunciones que tienen incorporadas los paquetes de programas de Dise~no de Sistemasde Control por Computador (cacsd), tales como Program CC, y Robust ControlToolbox, sea necesario el empleo de un regulador sub�optimo que de mejores carac-ter��sticas de robustez globales. De ah�� la importancia del conjunto de indicadoresde robustez propuesto (L�opez, 1994).11.5.1 Controladores H1 para sistema de orden elevadoSe plantea el problema de obtener el dise~no de controladores H2 y H1, a �n derealizar un an�alisis comparativo entre ellos y con los resultados anteriores obtenidoscon los reguladores LTR-o. Para realizar los dise~nos se emplea el modelo de ordenreducido (sexto orden) obtenido para el modelo mlmv19 descrito anteriormente, elcual es de orden diecinueve. Una vez obtenidos los reguladores se eval�uan con elmodelo de orden completo del buque.En primer lugar se plantea el problema de optimizaci�on de sensibilidad mixtadescrito en el cap��tulo 10. Para seleccionar las funciones de ponderaci�on: WS(s) yWT (s), se utilizan como ayuda los per�les (respuestas en frecuencia) de la ftladempleados para el dise~no ltr. O en otro caso, se parte simplemente de las especi�-caciones de dise~no sin disponer de dise~nos anteriores. Tras algunos ensayos, se tomapara la especi�caci�on del comportamiento nominal (np):W�1S (s) = 26664 3:1623s+ 9:0 10�6s+ 0:09 00 3:1623s+ 4:510�6s+ 0:045 37775

Page 323: Control Adaptativo y Robusto

Aplicaci�on de control robusto 307y como funci�on de ponderaci�on de la funci�on de sensibilidad complementaria To(s):W�1T (s) = 2664 3:1623s+ 15003162:3s+ 474:34 00 3:1623s+ 7503162:3s+ 237:17 3775en la �gura 11.25 se muestran ambas funciones (matrices) de ponderaci�on, las cualesre ejan las especi�caciones de dise~no en el dominio de la frecuencia.

-20

-10

0

10

20

30

40

50

60

70

80

10-6 10-5 10-4 10-3 10-2 10-1 100 101 102 103 104

rad/s

sv(W

_S),

sv(W

_T)

(db)

W_S

W_T

Figura 11.25: Respuestas en frecuencia de WS y WTSe calcula el regulador �optimo H2 (sensibilidad mixta) de la forma descrita en elcap��tulo 10. Este regulador consigue:kTzw(j!)k1 � 2 = 0:566El valor = 2 se utiliza como valor de partida para resolver el problema de opti-mizaci�on H1. Empleando un proceso iterativo para el c�alculo del regulador H1, seobtiene: kTzw(j!)k1 = o = 0:480Dado que o < 2, se consigue una mejora con respecto al regulador H2 anterior, enel sentido de que se veri�ca la desigualdadkTzwk1 � 1

Page 324: Control Adaptativo y Robusto

308 Dise~no de controladores H2 y H1 multivariablescon m�as holgura. Las respuestas temporales de ambos reguladores, para un cambiotipo escal�on de [0; 5]T grados en la referencia, son muy similares; en la �gura 11.26se muestran para el regulador H1.-2

0

2

4

6

0 20 40 60 80 100 120 140 160 180 200

t (seg)

y (g

ra)

y1

y2

-40

-20

0

20

40

60

0 10 20 30 40 50 60 70 80 90 100

t (seg)

u (g

ra)

u1

u2

Figura 11.26: Respuesta temporal controlador H1 (sensibilidad mixta)Como se describe en el cap��tulo 8, la responsabilidad de la atenuaci�on de lasperturbaciones que act�uen sobre la planta, y de conseguir un seguimiento adecuadoa cambios de referencia, recae sobre las matrices de transferencia So(s) y So(s)G(s).En la �gura 11.27 se tienen los valores singulares de ambas para el controlador H1(sensibilidad mixta). El comportamiento de So es totalmente satisfactorio,�[So(j!)]� 1; a baja frecuenciacomo era de esperar del planteamiento hecho con el problema de sensibilidad mixta.Sin embargo, no ocurre lo mismo con SoG; dado que seg�un se deduce de la �gura11.27, se pueden dar perturbaciones vectoriales, actuantes a la entrada de la planta,que no sean atenuadas por el sistema.Para conseguir una caracter��stica similar a la del controlador ltr-o dise~nadoen la secci�on anterior, se modi�ca la funci�on de coste de modo que Tzw incluya unt�ermino que pondere tambi�en al factor SoG, puesto que de lo visto en el cap��tulo 8

Page 325: Control Adaptativo y Robusto

Aplicaci�on de control robusto 309-60

-40

-20

0

20

10-5 10-4 10-3 10-2 10-1 100 101 102

w (rad/s)

sv(S

o) (

db)

-150

-100

-50

0

50

10-5 10-4 10-3 10-2 10-1 100 101 102

w (rad/s)

sv(S

oG)

(db)

Figura 11.27: So y SoG para controlador H1 (sensibilidad mixta)se obtiene que el vector de error entre la referencia y la respuesta del sistema vienedado por, e = r � y= So(r � do � n)� SoGdiEn el planteamiento general del problema de optimizaci�on realizado en el cap��tulo10, se considera el caso particular:" z1(s)z3(s) # = " WS(s)So(s) �WS(s)So(s)G(s)Wdi(s)WT (s)To(s) WT (s)So(s)G(s)Wdi(s) # " r(s)di(s) #donde Wdi(s) se elige de forma que se especi�que, con los elementos (1,2) y (2,2) deTzw, el objetivo de conseguir como resultado un controlador que a baja frecuenciasatisfaga: �[So(j!)G(j!)]� 1 (11:6)Este objetivo puede alcanzarse (ver �gura 11.30) tomando las siguientes matrices

Page 326: Control Adaptativo y Robusto

310 Dise~no de controladores H2 y H1 multivariablesde ponderaci�on:Wdi(s) = 1s+ 1IWS(s) = 26664 s+ 7:210�23:1623s+ 2:2768 10�5 00 s+ 3:6 10�23:1623s+ 1:1384 10�5 37775WT (s) = 2664 3162:3s+ 379:473:1623s+ 1200 00 3162:3s+ 189:743:1623s+ 600 3775En las �guras 11.28 y 11.29 se muestran respectivamente las funciones de pon-deraci�on WS, WT , as�� como WSWdi y WTWdi, para el caso del problema de rechazoa las perturbaciones.

-20

-10

0

10

20

30

40

50

60

70

80

10-6 10-5 10-4 10-3 10-2 10-1 100 101 102 103 104

rad/s

sv(W

_S),

sv(W

_T)

(db)

W_S

W_T

Figura 11.28: Respuestas en frecuencia de WS y WTCon el regulador H2 se obtiene kTzwk1 = 1:533; mientras que el regulador H1,consigue kTzwk1 = 1:195. En la �gura 11.31 se muestra la respuesta temporal delsistema con el controlador H1 para un cambio de consigna [0; 5]T grados.Si se calculan los indicadores de robustez propuestos para los controladores

Page 327: Control Adaptativo y Robusto

Aplicaci�on de control robusto 311

-80

-60

-40

-20

0

20

40

60

10-6 10-5 10-4 10-3 10-2 10-1 100 101 102 103 104

rad/s

sv(W

_S W

_di),

sv(W

_T W

_di)

(db)

W_S W_di

W_T W_di

Figura 11.29: Respuestas en frecuencia de WSWdi y WTWdi-100

-50

0

50

10-5 10-4 10-3 10-2 10-1 100 101 102

w (rad/s)

sv(S

o) (

db)

-150

-100

-50

0

50

10-5 10-4 10-3 10-2 10-1 100 101 102

w (rad/s)

sv(S

oG)

(db)

Figura 11.30: So y SoG controlador H1

Page 328: Control Adaptativo y Robusto

312 Dise~no de controladores H2 y H1 multivariables-2

0

2

4

6

8

0 50 100 150 200 250 300

t (seg)

y (g

ra)

y1

y2

-40

-20

0

20

40

60

0 50 100 150 200 250 300

t (seg)

u (g

ra)

u1

u2

Figura 11.31: Respuesta temporal controlador H1dise~nados, se obtienen los resultados que se resumen en la tabla 11.3. Los valo-res de la tabla est�an expresados: MF en grados, MG en decibelios y el resto entanto por ciento de incertidumbre tolerable.

Controlador I11i I12i I11o I12o I1s MG MF I3o I3i% % % % % db gra % %H2 (s. mixta) 37 82.4 100 100 42.5 37.6 74.9 68.1 51.0H1 (s. mixta) 45.2 86.3 100 100 44.5 72.1 80.6 73.5 55.6H2 42.1 45.8 72.9 74.1 34.8 12.3 58.7 51.8 37.9H1 31.7 39.8 74.4 74.4 28.8 9.1 58.2 52.3 33.2Tabla 11.3: Indicadores de robustez de los controladores H2 y H1 (mlmv19)

Page 329: Control Adaptativo y Robusto

Aplicaci�on de control robusto 31311.5.2 Regulador H1 para una planta no linealEn este apartado se va a dise~nar un controlador H1 para el modnl, cuyos objetivosson: 1) obtener un rechazo adecuado de las perturbaciones ambientales (las cuales semani�estan a la entrada y a la salida de la planta), y 2) una estabilidad robusta paraciertos niveles de incertidumbre. Para ello, como se ha justi�cado en el apartadoanterior, se toma la siguiente matriz de transferencia:Tzw = " WS(s)So(s) �WS(s)So(s)G(s)Wdi(s)WT (s)To(s) WT (s)So(s)G(s)Wdi(s) #y por tanto, en la funci�on de coste, kTzwk1aparecen de manera expl��cita las matrices de transferencia So y SoG; las cuales soncomo ya se ha indicado, las responsables directas que determinan la atenuaci�on de lasperturbaciones que act�uen sobre la planta. Las respectivas matrices de ponderaci�on(dependientes de la frecuencia) WS;Wdi se eligen para conseguir tales objetivos. Elt�ermino WTTo se emplea para tener en cuenta la incertidumbre en el modelo de laplanta, y se elige de forma que se consiga una tolerancia a incertidumbres de tipomultiplicativo de un 50% en el peor caso.El modelo de la planta es no lineal, sin embargo para hacer el dise~no se empleaun modelo linealizado, y posteriormente el controlador se prueba con el modelomatem�atico no lineal. El regulador obtenido es sub�optimo para las condiciones deoperaci�on para las que se ha realizado la linealizaci�on, por ello no est�a garantizadopara el conjunto de puntos en su vecindad debido a la din�amica no lineal del sistema.Sin embargo, el controlador se dise~na con unas buenas propiedades de robustez,siendo los resultados obtenidos por simulaci�on satisfactorios.Para una velocidad de crucero de 21 nudos se eligen (tras algunos ensayos, yayudado de los resultados obtenidos con el regulador ltr-i dise~nado en la secci�onanterior) las siguientes matrices de transferencia de ponderaci�on:WS(s) = 2664 s+ 0:0723:1623s+ 2:2768 10�5 00 s+ 3:6 10�23:1623s+ 1:1384 10�5 3775Wdi(s) = 1s+ 1I

Page 330: Control Adaptativo y Robusto

314 Dise~no de controladores H2 y H1 multivariablesWT (s) = 2664 3162:3s+ 379:473:1623s+ 1200 00 3162:3s+ 189:743:1623s+ 600 3775Con las cuales, el regulador H2 obtiene kTzwk1 = 1:046, y el H1 reduce dichovalor a kTzwk1 = 0:91. En la �gura 11.32 se muestran las respuestas en frecuenciade �[So(j!)] y �[So(j!)G(j!)]; como puede comprobarse, ambas magnitudes son losu�cientemente peque~nas en el rango de baja frecuencia. La �gura 11.33 muestralos niveles estimados de incertidumbre multiplicativa no estructurada tolerables porel sistema a la entrada de la planta (iMi), y a la salida (iMo). Esta �gura repre-senta 1=�(M), donde M es el sistema de interconexci�on para cada tipo particularde incertidumbre. Si se trata de incertidumbre no estructurada, de la �gura 11.33se desprende que para el caso de incertidumbre multiplicativa situada a la entradade la planta Ei (donde G0 = G(I + Ei)), �esta no causar�a la inestabilidad del sis-tema, siempre que kEik1 < 0:56 (o sea, que el sistema permite hasta un 56% deincertidumbre relativa).Igualmente, para el caso en que la incertidumbre est�e a la salida Eo (tal queG0 = (I + Eo)G) se obtiene que kEok1 < 0:66 (lo cual supone un 66% de incer-tidumbre tolerable en el caso m�as desfavorable). Si se analiza la robustez del sistemacon respecto a incertidumbres estructuradas (estructura diagonal), se obtienen res-pectivamente unas tolerancias del 62% y 67% respectivamente, lo cual implica unaestimaci�on menos conservativa, ya que en estos casos se emplea 1=�(M), donde�(M) es el valor singular estructurado de M .Para evaluar el comportamiento del controlador dise~nado frente a las perturba-ciones ambientales, el sistema se somete a unas condiciones de navegaci�on carac-terizadas por una altura signi�cativa de olas de 4m, corriente de 2m=s, y vientocon velocidad de 20m=s, actuando las perturbaciones en una direcci�on de 45 gradosrelativa al curso de referencia del buque. Las respuestas temporales obtenidas semuestran en las �guras 11.34 y 11.35, en las que se puede comparar el compor-tamiento obtenido con el regulador H1 multivariable, y un controlador escalar queno considera la naturaleza multivariable de la planta. Puede comprobarse que conel regulador H1 se obtiene una mejora considerable en la reducci�on del movimientode balance, as�� como en el mantenimiento del rumbo.En la �gura 11.36 se muestra el comportamiento obtenido con el mismo contro-lador para una velocidad de crucero de 18 nudos, diferente a la nominal empleadapara el dise~no. Para la implementaci�on del regulador en un computador digital seemplea un controlador de tiempo discreto equivalente con un per��odo de muestreo

Page 331: Control Adaptativo y Robusto

Aplicaci�on de control robusto 315-150

-100

-50

0

50

10-5 10-4 10-3 10-2 10-1 100 101 102

w (rad/s)

sv(S

o) (

db)

-150

-100

-50

0

50

10-5 10-4 10-3 10-2 10-1 100 101 102

w (rad/s)

sv(S

oG)

(db)

Figura 11.32: �[So(j!)] y �[So(j!)G(j!)]0

20

40

10-5 10-4 10-3 10-2 10-1 100 101

w (rad/s)

1/sv

(M)

(db)

Multiplicativa a la entrada (iMi)

0

20

40

10-5 10-4 10-3 10-2 10-1 100 101

w (rad/s)

1/sv

(M)

(db)

Multiplicativa a la salida (iMo)

Figura 11.33: Tolerancias a incertidumbres (1=�[M(j!)])

Page 332: Control Adaptativo y Robusto

316 Dise~no de controladores H2 y H1 multivariables-5

0

5

0 50 100 150 200 250 300 350 400 450 500

t (sec)

head

ing

(deg

) Controlador SISO

-5

0

5

0 50 100 150 200 250 300 350 400 450 500

t (sec)

head

ing

(deg

) Controlador MIMO

Figura 11.34: Rumbo para controladores SISO y MIMO-5

0

5

10

15

0 50 100 150 200 250 300 350 400 450 500

t (sec)

roll

(deg

)

Controlador SISO

-5

0

5

10

15

0 50 100 150 200 250 300 350 400 450 500

t (sec)

roll

(deg

)

Controlador MIMO

Figura 11.35: Movimiento de balance para controladores SISO y MIMO

Page 333: Control Adaptativo y Robusto

Aplicaci�on de control robusto 317Contrl I11i I12i I11o I12o I1s MG MF I3o I3i% % % % % db gra % %1: LTR-i 68.5 78.7 60.7 71.7 44.4 25.8 66.7 - -2: LTR-i 62.3 69.8 60.5 63.1 37.6 27.6 59.5 52.1 53.13: H2 52.3 58.3 63.7 63.7 31.3 17.8 46 49.7 39.74: H1 56.2 61.9 67.3 67.3 33.5 11.5 50.3 53.2 42.6Tabla 11.4: Indicadores de robustez de los controladores para modnlde 0:1 segundos (se utiliza para ello la transformaci�on bilineal, ver cap��tulo 10). Seemplea este per��odo con el criterio de obtener unas respuestas temporales del sistemaen lazo cerrado equivalentes para el regulador de tiempo continuo y el de tiempodiscreto. En la tabla 11.4 se resumen los indicadores de robustez de los controladoresdise~nados para el modelo no lineal (modnl).-5

0

5

0 50 100 150 200 250 300 350 400 450 500

t (sec)

head

ing

(deg

)

-5

0

5

10

15

0 50 100 150 200 250 300 350 400 450 500

t (sec)

roll

(deg

)

Figura 11.36: Comportamiento para condici�on no nominal

Page 334: Control Adaptativo y Robusto

318 S��ntesis de los resultados obtenidos11.6 S��ntesis de los resultados obtenidosEn este apartado se trata de resumir y remarcar los principales resultados obtenidosen los estudios llevados a cabo. De ello cabe destacar:1. Se han realizado diversos dise~nos para el control de un sistema multivariable,como es el control del rumbo y balance de un buque.2. Para evaluar los diferentes dise~nos LTR, H2 y H1 se ha propuesto un conjuntode indicadores de comportamiento y robustez.3. El problema de dise~no de un sistema de control multivariable es sensiblementem�as complejo que el de un sistema escalar. Sin embargo, los algoritmos em-pleados para resolver tales problemas se realizan en el espacio de estados y sonindependientes de la dimensi�on y car�acter vectorial o escalar de la planta. Sinembargo puede ser necesario emplear un m�etodo de c�alculo alternativo en al-gunos de los pasos intermedios del algoritmo, debido a los problemas num�ericosque aparecen con mayor frecuencia en el caso de sistemas multivariables y/oen sistemas de dimensi�on elevada.4. Se han empleado las metodolog��as LTR-i y LTR-o, en sus versiones de estruc-tura basada en observador (cbo), o convencional, y no basada en observador(cnbo). Mostr�andose que para un mismo nivel de recuperaci�on es aconsejable,en general, el empleo de la �ultima, siempre que el sistema en lazo abierto pre-sente elevada ganancia a baja frecuencia.Ya que, para un nivel de recuperaci�on dado, proporciona unos reguladores m�asrobustos y m�as realizables desde un punto de vista de la aplicaci�on industrial.En otro caso (para controladores que no aproximen la acci�on integral, como losempleados para obtener respuestas sin sobre-oscilaci�on apreciable a cambios deconsigna tipo escal�on), la estructura cbo se caracteriza por conseguir mejorespropiedades de robustez.5. La elecci�on de la s��ntesis LTR-i o de la LTR-o, va a depender de las especi�ca-ciones de dise~no y de que en cada caso concreto la elecci�on de una de ellas seam�as propicia para satisfacer tales especi�caciones. As��, si se conoce a priorique los efectos de las incertidumbres del sistema pueden quedar re ejados a lasalida de la planta, o si �esta tiene m�as salidas que entradas, ser��a m�as ventajosoemplear la metodolog��a LTR-o. Mientras que si la planta tiene m�as entradasque salidas y/o la incertidumbre puede considerarse que queda re ejada a laentrada de la planta, resulta m�as aconsejable utilizar el m�etodo LTR-i.

Page 335: Control Adaptativo y Robusto

Aplicaci�on de control robusto 3196. El m�etodo de dise~no seguido para los reguladores H2 y H1, calcula en primerafase un regulador H2, a partir del cual se obtiene el H1, con el que se consiguedisminuir el valor de la funci�on de coste kTzwk1 obtenido con el dise~no H2.La robustez del sistema, en general, mejora para el controlador H1, pero encada caso hay que examinarla, antes de decidir entre los reguladores H2 y H1.7. Un reguladorH1 sub�optimo puede proporcionar unas propiedades de robustezy comportamiento globalmente m�as satisfactorias que el regulador H1 �optimo.8. Los resultados del empleo de una u otra metodolog��a de dise~no, van a dependeren gran manera de diversos factores:(a) De los requerimientos de control que se precisen.(b) Del modo en que �estos se expresen de forma matem�atica.(c) De la experiencia que se tenga a la hora de seleccionar los par�ametros dedise~no.(d) De seguir un procedimiento iterativo sistem�atico que simpli�que el dise~noy reduzca el n�umero de iteraciones.Se han obtenido buenos resultados con cada una de las metodolog��as analiza-das: LTR, H2 y H1.9. Se ha comprobado, al menos para los casos analizados, que un controla-dor H1 con prestaciones similares a un controlador LTR, requiere una di-mensi�on mayor, necesita per��odos de muestreo sensiblemente inferiores y poseepropiedades num�ericas menos favorables; por lo que desde un punto de vistapr�actico, y en determinados casos concretos, podr��a ser m�as recomendable elempleo de controladores ltr (L�opez y Rubio, 1995b).La metodolog��a H1 aborda de una forma expl��cita las especi�caciones del sis-tema en lazo cerrado y los niveles de incertidumbre que el sistema de controldebe soportar, por lo que resulta m�as simple la formulaci�on de ciertos pro-blemas de control robusto. La metodolog��a LTR consiste sin embargo, en unprocedimiento indirecto, ya que trata con las funciones (matrices) de trans-ferencia en lazo abierto, no pudi�endose expresar de manera directa (a partirde las matrices de ponderaci�on empleadas para el dise~no) los niveles de in-certidumbre tolerables, teniendo que calcularse �estos a posteriori. Por otrolado, la metodolog��a H1 junto con el procedimiento de dise~no conocido comos��ntesis-� (Balas et al, 1991) puede proporcionar de forma directa reguladorescon un comportamiento robusto.

Page 336: Control Adaptativo y Robusto

320 S��ntesis de los resultados obtenidosEn general, se puede decir que ning�un m�etodo proporciona la soluci�on total alproblema de dise~no; ya que con t�ecnicas diferentes, y con distintos grados de so�sti-caci�on, pueden obtenerse resultados similares. En cada caso particular habr�a quedeterminar a partir de las caracter��sticas del sistema a controlar y de las exigenciasde dise~no, cu�al es la metodolog��a que proporciona los mejores resultados. Resultapor tanto de inter�es el desarrollo de m�etodos iterativos informatizados para el ajustey selecci�on automatizada de los par�ametros de dise~no, en funci�on de unas especi�-caciones realizadas por el operador (cosa que no siempre es sencilla, especialmenteen el caso de sistemas multivariables). Integrando diferentes t�ecnicas de control ro-busto en un sistema que ofrezca al usuario la posibilidad de comparar y decidir laestrategia de control que pueda conseguir mejores resultados, o que mejor se adapteal problema concreto de dise~no.Hay que remarcar que la teor��a de control en torno a los m�etodos H1 est�a encontinua evoluci�on, as�� como el desarrollo de t�ecnicas de dise~no de controladoresmulti-objetivos, tales como la conocida por H2=H1; existiendo la en actualidadgrandes esfuerzos de investigaci�on en torno a tales m�etodos (Doyle et al. 1994,Haddad et al, 1994; Rotea et al, 1991; Stoorvogel, 1992; Khargonekar et al, 1991;Green y Limebeer, 1995; Grimble, 1994).

Page 337: Control Adaptativo y Robusto

Ap�endice AAn�alisis de los sistemas de controlbasados en observadorA.1 An�alisis de robustez con y sin observadorSea un sistema de control por realimentaci�on del vector de estado, y el correspon-diente sistema que emplea un observador para estimar el estado del proceso, tal comomuestran las �guras A.1 y A.2 respectivamente. Entre los esquemas correspondientesde �estas �guras (Doyle y Stein, 1979), se cumplen las siguientes propiedades:1. La funci�on de transferencia de los bucles cerrados es la misma en ambos casos.2. La funci�on de transferencia en bucle abierto abriendo en el esquema de la

-� �� - �(s)B C -Kc �6 G(s) yx- s sabr

Figura A.1: Realimentaci�on del vector de estado321

Page 338: Control Adaptativo y Robusto

322 An�alisis de robustez con y sin observador- jj j

--t t- ?���

6� �

r - u (1) (2) u0 Planta yu Kc �(s)B Ko- 6C -

Figura A.2: Diagrama del controlador LQG�gura A.2 por el punto (1) es la misma. En efecto:� en la �gura A.1, u = �Kc x = �Kc�B u0� en la �gura A.2, u = �Kc x = �Kc�B u0ya que x = �Bu0, al tener los dos sistemas (planta y observador) la mismase~nal de entrada.3. Las funciones de transferencia abriendo en el esquema completo (A.2) por (2)son diferentes. Se puede demostrar que s�olo son iguales si se modi�ca Ko,pasando a depender de un par�ametro q y tendiendo �este a in�nito. Ello sedemostrar�a en la pr�oxima secci�on.El hecho de que sean distintos en este caso, se debe a que la din�amica delerror del observador (y � y) es tenida en cuenta, si se rompe el bucle (o sise introducen perturbaciones) por (2), cosa que no ocurre si se abre por (1)(A.2).

Page 339: Control Adaptativo y Robusto

An�alisis de los sistemas de control basados en observador 323A.2 Condici�on su�ciente para la recuperaci�onA continuaci�on se va a desarrollar la condici�on su�ciente para que el bucle abiertolqg tienda al lqr. A partir de la �gura A.1 se tiene que la funci�on de transferenciaen lazo abierto (que relaciona la se~nal que entra por el punto a y sale por el puntob) del regulador lqr viene dada por,Hc(s) = LLQR(s) = Kc(sI � A)�1B (A:1)Para ello, se hacen depender las ganancias del �ltro de Kalman de un determinadopar�ametro q. Si se cumple que: limq!1 Ko(q)q = BW (A:2)siendo W cualquier matriz no singular entonces; el bucle abierto lqg se aproximaasint�oticamente al lqr.En efecto, la funci�on de transferencia de bucle abierto con observador viene dadapor, LLQG = Kc(sI � A+BKc +KoC)�1Ko C�B (A:3)Si se hace = (sI � A + BKc)�1 y teniendo en cuenta el lema de inversi�on dematrices, (A+BCD)�1 = A�1 � A�1B(C�1 +DA�1B)�1DA�1 (A:4)dicha expresi�on, puede ser escrita como:LLQG = Kc[�Ko(1 + CKo)�1C]Ko C�B == [KcKo �KcKo(1 + CKo)�1CKo] C�B == [KcKo(1� (1 + CKo)�1)CKo] C�B == KcKo(1 + CKo)�1 C�B (A.5)Si en esta �ultima expresi�on se aplica la condici�on de recuperaci�on dada por laexpresi�on (A.2), se tiene,LLQG = KcqBW (1 + CqBW )�1 C�Bque cuando se hace tender q a in�nito se reduce a:LLQG = KcBW (CBW )�1 C�B

Page 340: Control Adaptativo y Robusto

324 Condici�on su�ciente para la recuperaci�onAplicando a �esta �ultima expresi�on, nuevamente el lema de inversi�on de matrices(A.4) y sustituyendo por su valor se llega a,LLQG = KcBW (CBW )�1 C�B == Kc�BW (1 +Kc�B)�1[C�BW (1 +Kc�B)�1]�1 C�B == Kc�BW (C�BW )�1 C�B == Kc�BLuego la expresi�on �nal que se obtiene es,LLQG(s) = Kc�Bla cual es id�entica a la expresi�on (A.1) correspondiente a LLQR(s). Con esto quedademostrada la convergencia al tender el par�ametro q a in�nito, de las funciones detransferencia en bucle abierto, cuando se tiene una estructura de realimentaci�ondirecta del estado o con un observador (�ltro de Kalman).Para que Ko cumpla la condici�on de recuperaci�on se tendr�a que introducir algunamodi�caci�on en el �ltro de Kalman. Para ello, se dise~na el �ltro de Kalman con unasmatrices de covarianzas �cticias. Se tomar�an:Q = Qo + q2BV BT (A.6)R = Ro (A.7)siendo V cualquier matriz no singular y donde Qo y Ro son las matrices de cova-rianzas nominales de w y v; y q es un par�ametro escalar conocido como ganancia derecuperaci�on.Con estas modi�caciones se calcula el �ltro de Kalman:Ko = PCTR�1 (A:8)AP + PAT +Q� PCTR�1CP = 0 (A:9)Introduciendo las anteriores matrices de covarianzas en la ecuaci�on (A.9), resulta:AP + PAT +Qo + q2BV BT � PCTR�1CP = 0 (A:10)

Page 341: Control Adaptativo y Robusto

An�alisis de los sistemas de control basados en observador 325y dividiendo la expresi�on por q2 se llega a,APq2 + Pq2AT + Qoq2 +BV BT � q2(Pq2 )CTR�1C(Pq2 ) = 0 (A:11)Hay que destacar el hecho de que en la anterior ecuaci�on (A.11), existen dos tiposde variables: q, que es el par�ametro cuyo valor se modi�ca para recuperar la funci�onde transferencia, y la matriz P , de la cual dependen los valores de las gananciasdel �ltro de Kalman y que s�olo puede ser encontrada una vez asignado a q un valordeterminado.Por tanto, si se hace tender q a in�nito se tendr�a:q2(Pq2 )CTR�1C(Pq2 ) q!1�! BV BTy teniendo en cuenta el valor de Ko (ecuaci�on A.8), se tiene:Ko(q)RKTo (q)q2 q!1�! BV BTque descomponiendo lo anterior se llega a:Ko(q)q q!1�! B V 12 (R 12 )�1| {z }W = BWSe cumple, por tanto, la condici�on de recuperaci�on (ecuaci�on A.2).Se calcular�a, por tanto, el �ltro de Kalman a partir de la matriz de covarianzamodi�cada, de este modo, a medida que se aumente el valor del par�ametro q m�ascerca se estar�a de la funci�on de transferencia en bucle abierto del lqr. Al hacer�esto, se pierde precisi�on en la estimaci�on del estado, ya que se est�a calculando el�ltro de Kalman con unas covarianzas �cticias, sin embargo, se gana en robustez.A.3 Planteamiento del M�etodo LQG en el Do-minio de la FrecuenciaLa ecuaci�on de Riccati se puede interpretar en el dominio de la frecuencia, de formaque proporcione expresiones en t�erminos de funciones de transferencia. Sea el sis-

Page 342: Control Adaptativo y Robusto

326 Planteamiento del M�etodo LQG en el Dominio de la Frecuenciatema, _x = Ax+Bu (A:12)d�onde u es de dimensi�on 1 por simplicidad, y sometido al criterio de funcionamiento:J = Z 10 (xTQcx + u2) dt (A:13)Se supone r = 1 sin p�erdida de generalidad, ya que puede ser englobado en loselementos de la matriz Qc. La ecuaci�on de Riccati correspondiente viene dada por:ATPc + PcA� PcBR�1BTPc +Qc = 0que a su vez puede ser reordenada de la forma:�PcA� ATPc = Qc � PcBBTPcSumando y restando sPc al primer miembro se tiene:Pc(sI � A) + (�sI � AT )Pc = Qc � PcBBTPcque llamando �(s) = (sI � A)�1 conduce a:Pc��1(s) + �T�1(�s)Pc = Qc �KTc KcPremultiplicando por BT�T (�s) y postmultiplicando por �(s)B se llega a:BT�T (�s)Pc��1(s)�(s)| {z }I B +BT �T (�s)�T�1(�s)| {z }I Pc�(s)B =BT�T (�s)[Qc �KTc Kc]�(s)BBT�T (�s)PcB| {z }KTc +BTPc| {z }Kc �(s)B =BT�T (�s)Qc�(s)B � BT�T (�s)KTc Kc�(s)B

Page 343: Control Adaptativo y Robusto

An�alisis de los sistemas de control basados en observador 327La funci�on de transferencia en bucle abierto cuando se aplica la ley de controllqr es Hc = Kc�(s)B = BT�T (s)KTc , luego la anterior expresi�on se puede escribir:HTc (�s) +Hc(s) = BT�T (�s)Qc�(s)B �HTc (�s)Hc(s) (A:14)que a su vez se puede reescribir de la forma:[1 +HTc (�s)][1 +Hc(s)] = 1 +BT�T (�s)Qc�(s)B (A:15)Se de�ne: Fc(s) � 1 +Hc(s), y Fc(s) se conoce como la funci�on de diferenciasdel retorno.Ahora sup�ongase el segundo miembro de (A.15) factorizado de la forma (factor-izaci�on espectral): 1 +BT�T (�s)Qc�(s)B = �c(s)�c(�s) (A:16)se tiene entonces que (A.15) se puede reescribir:Fc(s)Fc(�s) = �c(s)�c(�s)y por tanto: Fc(s) = �c(s)con lo que se llega a la expresi�on que da la funci�on de transferencia del sistema enbucle abierto, con la realimentaci�on de las variables de estado:Hc(s) = �c(s)� 1Obs�ervese que mediante la factorizaci�on espectral anterior se ha resuelto laecuaci�on de Riccati al determinar �c(s). En efecto se ha obtenido Hc(s), lo cuales equivalente a determinar Kc, ya que ambas vienen relacionadas por la expresi�onHc(s) = Kc�B. Es decir, manipulando exclusivamente funciones de transferenciase llega a determinar la soluci�on al problema lqr.Una vez demostrado lo anterior se puede comprobar lo que se hab��a a�rmadosobre la robustez de los reguladores lqr.Si se factoriza Qc de la forma Qc = MTM y se hace s = j! en la ecuaci�on deRiccati (A.15) se obtiene:

Page 344: Control Adaptativo y Robusto

328 Planteamiento del M�etodo LQG en el Dominio de la Frecuenciaj 1 +Hc(j!) j2= 1+ jM�(j!)B j2de donde: k1 +Hc(j!)k > 1 (A:17)Si se interpreta esta condici�on en el plano polar, la curva de Hc(j!) no puedeentrar dentro de un c��rculo de centro (�1; 0) y radio 1, por lo que se asegura unmargen de fase mayor de 60 grados y un margen de ganancia in�nito.Un desarrollo an�alogo para el problema de la observaci�on llevar�a a un resultadodel mismo tipo. Para el �ltro de Kalman se tiene que la matriz de ganancia delobservador est�a dada por, Ko = PoCTobteni�endose �esta de la ecuaci�on de Riccati:APo + PoAT +Qo � PoCTCPo = 0Si se de�ne la funci�on de transferencia en bucle abierto del observador como laque resulta de cortar el bucle del �ltro de Kalman por el punto (1) en la �gura A.2,se tendr�a: Ho = C�Ko (A:18)Y efectuando un desarrollo similar al realizado para el control se llegar�a a:Ho(s) = �o(s)� 1con: �o(s)�o(�s) = 1 + C�(s)Qo�T (�s)CT (A:19)Lo que se obtiene no es Ko, sino Ho(s), pero ambos resultados, como se ha visto,son equivalentes.Procedimiento de c�alculoDe lo desarrollado en esta secci�on se puede resumir que mediante la manipulaci�onde funciones de transferencias, se llega a resolver el problema lqg. El procedimientoser��a especi�car la matriz Qc en forma factorizada como Qc = MTM , lo cual esequivalente a especi�car la funci�on de transferencia Gc(s) = M�(s)B. A partir de

Page 345: Control Adaptativo y Robusto

An�alisis de los sistemas de control basados en observador 329esta funci�on de transferencia y mediante la factorizaci�on de la ecuaci�on de diferenciasdel retorno: [1 +HTc (�s)][1 +Hc(s)] = 1 +GTc (�s)Gc(s) (A:20)se puede llegar a deducir Hc(s), funci�on de transferencia de bucle abierto del lqr.De forma an�aloga, especi�cando la matriz Qo en forma factorizada como Qo =��T o bien especi�car la funci�on de transferencia Go(s) = C�(s)�, y mediante lafactorizaci�on de la ecuaci�on de diferencias del retorno:[1 +Ho(s)][1 +HTo (�s)] = 1 +Go(s)GTo (�s) (A:21)se puede calcular Ho(s).Con estas dos funciones de transferencia: Hc(s); Ho(s), se pueden calcular lasganancias de la ley de control y del �ltro de Kalman Kc y Ko, ya que estan directa-mente relacionadas por las expresiones (A.1) y (A.18) rese~nadas anteriormente.A.4 Regulador LQG obtenido mediante ecuaci�ondiof�anticaA continuaci�on se deduce una ecuaci�on diof�antica, que puede ser utilizada comoalternativa para obtener la expresi�on del regulador lqg. Este regulador a partir dela (ecuaci�on A.3) viene dado por,GR(s) = Kc(sI � A +BKc +KoC)�1Ko (A:22)que operando como se ha visto en la secci�on (A.2), se llega a la expresi�on (A.5) dela funci�on de transferencia en bucle abierto, y por tanto para el regulador ser��a,GR(s) = KcKo(1 + CKo)�1 (A:23)Utilizando nuevamente el lema de inversi�on de matrices (A.4) se obtiene la expresi�on:GR(s) = [Kc�Ko �Kc�B(1 + C�B)�1Kc�Ko](1 + CKo)�1 (A:24)que llamando kk(s) = Kc�Ko, y teniendo en cuenta las expresiones de Gc (A.1) yGo (A.18), puede escribirse,GR(s) = [kk �Gc(1 +Gc)�1kk](1 + CKo)�1 == [kk(1�Gc(1 +Gc)�1)][1 + C�Ko � C�B(1 +Gc)�1kc�Ko]�1 == kk(1 +Gc)�1[1 +Go �Gp(1 +Gc)�1kk]�1 (A.25)

Page 346: Control Adaptativo y Robusto

330 Regulador LQG obtenido mediante ecuaci�on diof�anticaGR(s) = kk1 +Gc +Go +GcGo �Gpkk (A:26)GR(s) = kk(1 +Gc)(1 +Go)�Gpkk (A:27)Esta expresi�on da una relaci�on en t�erminos de funciones de transferencia parael regulador lqg. Si se expresan las funciones de transferencia deseadas Gdc y Gdocomo cociente de dos polinomios en s, y sustituyendo en la expresi�on (A.27) se tiene:Gdc(s) = n1(s)d1(s) y Gdo(s) = n(s)d(s) (A:28)GR(s) = kk(s)�c(s)�o(s)d1(s)d(s) � n(s)kk(s)d(s) = kk(s)d1(s)�c(s)�o(s)� n(s)kk(s)d1(s)d(s) = nr(s)dr(s) (A:29)donde �c(s) es el factor positivo procedente de la factorizaci�on del t�ermino derechode la ecuaci�on (A.20) y �o(s) el correspondiente a la ecuaci�on (A.21).A partir de la ecuaci�on (A.29), se puede llegar a la ecuaci�on diof�antica quepermite obtener la expresi�on del regulador mediante la manipulaci�on de polinomiosen s, donde nr(s) y dr(s) son las incognitas. En efecto, haciendo nr(s) = kk(s)d1(s),se tiene: �c(s)�o(s) = dr(s) d(s) + n(s) nr(s) (A:30)

Page 347: Control Adaptativo y Robusto

Ap�endice BElementos matem�aticos �utiles enla teor��a de controlB.1 Polos y ceros de un sistema multivariableSea un sistema lineal e invariante en el tiempo (slit) descrito por el conjunto deecuaciones: _x(t) = Ax(t) +Bu(t)y(t) = Cx(t) +Du(t) (B.1)donde x 2 <n es el vector de estados, y 2 <p es el vector de medidas y u 2<m es el vector de control. Siendo A;B;C;D matrices constantes de dimensionescompatibles.Se de�nen los polos del sistema como los autovalores o valores propios de lamatriz A.Supuesto que:� El conjunto de matrices (A;B;C;D) constituyen una realizaci�on m��nima dela matriz de transferencia de la planta G(s).� El n�umero de salidas no es inferior al de entradas: p � m.se de�nen los ceros de transmisi�on del sistema B.1 como el conjunto de n�umeros331

Page 348: Control Adaptativo y Robusto

332 Polos y ceros de un sistema multivariablecomplejos z, los cuales satisfacen la siguiente desigualdad (Zhang y Freudenberg,1990): rango " zI � A �B�C D # < n +msiendo la multiplicidad de z igual a su multiplicidad algebraica.Si el sistema G(s) tiene alg�un cero en el semiplano complejo derecho se dice quees de fase no m��nima; en caso contrario de fase m��nima.El sistema B.1 es estable si y solamente si todos sus polos est�an en el semiplanocomplejo de la izquierda.Criterio de Nyquist generalizadoA trav�es de los autovalores del sistema en lazo cerrado se determina si un sistemade control es estable. Igualmente, �esto se podr��a inferir a partir de la aplicaci�ondel teorema de Nyquist. Para sistemas multivariables tiene la siguiente expresi�on(MacFarlane, 1977): rXi=1N(�1; �i[L(s)]; D) = �Poldonde:L(s) matriz de transferencia en lazo abierto de dimensiones r � r.D contorno semicircular de Nyquist, de radio in�nito que envuelve al semiplanocomplejo derecho, y que evita los polos de L(s) en el eje imaginario rode�andoloscon semic��rculos de radio in�nitesimal.Pol n�umero de polos inestables de L(s).N n�umero de vueltas en sentido horario del lugar de Nyquist en torno al punto(�1; 0).�i autovalores o valores propios.

Page 349: Control Adaptativo y Robusto

Elementos matem�aticos �utiles en la teor��a de control 333B.2 NormasSe de�ne una norma k : k en un espacio vectorial V (de�nido sobre un conjunto conestructura de cuerpo C), como una operaci�on con las propiedades:k v k > 0 8v 2 V; v 6= 0k v k = 0, v = 0k �v k = j � jk v k 8� 2 C; v 2 Vk v + w k � k v k + k w k 8v; w 2 VSea C el conjunto de los n�umeros complejos. Para V = Cn, se de�ne la norma-ppara el vector v = (v1; : : : ; vn) 2 V como:k v kp= (j v1 jp + : : :+ j vn jp)1=pLas tres normas m�as utilizadas son para p = 1; 2;1, con:k v k1= maxi j vi jSi se trata de V = Cn�n los elementos de V ser�an las matrices complejas M deorden n. Algunas normas usuales son:1. Norma de Frobenius: kM kF= sXi Xj j mij j22. Norma�1: kM k1= maxj Xi j mij j3. Norma�1: kM k1= maxi Xj j mij j4. Norma espectral: kM k2= rmaxi �i(MHM)Algunas relaciones �utiles son:kM k22 � kM k2F= traza(MHM) � n kM k22

Page 350: Control Adaptativo y Robusto

334 Los Valores SingularesUna norma matricial que satisfaga la condici�on:kMN k � kM kk N kse denomina compatible. Se tiene una cota inferior para cualquier norma matricialcompatible: �(M) � kM kdonde �(M) es el radio espectral de M :�(M) = maxi j �i(M) jSe de�ne la norma inducida de la matriz M como:kM k= supv 6=0 kMv kk v kLa norma inducida tiene las siguientes propiedades:1. kMv k � kM k k v k2. k �M k = j � j kM k3. kM +N k � kM k k N k4. kMN k � kM k k N kB.3 Los Valores SingularesLos valores singulares (sv) de una matriz G se de�nen como :�i(G) = q�i(GHG) i = 1; 2; : : : ; kdonde �i representa un autovalor y k = min(r;m); siendo m el n�umero de columnasde G y r su n�umero de �las.Si los valores singulares se ordenan de forma que �i � �i+1, los valores singularesextremos ser�an: � = �1 � = �k

Page 351: Control Adaptativo y Robusto

Elementos matem�aticos �utiles en la teor��a de control 335La descomposici�on en valores singulares (svd) de una matriz G queda de laforma: G = (U1 U2) � 00 0 ! (V1 V2)HG = USV h = nXi=1 uivHi �iGvi = �iuiuHi G = vhi �icon: S = diag[�1; �2; : : : ; �n]V = [v1; v2; : : : ; vn]U = [u1; u2; : : : ; un]UUH = I; V V H = ILos valores singulares son los elementos de la diagonal principal de S, las colum-nas de la matriz U son los denominados vectores singulares por la izquierda (otambi�en direcciones principales de salida) y las de V son conocidos como vectoressingulares por la derecha (o direcciones principales de entrada).Algunas propiedades �utiles de los valores singulares son:1. �(G) = maxx6=0 k Gx kk x k2. �(G) = minx6=0 k Gx kk x k3. �(G) �j �i(G) j� �(G)4. Si G es no singular: �(G) = 1�(G�1)5. Si G es no singular: �(G) = 1�(G�1)6. �(�G) =j � j �(G)7. �(G+H) � �(G) + �(H)8. �(GH) � �(G)�(H)

Page 352: Control Adaptativo y Robusto

336 Los Valores Singulares9. �(G)� �(H) � �(G+H) � �(G) + �(H)10. maxf�(G); �(H)g � �(GH) � p2maxf�(G); �(H)g11. nXi=1 �2i = Traza(GhG)12. maxi;j j gi;j j� �(G) � nmaxi;j j gi;j jValor Singular EstructuradoSe de�ne el valor singular estructurado (ssv) (Doyle, 1982) de una matriz M ,como la inversa del valor singular m�aximo de una matriz E que anule el determinantedet (I �ME), y cero en otro caso. O sea:�(M) = min� f��1 = det (I �ME) = 0 para alg�un E 2 X�gDonde X� es el conjunto de matrices caracterizado por una determinada estruc-tura diagonal de bloques Ei estables:X� = fE = diag fEig = �[Ei] � �g (B:2)La de�nici�on de �(M) supone una generalizaci�on del radio espectral �(M) =�max(M), y del m�aximo valor singular �(M). En el caso particular donde se de�neX� de la forma: X�=1 = fE = �I = j � j� 1gse tiene que �(M) = �(M) . Y si ocurre que E es una matriz que no tiene estructuradiagonal de bloques, entonces �(M) = �(M).Algunas propiedades �utiles del valor singular estructurado son:1. Para la matriz unidad I: �(I) = 12. Para todo escalar �: �(�M) =j � j �(M)3. Acotamiento: �(M) � �(M) � �(M)

Page 353: Control Adaptativo y Robusto

Elementos matem�aticos �utiles en la teor��a de control 3374. Para A;B matrices cuadradas:�(AB) � �(A)�(B)5. Para cualquier E 2 X�: �(E) = �(E)6. Sea D el conjunto de matrices reales diagonales positivas: D = diag fdiIig,donde el tama~no de cada bloque (diIi) coincide con el de los bloques Ei. SiD 2 D y E 2 X�, entonces DED�1 2 X�, cumpli�endose que:�(DMD�1) = �(M)de lo anterior, y teniendo en cuenta la propiedad 3 se obtiene:�(M) � �(DMD�1) 8D 2 D7. A partir de la propiedad anterior se deriva un m�etodo para el c�alculo de unacota de �(M): �(M) � infD2D �(DMD�1)Se demuestra, que la igualdad se alcanza hasta un m�aximo de tres bloques.Para un n�umero mayor de bloques se consigue una cota ajustada (Morari etal, 1989; Thompson, 1988).B.4 Los Valores PropiosLos valores singulares de matrices de funciones racionales (Matrices de Transferen-cia) no son funciones anal��ticas, por lo que a diferencia del caso escalar no se tieneuna expresi�on anal��tica que relacione la ganancia y la fase del sistema (Freudenberget al, 1988).Para el caso de sistema escalar de fase m��nima se tiene que cuando j KG j� 1(zona pr�oxima a frecuencia de cruce de ganancia !c) se tiene que:j 1 +KG j�j 1 + (KG)�1 j� 2 j sen((� + �)=2) jsiendo � + � el margen de fase (mf) del sistema.Los autovalores de un sistema multivariable s�� satisfacen las propiedades mate-m�aticas requeridas, pero no se relacionan directamente con la calidad del dise~no enlazo cerrado y no est�an de�nidos para matrices de transferencias no cuadradas.

Page 354: Control Adaptativo y Robusto

338 Los Valores PropiosA pesar de ello, para el caso de sistema multivariable se desarrollan unas rela-ciones similares a las anteriores, empleando los valores propios de las matrices detransferencia I +GK y I + (GK)�1. Teniendo en cuenta que para cualquier matrizcuadrada Q: �(Q) �j �(Q) j� �(Q)se pueden acotar superiormente al valor singular m��nimo e inferiormente al valorsingular m�aximo.Para un sistema con matriz de transferencia G cuadrada se realiza la factorizaci�ono descomposici�on en valores caracter��sticos (cvd) dada por:G = W�W�1donde las columnas de W son los autovectores (o vectores propios) de G y � es unamatriz diagonal formada por los autovalores (o valores propios) de G:� = diag f�igSe obtienen unas propiedades muy �utiles y sencillas de manejar:�i[I +GK] = 1 + �i(GK)�i[I + (GK)�1] = 1 + 1=�i(GK)As��, cuando j �i(GK) j= 1 para alg�un �i y ! = !c se tiene:j �i(I +GK) j=j �i[I + (GK)�1] j= 2 j sen[(� + ��i)=2] jque es an�aloga, para cada �i, a la obtenida en el caso escalar.Por tanto, como j �i j acota a �, se puede emplear el valor de (� + ��i) comoargumento para evaluar un dise~no, ya que si �+��i es peque~no en la zona de cruce,el sistema exhibir�a una robustez pobre (Doyle y Stein, 1981).Generalizaci�on de los conceptos de M�argenes de EstabilidadEl an�alisis con los �i(j!) da un conocimiento sobre la estabilidad del sistema.Pueden extenderse los conceptos escalares de margen de ganancia (MG) y margende fase (MF) para el caso vectorial de�niendo:MG = mini fMG(�i)g ; MF = mini fMF (�i)g

Page 355: Control Adaptativo y Robusto

Elementos matem�aticos �utiles en la teor��a de control 339donde para cada �i[L(j!)] se obtiene un diagrama de Nyquist (escalar) as�� comounos m�argenes de estabilidad (MGi;MFi) asociados.Hay que tener en cuenta que en el caso multivariable la existencia de unosm�argenes de fase y ganancia (tal y como se de�nen arriba) excelentes, no va aindicar necesariamente (a diferencia de lo que ocurre en el caso escalar) que el sis-tema tenga una robustez tambi�en excelente. Sin embargo, s�� se puede a�rmar locontrario: si se obtienen unos m�argenes de estabilidad (MF;MG) inaceptables, elloser�a indicativo de que la robustez del sistema no es satisfactoria (Doyle y Stein,1981). Es por ello que algunos autores los cali�quen como indicadores de robustezcualitativos (Lunze, 1989).B.5 La Matriz de Ganancia RelativaEn algunos casos la incertidumbre o errores de modelado de un sistema puedendescribirse en t�erminos de las incertidumbres de los elementos de la matriz de trans-ferencia, por ejemplo como producto de una identi�caci�on experimental.Si G(j!) es la matriz de transferencia de un sistema, �esta se har�a singular a unafrecuencia ! si se produce un cambio relativo de �1=�ij(j!) en su elemento gij(j!)(Postlethwaite et al, 1993), y no se har�a singular mientras se cumpla:j g0ij(j!)� gij(j!) j< �1�ij(j!)Los valores �ij(j!) son los elementos de la matriz �[G(j!)] llamada Matriz deGanancia Relativa (rga), obteni�endose de:�[G(j!)] = G(j!): � (G(j!)�1)Tdonde :� indica producto elemento a elemento (o de Schur) de dos matrices.Por tanto, los elementos de rga dan una medida directa de la sensibilidad ala incertidumbre en el sistema elemento a elemento. Matrices con valores elevadosde los elementos de rga se har�an singulares para peque~nos errores relativos en suselementos.Se veri�can las propiedades siguientes:1. Xi �ij =Xj �ij = 1

Page 356: Control Adaptativo y Robusto

340 La Matriz de Ganancia Relativa2. Independencia de escalados. Para dos matrices reales y diagonales D1; D2 secumple: �(D1GD2) = �(G)3. Al menos para sistemas con dos entradas y dos salidas se veri�ca:k �(G) km � 1��(G) �k �(G) kmdonde �(G) es el n�umero de condici�on de G o relaci�on entre sus valores singu-lares extremos para cada frecuencia !:�[G(j!)] = �[G(j!)]�[G(j!)]Se cumple que: k �(G) km= 2maxfk �(G) k1; k �(G) k1gDado que � va a depender de las unidades que se empleen para representar alsistema, existen unas para las que toma su valor m��nimo ��. Se consigue si seescala la planta de forma adecuada por un par de matrices reales diagonalesD1; D2: ��(G) = minD1;D2 �(D1GD2)Se tendr�a por tanto que un sistema con un �� elevado tendr�a tambi�en un valorgrande de los elementos de RGA. E igualmente sistemas con altos elementos deRGA tendr�an tambi�en elevados valores de ��. En este caso se dice que la plantaest�a mal condicionada, lo que implicar�a en general algunos problemas adicionalespara realizar su control (Morari et al. 1989), as�� como una mayor sensibilidad a lasincertidumbres relativas en sus elementos de la matriz de transferencia del sistema.Otro aspecto importante a tener en cuenta en el an�alisis de robustez consiste enque la rga tambi�en sirve como indicador de la robustez del sistema a incertidumbresmultiplicativas diagonales que se presenten a la entrada de la planta. Como es elcaso de las incertidumbres independientes debidas a la din�amica no modelada de losactuadores. En ese caso, la incertidumbre E(s) se representa:E(s) = diagfei(s)gy la planta real G0 estar�a relacionada con la nominal G por:G0(s) = G(s)[I + E(s)]

Page 357: Control Adaptativo y Robusto

Elementos matem�aticos �utiles en la teor��a de control 341La matriz de transferencia en lazo abierto real queda:G0K = G(I + E)K = GK(I +K�1EK)o de forma equivalente:G0K = G(I + E)K = (I +GEG�1)GKLas matrices de error correspondientes a cada expresi�on anterior a su vez puedenponerse como: (K�1EK)ii =Xj �ji(K)ej(GEG�1)ii =Xj �ij(G)ejSi tanto la planta G, como el controlador K tienen valores elevados en los ele-mentos de RGA, el sistema de control ser�a especialmente sensible a incertidumbrestipo multiplicativo situadas a la entrada de la planta. Lo anterior se dar��a por ejem-plo para una planta mal condicionada en caso de emplear un controlador que realiceuna inversi�on de la planta en determinadas frecuencias para conseguir reducir lainteracci�on entre los diferentes canales o lazos de control del sistema.

Page 358: Control Adaptativo y Robusto

342 La Matriz de Ganancia Relativa

Page 359: Control Adaptativo y Robusto

Ap�endice CDe�niciones y algoritmosrelacionados con la teor��a H1C.1 Algunas de�nicionesA continuaci�on se de�nen los espacios de Hardy H2 y H1, los cuales son amplia-mente tratados en los temas relacionados con las teor��as de control �optimo y robustoH2; H1, as�� como en problemas mixtos H2=H1. En primer lugar se de�nen para elcaso del problema escalar.El espacio de Hardy H1 consiste en el conjunto de funciones F (s) de la variablecompleja s = � + j!, las cuales son anal��ticas y est�an acotadas en el semiplanocomplejo de la derecha, Re s > 0. Se de�ne la norma H1 de F como:kFk1 = supfj F (s) j: Re s > 0gDado que en la teor��a de control se trabaja con funciones y matrices de transferenciacon coe�cientes reales, se de�ne el subconjunto,RH1 � H1En este caso, y empleando el teorema del m�odulo m�aximo (Churchill et al, 1978;Spiegel, 1971), basta con emplear s = j!, y por tanto:kFk1 = supfj F (j!) j: ! 2 <gEl espacio de Hardy H2 consiste en el conjunto de funciones F (s) de la variable343

Page 360: Control Adaptativo y Robusto

344 Algunas de�nicionescompleja s = �+j!, las cuales son anal��ticas en el semiplano complejo de la derecha(Re s > 0), y que satisfacen la condici�on,kFk22 = sup�>0 12� Z 1�1 j F (� + j!) j2 d! <1Y limit�andose al caso de coe�cientes reales (espacio RH2), se tiene que paracalcular la norma H2, basta con integrar a lo largo del eje imaginario s = j!:kFk22 = 12� Z 1�1 j F (j!) j2 d!Para el caso vectorial, se de�nen de forma similar empleando las de�nicionespara sistemas multivariables de norma H2 y norma H1:kFk22 = 12� Z 10 traza[F T (�j!)F (j!)]d!kFk1 = sup! �[F (j!)]En la bibliograf��a relacionada con la teor��a de control H1 se emplea una de-terminada nomenclatura para indicar los diferentes conjuntos que se utilizan. Acontinuaci�on se presenta un resumen de �esta, a �n de identi�car de forma sencilla ydirecta cada uno de dichos conjuntos (Francis, 1987):L2 : Conjunto de funciones (matrices) de transferencias estrictamente propias y sinpolos en el eje imaginario.H2 : Conjunto de funciones (matrices) de transferencias estrictamente propias yestables.L1 : Conjunto de funciones (matrices) de transferencias propias y sin polos en eleje imaginario.H1 : Conjunto de funciones (matrices) de transferencias propias y estables.

Page 361: Control Adaptativo y Robusto

De�niciones y algoritmos relacionados con la teor��a H1 345RL2 : Conjunto de funciones (matrices) de transferencias con coe�cientes reales,estrictamente propias y sin polos en el eje imaginario.RH2 : Conjunto de funciones (matrices) de transferencias con coe�cientes reales,estrictamente propias y estables.RL1 : Conjunto de funciones (matrices) de transferencias con coe�cientes reales,propias y sin polos en el eje imaginario.RH1 : Conjunto de funciones (matrices) de transferencias con coe�cientes reales,propias y estables.C.2 El operador de RiccatiSean A;Q;R matrices cuadradas de dimensi�on n, con R y Q sim�etricas. Se de�nela matriz Hamiltoniana asociada como:H = " A RQ �AT #Si se supone que H no tiene autovalores en el eje imaginario, y que existe unamatriz T que hace la siguiente partici�on:T�1HT = " A11 A120 A22 # (C:1)con la propiedad de que la matriz A11 tiene todos sus autovalores con parte realnegativa; y que a su vez T puede ponerse como:T = " T11 T12T21 T22 # (C:2)entonces la matriz X = T21T�111estar�a determinada de forma �unica por H. O dicho de otra forma, se puede es-tablecer una correspondencia o funci�on (denominada tambi�en operador de Riccati),representada por Ric, entre el conjunto de matrices Hamiltonianas fHg y el conjuntode matrices fXg: X = Ric (H)

Page 362: Control Adaptativo y Robusto

346 El problema de aproximaci�on de Hankelel dominio de esta funci�on se representa por dom (Ric), y consta del conjunto dematrices Hamiltonianas H que no tienen autovalores en el eje imaginario, y para lasque existe una matriz de transformaci�on T que particiona a H en la forma dada porla ecuaci�on C.1, con todos los autovalores de A11 con parte real negativa.Se tiene adem�as que la matriz X es sim�etrica, y resulta ser la soluci�on de laecuaci�on algebraica de Riccati (Doyle et al. 1989):ATX +XA+XRX �Q = 0por lo que se suele decir que H es la matriz Hamiltoniana asociada a la ecuaci�onalgebraica de Riccati anterior.C.3 El problema de aproximaci�on de HankelA continuaci�on se describe otro planteamiento del problema de ajuste del modelo(M-M), basado en el problema de aproximaci�on de Hankel; y que es la base delalgoritmo de Doyle y Glover para resolver el problema H1 en el espacio de estados,as�� como otros algoritmos relacionados con problemas H1.Se plantea el problema de minimizar,kT1 + T2QT3k1Seg�un las dimensiones relativas de T1; T2; T3 se pueden dar varias situaciones cono-cidas como problemas de uno, dos y cuatro bloques respectivamente. En primerlugar se va a considerar el caso en que se supone que T1; T2 son matrices cuadradas,o que T1 tiene m�as columnas que �las, y T2 m�as �las que columnas. En cuyo casose denomina problema de un bloque. En ese caso, se supone que se cumple,T1T �1 = I; T �2 T2 = I (C:3)Teniendo en cuenta las propiedades de una matriz A,�(A�) = �(A); �(XAY ) = �(A) (C:4)para X; Y funciones (matrices) de transferencia pasa-todo, se obtiene que (problemade un bloque) kT1 + T2QT3k1 = kT3T �1 T2 +Q�k1 = kN +Q�k1

Page 363: Control Adaptativo y Robusto

De�niciones y algoritmos relacionados con la teor��a H1 347Dado que Q es estable, Q� ser�a inestable, y se demuestra queN = T3T �1 T2es tambi�en estable. El problema de aproximar una funci�on (matriz) de transferenciaconocida estable ,N , por una inestable, Q�, es similar al problema de Nehari descritoen el cap��tulo 10, y se conoce como problema de aproximaci�on de Hankel.Puede darse el caso que T1 tenga m�as �las que columnas, o que T2 tenga m�ascolumnas que �las, en cuyo caso el problema se complica, ya que no es posible hacerque se cumplan las igualdades dadas en C.3. Sin embargo, es posible encontrarsendas matrices T1?; T2? tales que cumplan:" T �1T �1? # = " T1T1? # = I; " T2T2? # = " T �2T �2? # = Iteniendo en cuenta las propiedades dadas en C.4, se llega a,kT1 + T2QT3k1 = " N11 +Q N12N21 N22 # 1que corresponde a la forma general del denominado problema de cuatro bloques queaparece en la literatura sobre la teor��a de control H1. Se tiene que,N11 = T �2 T1T �3 ; N12 = T �2 T1T �3?N21 = T �2?T1T �3 ; N22 = T �2?T1T �3?En el caso especial en que T21 es cuadrada, o tiene m�as �las que columnas, elproblema se simpli�ca quedando:kT1 + T2QT3k1 = " N11 +QN21 # 1de igual forma, si T2 es cuadrada, o tiene m�as columnas que �las, queda el problemareducido a kT1 + T2QT3k1 = h N11 +Q N12 i 1Los dos problemas anteriores se conocen como problemas de dos bloques. Portanto, a la hora de resolver el problema de aproximaci�on de Hankel, se pueden darcuatro situaciones: dos correspondientes a los problemas de dos bloques, una alproblema de cuatro bloques, y otra al problema de un bloque (Maciejowski, 1989).

Page 364: Control Adaptativo y Robusto

348 El algoritmo de GloverC.4 El algoritmo de GloverA continuaci�on se da el algoritmo desarrollado por Glover (Glover, 1984) para re-solver el problema de aproximaci�on de Hankel. De forma gen�erica �este se puedeexpresar de la siguiente forma:minQ2RH1 kN + Y �k1; Y; N 2 RH1En lo que sigue, se supone que N es una matriz de transferencia cuadrada, ycaso de no serlo se ampliar��a �esta con �las o columnas de ceros hasta que as�� fuera.Paso 1. Se obtiene una realizaci�on de N(s) � (Ab; Bb; Cb; Db), tal que las ecua-ciones de Lyapunov Ab� + �ATb = �BbBTbATb � + �Ab = �CTb Cbtengan la misma soluci�on� = " �iI 00 �1 # ; �1 = diag f�2; � � � ; �ng; �1 � �2 � � � � � �n > 0Para obtener dicha realizaci�on (denominada realizaci�on balanceada), se puedeemplear el siguiente algoritmo:1. Se parte de una realizaci�on de N(s) � (A;B;C;D).2. Se resuelven las ecuaciones de Lyapunov para (A;B;C;D), obteniendolas soluciones respectivas P y Q.3. Se obtiene una factorizaci�on Q = RTR, empleando por ejemplo el m�etodode Cholesky (Press et al, 1990).4. Se realiza la descomposici�on en valores singulares siguiente,RPRT = U�2UT5. Se obtiene �nalmente la realizaci�on deseada(Ab; Bb; Cb; Db) = (TAT�1; TB; CT�1; D)donde T = ��1=2UTR.

Page 365: Control Adaptativo y Robusto

De�niciones y algoritmos relacionados con la teor��a H1 349Paso 2. Se obtiene una partici�on de A;B;C conforme con la forma obtenida de �en el paso 1.Ab = " A11 A12A21 A22 # ; Bb = " B1B2 # ; Cb = h C1 C2 iy se toman: � = �21 � �21I1; UUT = Ital que B1 = �CT1 U .Paso 3. Se calcula la soluci�on �optima al problema de aproximaci�on de Hankel, queviene dada por la realizaci�on,Yopt = (�AT ;�CT ; BT ; DT )donde sus matrices se obtienen de:A = ��1(�21AT22 + �1A22�1 � �1CT2 UBT2 ); B = ��1(�1B2 + �1CT2 U)C = �C2�1 � �1UBT2 ; D = �D + �1ULa teor��a y resultados de la aproximaci�on de Hankel tiene un gran n�umero deaplicaciones, adem�as de para la resoluci�on de los problemas de control H1. Laprincipal es la aproximaci�on de modelos de gran dimensi�on en el espacio de estadospor otros m�as simples o modelos reducidos.Frecuentemente, en muchos problemas H1, se plantea el encontrar una funci�on(matriz) de transferencia Y que satisfagakN + Y �k1 � y no siempre se trata de obtener la soluci�on �optima Yopt; en ese caso se habla desoluci�on sub�optima. Sin embargo, existir�a una Y que satisfaga dicho requerimientosi y solo si � �1. Una forma de obtener dicha soluci�on sub�optima es por medio dela realizaci�on: Ysubopt(s) � (A ; B ; C ; D )con A = ��1 ( 2ATb + �Ab�)B = ��1 �Bb; C = �Cb�; D = �Db

Page 366: Control Adaptativo y Robusto

350 El algoritmo de Gloverdonde � = �2 � 2I. Se demuestra (Safonov et al, 1987) que en este caso no esnecesario obtener previamente la realizaci�on (Ab; Bb; Cb; Db), sino que directamentea partir de (A;B;C;D) se resuelven las ecuaciones de LyapunovAP + PAT = �BBT ; ATQ+QA = �CTCy se obtiene � = QP � 2Iquedando �nalmente la realizaci�on de Ysubopt con las matrices,A = ��1 ( 2AT +QAP )B = ��1 QB ; C = �CP; D = D

Page 367: Control Adaptativo y Robusto

Referencias[1] J. Ackermann (1984), Robustness Against Sensor Failures, Automatica, Vol.20, No. 2, pp 211-215.[2] J. Ackermann (1993), Robust Control: Systems with Uncertain PhysicalParameters. Springer Verlag.[3] P. Albertos and R. Ortega. On Generalized Predictive Control: Two Alter-native Formulations. Automatica, Vol. 25-5, pp 753-755, 1989.[4] F. Alix, J.M. Dion, L. Dugard and I.D. Landau (1982), Adaptive Controlof Nonminimun Phase Systems - Comparison of Several Algorithms andImprovements. IFAC Workshop on Adaptive Control ISIS Florencia.[5] A.C. Allison and N.J. Young (1983), Numerical Algoritms for the Nevalina-Pick Problem, IEEE Press, pp. 412-422.[6] B. Anderson and J.B. Moore (1990), Optimal Control: Linear QuadraticMethods, Prentice Hall.[7] J. Aracil (1974), A Note on the Design of S.I.S.O. Systems. RevueR.A.I.R.O. n�um. April pp 119-125.[8] K.J. Astrom (1970) Introduction to Stochastic Control Theory, AcademicPress.[9] K.J. Astrom and P. Eykho� (1971), System Identi�cation: A survey. Auto-matica Vol. 7 pp 123-162.[10] K.J. Astrom and P.D. Wittenmark (1973), On Self-tuning Regulators. Auto-matica Vol. 9 pp 185-199.[11] K.J. Astrom (1980a), Self-tuning Regulation - Design Principles and Appli-cations. Departament of Aut. Control, Lund Institud of technology. Lund,Sweden. 351

Page 368: Control Adaptativo y Robusto

352 REFERENCIAS[12] K.J. Astrom and P.D. Wittenmark (1980b), Self-tuning Controllers Basedon Pole-zero Placement. Proc. IEE Vol 127-3 pp 120-130.[13] K.J. Astrom and B. Wittenmark (1984), Computed Controlled Systems,Prentice-Hall.[14] K.J. Astrom and B. Wittenmark (1989), Adaptive Control, Addison-Whesley.[15] M. Athans (1974), Modern Control Theory, Center for Advanced Engineer-ing Study M.I.T.[16] M. Athans (1986), A Tutorial on the LQG/LTR Method, ACC., pp 1289-1296.[17] M. Bala (1995), Finite Horizon H1 and Related Control Problems,Birkh�auser.[18] G.J Balas, J.C. Doyle, K. Glover, A. Packard, and R. Smith (1991), �Analysis and Synthesis Toolbox, Musyn Inc. and The MathWorks, Inc.[19] E. Baeyens, J.R. Per�an y E. Vidal (1994), An�alisis y dise~no de sistemas decontrol mediante optimizaci�on convexa, Inform�atica y Autom�atica, Vol. 27,N�um. 2, pp 5-21.[20] B.R. Barmish and H.I. Kang (1993), Automatica, Vol. 29, No. 1, pp 13-35.A Survey of Extreme Point Results for Robustness of Control Systems.[21] R. Bitmead, M. Gevers and V. Wertz (1990), Adaptive Optimal Control.Prentice Hall.[22] U. Borisson and R. Syding (1976), Self-tuning Control of an Ore Crusher.Automatica Vol. 12 pp 1-7.[23] S.P. Boyd and C.H. Barrat (1991), Linear Controller Design, Prentice Hall.[24] F. Buchholt and M. Kummel (1979), Self-tuning Control of a PH-Neutralization Process. Automatica Vol. 15 pp 665-671.[25] E.F. Camacho, F.R. Rubio and J.A. Gutierrez (1988), Modelling and Sim-ulation of a Solar Power Plant with a Distributed Collectors System. PowerSystems, Modelling and Control Applications. pp 11.3.1-11.3.5, FederationIBRA-BIRA, Septiembre, Bruselas (Belgica).

Page 369: Control Adaptativo y Robusto

REFERENCIAS 353[26] E.F. Camacho, F.R. Rubio and F.M. Hughes (1992), Self-tuning Controlof a Solar Power Plant with a Distributed Collector Field. IEEE ControlSystems Magazine. Vol 12, num. 2, pp 72-78.[27] E.F. Camacho, M. Berenguel and F.R. Rubio (1994), Application of a GainScheduling Generalized Predictive Controller to a Solar Power Plant, Con-trol Engineering Practice. A Journal of IFAC, Vol 2 n�um. 2, pp 227-238.[28] E.F. Camacho and C. Bordons (1995), Model Predictive Control in the Pro-cess Industry. Advances in Industrial Control Series. Springer-Verlag.[29] R.G. Cameron (1985), The Design of Multivariable Systems, V Curso deAutomtica en la Industria, La R�abida (Huelva).[30] R. Carmona, F.R. Rubio and E.F. Camacho (1985), Automatic Controlfor Large Solar Thermal Arrays. Symposium International of Solar EnergySociety. Tokyo.[31] J.M. Carrasco, F. Gordillo, L.G. Franquelo and F.R. Rubio (1992), Controlof Resonant Converters Using the LQG/LTR Method. Power ElectronicsSpecialists Conference (PESC'92), Junio, Toledo, Espa~na.[32] R.Y. Chiang and M.G. Safonov (1992), Robust Control Toolbox. The MathWorks Inc.[33] R.Y. Chiang and M.G. Safonov (1993), A Fixed H1 Controller for a Super-maneuverable Figther Parforming the Herbst Maneuver, Automatica, Vol.29, No. 1, pp 111-127.[34] B.M. Chen, A. Saberi and P. Sannuti (1991), A New Stable CompensatorDesign form Exact and Approximate Loop Transfer Recovery, Automatica,Vol. 27, No. 2, pp 257-280.[35] B.M. Chen, A. Saberi and P. Sannuti (1992), Necessary and Su�cient Con-ditions for a Nonminimum Phase Plant to have a Recoverable Target Loop-A Stable Compensator Design form LTR, Automatica, Vol.28, No.3, pp493-507.[36] T. Chen and B. Francis (1995), Optimal Sampled-Data Control System ,Springer Verlag.[37] R.V. Churchill, J.W. Brown and R.F. Verhey (1978), Variables Complejasy sus Aplicaciones, McGraw Hill.[38] D.W. Clarke and P.J. Gawthrop (1975), Self-tuning Controller. Proc. IEEVol 122-9 pp 929-935.

Page 370: Control Adaptativo y Robusto

354 REFERENCIAS[39] D.W. Clarke and P.J. Gawthrop (1979), Self-tuning Control. Proc. IEE Vol126-6 pp 633-640.[40] D.W. Clarke, P.P. Kanjila and C. Mohtadi (1985), A Generalized LQGAproach to Self-Tuning Control, Part I and Part II, Int J. Control, pp1509-1523, pp 1525-1544.[41] D.W. Clarke, C. Mothadi and P.S. Tu�s (1987), Generalized Predictive Con-trol. Parts I and II, Automatica, Vol. 23, No. 2 pp 137-160[42] D.W. Clarke (1988), Application of Generalized Predictive Control to In-dustrial Processes, IEEE Control Systems Magazine, Vol. 122, pp 49-55.[43] A.O. Cordero and D.Q. Mayne (1981), Deterministic convergence of a Re-gulator with Variable Forgetting Factor. Proc. IEE Vol 128-1 pp 19-23.[44] S. Dormido y J.M. Cruz (1993), Fundamentos de Control Robusto, CursoAEIA, Isla Cristina (Huelva).[45] R.M.C. De Keyser and A.R. Van Cuawenberghe (1985), Extended PredictionSelf-adaptive Control, IFAC Symp. on Identi�cation and System ParameterEstimation, York, pp. 1317-1322.[46] J.C. Doyle and G. Stein (1979), Robustness with Observers, IEEE Trans.on Automatic Control, Vol AC-24, n�um. 4, pp 607-611.[47] J.C. Doyle and G. Stein (1981), Multivariable Feedback Design: Conceptsfor a Classical/Modern Synthesis, IEEE Trans. on Automatic Control, VolAC-26, n�um. 1, pp 4-16.[48] J.C. Doyle (1982), Analysis of Feedback Systems with Structured Uncertain-ties, IEE Proc., Vol. 129, No. 6, pp 242-250[49] J.C. Doyle (1983), Synthesis of Robust Controllers and Filters, IEEE Proc.22nd Conf. Decision Control, pp 109-114.[50] J.C. Doyle, K. Glover, P.P. Khargonekar, and B.A. Francis (1989), State-Space Solutions to Standard H2 and H1 Control Problems, Transactions onAutomatic Control, Vol. 34, No. 8, pp 831-846.[51] J.C. Doyle, B.A. Francis, and A.R. Tannenbaum (1992), Feedback ControlTheory, Macmillan Publishing Company.[52] J.C. Doyle, K. Zhou, K. Glover and B. Bodenheimer (1994), Mixed H2and H1 Performance Objetives II: Optimal Control; I: Robust PerformanceAnalysis, IEEE Trans. on Automatic Control, Vol 39, num. 8, pp 1564-1587.

Page 371: Control Adaptativo y Robusto

REFERENCIAS 355[53] P. Dorato (1987), Robust Control. IEEE Press.[54] P. Dorato, R. Tempo, and G. Muscato (1993), Bibliography on Robust Con-trol, Automatica, Vol, 29, No.1, pp 201-213.[55] G.A. Dumont (1982), Self-tuning Control of a Chip Re�ner Motor Load.Automatica Vol. 18-3 pp 307-314.[56] P. Eykho� (1974), System Identi�cation, Parameter and State Estimation.J. Wiley and Sons: London.[57] D.F. Enns (1984), Model Reduction with Balanced Realizations: An ErrorBound and a Frequency Weighted Generalization, Proc. Conf. on Decisionand Control.[58] M.P. Ford, J.M. Maciejowski and J.M. Boyle (1988), Multivariable Fre-quency Domain Toolbox. Cambridge Control Ltd.[59] T.R. Fortescue, L.S. Kershenbaum and B.E. Ydstie (1981), Implementationof Regulators with Variable Forgetting Factors. Automatica Vol. 17-6 pp831-835.[60] B.A. Francis, and G. Zames (1984), On H1-Optimal Sensitivity Theoryform SISO Feedback Systems, IEEE Transactions on Automatic Control,Vol. AC-29, No.1, pp 888-899.[61] B.A. Francis (1987), A course in H1 Control Theory. Lecture Notes inControl and Information Sciencies, Vol. 88, Springer Verlag.[62] D.J. Freeman, R. Whalley and M.G. Waugh (1982), Ship Motion and Com-puter Control, Fourth International Symposium on Ship Operation Automa-tion, Genova (Italy).[63] J.S. Freudenberg (1989), Analysis and Design for Ill-conditioned plants.Part 1: Lower Bounds on the Sturctured Singular Value; Part 2: Direction-ally Uniform Weightings and an Example, Int. J. Control, Vol. 49, No. 3,pp 851-903.[64] J.S. Freudenberg (1993), Algebraic Versus Analytic Design limitations Im-posed by Ill-Conditioned Plants, IEEE Trans. Automat. Contr., Vol. 38, No.4.[65] J.S. Freudenberg and D.P. Looze (1986), An Analysis of H1 OptimizationDesign Methods, IEEE Trans. Automat. Contr., Vol. AC-31, No. 3, pp 194-200.

Page 372: Control Adaptativo y Robusto

356 REFERENCIAS[66] J.S. Freudenberg, D.P. Looze (1988), Frequency Domain Properties ofScalar and Multivariable Feedback Systems. Springer-Verlag.[67] K. Glover (1984), All Optimal Hankel-Norm Approximations of Linear Mul-tivariable Systems and their L1 Errors Bounds, Int. J. Control, Vol.39, No.6, pp 1115-1193[68] K. Glover and D. Mcfarlane (1989), Robust Stabilization of Normalized Co-prime Factor Plant Descriptions with H1-Bounded Uncertainty, Transac-tions on Automatic Control, Vol. 34, No. 8.[69] M. Gopal (1982), Modern Control System Theory, Whiley.[70] F. Gordillo y F.R. Rubio (1991), Aplicaci�on de las T�ecnicas lqg/ltr enControl Adaptativo. Jornadas de Control Inteligente, Sevilla, Enero.[71] F. Gordillo and F.R. Rubio (1991), Self-tuning Controller with LQG/LTRStructure. European Control Conference (ECC 91). pp 2159-2163, Julio,Grenoble, Francia.[72] M. Green and D.J.N. Limebeer (1994), Linear Robust Control. PrenticeHall.[73] M.J. Grimble (1994), Robust Industrial Control: Optimal Design Aproachfor Polynomial Systems. Prentice Hall.[74] J.A. Gutierrez, E.F. Camacho, F.R. Rubio and R. Carmona (1986), FullyAutomation of a Distributed Collectors Field of a Solar Power Plant. Com-ponents, Instruments and Techniques for Low Cost Automation and Ap-plications. (LCA'86), pp 381-386, Ed. P. Albertos y J.A. de la Puente,Pergamon Press.[75] W.H. Haddad, D.S. Bernstein and Y.W. Wang (1994), Disipative H2=H1Controller Synthesis, IEEE Trans. on Automatic Control, Vol. 39, No. 4,pp. 827-831.[76] C.C. Hang and P.C. Parks (1973), Comparative Studies of Model ReferenceAdaptive Control Systems. IEEE T.A.C. Vol AC 18-5 pp 419-428.[77] I. Horowitz (1982), Quantitative Feedback Theory, Proceedings of the Insti-tution of Electrical Engineers, Part D, 129, pp 215-226.[78] The Institue of Measurement and Control (1991), Robust Control SystemDesign using H1 and Related Methods. March, 1991, Cambridge University,U.K.

Page 373: Control Adaptativo y Robusto

REFERENCIAS 357[79] R. Isermann (1980), Practical Aspects of Process Identi�cation, AutomaticaVol. 16 pp 575-587.[80] R. Isermann (1981), Digital Control Systems. Springer-Verlag New York.[81] R. Isermann (1982), Parameter Adaptive Control Algorithms. A Tutorial.Automatica Vol. 18-5 pp 513-528.[82] R. Isermann, K.H. Lachmann and D. Matko (1992), Adaptive Control Sys-tems, Prentice Hall.[83] R.E. Kalman (1964), When Is a Linear Control System Optimal?, Journalof Basic Engineering. Trans. of the ASME, pp 51-60.[84] C.G. Kallstrom, K.J. Astrom, N.E. Thorell, J. Eriksson and L. Sten (1979),Adaptive Autopilots for Tankers. Automatica Vol. 15 pp 241-254.[85] C.G. Kallstrom and P. Ottosson (1982), The Generation and Control ofRoll Motion of Ships in Close Turns, Fourth International Symposium onShip Operation Automation, Genova (Italy).[86] H. Kaufman, I. Bar-Kana and K. Sobel (1994), Direct Adaptive ControlAlgorithms: Theory and Applications, Springer-Verlag.[87] P.P. Khargonekar and M. Rotea (1991), Mixed H2=H1 control: A convexoptimization approach, IEEE Trans. Automat. Control, 36 (7), pp 824-837.[88] H. Kwakernaak (1993), Robust Control and H1 -Optimization-Tutorial Pa-per Automatica, Vol. 29, No. 2, pp 255-273.[89] H. Kwakernaak and R. Sivan (1972), Linear Optimal Control Systems,Wiley-Interscience.[90] H. Kwakernaak and R. Sivan (1991), Signal and Systems, Prentice Hall.[91] I.D. Landau (1974), A Survey of Model Reference Adaptive Techniques -Theory and Applications. Automatica, Vol. 10 pp 353-379.[92] I.D. Landau (1979), Adaptive Control - The Model Reference Approach.Control and Systems Theory Vol 8. Marcel Dekker, Inc.[93] I.D. Landau (1981a), Model Reference Adaptive Control and Stochastic Re-gulators : A Uni�ed Approach. Trans. of ASME Vol 103 pp 404-416.[94] I.D. Landau and Lozano, R. (1981b), Uni�cation of Discrete Time ExplicitModel Reference Adaptive Control Designs. Automatica Vol. 17-4 pp 593-611.

Page 374: Control Adaptativo y Robusto

358 REFERENCIAS[95] I.D. Landau (1982), Combining Model Reference Adaptive Controllers andStochastic Regulators. Automatica Vol. 18-1 pp 77-84.[96] I.D. Landau (1990), System Identi�cacion and Control Design, PrenticeHall.[97] K. Latawiec and M. Chyra (1983), On Low Frecuency and Long-run E�ectsin Control. Automatica Vol. 19 pp 419-424.[98] J.R. Layne and K.M. Passino (1993), Fuzzy Model Reference Learning Con-trol for Cargo Ship Steering, IEEE Control Systems Magazine, pp 23-34.[99] A.J. Laub and J.N. Little (1986), Control System ToolBox, The MathWorks,Inc.[100] N.A. Lehtomaki, N.R. Sandell and M. Athans (1981), Robustness Resultsin Linear-Quadratic Gaussian Based Multivariable Control Designs. IEEETransactions on Automatic Control, Vol. AC-26, No.1, pp 75-92.[101] N.A. Lehtomaki and D.A. Castanon (1984), Robustness and Modeling ErrorCharacterization, IEEE Transactions on Automatic Control, Vol. AC-29,No. 3, pp 212-220.[102] D.J. N. Limebeer, E.M. Kasenally and J.D. Perkins (1993), On the Designof Robust Two Degree of Freedom Controllers, Automatica, Vol. 29, No. 1,pp 157-168.[103] L. Ljung (1985), On the Estimation of Transfer Functions, Automatica,Vol. 21, No. 6.[104] L. Ljung (1986), System Identi�cation ToolBox, The MathWorks, Inc.[105] L. Ljung (1987), System Identi�cation: Theory for the User, Prentice Hall.[106] M.A. Lelic and P.E. Wellstead (1987a), Generalized Pole Placement SelfTuning Controller. Part I. Basic Algorithm, Int. J. Control, Vol. 46-2, pp547-568.[107] M.A. Lelic and P.E. Wellstead (1987b), Generalized Polo Placement SelfTuning Controller. Part II. Application to Robot Manipulator Control, Int.J. Control, Vol. 46-2, pp 569-601.[108] M.J. L�opez and F.R. Rubio (1992), LQG/LTR Control of Ship SteeringAutopilots, IEEE International Symposium on Intelligent Control (ISIC-92), pp 447-450, August, Glasgow, Scotland, U.K.

Page 375: Control Adaptativo y Robusto

REFERENCIAS 359[109] M.J. L�opez y F.R. Rubio (1994), Metodolog��as de Dise~no ltr. Jornadas deAutom�atica, M�alaga, Octubre.[110] M.J. L�opez and F.R. Rubio (1994), Design Multivariable Control for a ShipBased on Robust Methodology, IEEE International Conference on ControlApplications (CCA-94), pp 833-838, August, Glasgow, Scotland, U.K.[111] M.J. L�opez (1994), An�alisis y Dise~no de Controladores Robustos. Aplicaci�onal control de un buque. Tesis Doctoral. Universidad de Sevilla.[112] M.J. L�opez and F.R. Rubio (1995a), Comparison between Multivariable H1and LTR Controllers for a Ship, CAMS '95, Control Aplications in MarineSystems, (IFAC). Tronhein, Norway[113] M.J. L�opez and F.R. Rubio (1995b), Multivariable Robust LTR-i Controllerfor a Ship, CAMS '95, Control Aplications in Marine Systems, (IFAC).Tronhein, Norway[114] M.J. L�opez and F.R. Rubio (1995c), H1 Multivariable Design Methodologyfor a Ship, European Control Conference ECC 95. Roma (Italy).[115] M.J. L�opez and F.R. Rubio (1995d), Gain Scheduling LQG/LTR Controllerof Ship Steering Autopilots, European Control Conference ECC 95. Roma(Italy).[116] M.J. L�opez y F.R. Rubio (1995f), Mejora de la robustez de controladoresLQG/LTR. Aplicaci�on a un sistema multivariable. Aceptado para publi-caci�on en Revista de Inform�atica y Autom�atica.[117] M.J. L�opez, A.P. Consegliere y J. Terr�on (1995), T�ecnicas de modelado,simulaci�on e identi�caci�on de la din�amica de un buque por computador. Apublicar por el servicio de publicaciones de la Universidad de C�adiz.[118] J. Lunze (1989), Robust Multivariable Feedback Control. Prentice Hall.[119] A.G.J. MacFarlane (1970), Return-di�erence and return-ratio matrices andtheir use in analysis and design of multivariable feedback control systems.Proc. IEE, vol. 117, No. 10, pp 2037-2049.[120] A.G.J. MacFarlane and N. Karcanias (1976), Poles and Zeros of LinearMultivariable Systems: a Survey of the Algebraic, Geometric and Complex-Variable Theory, Int. J. Control, Vol. 24, No. 1, pp 33-74.[121] A.G.J. MacFarlane and I. Postlethwaite (1977), The Generalized NyquistStability Criterion and Multivariable Root Loci, Int. J. Control, Vol. 24, No.1, pp 81-127.

Page 376: Control Adaptativo y Robusto

360 REFERENCIAS[122] J.M. Maciejowski (1985), Asymptotic Recovery for Discrete-Time Systems,IEEE Trans. Automat. Contr., Vol AC-30, No. 6, pp 602-605.[123] J.M. Maciejowski (1989), Multivariable Feedback Design. Adison Wesley.[124] R.J. Martin, L. Valavani and M. Athans (1986), Multivariable Control of aSubmersible Using the LQG/LTR Methodology, ACC., pp 1313-1324.[125] The MathWorks, Inc. (1990), Matlab for MS-DOS Personal Computers.User's Guide.[126] J.M. Mendel (1987), Lessons in Digital Estimation Theory, Prentice Hall.[127] A.C. Messer and M.J. Grimble (1992), Robust Track Keeping Control,CAMS'92 ,IFAC, Genova (Italy).[128] B.C. Moore (1981), Principal Component Analysis in Linear Systems, IEEETrans. Automat. Contr., Vol. AC-26.[129] M. Morari and E. Za�riou (1989), Robust Process Control, Prentice Hall.[130] A.N. Moser (1993), Designing Controllers for Flexible Structures withH1=�Synthesis, IEEE Control Systems, Vol. 13, No. 2, pp 79-89.[131] D. Mustafa and K. Glover (1991), Controller Reduction by H1 BalancedTruncation, IEEE Trans. on Automatic Control, Vol. 36, No. 6, pp 668-682.[132] K.S. Narendra and R.V. Monopoli (1980), Applications of Adaptive Control.Academic Press.[133] K.S. Narendra and A.M. Annaswamy (1989), Stable Adaptive Systems,Prentice Hall.[134] G.C. Newton, L.A. Gould, J.F. Kaiser (1957), Analytical Design of LinearFeedback Controls, Wile & Sons.[135] R. Ortega (1982), On PID Self-tuning. Proc. of the IFAC Software for Com-puter Control (SOCOCO), Madrid.[136] A. Packard and J. Doyle (1993), The Complex Structured Singular Value,Automatica, Vol. 29, No. 1[137] G.K.H. Pang and A.G.J. MacFarlane (1987), An Expert Systems Approachto Computer-Aided Design of Multivariable Systems, Springer-Verlag.

Page 377: Control Adaptativo y Robusto

REFERENCIAS 361[138] I. Postlethwaite and S. Skogestad (1993), Robust multivariable Control Us-ing H1 Methods: Analysis, Design and Industrial Applications, Essays onControl, ECC-93, pp 271-330.[139] W.H. Press, B.P. Flannery, S.A. Teukolsky and W.T. Vetterling (1990),Numerical Recipes: The Art of Scienti�c Computing.[140] J.M. Quero and E.F. Camacho (1990), Neural Generalized Predictive Con-trollers. Proc. of the IEEE International Conference on System Engineering,Pittsburg, pp 160-163.[141] L.R. Ray (1993), Stability Robustness of Uncertain LQG/LTR Systems,IEEE Trans. on Automatic Control, Vol. 38, No. 2, pp 304-308.[142] A.J. Robins and P.E. Wellstead (1981), Recursive Systems Identi�cationUsing Fast Algorithms. I.J. of Control Vol 33-3 pp 455-480.[143] H.H. Rosenbrock (1974), Computer- Aided Control System Design.[144] M.A. Rotea and P.P. Khargonekar (1991), H2 -Optimal Control with an H1-constraint:The State Feedback Case, Automatica, Vol.27, No.2, pp 307-316.[145] M.A. Rotea (1993), The Generalized H2 Control Problem, Automatica, Vol.29, No. 2, pp 373-385.[146] F.R. Rubio, E.F. Camacho, J. Aracil, L.G. Franquelo and J.M.G. Provost(1982), Studies for the Application of an Adaptive Controller to Hydrotur-bine Generators. Software for Computer Control (SOCOCO), pp 425-430,Ed. G. Ferrat�e y E.A. Puente, Pergamon Press.[147] F.R. Rubio y E.F. Camacho (1984), Control Adaptativo del Campo de Colec-tores Distribuidos de una Planta Solar. Autom�atica en la Industria. pp 131-135, Ed. M. Silva, Publicaci�on IFAC, Zaragoza, Nov.[148] F.R. Rubio, E.F. Camacho y R. Carmona (1985), Control Adaptativo delCampo de Colectores Distribuidos (ACUREX) de la Planta Solar SSPS deAlmer��a. Regulaci�on y Mando Autom�atico Vol XIX, n�um. 145 pp 139-143.[149] F.R. Rubio, J. Aracil and E.F. Camacho (1985), Chaotic Motion in anAdaptive Control System. International Journal of Control, Ed. A.G.J. Mac-farlane, Taylor and Francis, Vol 42-2, pp 353-360.[150] F.R. Rubio y E.F. Camacho (1985), Identi�caci�on Reducida de SistemasLineales. Actas de las VI Jornadas de Autom�atica, pp 27-49, Valladolid.

Page 378: Control Adaptativo y Robusto

362 REFERENCIAS[151] F.R. Rubio (1985), Control Adaptativo de Procesos Industriales. Aplicaci�ona una Central Solar. Tesis Doctoral.[152] F.R. Rubio, E.F. Camacho and R. Carmona (1985), Application of a Self-tuning Regulator to a Solar Power Plant. 7th Conference on Digital Com-puter Applications to Process Control, pp 263-269, Sept. Viena (Austria).[153] F.R. Rubio, R. Carmona and E.F. Camacho (1986), Adaptive Control ofThe ACUREX Field. The IEA/SSPS Solar Thermal Power Plants, Vol 2,pp 5.2.1-5.2.18, Ed. P. Kesserlring and C.S. Selvage, Springer-Verlag.[154] F.R. Rubio (1987), Programa de Ayuda al Dise~no de Controladores Adap-tativos. Autom�atica e Instrumentaci�on. Revista de Control Industrial. n�um.174, pp 299-305.[155] F.R. Rubio, R. Sanz, E.F. Camacho and A. Ollero (1987), Studies on ExpertSelf-tuning Control of Distributed Collector Fields. AI, Expert Systems andLanguages in Modelling and Simulation. pp 231-236, Ed. R. Huber y C.Kulikowski, IMACS Publication, Junio, Barcelona (Espa~na).[156] F.R. Rubio, F.M. Hughes and E.F. Camacho (1989), Self-tuning PI Controlof a Solar Power Plant. Adaptive Systems in Control and Signal Processing.pp 335-340, Ed. M.J. Grimble, IFAC Publication, Abril, Glasgow.[157] F.R. Rubio and J. Aracil (1990), Classiccal/Modern Design of a TrackingControl System. IEEE International Conference on Systems Engineering.pp 156-159, Agosto, Pittsburgh, PA.[158] F.R. Rubio y J. Aracil (1992), De vuelta al Diagrama de Bode pasando porel Control Optimo. Revista de Inform�atica y Autom�atica, Vol 25 n�um. 2,pp 5-16.[159] F.R. Rubio and M.J. L�opez (1993), Adaptive Optimal Control of Ship Steer-ing Autopilots, 12th World Congress International Federation of AutomaticControl (IFAC-93), Vol. 5, pp 413-416, 18-23 July, Sydney, Australia.[160] V. Ruiz y C. G�omez (1982), Centrales El�ectricas Termosolares. Energ��asRenovables y Medio Ambiente. Editado por el Centro de Ordenaci�on delTerritorio y Medio Ambiente del Ministerio de Obras P�ublicas y Urbanismo.Madrid.[161] A. Saberi, and P. Sannuti (1990), Observer Design for Loop Transfer Recov-ery for Uncertain Dynamical Systems. IEEE Trans. On Automatic Control,Vol. 35, No. 8, pp 878-896.

Page 379: Control Adaptativo y Robusto

REFERENCIAS 363[162] A. Saberi, B.M. Chen, and P. Sannuti (1993), Loop Transfer Recovery:Analysis and Design. Springer-Verlag.[163] M. Saeki (1992), H1=LTR Procedure with Speci�ed Degree of Recovery,Automatica, Vol. 28, No. 3, pp 509-517.[164] M.G. Safonov, and M. Athans (1977), Gain and Phase Margin for MultiloopLQG Regulators, IEEE Transaction on Automatic Control, Vol. AC-22, No.2, pp 415-422.[165] M.G. Safonov, A.J. Laub and G.L. Hartmann (1981), Feedback Properties ofMultivariable Systems: The Role and Use of the Return Di�erence Matrix,IEEE Trans. Automat. Contr., Vol AC-26, No. 1, pp 47-65.[166] M.G. Safonov and R.Y. Chiang (1987), A Schur Method for Balanced modelReduction, Proc. Conf. on Decision and Control.[167] M.G. Safonov, D.J.N. Limebeer and R.Y. Chiang (1989), Simplifying theH1 Theory via Loop Shifting, Matrix Pencil and Descriptor Concepts, Int.J. Control, 50, 6, pp 2467-2488.[168] S. Sastry and M. Bodson (1989), Adaptive Control. Stability, Convergence,and Robustness, Prentice Hall.[169] B. Shahian and M. Hassul (1992), Computer-Aided Control Systems DesignUsing Matlab, Prentice-Hall.[170] D.E. Seborg, T.F. Edgar and D.M. Mellichamp (1989), Process Dynamicsand Control. John Wiley and Sons.[171] U. Shaked (1986), Guaranteed stability margin for the discrete-time linearquadratic optimal regulator, IEEE Trans. Automat. Contr., Vol. AC-31.[172] S. Skogestad, M. Morari, and J.C. Doyle (1988), Robust Control of Ill-Conditioned Plants: High-Purity Distillation, IEEE Transactions on Auto-matic Control, vol. 33, No 12., pp 1092-1105.[173] M.R. Spiegel (1971), Variable Compleja, McGraw Hill.[174] G. Stein and M. Athans (1987), The LQR/LTR Procedure for MultivariableFeedback Control Design, IEEE Transactions on Automatic Control, Vol.AC-32, No.2, pp 105-113.[175] G. Stein and J.D. Doyle (1991), Beyond Singular Values and Loop Shapes,J. Guidance, Vol. 14, No. 1, pp 5-16.

Page 380: Control Adaptativo y Robusto

364 REFERENCIAS[176] A. Stoorvogel (1992), The H1 Control Problem, Prentice Hall.[177] P.M. Thompson (1988a), Program CC's Implementation of the Wiener-HopfLQG optimal control problem, Optimal Control Applications and Methods,Vol. 8, 63-89.[178] P.M. Thompson (1988b), Program CC, Tutorial and User's Guide, ControlSystems Technology, Inc.[179] P.E. Wellstead and P. Zanker (1978), The Techniquest of Self-tuning. Con-trol Systems Centre, Report 432.[180] P.E. Wellstead, J.M. Edmunds, D. Prager and P. Zanker (1979a), Self-tuning Pole-cero Assignment Regulators. Control Systems Centre Report404. (Also in I.J. of Control Vol 30-1 pp 1-26).[181] P.E. Wellstead and P. Zanker (1979b), Servo Self-tuning. Control SystemCentre, Report 419. (Also in I.J. of Control Vol 30-1 pp 27-36).[182] H.P. Whitaker, J. Yamron and A. Kezer (1958), Design of Model-ReferenceAdaptive Control Systems for Aircraft. Report R-164 Intrumentation Lab-oratory, M.I.T., Cambridge. (Referenciado en Astrom 1983).[183] B. Wittenmark and K.J. Astrom (1984), Practical Issues on the Implemen-tation of Self-tuning Control. Automatica Vol. 20-5 pp 595-605.[184] D.C. Youla, J.J. Bongiorno and H.A. Jabr (1976), Modern Wiener-HopfDesign of Optimal Controllers. Part I: The Single-Input-Output Case. PartII: The Multivariable Case. IEEE Trans. Automat. Contr., Vol. AC-21, No.1, pp 3-13, No. 3, pp 319-338.[185] S.D. O'Young, and B.A. Francis (1986), Optimal Performance and RobustStabilization, Automatica, Vol. 22 No. 2., pp 171-183.[186] G. Zames (1963), Functional Analysis Applied to Non-linear Feedback Sys-tems, IEEE Trans. Circuit Theory, pp 392-404.[187] G. Zames (1981), Feedback and Optimal Sensitivity: Model Reference Trans-formations, Multiplicative Seminorms, and Approximate Inverses, IEEETrans. Automat. Control, Vol. AC-26, No. 2, pp 301-320.[188] G. Zames and B.A. Francis (1983), Feedback, Minimax Sensitivity, and Op-timal Robustness, IEEE Trans. Automat. Contr., Vol.AC-28, No. 5, pp 585-601.

Page 381: Control Adaptativo y Robusto

REFERENCIAS 365[189] Z. Zhang and J.S. Freudenberg (1990), Loop Transfer Recovery for Non-minimum Phase Plants, IEEE Trans. Automat. Contr., Vol. 35, No. 5, pp547-553.[190] Z. Zhang and J.S. Freudenberg (1993), Discrete-time Loop Transfer Recov-ery for Systems whith Nonminimum Phase Zeros and Time Delays, Auto-matica, Vol. 35, No. 2, pp 351-363.[191] K. Zhou (1992), Comparision BetweenH2 andH1 Controllers, IEEE Trans.on Automatic Control, Vol. 37, No. 8, pp. 1261-1265.