Hamiltonians based Control

March 25, 2018 | Author: fabianlopezchozy | Category: Eigenvalues And Eigenvectors, Motion (Physics), Momentum, Matrix (Mathematics), Mathematical Analysis


Comments



Description

TESIS DOCTORALControl de sistemas no lineales basado en la estructura hamiltoniana por Fabio G´ omez-Estern Aguilar Ingeniero de Telecomunicaci´on por la Escuela Superior de Ingenieros de la Universidad de Sevilla Presentada en la Escuela Superior de Ingenieros de la Universidad de Sevilla para la obtenci´on del Grado de Doctor Ingeniero de Telecomunicaci´ on Sevilla, Septiembre de 2002 TESIS DOCTORAL Control de sistemas no lineales basado en la estructura hamiltoniana Autor: Fabio G´omez-Estern Aguilar Directores: Javier Aracil Santonja ´ Francisco Gordillo Alvarez Su imaginaci´on. Spong. le debo la dedicaci´on. sabidur´ıa y dedicaci´on lo hacen indiscutible merecedor del prestigio del que disfruta. Javi Reig. Teresa Cruz. Wolfgang Mitterbaur. Sup´elec. Dar´ıo B´ecares. Kurt Schlacher. Jos´e Angel Acosta. Rafael Garc´ıa. Ismael Alcal´a. Es un honor para m´ı el haber sido coautor con ´el de una serie de art´ıculos. Guido Blankestein. Miguel Angel G. Agust´ın Mart´ınez. Olga Puente. Mark W. y los an´onimos revisores que intervinieron en las publicaciones relacionadas con la tesis. expresar mi gratitud a mis padres cuyo cari˜ no y apoyo incondicional.Agradecimientos Ante todo. Ces´areo Raim´ undez. Al codirector de esta tesis. mi primer director por sus muchas sugerencias y apoyo constante durante esta investigaci´on. Francisco Gordillo. Cordones. me siento en deuda con Enrique Ponce. ´ Manolo L´opez. Pedro Montes. Iv´an Gonz´alez. Jorge Ch´avez. que ha dado sus frutos y continuar´a haci´endolo en el futuro. por parte del Centre National de la Recherche Scientifique franc´es. as´ı como la ejemplar gesti´on de los proyectos en los que se enmarca el presente trabajo. Hugo Rodr´ıguez. y los amigos injustamente omitidos. Oscar Collazo. Carlos P´erez. Antonio Barreiro. Por sus sugerencias y colaboraci´on. Por u ´ltimo har´e constar mi cari˜ no y gratitud por su apoyo y comprensi´on a los siguientes: C´esar Saiz. Estoy igualmente agradecido al profesor Francisco Rodr´ıguez Rubio por su decisiva contribuci´on al inicio y desarrollo de esta tesis. Igualmente ha recibido financiaci´on para las estancias del doctorando en el Laboratoire de Signaux et Systemes. su compromiso con la calidad y la puesta al servicio del trabajo com´ un de sus s´olidos conocimientos en nuestra a´rea en la dif´ıcil preparaci´on de los art´ıculos que contribuyeron a esta tesis. El profesor Romeo Ortega manifest´o su inter´es por nuestro trabajo y la posibilidad de abrir un l´ınea com´ un de investigaci´on entre su grupo franc´es de Sup´elec y el sevillano. Gr´egory Potel. han resultado imprescindibles para llevar a t´ermino esta ambiciosa tarea. El presente trabajo ha sido financiado parcialmente por el Ministerio de Ciencia y Tecnolog´ıa espa˜ nol bajo los programas FEDER y PICASSO. Estoy igualmente agradecido a Javier Aracil. todos ellos investigadores de primera l´ınea. en recuerdo de los buenos momentos compartidos. Miguel Pe˜ na. Sevilla Septiembre de 2002 Fabio G´omez-Estern Aguilar . Nocte dieque incubando (D´ıa y noche d´andole vueltas) Sir Isaac Newton Por supuesto, por siempre, a Paloma. ´Indice General Glosario 1 Resumen 5 1 Introducci´ on 7 1.1 Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2 Motivaci´on y objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.3 Control de plataformas giroestabilizadas . . . . . . . . . . . . . . . . . . . 7 1.4 Sistemas subactuados en control . . . . . . . . . . . . . . . . . . . . . . . . 8 1.5 Control basado en la energ´ıa . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.5.1 Evoluci´on del concepto de energ´ıa . . . . . . . . . . . . . . . . . . . 9 1.5.2 Energ´ıa en control: planteamiento del problema . . . . . . . . . . . 10 1.5.3 Estabilizaci´on mediante la energ´ıa . . . . . . . . . . . . . . . . . . . 12 1.5.4 Comportamiento transitorio . . . . . . . . . . . . . . . . . . . . . . 15 1.5.5 Generalizaci´on de la energ´ıa en el control . . . . . . . . . . . . . . . 16 1.6 Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2 Fundamentos te´ oricos y estado de la t´ ecnica 19 2.1 Sistemas electromec´anicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.2 Sistemas de Euler–Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.3 Sistemas hamiltonianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.3.1 Sistemas hamiltonianos generalizados. . . . . . . . . . . . . . . . . . 22 2.3.2 Hamiltoniano y energ´ıa . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.4 Estabilidad en sistemas aut´onomos . . . . . . . . . . . . . . . . . . . . . . 25 2.5 Bifurcaciones en sistemas no lineales . . . . . . . . . . . . . . . . . . . . . 26 i . .1 Elecci´on de un punto de equilibrio arbitrario . . . .6.2 Estabilidad seg´ un Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . .4 Control de sistemas en cascada mediante backstepping . . . . . . . . . . . . . . 38 3 Control de una plataforma giroestabilizada de dos grados de libertad 41 3. . . . . . . . . . .3 Interconexi´on de sistemas pasivos . . . . . . . . . . . . . . . . . . . . 51 3. . . . . . .4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5 Rechazo de perturbaciones L2 . . . . . . . . 33 2. .7. .7. . . . . . . . . . .7 Simulaciones . . . . . . . . . .2 M´etodos de s´ıntesis que preservan la estructura hamiltoniana/lagrangiana en bucle cerrado . 61 3. . . . . 55 3. . . .1 Controlabilidad en sistemas subactuados . .3 Atenuaci´on de perturbaciones en la planta real . . . . . . . . . . . . . . . . . 53 3. . . . . . . . 64 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .´INDICE GENERAL ii 2. .1 Identificaci´on de la planta real . .8.3 Modelo de la plataforma . . . . . . . . . . . . . . . . .6. . . . . . . . . . 35 2.9. . . . . 49 3. . . . .7. . . . . . . .1 Sensores empleados en control inercial .4 Seguimiento de trayectorias en la planta real .4 Atenuaci´on L2 de perturbaciones . . 37 2. 32 2.4 Control hamiltoniano . . . . . . . .6 2. 30 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9. . . . . . . . . . . . . . . . . . .1 Seguimiento visual .6. 43 3. . . . . . . . . . . . . . . 62 3. . 51 3. . . . . . . . .2 Subsistema de estabilizaci´on de trayectorias . .6. . . . .3 Inmersi´on e invariancia . . . .7. 27 2. . .4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 3. . . . . . . . 41 3. 63 3. . . 47 3. .6. . . . . . . .2 Descripci´on de la plataforma inercial . 29 2.1 3.2 Control hamiltoniano con prealimentaci´on de fricci´on . . .8 Aplicaci´on a una planta de laboratorio . . . . . . . . . . . . 61 3. . . . . . . . . . . . . . . . . . 60 Resultados experimentales . . . .2 Pasividad y ganancia L2 . . . . . .6. . . . . 30 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1 Estabilidad Lq 2. . . .9 Identificaci´on de los par´ametros . . 44 3. . . . . . . . . . . . . . . . . .7 Pasividad y disipatividad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3. 28 Sistemas subactuados . . 49 3. . . . . .9. . .6 Seguimiento de objetos m´oviles en superfices no inerciales . . . . . . . . . . . . 103 5. . . . . . . . . 115 5. . 117 5. . 72 4. . . . . . . . . . . . . . . . . 103 Reducci´on de las ecuaciones de moldeo de la energ´ıa cin´etica . . .4. . . . . . . . . . . . . . . . . . 76 4. . . .2 Control por lagrangianos controlados . . . . . . . . . . . . . . . . . . . . . . 78 4. . . . . . . . 74 El p´endulo de disco inercial . . . . . 97 5 Reducci´ on del m´ etodo IDA-PBC para sistemas subactuados 99 5. . . . . . . . . . . . . . . . . . . . .4 Las ecuaciones λ . . . . . . . . . . . . . . . . . . . . .1 Generalizaci´on de la parametrizaci´on de Md para sistemas dos grados de libertad . . . . . . . . . .´INDICE GENERAL 4 Control de sistemas subactuados mediante el m´ etodo IDA-PBC iii 67 4. . . . . . .4. . . . . . . . . .7 Simulaciones . 72 4. 109 5.5 Moldeo de la energ´ıa potencial . . . . .4. . . . . . . . . . . . . . . . . . . . . . . . 99 5. . . .1 Modelo . . . . . . . . . . . .6 C´alculo de la ley de control . . . . .3. . . . . . . 71 4. . . . . . . . . . . .4. . . . . . . . . . . .3 4. . . . . . . . . . . . . . . . 104 5.2 Dise˜ no del controlador . . . . . . . . . . . . . .3 Resultados de simulaci´on . . .1 Introducci´on . . . . . . . . 116 5. . .2. . . . . . . .4 4. . . . . . . . . . . . . . . 77 4. . . . . . . . .3 M´etodo aproximado de la elipse exterior . . . . . . . . . . . . . . . . 83 4. . . . . . . . . . . . . . .1 5. . . . . . 110 5. . . . . . . . . . . . . . . . . . . . . . . .4 Comparaci´on entre los enfoques lagrangiano y hamiltoniano . . . . . . .4. . . . . . . . .2. . . .1 Introducci´on . . . . . .3. . .3. . . . . . . . . . . . . . . . . . . . . . . . . 82 El sistema de la bola en la viga . . . . . . . . . . .3 Moldeo de energ´ıa . . . . . . . . . . . . . . . . . . . . 70 4.8. .2. .3 Reducci´on de las ecuaciones de ajuste en IDA-PBC . . . . . . . . .8. . . . 85 4. . . . . . .1 Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . .4 Simulaciones . . . . . . . . . . .2. . . . . . . . . . 68 4. . . . . . . . .2 Estabilidad . . . . . . . .2 Estabilizaci´on de sistemas mec´anicos subactuados . . . . . . . . . . . . . . . .1 Control lineal .3. . . . . . . . . . . . . . . . . . . . . .1 5. . . . . . . . . . . 119 . . . . . . 113 5. . 101 Definici´on de la clase de sistemas . . . . . . . . .2 Dise˜ no del controlador . . . . . . . . . . . .8 Comparaci´on de leyes de control . .1 Din´amica objetivo . . . . 94 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 5. . . . 83 4. . . . . . . . . . . . .2 Reducci´on de las EDPs de ajuste en m´etodos lagrangianos . . .2. . . . . . . . . . . . . . . . . . . 155 6. .8 Realizaci´on de una familia de sistemas oscilantes a partir de la linealizaci´on por realimentaci´on . . . . . . . . . .9. . . . . . . . 121 5. . . .9. . . . . . . 160 6. . . . . . . . . . 137 6. . . . . . . . . . . . . . .1 Moldeo de energ´ıa cin´etica del robot PPR . . . . . . . . . . . . 165 6.10 Estabilizaci´on de oscilaciones por Inmersi´on e Invariancia . . . . . .1 . .9. . . . . . . . .5 Un m´etodo para la estabilizaci´on de oscilaciones mediante backstepping . . . . 132 6. . . . . . . . . . . . 171 . . . . . . .6. . . . . . .1 5. . . . . . . . . . . . . . . . . . . . . . . . 167 6. . . . . . . .10. . . . . . . .4 Identificaci´on de par´ametros . . . . . . . . . . . . . . .3 Modelo del sistema de laboratorio . . . . . . . . . .9. . . .1 Sistema de levitaci´on magn´etica . . .9. . . . . . . . . . . . . . . . . . . . . 156 6. . . . . . . . . . . . . .2 Un sistema hamiltoniano generalizado oscilatorio de segundo orden .9 Extensi´on de la soluci´on a otros sistemas . . . 125 129 6. . . .1 171 Conclusiones del cap´ıtulo 3 . . . . . . . . . . . . .2 Moldeo de la energ´ıa potencial . . . . . . 164 6. . . . . . . .1. . .8 Bifurcaciones en el sistema de la bola y la viga . .6 Resultados experimentales .9. . . . . . . . . . . . . . 142 Caso m´as general .9 Aplicaci´on a sistemas subactuados . . .9. . . . . . . . . . 156 6. 161 6. . . . .9. . . . . . .9 Efecto de la aceleraci´on centr´ıfuga .´INDICE GENERAL iv 5. . 146 6. . . . . . . . . . . . . . . .2 Sistemas de orden mayor . . . . 168 7 Conclusiones y desarrollos futuros 7. . . . . .1 Introducci´on . . . . . .9. . . . . . . . . . 121 5. . . . . . . . . . . . . . .9. . . . . . . . . . . . . . . .3 Estabilizaci´on de oscilaciones en sistemas de orden dos . . . . 145 6. . . 138 6. . . . . . . . .9. . . . . .6 Sistemas de orden mayor 6. . . . .7 Revisi´on del m´etodo empleando linealizaci´on por realimentaci´on . . . . . . . .2 Implementaci´on en un sistema de laboratorio . . . . 129 6. . . . 148 6.1. . . . . . . . . 158 6. . . 125 Efecto de la p´erdida de controlabilidad en IDA-PBC 6 Estabilizaci´ on de oscilaciones en sistemas no lineales . . . . . . . . . . . . . . .9. . . . . 136 6. . .9. . . . . . . . . . . . . . . . . . .5 Dise˜ no del controlador . . . . . . . . . . . . . . . .1 Resultados de la simulaci´on . . . . . . . . 121 5.4 Backstepping para una clase de sistemas no afines . . . . .7 Oscilaciones en la bola en la viga . . 155 6. . . . . 160 6. . . . . . . . . . . . . . . . . . . . . . . . . . 189 B C´ odigo Maple para la ecuaci´ on (6. . . . 181 A. . . . . . . . . 176 7. . . . . . . . . . . . . 184 A. . . . . . . .4 Conclusiones del cap´ıtulo 6 . . . . . . . . . . . . . 187 A. . . .´INDICE GENERAL v 7. . . . . . . . 174 7. . . . . . . . . . . . 174 7. . . . . . . .5 Desarrollos futuros . . . . . . . . . . . . . . . . . . . . . . . . . 181 A. . . . . . . . .3 Estabilizaci´on de oscilaciones . .8. . 173 7. .3 Arquitectura de la aplicaci´on . . . . . .8 Conclusiones . . . . .1 Cinem´atica de la plataforma de sensores . . . . . . . . . . . . . . 188 A. . . . .4 Simulador de la plataforma giroestabilizada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2 Arquitectura hardware . . . . . . . . . .5 Procesador de comunicaciones .5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3 Conclusiones del cap´ıtulo 5 . . . . . . . . . . . . .7 Procesadores de lazos de control . .2 Conclusiones del cap´ıtulo 4 . . . . . . . 171 7. . . . . . . . . 183 A. . . . . . . . .1) 191 Bibliograf´ıa 195 . . . . . . . . . . . . . . . . . .5. . .1 Introducci´on . . . . . . . . . . . . .5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 7. . . . . . . . . . .2 Sistemas subactuados . . . .6 M´aquina de estados . . . . 185 A. . . . . . . . . 177 A Proyecto DORNA 181 A. . . . . . . . . . . . . . . vi ´INDICE GENERAL . Glosario Notaci´ on matem´ atica IR+ Cn R>0 R≥0 M (q) > I G G⊥ u τ g In Mij Mi· M·j q p Conjunto de n´ umeros reales no negativos.8m/s2 . . Matriz dependiente del estado q donde los autovalores cumplen λi > . Elemento de la fila i. Vector de coordenadas articulares dado por q = [q1 . . Matriz que multiplica al vector de control en sistemas del tipo x˙ = f (x) + Gu. Matriz sim´etrica semidefinida positiva. Matriz cuyas filas son ortogonales a las columnas de G. pn ]T en un sistema mec´anico de n grados de libertad. . Conjunto de funciones diferenciables n veces. 1 . p2 . columna j de la matriz M . Matriz sim´etrica definida positiva. Matriz identidad de orden n. . Ley de control (vector). Columna j-´esima de la matriz M . Par de control (vector). tal que G⊥ G = 0 y cuyo rango es r = n − rango(G). ∀q para una cierta constante  > 0. (Matriz uniformemente definida positiva). q2 . Vector de momentos generalizados dado por p = [p1 . . qn ]T en un sistema mec´anico de n grados de libertad. . Fila i-´esima de la matriz M . ∀i. . Aceleraci´on de la gravedad en la superficie terrestre de valor 9. . q) ˙ M (q) T (q. q) ˙ Vd (q) q∗ arg min (V (q)) q0 p0 t ues udi BIBO Ixx . Momentos de inercia respecto a los ejes principales x.y. Valores de las coordenadas generalizadas en el instante inicial. ∂q1 ∂q2 de la funci´on escalar f: ∂f Elemento k-´esimo de ∇q f . Posici´on de referencia que se desea estabilizar q. Valores de los momentos generalizados en el instante inicial. V´ease la secci´on 2. Matriz de inercia en bucle cerrado. Derivada r-´esima con respecto al tiempo de la funci´on y(t). . Funci´on de Hamilton de un sistema en bucle abierto. respectivamente. . ∂qn . Izz rango(A) Vector gradiente T  ∂f ∂f ∂f . Energ´ıa potencial en bucle abierto. Funci´on de Hamilton de un sistema en bucle cerrado. Ley de control de inyecci´on de amortiguamiento (Damping Injection). . q) ˙ Md (q) Td (q. q) ˙ V (q) Hd (q. Energ´ıa cin´etica en bucle cerrado. Variable tiempo Ley de control de moldeo de energ´ıa (Energy Shaping). Estabilidad en t´erminos de entrada acotada ⇒ salida acotada (Bounded Input Bounded Output).6. . Valor del vector q que hace m´ınima localmente la funci´on V (q). .6.2 Glosario ∇q f ∇qk f gradf y (r) Lq L2 H(q. V´ease la secci´on 2. Iyy . .z. Matriz de inercia en bucle abierto. es decir ∂q k Equivalente a ∇q f . Energ´ıa potencial en bucle cerrado. Energ´ıa cin´etica en bucle abierto. Rango de la matriz A. Funci´on V (x) definida en χ tal que los conjuntos {x ∈ χ|0 ≤ V (x) ≤ c} son compactos para cada c ∈ IR+ ). Equivale al t´ermino radialmente no acotada.Glosario 3 T´ erminos matem´ aticos Curva de nivel Conjunto de nivel Matriz acotada Trayectoria acotada Pasividad Conjunto abierto Conjunto cerrado Conjunto acotado Conjunto compacto Conjunto conexo Funci´on propia Clase K Clase K∞ Lugar geom´etrico donde el valor de una funci´on V (x) permanece constante.6. Un funci´on continua α : [0. a) → [0. Matriz de autovalores acotados. Conjunto donde existe una cota M ∈ IRn tal que x ≤ M para todo elemento x en ´el. Conjunto en el que para cada elemento x. Conjunto cuyo complemento es un conjunto abierto. Trayectoria donde la norma eucl´ıdea del vector q est´a acotada. . ∞) → [0. ∞) es de clase K∞ si es de clase K y adem´as α(r) → ∞ cuando r → ∞. Lugar geom´etrico donde una funci´on toma valores inferiores a una determinada constante. existe una bola de radio r contenida en ´el. Conjunto donde para cada par de puntos existe una sucesi´on de segmentos que los une plenamente contenida en ´el. V´ease la secci´on 2. ∞) es de clase K si es estrictamente creciente y α(0) = 0. Conjunto cerrado y acotado. Un funci´on continua α : [0. Universidad de Sevilla. PBC con inyecci´on de amoriguamiento (Interconnection and Damping Assigmnment-PBC). Control basado en pasividad (Passivity-Based Control). Ecuaciones de Euler-Lagrange. Estabilidad asint´otica global. Sistema de posicionamiento global por sat´elite (Global Positioning System). Sistema de navegaci´on inercial (Inertial Navigation System). Realizaci´on hamiltoniana directa (Direct Hamiltonian Realization. equivalente a GHS). L´ınea a trazos en una gr´afica. Sistema hamiltoniano controlado por puertos con disipaci´on. Sistema hamiltoniano generalizado (Generalizaed Hamiltonian System). DHR Discont. Sistema hamiltoniano controlado por puertos (PortControlled Hamiltonian System). Ecuaci´on diferencial en derivadas parciales.4 Glosario Abreviaturas y acr´ onimos Cont. Depto. EDO EDP EL GAS GHS GPS IDA-PBC INS ISA LSS PBC PCH PCHD US L´ınea continua en una gr´afica. . Ecuaci´on diferencial ordinaria. de Ingenier´ıa de Sistemas y Autom´atica. Laboratoire des Signaux et Syst`emes. de forma sucinta y ordenada. Los m´etodos a los que ha dado lugar esta l´ınea de investigaci´on permiten. La s´ıntesis de controladores para este sistema plantea importantes retos. y se proponen soluciones para problemas que quedaban abiertos desde largo tiempo atr´as. Este sistema est´a motivado por una aplicaci´on naval. Se ofrece una comparativa te´orica y de simulaci´on con otros m´etodos actualmente en uso. El primer sistema estudiado es una plataforma de sensores de dos grados de libertad inmersa en un sistema de referencia no inercial (mesa desestabilizadora) instalada en el departamento de Ingenier´ıa de Sistemas y Autom´atica de la Universidad de Sevilla. incluyendo buen n´ umero de sistemas 5 . En esta tesis se han abordado tres problemas de diferente naturaleza que comparten un hilo com´ un en la exposici´on: la explotaci´on de la estructura hamiltoniana de sistemas electromec´anicos tanto en bucle abierto como en bucle cerrado para dirigirlos de manera robusta hacia equilibrios y o´rbitas peri´odicas bas´andose en consideraciones energ´eticas. Se hace un estudio te´orico con el fin de extender y sistematizar los m´etodos basados en pasividad. seguimiento visual de objetos m´oviles y estabilizaci´on girosc´opica frente a movimientos del sistema de referencia en que se apoya. por primera vez. abordar de manera sistem´atica un conjunto de problemas abiertos como el control de sistemas subactuados y la obtenci´on de funciones de Lyapunov para controladores no lineales. La segunda l´ınea de investigaci´on se centra en el interesante y no trivial problema de s´ıntesis de controladores para sistemas subactuados basados en pasividad. Al comienzo de esta tesis se presentan. sirva de ejemplo la estabilizaci´on robusta frente a perturbaciones. consistente en un sistema de detecci´on visual de obst´aculos en navegaci´on. En esta secci´on se presentan una serie de resultados te´oricos de gran utilidad para lograr los comportamientos oscilatorios en una amplia clase de sistemas. las definiciones y resultados m´as importantes de la literatura af´ın que dan el soporte te´orico para la comprensi´on del presente trabajo. La tercera l´ınea aborda la estabilizaci´on de oscilaciones peri´odicas en sistemas no lineales y el an´alisis de bifurcaciones que aparecen en bucle cerrado.Resumen Las t´ecnicas de control basadas en las estructuras lagrangiana y hamiltoniana de los sistemas electromec´anicos han experimentado un reciente auge de notables proporciones. . A continuaci´on se presenta una secci´on de conclusiones resumiendo las pricipales contribuciones de esta tesis y propuestas de desarrollos futuro.6 Resumen mec´anicos subactuados. El presente texto concluye con un ap´endice en el que se muestran los detalles de una aplicaci´on de tiempo real que desarroll´o un equipo del departamento ISA al que pertenec´ıa el doctorando y que dio pie a la primera l´ınea de investigaci´on de esta tesis. Los resultados son contrastados mediante simulaci´on y de forma experimental en sistemas reales de laboratorio . 3 Control de plataformas giroestabilizadas La primera parte de la tesis. al ser estos tres los principales ´ambitos de aplicaci´on de los resultados de esta tesis. El presente cap´ıtulo se destina a la exposici´on de las motivaciones pr´acticas subyacentes en el control de plataformas de sensores giroestabilizadas. consistente en la estabilizaci´on de sistemas no lineales empleando t´ecnicas de pasividad y la estructura hamiltoniana. En la secci´on 1. y las t´ecnicas de estabilizaci´on de o´rbitas peri´odicas. 1. Asimismo se realizar´a una breve introducci´on.1 Generalidades En esta tesis se presentar´an distintas contribuciones en el contexto del control de sistemas mec´anicos basado en la estructura hamiltoniana y el enfoque energ´etico.6 de este cap´ıtulo se detallar´a la estructura del resto de los cap´ıtulos de esta la. y se detallar´an publicaciones a que ha dado lugar cada uno de los cap´ıtulos. con referencias hist´oricas. en los que se asientan las t´ecnicas de pasividad y el control hamiltoniano. con un car´acter m´as pr´actico que el resto del texto. Si bien existe una l´ınea com´ un clara en el enfoque de la investigaci´on. el control de sistemas subactuados. El sistema de control est´a basado en procesadores digitales de se˜ nales conectados en bus VME destinados a la estabilizaci´on inercial de una plataforma 7 .2 Motivaci´on y objetivos En este apartado se comentar´an los motivos y aplicaciones reales que suscitan el inter´es del ingeniero de control por la resoluci´on de los problemas tratados en esta tesis. emerge en el marco de un proyecto de aplicaci´on en la industria naval que conlleva importantes ingredientes de inter´es te´orico. podemos discernir tres l´ıneas de estudio tratadas de forma independiente 1. a los m´etodos de control basado en la energ´ıa.Cap´ıtulo 1 Introducci´ on 1. Este sistema. 1. los resultados distan de tener gran generalidad. Este sistema se instala sobre la cubierta de un buque. Los supuestos te´oricos est´an ampliamente avalados con resultados de simulaci´on y trabajos experimentales. Mantener en equilibrio una varilla cil´ındrica sobre la palma de nuestra mano es un buen ejemplo de un sistema subactuado. tiene cinco grados de libertad (tres para la posici´on del punto de contacto de la mano con la varilla. y en este momento del desarrollo de la t´ecnica cada ejemplo en particular es un problema abierto diferente de los ya resueltos y que debe ser abordado atendiendo a . la robustecimiento mediante un resultado reciente de rechazo de perturbaciones y el seguimiento de trayectorias basado en pasividad. de modo que la perturbaci´on en la medida de los sensores causada por el oleaje se ve compensada por la estabilizaci´on girosc´opica de la l´ınea de mira. Para una introducci´on al problema v´ease (Spong 1997). Existe una extensa literatura de investigaci´on dedicada a este tipo de sistemas. Un sistema subactuado es aqu´el que posee menos entradas de control que grados de libertad. 5 4 3 2 1 Figura 1. con seis grados de libertad y cuatro actuadores.4 Sistemas subactuados en control La segunda parte de la tesis aborda uno de los problemas matem´aticos abiertos en teor´ıa de control que m´as inter´es ha despertado en la u ´ltima d´ecada: la s´ıntesis de controladores para sistemas mec´anicos subactuados.8 1. Una clasificaci´on interesante de problemas de sistemas subactuados sencillos desde el punto de vista de las posibles estrategias para su resoluci´on puede verse en (Weibel 1997) y tambi´en en (Olfati-Saber 2001). En la pr´actica cualquier sistema que necesite nuestra atenci´on para mantenerse en equilibrio es un sistema subactuado. Pese a los grandes avances te´oricos y experimentales. Sistemas subactuados en control de dos grados de libertad equipada con sensores de movimiento (gir´oscopos. tel´emetro.1. un avi´on. como se muestra en la figura 1. el control hamiltoniano de la misma. y aunque menos evidente. infrarrojos. En esta tesis se desarrollan los fundamentos te´oricos para la identificaci´on de la plataforma. resolvers y encoders) y otros tipos: radar. etc. comunicaciones. Sin embargo s´olo podemos actuar en los tres grados de libertad de la mano.4.1: Grados de libertad de un sistema subactuado. Otros ejemplos son la bicicleta. y dos a´ngulos para la u ´ltima). causa eficiente de los movimientos. misiles. 1. cobr´o un sentido formal en el an´alisis de los sistemas mec´anicos. y cu´ales inyectan energ´ıa al sistema. Si un aeronave es un sistema subactuado en el que se aplica el empuje en la direcci´on del motor de reacci´on y se controla la trayectoria del cuerpo (de seis grados de libertad) con la sola intervenci´on del tim´on de cola y la potencia del motor. 1. Otras aplicaciones de sistemas subactuados aparecen en el dise˜ no de veh´ıculos submarinos. garantizando estabilidad y trayectorias o´ptimas. sobre todo en despegue y aterrizaje.5. Introducci´ on 9 sus particularidades. cu´ales tienen un efecto disipativo. sat´elites de comunicaciones. abriendo paso a las tareas subsiguientes de ajuste y refinamiento del comportamiento transitorio. se arrojar´a una luz necesaria para el problema de la estabilizaci´on. En la pr´actica existe un peque˜ no conjunto de sistemas subactuados sencillos que han cobrado gran popularidad por el desaf´ıo que representan. y robots b´ıpedos. para los cuales existe una amplia gama de controladores en la literatura. podr´ıamos a˜ nadir actuadores. Evidentemente. hasta poder situar el avi´on en la posici´on que queramos.5 Control basado en la energ´ıa Una de las t´ecnicas que mayor inter´es ha despertado en la comunidad del control de sistemas subactuados por sus m´ ultiples aplicaciones y por su retorno al uso de la intuici´on f´ısica en la labor del ingeniero. y requiere informaci´on adicional para cobrar significado. Para su entendimiento es preciso establecer el papel de la energ´ıa en el control. sabemos discernir qu´e t´erminos mantienen la energ´ıa constante. para los que las t´ecnicas existentes se muestran impotentes. Otras aplicaciones surgen por la propia disposici´on f´ısica del sistema.1 Evoluci´on del concepto de energ´ıa El concepto de energ´ıa en control tiene un valor relativo. pero se tratar´ıa de una m´aquina costos´ısima y el consumo de combustible resultar´ıa sumamente ineficiente. hasta seis. La energ´ıa. es la pasividad. El problema del control de sistemas subactuados est´a motivado por numerosas aplicaciones pr´acticas. Mantener la estabilidad de la lanzadera en la posici´on vertical superior es un reto para el control que se ha reproducido en un popular sistema instalado en gran parte de los laboratorios de las universidades del mundo: el p´endulo invertido. Una lanzadera espacial es un sistema subactuado inestable por naturaleza al aplicar el empuje del motor por debajo de su centro de gravedad. . que se analizar´a en esta tesis. que apliquen la propulsi´on en las tres direcciones espaciales y que impriman cualquier momento de giro. En primer lugar se esgrime el s´olido argumento de la econom´ıa de dise˜ no. gracias a los trabajos del siglo XVII. incluso detenido o invertido. existe una infinidad de ejemplos inexplorados. tantos como queramos idear.Cap´ıtulo 1. Posiblemente ser´ıa un sistema m´as f´acil de pilotar. Si al analizar una ley de control que act´ ua sobre un sistema. 5. En ellos. y se hac´ıa imposible constatar experimentalmente sus predicciones. as´ı como marco para la incorporaci´on de la intuici´on f´ısica en el control. la energ´ıa solo exist´ıa ligada a la configuraci´on o estado del cuerpo al que describe. Hasta un cierto momento de la historia de la ciencia. Las t´ecnicas experimentales de la f´ısica nuclear tardaron d´ecadas en desarrollarse. como si de un fluido se tratara. que admiten la denominaci´on de integrales de movimiento. concretamente en el sentido de funci´on asociada al estado o configuraci´on del mecanismo. cuya suma es invariante o decreciente en ausencia de una fuente externa que suministre energ´ıa. el´ectrica y magn´etica. La coronaci´on a este proceso de enriquecimiento del entendimiento cient´ıfico lleg´o con la aparici´on de la teor´ıa de la relatividad restringida que en 1905 consagra a Albert Einstein estableciendo una equivalencia entre masa y energ´ıa. La b´ usqueda de estas funciones generatrices del movimiento fue objeto de una intensa investigaci´on iniciada por Maupertuis y culminada por Euler y Lagrange. pronto se observ´o que las leyes de la mec´anica admit´ıan la existencia de ciertas funciones escalares del estado que conten´ıan suficiente informaci´on para determinar la evoluci´on futura del sistema en forma diferencial gracias a un principio variacional de m´ınima acci´ on elegantemente formulado. Control basado en la energ´ıa realizados por los estudiosos de la entonces entonces llamada filosof´ıa natural1 . con lo que se admiti´o definitivamente que el nuevo concepto de energ´ıa recog´ıa fielmente gran cantidad de fen´omenos observables en la naturaleza. pero en su madurez corroboraron todas las predicciones de la teor´ıa de Einstein. desde la f´ısica de part´ıculas hasta la astrof´ısica. En la descripci´on de sistemas electromec´anicos en bucle abierto se emplea una funci´on de energ´ıa que se corresponde con el fen´omeno natural. De ello se deduce que la energ´ıa no requiere la existencia de un substrato material para existir. establecen por primera vez la existencia de una magnitud llamada energ´ıa que es independiente de los cuerpos y puede ser medida en un volumen en ausencia de masa. A estas funciones. cin´etica. El perspicaz avance en la descripci´on de los fen´omenos naturales que supone la teor´ıa electromagn´etica de Maxwell y los resultados de Poynting. Tambi´en podemos identificar en bucle 1 T´ermino empleado en el t´ıtulo de la principal obra de Sir Isaac Newton Philosophae Naturalis Principia Mathematica.10 1. y es instrumento esencial para posteriores desarrollos en todos las escalas. .5. Esta actitud es m´as parad´ojica a´ un si se tiene en cuenta que las pesquisas que condujeron al enunciado del principio de relatividad surgieron de hechos tan emp´ıricos como el experimento de Michelson y Morley.2 Energ´ıa en control: planteamiento del problema En control autom´atico es tendencia reciente la incorporaci´on del concepto de energ´ıa como un elemento matem´atico de ayuda al dise˜ no de los controladores. no se pod´ıa atribuir una existencia aut´onoma en la naturaleza. otorgando a la segunda el status de realidad f´ısica que hasta entonces s´olo ostentaba la primera. Posteriormente. Sobre los f´ısicos te´oricos reca´ıa la acusaci´on de abusar de incomprensibles artificios matem´aticos desligados de su natural objeto de estudio. 1. Desafortunadamente una representaci´on no desde˜ nable de la comunidad intelectual de principios del siglo XX encontr´o en este hecho una raz´on para comenzar un amargo distanciamiento entre f´ısica y metaf´ısica. resultados en gran medida equivalentes fueron trasladados a sistemas el´ectricos. El teorema de Poynting permite calcular la energ´ıa del campo contenida en un volumen carente de materia radiante y el flujo a trav´es de su contorno. En este caso se puede establecer una separaci´on entre energ´ıas potencial. Tratemos de formular la pregunta correctamente y habremos recorrido parte del camino hacia la soluci´on. Se abre un problema conceptual de dos inc´ognitas para el ingeniero de control: la elecci´on de la funci´on de energ´ıa en bucle cerrado y el consiguiente c´alculo de se˜ nal de control. La segunda raz´on por la cual este enfoque no es pr´actico en control reside en que la funci´on de energ´ıa. x) ˙ tal que las trayectorias x(t) soluci´on del sistema de ecuaciones de Euler-Lagrange   d ∂L ∂L − =0 dt ∂ x˙ ∂x sean tambi´en soluci´on del sistema no lineal aut´onomo (1. para que las trayectorias de ´estos puedan ser calculadas y analizadas en virtud de dichas funciones. al contener informaci´on sobre el comportamiento del lazo cerrado debe ser un objetivo de dise˜ no. El segundo principio de la termodin´amica establece el sentido de la disipaci´on de la energ´ıa en sistemas aislados. Introducci´ on 11 abierto el fen´omeno de disipaci´on y sus causas. La elecci´on de estos par´ametros se har´a atendiendo a restricciones de distinta naturaleza.5. tanto la funci´on de energ´ıa como la se˜ nal de control son los par´ametros a dise˜ nar. . De lo esgrimido anteriormente se desprende que en la fase de dise˜ no de un controlador basado en energ´ıa. el ingeniero se ve desprovisto de las herramientas m´as fundamentales para el c´alculo de trayectorias o an´alisis de estabilidad de los cuerpos. como sucede con las saturaciones. de manera que se abandona la naturaleza conservativa o disipativa del sistema natural porque ´este ya no se encuentra aislado. expresado en funci´on de las coordenadas generalizadas. la expresi´on anal´ıtica de una funci´on de energ´ıa de un sistema aut´onomo. En este contexto. en el que se parte de un sistema no lineal descrito en variables de estado: x˙ = f (x) (1. Aun as´ı sirve de base para un campo de investigaci´on de enorme inter´es denominado problema anal´ıtico inverso (Santilli 1978). el hamiltoniano. que aparecen por especificaciones de rendimiento del sistema o por simples limitaciones del equipamiento disponible: • Restricciones en la se˜ nal de control. Primera cuesti´on: dado un sistema controlado ¿c´omo encontrar una nueva funci´on de energ´ıa que sirva de descripci´on del sistema realimentado mediante de un principio de m´ınima acci´on? Este enfoque no es pr´actico en control porque supone el conocimiento previo de la soluci´on del problema de dise˜ no. no basta con un conocimiento del sistema libre. M´as a´ un. restricciones de tipo matem´atico o geom´etrico debidas a la subactuaci´on. El problema formulado no siempre admite soluci´on pero se pueden establecer ciertas relaciones que aqu´ı no comentaremos por razones de espacio. Controlar implica la adici´on de energ´ıa al sistema en algunos instantes y absorci´on en otros. En la tarea de s´ıntesis de controladores.5. proporciona informaci´on suficiente para calcular trayectorias en ausencia de disipaci´on o inyecci´on externa de energ´ıa.Cap´ıtulo 1. sin un principio de conservaci´on de la energ´ıa o de la cantidad de movimiento. T´engase en cuenta que f (x) contiene tambi´en la ley de control bajo la suposici´on de que ´esta sea funci´on exclusiva del estado x. se requieren objetos matem´aticos que reflejen el efecto energ´etico de la se˜ nal de control.1). en la m´axima complejidad admisible en implementaci´on (por restricciones de tiempo o memoria para los c´alculos del microprocesador).1) y se pretende encontrar una funci´on L(x. La alternativa natural que surge de estos planteamientos es encontrar funciones de energ´ıa que describan a los sistemas controlados. Como se ver´a m´as adelante en esta tesis. proporcionando interesantes resultados pr´acticos.5. hallar una funci´on de realimentaci´on del estado u ≡ u(x). implica la de estabilidad de dicho conjunto l´ımite. • Restricciones en el tiempo de establecimiento. Conocidas las restricciones y conocido el modelo del sistema en bucle abierto se puede enunciar el problema del control basado en la energ´ıa del siguiente modo: dado el sistema x˙ = f (x. las especificaciones de un sistema en bucle cerrado se dividen en dos aspectos: estabilidad del r´egimen permanente y calidad del transitorio (velocidad. respecto a una funci´on del estado H(x). que evaluada en las trayectorias soluci´on es mon´otona decreciente. En la presente tesis se ver´a que estas restricciones pueden trasladarse al grupo anterior de restricciones en la funci´on de energ´ıa. 1. es decir. por lo tanto permanece como problema abierto en el control. Para el r´egimen permanente sabemos que la herramienta fundamental del an´alisis de estabilidad de sistemas no lineales es el m´etodo directo de Lyapunov. Bajo ciertas condiciones adicionales dadas en teoremas como los de LaSalle o Matrosov. hemos comentado soterradamente la necesidad de trasladar las especificaciones de lazo cerrado a restricciones en la funci´on de energ´ıa. • Restricciones en las trayectorias. la convergencia de las trayectorias hacia el l´ımite deseado. pues muchos sistemas se dise˜ nan para funcionar correctamente siempre que se garantice que ciertas variables permanezcan en un rango determinado. Control basado en la energ´ıa • Restricciones en la funci´ on de energ´ıa en bucle cerrado. un comportamiento disipativo (la energ´ıa decrece con el tiempo). se garantiza la estabilidad asint´otica. la forma funci´on de energ´ıa en bucle cerrado va a determinar las propiedades de estabilidad del sistema al identificarse con la funci´on de Lyapunov de control . Dichas restricciones suelen plantear problemas pr´acticos de gran dificultad e inter´es. u).12 1. ¿Qu´e significado tiene esto en la pr´actica? El procedimiento que se emplea en la literatura se denomina Energy Shaping (moldeo de energ´ıa) ya que las especificaciones en bucle cerrado se satisfacen dando forma o moldeando la superficie n-dimensional de la funci´on de energ´ıa.5. Desde el punto de vista te´orico existen pocos resultados a este respecto para sistemas no lineales. En el caso particular de no existir restricciones expl´ıcitas sobre la se˜ nal de control el proceso de dise˜ no es secuencial: se obtiene una funci´on de energ´ıa adecuada a las especificaciones y se calcula por procedimientos puramente algebraicos la se˜ nal de control que transforma el sistema en bucle abierto en otro que sea descrito por dicha funci´on de energ´ıa. Al analizar la estabilidad de un sistema controlado por .3 Estabilizaci´on mediante la energ´ıa Al introducir el problema del control basado en la energ´ıa. sobreoscilaci´on). La forma de esta funci´on debe acomodarse al conjunto de restricciones que se desprenden de las especificaciones en bucle cerrado del sistema. tal que el sistema resultante tenga. La existencia de una funci´on definida positiva (salvo en el conjunto l´ımite deseado donde vale cero). Es de sumo inter´es pr´actico limitar el tiempo en el que un sistema controlado alcanza el objetivo deseado. denominada funci´ on de almacenamiento o energ´ıa. ¿Con qu´e criterio hemos de “moldear” la funci´on de energ´ıa? Muy brevemente. Un controlador basado en la energ´ıa tratar´ıa de cambiar la forma completa de la funci´on de energ´ıa de modo que apareciese un m´ınimo estricto en el punto que se desea estabilizar. como se ver´a ampliamente en esta tesis. Una vez elegida la funci´on de energ´ıa. al pasar por el origen atravesaremos el perfil de m´aximo de energ´ıa (cresta). Para ilustrar este procedimiento. Es bien sabido que un punto de silla de la energ´ıa no representa un equilibrio estable de un sistema din´amico. m´etodos energ´eticos en la energ´ıa veremos en esta tesis que el concepto de disipatividad. tender´a asint´oticamente a dicho equilibrio. En ausencia de acci´on externa. Este procedimiento. si avanzamos hacia el origen en la ˙ nos encontramos un m´ınimo de direcci´on perpendicular al papel (direcci´on del eje θ) energ´ıa (valle). si el sistema es disipativo (de energ´ıa decreciente). Dicho c´alculo involucra la resoluci´on de un sistema de ecuaciones generalmente algebraicas. un t´ermino de inyecci´on de energ´ıa Ha = −2 cos θ de modo que en bucle cerrado resultar´ıa. proporcionan una funci´on de Lyapunov para el control. unido al de moldeo de energ´ıa. Introducci´ on 13 O Figura 1. mientras que si avanzamos en la direcci´on horizontal paralela al papel. no se trata de un m´etodo general aplicable a la totalidad de . hallar una ley de control tal que la funci´on de energ´ıa en bucle cerrado sea definida positiva en todo el rango de funcionamiento y cero en el objetivo.Cap´ıtulo 1. esta ser´a la funci´on de Lyapunov y el sistema ser´a estable. En efecto. En primer lugar. θ) seg´ un la expresi´on H = cos θ + k θ˙2 A la izquierda de la figura 1. Si el sistema en bucle cerrado es conservativo con respecto a la energ´ıa. que pudiera parecer sencillo a primera vista. involucra ciertos matices y complicaciones que no es posible evitar. Para ello se podr´ıa a˜ nadir a la funci´on de energ´ıa natural.2: P´endulo simple. H.3 aparece la funci´on de energ´ıa de dicho sistema frente al ´angulo y su derivada. se calcula la se˜ nal de control que logra que el sistema en bucle cerrado posea una din´amica lagrangiana con respecto a dicha funci´on. Es f´acil observar el un punto de silla en el origen de coordenadas (p´endulo en posici´on vertical superior). El procedimiento expuesto se conoce como moldeo de energ´ıa (energy shaping). que es la energ´ıa del sistema en bucle cerrado.2. obs´ervese el cl´asico sistema del p´endulo simple de la figura 1. la funci´on de energ´ıa mec´anica total (potencial m´as ˙ cin´etica) es una superficie que atribuye un valor de energ´ıa a cada punto en el plano (θ. H + Ha = − cos θ + k θ˙2 Esta funci´on de energ´ıa s´ı posee un m´ınimo en el origen y por tanto. El proceso de dise˜ no en este contexto ser´ıa: dado un punto o conjunto de puntos que se desee estabilizar. ˙ horizontal paralelo al (θ.3. Visto en el espacio tridimensional (tomando la energ´ıa como el tercer eje). θ) tal que las trayectorias en el espacio tridimensional siempre estar´an por debajo de dicho plano. observamos las l´ıneas de nivel ˙ constante. de sistemas mec´anicos en IR2 afirma que los subconjuntos de nivel (´areas encerradas bajo las curvas de nivel) son invariantes del sistema (Landau & Lifchitz 1964). jam´as podr´a llegar al origen en una trayectoria de energ´ıa decreciente. En sistemas conservativos y disipativos sabemos que la energ´ıa mec´anica no puede superar el valor inicial. incluso en los casos para los que existen soluciones expl´ıcitas. Este fen´omeno se observa a la derecha de la figura 1. Si todo lo anteriormente es v´alido para sistemas disipativos. y bucle cerrado (derecha). . ni aun restringi´endonos a los sistemas controlables. 2 Curvas de nivel: lugar geom´etrico de dimensi´on n − 1 en el espacio de estados donde la energ´ıa permanece constante.3: Energ´ıa del p´endulo en bucle abierto (izquierda). por lo que dados la posici´on y velocidad iniciales el sistema queda confinado a la regi´on por debajo del corte. A lo sumo proporciona un fundamento matem´atico estructurado para abordar problemas que anteriormente s´olo admit´ıan soluciones muy particulares. entonces las trayectorias que comiencen dentro de esa curva de nivel. En segundo lugar. Por tanto todo m´etodo de control basado en el moldeo de energ´ıa debe incluir un t´ermino que “ayude” al sistema a disipar energ´ıa adecuadamente. permanecer´an dentro de ella indefinidamente. hay que tener en cuenta que hemos llegado a la funci´on de energ´ıa H + Ha de forma artificial. θ). y por tanto no es natural esperar que la propia fricci´on del sistema lo haga disipativo con respecto a esta funci´on. Este resultado es s´olo de aplicaci´on en sistemas disipativos.3 donde si el sistema comienza a cierta distancia del origen. Otro matiz interesante que se desprende de la t´ecnica del moldeo de energ´ıa para sistemas en IR2 . De nuevo en la figura 1. θ) Figura 1. lo habitual es que el equilibrio estabilizado en bucle cerrado tenga una cuenca de atracci´ on limitada. en la direcci´on del eje θ. ni siquiera a los invariantes en el tiempo.5. es el hecho de que en la regi´on donde la funci´on de energ´ıa es convexa. y dado un ˙ la energ´ıa de ese punto establece un plano punto origen del movimiento en el plano (θ.14 1. Control basado en la energ´ıa sistemas no lineales de par´ametros conocidos. y debe interpretarse del siguiente modo: si una curva de nivel de la energ´ıa del sistema disipativo es cerrada. las curvas de nivel2 son cerradas. Un hecho fundamental en el estudio proyectadas sobre el plano inferior (θ. En este caso se puede afirmar que la altura de la pesa en instantes futuros est´a acotada superiormente por el valor de la energ´ıa potencial inicial del martillo.4). Al estudiar el sistema en bucle cerrado. una curva cerrada en el espacio de las coordenadas representa un conjunto acotado.Cap´ıtulo 1. el valor de dicho m´aximo depende precisamente de la energ´ıa inicial. De hecho el inter´es del acotamiento de trayectorias en control es un problema fundamental para determinar regiones de operaci´on de los sistemas reales. y trayectorias del sistema. Introducci´ on 15 1. En los primeros cursos de Control Autom´atico se incide profundamente en el dise˜ no de controladores con . podemos deducir que el energy shaping puede ser una v´ıa para modular el comportamiento transitorio. Si el concursante emplea sus manos exclusivamente como punto de apoyo para la ca´ıda del martillo sin esfuerzo adicional. Figura 1. El control basado en la energ´ıa tal y como se desarrolla en esta tesis proporciona dicho modelo de energ´ıa en bucle cerrado y una adici´on de amortiguamiento tal que el equilibrio deseado pasa a ser estable. Si deseamos encontrar una cota superior para la altura de la pesa tras el golpe nos encontramos con la siguiente pregunta: ¿cu´al es la m´axima energ´ıa que el forzudo puede transmitir al martillo y por consiguiente a la pesa? Ya no basta con conocer la energ´ıa del sistema en bucle abierto. ´ Esta es la energ´ıa inicial en bucle abierto. sino que es necesario tener un modelo de energ´ıa del conjunto concursante-martillo y en funci´on de ´el se podr´a obtener la altura m´axima que puede alcanzar la pesa. Para explicarlo recurriremos a un curioso ejemplo: una persona vigorosa golpea un martillo de feria para medir su energ´ıa. M´as a´ un. esta energ´ıa se transmite al peso que se eleva hasta una altura que ser´a una medida de la energ´ıa potencial inicial del martillo elevado. describiremos la conexi´on existente entre la forma de la funci´on de energ´ıa y el acotamiento de coordenadas en el transitorio. Inicialmente el martillo est´a en la posici´on P0 y posee una energ´ıa mgh0 = 0.4 Comportamiento transitorio Una vez establecida la relaci´on entre energ´ıa.5. el concursante se convierte en actuador y realiza un esfuerzo para acelerar el martillo mas all´a de la gravedad y por tanto inyecta energ´ıa al sistema. Si adem´as empleamos el hecho de que las curvas de nivel de energ´ıa representan regiones de confinamiento de las coordenadas. Esto implica que existe un valor m´aximo para cada coordenada cuando las trayectorias comienzan con una energ´ıa inicial determinada.4: Variaci´ on del estado en funci´ on de la energ´ıa a˜ nadida . disipaci´on.4 pero con interesantes consecuencias en el campo del control. En efecto. Para ello observa la m´axima altura a la que llega una pesa empujada por el martillazo sobre un trampol´ın (figura 1. con lo que estamos en una situaci´on semejante a la figura 1. est´a bien asentado en la teor´ıa de sistemas lineales y se mantiene como problema abierto. de forma abstracta.5. de la forma x˙ = f (x. de manera extremadamente simple.3) sistema aut´onomo que posee el comportamiento requerido.5. Control basado en la energ´ıa determinadas especificaciones de sobreoscilaci´on para sistemas lineales. Con el concurso de las funciones de Lyapunov V (x). ∂x (1. es decir: • V (0) = 0 y V (x) > 0. ∂V V˙ = f (x. el sistema evoluciona de forma aut´onoma hacia el estado en que la energ´ıa se hace m´ınima. (1. Por otra parte. o sistema en bucle abierto. Sup´ongase que se dispone de una planta.5. 1. Este comportamiento comprende la propiedad de estabilidad en el origen. La evoluci´on del sistema hacia el estado de energ´ıa m´ınima sirvi´o de inspiraci´on a Lyapunov para desarrollar su conocido m´etodo para el estudio de la estabilidad de los sistemas din´amicos no lineales. el ritmo de disipaci´on de energ´ıa en bucle cerrado es un par´ametro cr´ıtico para ajustar comportamientos como el tiempo empleado en alcanzar el equilibrio. . introdujo lo que luego se ha conocido como funci´on de Lyapunov.4) Pues bien la gran aportaci´on de Lyapunov fue permitir generalizar los conceptos de comportamiento de la energ´ıa. en general no lineal. ∀x = 0. k(x)) < 0. En esta tesis se abre la puerta a un ajuste an´alogo para sistemas mec´anicos no lineales subactuados. desde un punto de vista f´ısico estricto. (1.5. a la que se asocia una representaci´on matem´atica.5.3) tienden al m´ınimo de la funci´on de Lyapunov V (x). Es decir. con las t´ecnicas de control basado en la energ´ıa se dar´an las bases para abordar este problema en situaciones de mayor generalidad. u). a situaciones en las que exista esa funci´on V (x) que posee las mismas propiedades matem´aticas que la 3 S´ olo si nos restringimos a sistemas lagrangianos con equilibrios estables. De nuevo en esta tesis.5 Generalizaci´on de la energ´ıa en el control El concepto de energ´ıa suministra una magnitud escalar cuya evoluci´on sintetiza.16 1. que se han comentado en las secciones anteriores. El estudio del tiempo de establecimiento tiene tanta relevancia como la sobreoscilaci´on. Es decir. ∀x = 0 • V˙ (x) < 0.5. la del propio sistema din´amico. lo que se traduce en que las trayectorias de (1. en alg´ un sentido.2) Es sabido que el problema del control consiste en determinar una funci´on u = k(x) tal que el sistema resultante de llevar esta u a (1. El hecho de que una magnitud escalar resuma en su comportamiento la evoluci´on del estado (en general un vector) tiene consecuencias te´oricas y pr´acticas que resulta dif´ıcil sobrevalorar.2) d´e lugar a un sistema en bucle cerrado de la forma x˙ = f (x. k(x)) = F (x). el problema del control se puede plantear. que no es sino una funci´on V (x) que posee las mismas propiedades matem´aticas que la energ´ıa3 .5. Por una parte. Una generalizaci´on adicional. De este modo se puede generalizar considerablemente el control basado en la energ´ıa al control basado en la existencia de la funci´on de Lyapunov. Lo expuesto en este cap´ıtulo ha dado lugar a la publicaci´on en la revista IEEE Transactions on Automatic Control del art´ıculo (Ortega. Sin embargo. En este primer cap´ıtulo se ofrece una exposici´on de motivos. La mayor parte del contenido de este cap´ıtulo ha sido publicado en (G´omez-Estern. Aracil & Rubio 2000) y (G´omez-Estern. es la de asociar una estructura (o realizaci´on. de los sistemas electromec´anicos para los que la adopci´on de una estructura hamiltoniana es un hecho bien conocido y explotado desde hace tiempo. por lo que se alcanza una notable s´ıntesis para el tratamiento de los sistemas din´amicos que admiten esa formalizaci´on. Spong. aunque no tenga su mismo significado f´ısico. Para este sistema se desarrolla un control de la l´ınea de mira basado en la estructura hamiltoniana con rechazo de perturbaciones. y se realiza una revisi´on del estado actual de las t´ecnicas de control dentro de las que se enmarcan las aportaciones de la tesis. Introducci´ on 17 energ´ıa. para el c´alculo de cotas en las trayectorias del sistema. Es el caso. Para estos sistemas las t´ecnicas de proyecto de controladores mediante moldeo de energ´ıa poseen un car´acter natural.6 Estructura de la tesis Esta tesis consta de siete cap´ıtulos complementados con dos ap´endices. El tercer cap´ıtulo est´a dedicado al control de un sistema completamente actuado que presenta interesantes peculiaridades y dificultades en el control: una plataforma giroestabilizada de dos grados de libertad situada sobre una superficie m´ovil como puede ser un veh´ıculo o buque. mediante las formulaciones hamiltonianas. El cuarto cap´ıtulo est´a dedicado al control de sistemas mec´anicos subactuados simples basado en pasividad. 1. Los resultados se aplican a una planta real instalada en el laboratorio del departamento de Ingenier´ıa de Sistema y Autom´atica de la Universidad de Sevilla. sin ning´ un significado de energ´ıa. Se presenta el m´etodo con rigor te´orico y se aplica a la resoluci´on de problemas abiertos ampliamente conocidos en la comunidad del control como la bola y la viga. Cordones & Rubio 2002). as´ı como una perspectiva general de los conceptos involucrados en el desarrollo de los posteriores cap´ıtulos.Cap´ıtulo 1. en una terminolog´ıa cl´asica de la teor´ıa del control) hamiltoniana al sistema considerado. La funci´on de Hamilton de esta realizaci´on hamiltoniana posee las propiedades de una funci´on del Lyapunov. y el consecuente empleo de funciones de Lyapunov. . que est´a teniendo lugar en nuestros d´ıas. Se aporta un an´alisis de los transitorios del sistema en bucle cerrado. se puede ampliar considerablemente el campo de aplicaci´on de las t´ecnicas de moldeo de energ´ıa. En el segundo cap´ıtulo se presentan formamente los fundamentos te´oricos necesarios para la correcta comprensi´on del texto subsiguiente. empleando el m´etodo IDA-PBC. en principio. G´omez-Estern & Blankenstein 2002) y al art´ıculo de congreso (G´omez-Estern. En el cap´ıtulo 6 de esta tesis se ilustra este hecho al proponer como objetivo que el sistema realimentado posea una funci´on del Lyapunov cu´artica. pero cuyo comportamiento presenta unas oscilaciones peri´odicas que constituyen el objetivo del proyecto. desarrolladas inicialmente para sistemas electromec´anicos. recientemente desarrollado. Ortega & Spong 2001). En ´el se parte de un sistema hamiltoniano oscilante de orden dos. (G´omez-Estern. En el ap´endice B se detallan los procedimientos Maple desarollados para el c´alculo autom´atizado de la ley de control para sistemas oscilantes de orden arbitrario. G´omezEstern & Gordillo 2002). la programaci´on de procesadores de se˜ nales en tiempo real. los linealizables por realimentaci´on y otros sistemas de forma aproximada. Ortega & Aracil 2002). . Aracil & G´omez-Estern 2002) y (Aracil. G´omez-Estern & Gordillo 2002). contiene elementos de inter´es desde el punto de vista del modelado.8. Los resultados de este cap´ıtulo han sido publicados en (G´omez-Estern. (Gordillo. El principal inter´es de estos procedimientos reside en la dificultad del manejo de sistemas de ecuaciones diferenciales cuando se desea trabajar con sistemas de orden variable. y se desarrolla una teor´ıa para la extensi´on del comportamiento oscilante en una amplia clase de sistemas de orden superior. Aracil & Gordillo 2002). incluyendo los sistemas con estructura triangular no af´ın. clasificadas en funci´on de las tres partes fundamentales de la tesis. Gordillo & G´omez-Estern 2002). G´omezEstern. Este ap´endice tambi´en se ha incluido en publicaci´on (Aracil. para el control de plataformas giroestabilizadas. El ap´endice A describe la labor desarrollada en el contexto del proyecto DORNA por el doctorando y el equipo de desarrollo formado a tal efecto. y se estudia la aplicaci´on de la reducci´on a sistemas de orden mayor. Dos resultados fundamentales son la detecci´on de una bifurcaci´on de Hopf que se mantiene al aumentar el orden del sistema y la posibilidad de representar el sistema en bucle cerrado en forma hamiltoniana generalizada. admite una soluci´on trivial gracias a la reducci´on obtenida. Adem´as se presentan soluciones de razonable generalidad para los pasos de moldeo de energ´ıa cin´etica y potencial para el caso de sistemas de dos grados de libertad. Estructura de la tesis El objetivo del quinto cap´ıtulo es la reducci´on de las ecuaciones IDA-PBC para una clase de sistemas subactuados en los que el sistema de ecuaciones diferenciales parciales propio del m´etodo.6. la sincronizaci´on de procesos y el dise˜ no de protocolos de comunicaciones. Ortega. La aplicaci´on. Rubio & Gordillo 2000). Los resultados de este ap´endice dieron lugar a la publicaci´on (G´omez-Estern. P´erez. presentada en la secci´on 6. Los resultados presentados en este cap´ıtulo han dado lugar a la serie de publicaciones (Aracil. y se expone una discusi´on detallada de las posibles l´ıneas futuras de investigaci´on posteriores a esta tesis. (Gordillo. El sexto cap´ıtulo aborda el problema de la estabilizaci´on de o´rbitas peri´odicas en sistemas no lineales mediante realimentaci´on est´atica del estado basadas en la energ´ıa y la estructura hamiltoniana. Rubio & Aracil 2001). El s´eptimo cap´ıtulo contiene una exposici´on de conclusiones referentes a los cap´ıtulos comprendidos entre el tres y el seis. el control.18 1. de tiempo real. que se propone como din´amica objetivo para el sistema a controlar. qn . y por tanto es una herramienta esencial en el an´alisis y control de sistemas rob´oticos y electromec´anicos en general. seguimiento de trayectorias y robustificaci´on en una clase de sistemas. . . y por tanto tampoco son intercambiables las t´ecnicas de control desarrolladas en uno u otro enfoque. . . todo sistema mec´anico est´a caracterizado por una funci´on de las coordenadas generalizadas qi . el 19 . . las formulaciones han sido generalizadas hasta el punto en que no es evidente su equivalencia. q.2 Sistemas de Euler–Lagrange Una interesante y compacta definici´on de sistemas de Euler–Lagrange (indistintamente EL) se enuncia en (Landau & Lifchitz 1964). 2. y el tiempo t L(q1 . q˙2 . q˙n . 2 . el sistema ocupa posiciones determinadas. ˙ t) tal que las trayectorias del sistema q(t) satisfacen la condici´on siguiente (Landau & Lifchitz 1964). mediante el principio de m´ınima acci´ on (o de Hamilton) . Entre estas posiciones. n. Supongamos que en los instantes t = t1 y t = t2 . q˙1 . La comunidad del control ha dividido sus l´ıneas de trabajo en dos paradigmas con un alto grado de paralelismo: los sistemas lagrangianos o de Euler–Lagrange (EL) y los hamiltonianos. . i = 1. q2 . . cuya propiedad fundamental es que poseen integrales de movimiento. caracterizadas por los conjuntos de coordenadas q 1 y q 2 . . . En virtud de este principio.Cap´ıtulo 2 Fundamentos te´ oricos y estado de la t´ ecnica 2. Esto quiere decir que la evoluci´on de sus trayectorias puede ser descrita en t´erminos de las derivadas temporales y con respecto a las coordenadas generalizadas de una funci´on escalar relacionada con la energ´ıa. . sus derivadas.1 Sistemas electromec´anicos Esta tesis tiene por objeto estudiar y desarrollar m´etodos de estabilizaci´on. Esta propiedad es com´ un en sistemas mec´anicos y sistemas el´ectricos. Pese existir una equivalencia entre ambos enfoques y poder expresar la modelo EL en forma hamiltoniana. t) o m´as brevemente L(q. ˙ t) y V (q. Sistemas de Euler–Lagrange sistema se mueve de forma que la integral  t2 S= L(q. ˙ t)dt t1 tome el menor valor posible. Euler y Lagrange la definieron correctamente en el caso general. respectivamente. q˙ + δ q. . Sea. en ausencia de fricci´on pueden ser escritas del siguiente modo M (q)¨ q + C(q. g(q) = ∂V∂q(q) y el t´ermino C(q. q. Con ello se logra . las trayectorias q(t) ser´an soluciones al sistema de ecuaciones diferenciales de segundo orden   d ∂L ∂L − = fi i = 1. n donde T (q.20 2. 2 . Generalizando al caso de sistemas sometidos a fuerzas externas. es decir. por lo que  t2  t2  t2 δS = L(q + δq. q) ˙ q˙ + g(q) = τ (2.2. cumpli´endose que M˙ − 2C es una matriz antisim´etrica. q = q(t) la funci´on (trayectoria) para la cual S se hace m´ınima. La variaci´on infinitesimal en S debe anularse en el m´ınimo. .1) Donde M (q) es la matriz de inercia del sistema.2. Estas ecuaciones. ˙ t) − V (q. ˙ t)dt − L(q. La funci´on L se conoce como funci´on de Lagrange y la integral S como integral de acci´ on.. t) i = 1.n dt ∂ q˙i ∂qi donde fi representa el conjunto de fuerzas y momentos externos que no derivan de un potencial. t) representan. en el caso de s´olidos r´ıgidos (p. entre los que habitualmente incluiremos • Los efectos de fricci´on que tienen como consecuencia una disipaci´on de energ´ıa. • Fuerzas y pares de control. q. precisamente. q) ˙ q˙ corresponde a los efectos centr´ıfugos y de coriolis. donde δq(t) es una funci´on peque˜ na en el intervalo de tiempo de t1 a t2 . El modelo de Euler–Lagrange ha dado lugar a una serie de m´etodos de s´ıntesis de controladores que adem´as de perseguir la estabilidad asint´otica de equilibrios y trayectorias. ˙ t)dt = δ L(q. q. que S aumenta si el sistema sigue cualquier trayectoria alternativa a q(t) de la forma q(t) + δq(t). tomando la forma L = T (q. q. q. las energ´ıa cin´etica y potencial. ej. preservan la estructura de Euler–Lagrange en bucle cerrado. ˙ t)dt = 0 t1 t1 t1 desarrollando la variaci´on de la integral se tiene   t2  ∂L ∂L δq + δ q˙ dt = 0 ∂q ∂ q˙ t1 y no es dif´ıcil probar (Ra˜ nada 1990) que la condici´on necesaria y suficiente para que δS = 0 es   d ∂L ∂L − =0 dt ∂ q˙i ∂qi Tras a˜ nos de especulaciones (Maupertuis) en cuanto a la definici´on de la funci´on L. sistemas rob´oticos).. . • Estructuras pasivas que permiten obtener resultados de robustez. Al . lo que permite hacer an´alisis en espacios de dimensi´on reducida. la din´amica se transforma en     q˙ 0n×n f = Γ∇H + In p˙ Mucho m´as que un sencillo cambio de variables. la formulaci´on hamiltoniana de la mec´anica tiene gran elegancia y ofrece una visi´on profunda sobre la evoluci´on de los sistemas. que hacen de ella una herramienta merecedora de su gran popularidad.Cap´ıtulo 2. Fundamentos te´ oricos y estado de la t´ecnica 21 • Una funci´on de Lyapunov natural como es la funci´on de energ´ıa. f2 . Si sobre el sistema act´ uan una serie de fuerzas externas y de control dadas por el vector f = [f1 . Para obtener estas ecuaciones se define la funci´on de Hamilton a partir de la transformada de Legendre de la funci´on de Lagrange   p˙i qi − L H= donde la variables {p1 . . Su primera ventaja aparente es la estructura: un conjunto de ecuaciones diferenciales de primer orden. • Separaci´on entre energ´ıas cin´etica y potencial en bucle cerrado. • Generalizar teor´ıas de s´ıntesis para el control de sistemas subactuados. p2 . pn } se denominan momentos conjugados y se definen como pk = ∂L ∂ q˙k Tomando derivadas parciales (Ra˜ nada 1990) ∂H ∂qk ∂H ∂pk ∂L ∂ q˙i  ∂L ∂qi − − = −p˙k ∂qk ∂ q˙i ∂qk ∂qk i i  ∂ q˙i  ∂L ∂ q˙i = q˙k + pi − = q˙k ∂pk ∂ q˙i ∂pk i i =  pi se llega a la siguiente descripci´on en variables de estado      ∂H 0n×n In q˙ ∂q = = Γ∇H ∂H p˙ −In 0n×n ∂p (2. A medida que analicemos la estructura y propiedades de esta descripci´on aparecer´an interesantes ventajas para el control. .3. . . . que se ajusta a la descripci´on cl´asica en variables de estado x˙ = f (x) empleada en control no lineal. . fn ]T . .1) Donde In es la matriz identidad de orden n. 2. La matriz Γ se denomina matriz simpl´ectica.3 Sistemas hamiltonianos La din´amica de los sistemas de Euler Lagrange admite una descripci´on alternativa conocida como ecuaciones can´onicas de Hamilton. 22 2. Sistemas hamiltonianos representar la matriz simpl´ectica una rotaci´on de ´angulo −π/2. Generalmente trataremos con sistemas PCH con disipaci´on (o PCHD) al incluir un t´ermino disipativo en la din´amica. En efecto.. o sistemas hamiltonianos controlados por puertos. En (Van der Schaft 2000) aparece una generalizaci´on de los sistemas hamiltonianos mediante la definici´on de la estructura PCH (Port–Controlled Hamiltonian System). ˙ p) ˙ aparece girando el gradiente del hamiltoniano 90o en sentido horario. Adem´as. 2. R(x) ≥ 0 es la matriz de disipaci´ on.p) grad(H) Figura 2.1: Campo vectorial de un sistema hamiltoniano.p) q (q. que a su vez determina la direcci´on del movimiento en el espacio de las fases (v´ease la figura 2. la matriz y el vector de control. q˙k + p˙k + H˙ = ∂q ∂p ∂t ∂t k k k k implica que si H no depende expl´ıcitamente del tiempo (el caso habitual que estudiaremos en esta tesis).3. H es el hamiltoniano o funci´on de Hamilton y G y u representan.. por lo que se dice que H es el generador de las trayectorias.. el hecho de que en las trayectorias del sistema se cumple que  ∂H  ∂H ∂H ∂H = . ∂x1 ∂x2 ∂xn Es f´acil de comprobar. ya que sus derivadas definen y determinan el vector de las derivadas del estado.. el campo vectorial en el espacio de las fases (q. T ∂H ∂H ∂H ∇H = . que en ausencia de acci´on de control la derivada del hamiltoniano viene dado por H˙ = −(∇H)T R(x)(∇H) ≤ 0 .2) donde x ∈ IRn es el vector de estado.3. grad(H) p (q. .1 Sistemas hamiltonianos generalizados.3). las trayectorias son curvas de H(t) ≡ H(0). por la propiedad antisim´etrica de J(x).3. Los sistemas PCH con disipaci´on admiten la siguiente descripci´on en variables de estado x˙ = (J(x) − R(x)) ∂H + Gu ∂x (2. J(x) = −J(x)T es la matriz de interconexi´ on. respectivamente. Fundamentos te´ oricos y estado de la t´ecnica 23 De hecho.... ∇ξ H ξ = ∂ξ1 ∂ξ2 ∂ξn T Supongamos que deseamos obtener las ecuaciones de estado en un nuevo conjunto de variables x ∈ IRn definido por el mapa diferenciable y difeom´orfico ψ : ξ .Cap´ıtulo 2. si R(x) = 0 desaparece el efecto disipativo y el hamiltoniano se conserva (sistema PCH). Sea el sistema PCHD definido en variables ξ ∈ IRn cuya din´amica est´a descrita por las ecuaciones ξ˙ = (Jξ (ξ) − Rξ (ξ))∇ξ Hξ donde ∂Hξ ∂Hξ ∂Hξ .. Cambio de variable en sistemas hamiltonianos Un resultado u ´til para los prop´ositos de esta tesis surge de la invariancia de las propiedades de la estructura hamiltoniana generalizada frente a un cambio de coordenadas en el sistema. . Gracias a este hecho fundamental. la funci´on H puede ser empleada como funci´on de Lyapunov de control para sistemas con estructura PCHD en bucle cerrado. Para ello se ha de calcular el jacobiano de la transformaci´on inversa x .→ x. recurrir a unas variables en las que sea sencillo encontrar una estructura hamiltoniana. ξ= (Jξ − Rξ )∇ξ Hξ = (Jξ − Rξ ) x˙ = ∂ξ ∂ξ ∂ξ ∂ξ Si definimos las matrices T ∂x ∂x Jx = Jξ ∂ξ ∂ξ  T ∂x ∂x Rx = Rξ ∂ξ ∂ξ  es sencillo demostrar que Jx es una matriz antisim´  etrica. para cualquier vecz ∈ IRn tal que por la propiedad tor z ∈ IRn podemos definir otro vector y = ∂x ∂ξ antisim´etrica de Jdξ se tiene T ∂x T T ∂x z Jx z = z z = y T Jξ y = 0 ∀z Jξ ∂ξ ∂ξ de lo que se deduce que Jx tambi´en es antisim´etrica.→ ξ representado por ∂x . en determinadas situaciones. Un caso particular es el de un sistema linealizado por realimentaci´on. . En efecto. ∂ξ Entonces se tiene T ∂x ∂x ∂x ∂x ˙ ∇x H x . El hecho de que Rx ≥ 0 se demuestra de una manera an´aloga. precisamente. el sistema expresado en variables x toma la forma x˙ = (Jx (x) − Rx (x))∇x Hx que es. Consecuentemente. Este resultado permite. un sistema PCHD con matrices de interconexi´on Jx y disipaci´on Rx . para poder deshacer el cambio preservando dicha estructura. T´omense los mismos vectores z e y del p´arrafo anteriores y se tiene T ∂x T T ∂x z Rx z = z z = y T Rξ y ≥ (>)0 ∀z Rξ ∂ξ ∂ξ Para lo cual es condici´on suficiente y necesaria que Rx ≥ (>)0. como se analizar´a en el cap´ıtulo 6. 2: Sistema hamiltoniano en sistema de referencia no inercial. Para ilustrar esto obs´ervese el sistema de la figura (2. y seg´ un se indica (Ra˜ nada 1990). En el caso de sistemas aut´onomos no inerciales. Como se ver´a a continuaci´on.2 Hamiltoniano y energ´ıa La siguiente discusi´on est´a motivada por la confusi´on que a menudo induce el emplear los t´erminos energ´ıa y funci´on de Hamilton indistintamente. q1 w Figura 2. es 1 H = a2 m(q˙12 − ω 2 sen2 q1 ) + mga cos q1 2 mientras que la energ´ıa mec´anica toma la forma 1 E = T + V = a2 m(q˙12 + ω 2 sen2 q1 ) + mga cos q1 2 Derivando la energ´ıa con respecto al tiempo se tiene E˙ = a2 mω 2 q˙1 sen2q1 lo que implica que siempre que haya variaci´on del ´angulo q1 .3. no existe la consabida equivalencia entre energ´ıa y hamiltoniano.3. en los sistemas mec´anicos que no se asientan sobre sistemas de referencia inerciales. . ya que el movimiento del sistema de referencia en el que est´a inmerso el sistema suele suele provocado por un intercambio de energ´ıa con el exterior. que es la u ´nica cantidad conservada. El lagrangiano de este sistema toma la forma 1 L = a2 m(q˙12 + ω 2 sen2 q1 ) − mga cos q1 2 donde g es la constante de gravedad. habr´a un intercambio de energ´ıa con el exterior. la cantidad conservada es el hamiltoniano. Supongamos que este sistema est´a accionado por un motor que lo mantiene girando en torno a un eje vertical que pasa por el centro del aro con velocidad constante ω.24 2.2). El sistema consiste en una masa puntual m restringida a moverse sobre una circunferencia de radio a que gira en torno a un eje vertical que pasa por su centro. ¿A qu´e se debe esta discrepancia entre hamiltoniano y energ´ıa?. Sistemas hamiltonianos 2. El hamiltoniano. f (x∗ ) = 0. .2) . ´esta se podr´a calcular siempre en funci´on de las coordenadas articulares q por la relaci´on rj = rj (q1 . 2. es decir.1 (Estabilidad en sistemas no lineales). x denota un conjunto de coordenadas locales en un espacio m–dimensional χ. la expresi´on general  1 B(q.4 Estabilidad en sistemas aut´onomos Los resultados presentados en esta secci´on son ampliamente conocidos y empleados en la literatura del control no lineal (Khalil 1996). y por tanto sumergido en un sistema de referencia no inercial. la energ´ıa cin´etica puede constar. si definimos rj como la expresi´on en cartesianas respecto a un sistema de referencia inercial de la part´ıcula j del sistema. q2 . x(t0 )) = x∗ t→∞ (2. Supondremos que f es localmente continua en el sentido de Lipschitz. adem´as de los t´erminos cuadr´aticos.4. entonces la energ´ıa cin´etica se reduce al t´ermino T = T2 en cuyo caso diremos que se trata de un sistema natural. Se incluir´an con el prop´osito de crear un texto autocontenido. pues. Fundamentos te´ oricos y estado de la t´ecnica 25 ¿Por qu´e se conserva s´olo el primero? La raz´on subyace en que el sistema no est´a aislado pues precisa del aporte de energ´ıa de un motor externo para mantener la rotaci´on a velocidad constante (normalmente oscilar´ıa). . implicando la existencia y unicidad de soluciones. Si en esta relaci´on no aparece expl´ıcitamente el tiempo. ∀t. qn .4. El equilibrio x∗ es (a) estable. En consecuencia existe un flujo de energ´ıa entre el sistema y el exterior.Cap´ıtulo 2. y por tanto x(t. pero no la energ´ıa. por lo cual H es una constante de movimiento. . El ejemplo mencionado se trata de un sistema no natural y aut´onomo y por tanto se conserva el hamiltoniano. Consid´erese el conjunto de ecuaciones diferenciales x˙ = f (x) (2. Definici´ on 2. x∗ ) = x∗ . Sea x∗ un equilibrio de (2. Si adem´as L (y por tanto H) no dependen expl´ıcitamente del tiempo. La condici´on para la conservaci´on del hamiltoniano es diferente. de otros t´erminos lineales.4.1). La expresi´on general de la energ´ıa cin´etica de un sistema de part´ıculas toma. si es estable y existe c > 0 tal que x(t0 ) − x∗  < c ⇒ lim x(t. t) = T2 + T1 + T0 T = Ars (q. Estas circunstancias son de especial relevancia en el contexto de esta tesis pues se estudiar´a el control de un sistema instalado en la cubierta de un buque. ∀t ≥ t0 (b) asint´oticamente estable. . t). M´as generalmente.1) donde x ∈ IRn . Para comprender lo que sucede con el hamiltoniano hay que puntualizar que cuando el sistema se encuentre en un sistema de referencia no inercial. ya que son esenciales para los desarrollos de esta tesis.s r Por otro lado. t)r q˙r + C(q. t)q˙r q˙s + 2 r. se trata de un sistema aut´ onomo. si para cada  > 0 existe δ = δ() > 0 tal que x(t0 ) − x∗  < δ ⇒ x(t) − x∗  < .4. Sea x(t. Un caso t´ıpico es el de un sistema del tipo x˙ = f (x. ∀x ∈ χ as Entonces x∗ es un equilibrio estable. ∀t ≥ 0. El siguiente teorema describe las condiciones para la existencia de dicha bifurcaci´on. Sea x∗ un equilibrio de (2. Si adem´ V˙ (x) < 0. x = x∗ entonces x∗ es un equilibrio asint´ oticamente estable. y tiene especial inter´es en sistemas de alto orden donde la complejidad imposibilita hacer un an´alisis detallado del retrato de estados. decimos que se ha producido un bifurcaci´ on. tal que V˙ (x) = (∇x V (x))T f (x) ≤ 0. t ≥ 0 una soluci´on de x˙ = f (x). V : χ → IR+ una funci´ on C 1 T para la cual V˙ (x) = (∇x V (x)) f (x) ≤ 0 para todo x ∈ χ. si es estable y limt→∞ x(t. ∀x ∈ χ. de inter´es en esta tesis. f (x∗ . x = x∗ (es decir. Entonces x(t : x0 ) converge al mayor subconjunto de {x ∈ χ|V˙ (x) = 0} B que es invariante para el sistema x˙ = f (x). Una herramienta muy potente para probar estabilidad asint´otica en sistemas no lineales es el principio de invariancia de LaSalle.5 Bifurcaciones en sistemas no lineales En el estudio de sistemas din´amicos no lineales es frecuente observar que la estructura del espacio de fases se ve dr´asticamente afectada por la variaci´on de uno o varios par´ametros del sistema. Supongamos que el sistema din´amico x˙ = f (x. µ) con f ∈ C 3 .4. La bifurcaci´on de Hopf. Este tipo de bifurcaciones es conocido como bifurcaci´ on de Hopf. y lo es globalmente si V es propia. esto es. µ) en el que existe un ciclo l´ımite estable para µ < 0 que colapsa en un punto de equilibrio estable cuando µ cambia de signo (v´ease la figura 2. V (x) > 0.4. Bifurcaciones en sistemas no lineales (c) globalmente asint´ oticamente estable. 2.3). y sus aplicaciones ha sido estudiada en (Marsden & McCracken 1976).4. suponga que existe un conjunto compacto B tal que x(t : x0 ) ∈ B. Una herramienta fundamental para el an´alisis de estabilidad de los sistemas din´amicos es el m´etodo directo de Lyapunov: Teorema 2.1 (Lyapunov). µc ) = 0. Sea V : χ → IR+ una funci´ on C 1 que cumple V (x∗ ) = 0.5. x0 ) = x∗ para todo x0 ∈ χ.1). definida positiva en x∗ ).26 2. x ∈ IRn y µ ∈ IR tiene un punto de equilibrio en x∗ . para alg´ un µ = µc . x0 ). . Teorema 2. En el caso de que el n´ umero o la naturaleza de los conjuntos l´ımite del sistema se vean modificados por la variaci´on de dicho par´ametro.2 (Principio de invariancia de LaSalle). 3: Representaci´on esquem´atica de las trayectorias en la bifurcaci´ on de Hopf. y adicionalmente. µ) la matriz jacobiana del sistema en el punto de equilibrio. ´nico par de autovalores imaginarios λ(µc ) = ±jωc . El polinomio caracter´ıstico para A es ∆(A) = sn + an−1 sn−1 + · · · + a1 s + a0 donde los ai dependen de µ. Sea A(µ) = Dx f (x∗ (µ). . y Supongamos que A(µc ) tiene un u ning´ un otro autovalor con parte real nula.Cap´ıtulo 2. Fundamentos te´ oricos y estado de la t´ecnica 27 Estado Parámetro de bifurcación Tayectoria entrante Trayectoria saliente Equilibrio estable Figura 2. dRe(λ(µ)) . . = 0 . Hn−3 > 0. (Van der Schaft 2000) para pasividad e interconexi´on de sistemas pasivos y (Ortega. . el teorema de la bifurcaci´on de Hopf (Marsden & McCracken 1976) sugiere la aparici´on de un ciclo l´ımite en (x∗ . Una posibilidad es el recurso a la t´ecnica de la funci´ on descriptiva. . . H1 (µ) > 0. 2. Las condiciones para la existencia de un par de autovalores puramente imaginarios de la matriz A(µ) pueden ser formulados para cualquier dimensi´on del siguiente modo (Liu 1994): Hn−1 (µ) = 0 Hn−2 (µ) > 0. Para determinar exactamente el lugar y si realmente se trata de un ciclo l´ımite atractivo.1) (2. a0 (µ) > 0 (2. esta condici´ on s´olo indica la existencia de oscilaciones bien a uno de los lados de la bifurcaci´ on o precisamente en el punto µ = µc . Loria. Niklasson & Sira-Ram´ırez 1998) para control basado en pasividad de sistemas EL. son necesarias consideraciones adicionales basadas en la informaci´on no lineal del sistema.5. dµ µ=µc Esto u ´ltimo se conoce como la condici´on de transversalidad. 1 En rigor. µc )1 . Bajo estas condiciones. .2) Donde Hi (µ) representa el i-´esimo menor descendente de la matriz de Hurwitz de ∆(A).6 Pasividad y disipatividad Los conceptos que se describir´an a continuaci´on pueden estudiarse con mayor detalle en: (Vidyasagar 1993) para estabilidad L2 .5. . 28 2.6. Pasividad y disipatividad 2.6.1 Estabilidad Lq Definici´ on 2.6.1 (Espacios Lq ). Para cada q ∈ {1, 2, . . . } se define Lq [0, ∞) = Lq como el conjunto de funciones2 f : IR+ → IR que satisfagan  ∞ |f (t)|q dt < ∞ 0 A su vez, L∞ consiste en el conjunto de funciones f : IR+ → IR acotadas, es decir sup |f (t)| < ∞ t∈IR+ En estos espacios es posible definir las siguientes normas Definici´ on 2.6.2 (Norma Lq ). Para toda funci´on f : IR+ → IR contenida en Lq se definen la normas  ∞  1q q |f (t)| dt q = 1, 2, . . . f q = f ∞ = 0 sup |f (t)| < ∞ t∈IR+ Asimismo, en L2 se define el producto interior de dos funciones f ,g contenidas en L2  ∞ < f, g >= f (t)g(t)dt 0 1 de donde se deduce que f 2 =< f, f > 2 . Para las funciones no acotadas sin tiempo de escape finito se define el espacio extendido Lqe Definici´ on 2.6.3 (Espacios Lqe ). Sea f : IR+ → IR. Entonces, para cualquier T ∈ IR+ , la funci´on fT : IR+ → IR se define como f (t) , 0≤t<T fT (t) = 0 , t≥T llamada la truncaci´on de f en el intervalo [0, T ]. Para cada q = 1, 2, . . . ∞, el espacio Lqe consiste de todas las funciones f : IR+ → IR tal que fT ∈ Lq para todo T con 0 ≤ T ≤ ∞. Lqe se denomina el espacio extendido de Lq . Lo expuesto anteriormente se puede extender trivialmente a funciones f : IR+ → IRn suponiendo la existencia de una norma definida en IRn . Los conceptos presentados son elementales para las siguientes definiciones de estabilidad Lq entrada–salida. Para representar la din´amica de un sistema haremos uso del concepto m´as general mapa de entrada– salida. Sea U un espacio lineal m-dimensional con norma  U , e Y otro espacio lineal p-dimensional con norma  Y , junto a una aplicaci´on entrada–salida G : Lqe (U ) → Lqe (Y ) u → y = G(u) 2 En adelante se supondr´ a que estamos hablando en todo caso de funciones medibles. Un funci´ on es medible si es el l´ımite punto por punto de una secuencia de funciones constantes a trozos, excepto un conjunto de medida cero. Cap´ıtulo 2. Fundamentos te´ oricos y estado de la t´ecnica 29 Definici´ on 2.6.4 (Estabilidad Lqe ). Sea un sistema representado por el mapeo G : Lqe (U ) → Lqe (Y ). Entonces se dice que G es Lq –estable si u ∈ Lqe (U ) → G(u) ∈ Lq (Y ) es decir, G aplica el subconjunto Lq (U ) ⊂ Lqe (U ) en el subconjunto Lq (Y ) ⊂ Lqe (Y ). Evidentemente, la estabilidad L∞ , equivale a estabilidad BIBO (Bounded Input Bounded Output). 2.6.2 Pasividad y ganancia L2 Sea un sistema descrito en variables de estado de la forma x˙ = f (x, u), u∈U Σ: y = h(x, u) y∈Y donde x = x1 , x2 , . . . , xn son las coordenadas locales en una variedad χ, U e Y son espacios lineales, de dimensiones m y p, respectivamente. En el espacio de estados U × Y de variables externas se define la funci´on s : U × Y → IR denominada tasa de suministro. Definici´ on 2.6.5 (Disipatividad). Un sistema en variables de estado Σ se dice que es disipativo con respecto a la tasa de suministro s si existe una funci´on S : χ → IR+ , denominada funci´on de almacenamiento tal que para todo x ∈ χ y todas las funciones de entrada u  t1 S(x(t1 )) ≤ S(x(t0 )) + s(u(t), y(t))dt (2.6.1) t0 La desigualdad (2.6.1) es conocida como la desigualdad de disipaci´on. Una elecci´on habitual de la tasa de suministro es s(u, y) =< y|u > . Definici´ on 2.6.6 (Pasividad). Un sistema en variables de estado Σ con u = y = m IR es pasivo si es disipativo con respecto a la tasa de suministro s(u, y) = uT y. Σ es estrictamente pasivo a la entrada si existe δ > 0 tal que Σ es disipativo con respecto a s(u, y) = uT y − δu2 . Σ es estrictamente pasivo a la salida si existe  > 0 tal que Σ es disipativo con respecto a s(u, y) = uT y − y2 . Finalmente, Σ es conservativo si se cumple (2.6.1) con signo de igualdad con respecto a la funci´on s(u, y) = uT y para todo x0 ,t1 ≥ t0 y u(·). Definici´ on 2.6.7 (Ganancia L2 ). Un sistema en variables de estado Σ con U = IRm , p Y = IR , tiene ganancia L2 ≤ γ si es disipativo con respecto a la tasa de suministro s(u, y) = 12 γ 2 u2 −y2 . La ganancia L2 de Σ se define como γ(Σ) = inf{γ|Σ tiene ganancia L2 }. Se dice que Σ tiene ganancia L2 < γ si existe γ˜ < γ tal que Σ tenga ganancia L2 < γ˜ Un resultado fundamental es el que relaciona la pasividad con la ganancia L2 : Proposici´ on 2.6.1. Si el sistema Σ es pasivo estrictamente a la salida, entonces tiene ganancia L2 finita. 30 2.6. Pasividad y disipatividad 2.6.3 Interconexi´on de sistemas pasivos Consid´erese la interconexi´on por realimentaci´on de los sistemas Σ1 y Σ2 como se presenta en la figura 2.4. Un resultado instrumental resulta del hecho de que la interconexi´on de sistemas pasivos es tambi´en pasiva. M´as a´ un, la condici´on de una realimentaci´on pasiva estrictamente a la salida conduce a la propiedad de ganancia L2 finita en bucle cerrado. e1 u1 + - S1 y1 y2 e2 + S2 u2 + Figura 2.4: Interconexi´ on por realimentaci´ on de sistemas pasivos. Proposici´ on 2.6.2. (i) Supongamos que Σ1 y Σ2 son pasivos o estrictamente pasivos a la salida. Entonces el sistema en bucle cerrado ΣfΣ2 ,Σ2 de la la figura (2.4) con entradas (e1 , e2 ) y salidas (y1 , y2 ) es pasivo, y estrictamente pasivos a la salida si ambos Σ1 y Σ2 son estrictamente pasivos a la salida. (ii)Sup´ongase que S1 , S2 , que satisfacen las desigualdades de disipaci´on  t1 S1 (x1 (t1 ))) ≤ S1 (x1 (t0 ))) + (u1 (t)y1 (t) − 1 y1 2 )dt t  0t1 S2 (x2 (t1 ))) ≤ S2 (x2 (t0 ))) + (u2 (t)y2 (t) − 2 y2 2 )dt t0 1 con 1 > 0, 2 > 0 son C y tienen m´ınimos locales estrictos en x∗1 y x∗2 respectivamente. Entonces (x∗1 , x∗2 ) es un equilibrio estable de ΣfΣ2 ,Σ2 con e1 = e2 = 0. (iii) Sup´ongase que Σ1 y Σ2 son estrictamente pasivos a la salida y detectables en el estado cero, y que las S1 , S2 que satisfacen (2.6.2) son C 1 y tienen m´ınimos locales estrictos en x∗1 = 0 y x∗2 = 0 respectivamente. Entonces, (0, 0) es un equilibrio asint´ oticamente estable f de ΣΣ2 ,Σ2 con e1 = e2 = 0. Si adicionalmente S1 y S2 tienen m´ınimos globales en x∗1 = 0 y x∗2 = 0 respectivamente, y son propias, entonces (0, 0) es un equilibrio globalmente asint´oticamente estable. 2.6.4 Atenuaci´on L2 de perturbaciones En esta tesis se emplear´a el concepto de ganancia L2 para analizar el rechazo de perturbaciones en sistemas hamiltonianos. Este concepto se basa en las t´ecnicas de pasividad estudiadas por A. Van der Shaft (Van der Schaft 2000), y ha sido desarrollado posteriormente por (Shen, Mei, Lu & Tamura 1999). Sea el sistema de control no lineal descrito como (2.6.2) x˙ = f (x) + g1 (x)u + g2 (x)w 6. y un equilibrio deseado x∗ ∈ IRn .3) se cumpla a lo largo de todas las trayectorias del sistema en lazo cerrado (2. Li & Ge 2002) Dado el sistema (2.. si R(x) − 1 [g2 (x)g2T (x) − g1 (x)g1T (x)] ≥ 0. ∂x ) .3) que V˙ ≤ 0). u ∈ IRm el vector de control y w ∈ IRp una perturbaci´on desconocida de norma acotada. . • Existe una funci´on ρ(c) de clase K∞ tal que para cualquier c > 0 y cualquier condici´on inicial V (x(0)) ≤ c.6.4) y un nivel de atenuaci´ on de perturbaciones γ > 0. atendiendo a (2.6.5) u = − h (x)h(x) + 2 Im g1T (x)∇H 2 2γ . y es f´acil de ver. Ahora consid´erese el siguiente sistema hamiltoniano con disipaci´on: x˙ = (J(x) − R(x))∇H + g1 (x)u + g2 (x)w z = h(x)g1T (x)∇H (2. h(x) es una matriz de ∂H ∂H ∂H T .6. • El sistema en bucle cerrado es estable en el sentido de Lyapunov cuando w se desvanece (t´omese V (x) como funci´on de Lyapunov.. se trata de hallar una realimentaci´on del estado u = α(x) y una funci´on de almacenamiento V (x) definida positiva en un entorno de x∗ tal que la desigualdad de disipaci´on–γ 1 V˙ + Q(x) ≤ {γ 2 w2 − z2 }.6.2) con la ley de control u = α(x).3. se cumple que V (x(t)) ≤ c. donde Q(x) ≥ 0 es una funci´on no negativa dada.3) puede asegurar los siguientes comportamientos: nal de penalizaci´on z es menor que el • La ganancia L2 de la perturbaci´on w a la se˜ nivel dado (Van der Schaft 2000). u ∈ IRm .4) donde x ∈ IRn .6. Fundamentos te´ oricos y estado de la t´ecnica 31 donde x ∈ IRn es vector de estado. ponderaci´on y ∇H = ( ∂x n 1 ∂x2 Si fijamos un nivel de atenuaci´on de perturbaciones γ > 0.Cap´ıtulo 2. (Wang.6. H(x) es definida positiva en la proximidades del equilibrio estable del sistema no perturbado. Se define el problema de rechazo de perturbaciones L2 del siguiente modo: Dada una se˜ nal de penalizaci´on z = q(x). ∀t. el cumplimiento de (2. un nivel de atenuaci´on de las perturbaciones γ > 0. 2γ 2 on dada por la entonces el problema de atenuaci´ on de perturbaciones L2 admite la soluci´ ley de realimentaci´on 1 1 T (2. R(x) ≥ 0. M´as a´ un el sistema en bucle cerrado es asint´oticamente estable si Q(x) > 0. Como puntualizan Besancon et al. . Cheng. (Besancon & Battiloti 1998). y tomamos z = h(x)g1T (x)∇H como la se˜ nal de penalizaci´on se tiene el siguiente teorema Teorema 2. ∀w(t) ≤ ρ(c). J(x) = −J(x)T .6. ∀w 2 (2. dado que R(x) − 2γ12 [g2 (x)g2T (x) − g1 (x)g1T (x)] ≥ 0. Demostraci´ on.5) Dado que en el momento de redacci´on de esta tesis este teorema no ha sido a´ un publicado.6. (2.4.6). el dise˜ no de leyes de control para sistemas subactuados es un a´rea objeto de una intensa labor investigadora. En esta tesis se presentan contribuciones para la resoluci´on de este tipo de problemas.6) 2γ 2 se cumple a lo largo de las trayectorias del sistema en bucle cerrado consistente en (2. A partir de (2.5). la desigualdad de disipaci´on 1 1 T T T H + (∇H) R(x) − 2 (g2 (x)g2 (x) − g1 (x)g1 (x)) ∇H ≤ {γ 2 w2 − z2 }.6. y por tanto T 1 T T Q(x) = (∇H) R(x) − 2 (g2 (x)g2 (x) − g1 (x)g1 (x)) ∇H ≥ 0 2γ  Por tanto la ley de control (2.4) y (2.5) es una soluci´on al problema de atenuaci´on de pertur2 baciones L2 con funci´on de Hamilton H(x).6.6. Adem´ as.6.6. En esta secci´on se har´a una revisi´on de los conceptos fundamentales subyacentes a la teor´ıa del control de sistemas subactuados. y se estudia una clase de sistemas subactuados para los cuales el dise˜ no de controladores se simplifica notablemente. 2. donde se enmarcan las t´ecnicas basadas en . es f´acil observar que dH dt = −(∇H)T R(x)∇H + (∇H)T g1 u + (∇H)T g2 w 1 1 1 = −(∇H)T R(x)∇H − γw − g2T ∇H2 + (γ 2 w2 − z2 ) 2 γ 2 1 1 1 1 + (∇H)T g1 hT hg1T ∇H − (∇H)T g1 ( hT h + 2 Im ) + 2 (∇H)T g2 g2T ∇H 2 2 2γ 2γ 1 1 = −(∇H)T R(x) − 2 g2 (x)g2T (x) + 2 g1 (x)g1T (x)) ∇H 2γ 2γ 1 1 1 2 (γ w2 − z2 ) − γw − g2T ∇H2 .6. + 2 2 γ Entonces dH dt 1 T T + (∇H) R(x) − 2 (g2 (x)g2 (x) − g1 (x)g1 (x)) ∇H 2γ 1 2 1 1 1 = (γ w2 − z2 ) − γw − g2T ∇H2 ≤ (γ 2 w2 − z2 ) 2 2 γ 2 T que tiene la forma (2.4) y (2.32 2. se expondr´an los detalles de la breve demostraci´on.7. Sistemas subactuados donde Im es la matriz identidad de orden m.7 Sistemas subactuados Tal y como se coment´o en la secci´on 1. un sistema subactuado es aqu´el en el que el rango de la matriz de control G es inferior al n´ umero de grados de libertad. . para determinar si un sistema es controlable en el origen se calcula la matriz de controlabilidad.7. En el caso de sistemas lineales.. j = 1 . Al no poder actuar sobre el espacio articular completo. Fundamentos te´ oricos y estado de la t´ecnica 33 la energ´ıa y la estructura hamiltoniana. Las condiciones enunciadas en (Rampazzo & Sussmann 2001) no son constructivas en el sentido de que aun cumpli´endose. .. para determinar si un sistema no lineal de la forma x˙ = m  i=1 ui fi (x) + r  vj gj (x). el orden del sistema. AB.Cap´ıtulo 2.. 2. no proporcionan m´etodos para dise˜ nar la ley de control que lleve el sistema al origen. C = [B.2). La primera cuesti´on en este sentido es determinar si un sistema es controlable en una regi´on del espacio de estados. Formalmente se dice que son subactuados los sistemas de n grados de libertad y r < n actuadores cuyas ecuaciones de Lagrange toman la forma   d ∂L ∂L − = ui . Tambi´en son de gran utilidad y generalidad para determinar la controlabilidad de sistemas subactuados los resultados de Isidori (Isidori 1989. a fin de vislumbrar sus ventajas e inconvenientes y justificar. i = 1 . el empleo de estructuras hamiltonianas de control en bucle cerrado. y se aportar´a un breve repaso de las t´ecnicas existentes destinadas a resolver problemas de esta naturaleza. An−1 B] Un resultado sobradamente conocido afirma que el sistema es controlable si y s´olo si el rango de C es igual a n.r dt ∂ q˙i ∂qi   d ∂L ∂L − = 0. es controlable desde un conjunto de condiciones iniciales Ω en tiempo peque˜ no hacia el origen. m. en este contexto.. Marino & Tomei 1995) que proporcionan . . aparecen limitaciones en cuanto al conjunto de comportamientos que se pueden alcanzar en bucle cerrado. con estructura x˙ = Ax + Bu..n dt ∂ q˙i ∂qi En la descripci´on hamiltoniana generalizada presentada en (2. i = 1. En el caso de sistemas no lineales el problema se mantiene abierto y el resultado m´as conocido es la condici´on suficiente de controlabilidad en el origen de Sussman (Rampazzo & Sussmann 2001). ... En este apartado se resumen los resultados cl´asicos fundamentales relativos a la controlabilidad de sistemas lineales y no lineales. i = r + 1. .3. siendo x ∈ IRn el vector estado y u ∈ IRp el de control. A2 B.1 Controlabilidad en sistemas subactuados Se ha comentado que el problema de dise˜ no de controladores para sistemas subactuados puede abordarse de una manera general analizando la controlabilidad de los mismos. r j=1 con restricciones en el control. 34 2... .   . . 0    . T (0) = 0 y una ley de control k(0) = 0. 1  . se dice que el sistema completo es de fase m´ınima.7.   0 0 0 .   0 0 1 . z˙ =   . .7..  ..         0  1  0 1 (2.. z˙ =   ..  z +   . .7.2) que es una forma lineal controlable. conocido como din´ amica cero. En un caso de sistemas subactuados este resultado no proporciona expl´ıcitamente la ley de control ni la transformaci´on z = T (x). . Si es estable.1) es linealizable parcialmente si existe una ley de control u = k(x) + β(x)v y un cambio de coordenadas z = T (x) tal que es equivalente al sistema parcialmente lineal ξ˙ = ϕ(ξ.  v = Ac z + bc v. Sistemas subactuados la condici´on necesaria y suficiente para que un sistema no lineal con entrada u ´nica. 0 0 0 . 0   . de la forma (2. 0 0 0 . x ∈ IRn ... entonces el estado del sistema es globalmente linealizable por realimentaci´ on. la controlabilidad es posible en sistemas que no cumplen estas condiciones. Para evitar las estrictas condiciones de la linealizaci´on por realimentaci´on. se han desarrollado nuevas l´ıneas de investigaci´on entre las que podemos destacar el trabajo de (Spong 1997) consistente en la linealizaci´on parcial en sistemas mec´anicos subactuados.. .    0 0    0   0   . .  . M´as a´ un.. .   0  1 z ∈ IRr La estabilidad de los sistemas parcialmente linealizables depende del estudio asint´otico del subsistema ξ de orden n − r cuando z tiende a cero. .  0 1   0 0  . Este se define como el n´ umero de veces que hay que derivar la salida con respecto al tiempo para que aparezca expl´ıcitamente la ley de control. z ∈ IRn z + . β(x) = 0.. Por ejemplo x˙ 1 x˙ 2 x˙ 3 y = = = = x2 u + x21 − x3 −x1 −x3 . z). as´ı como la inconveniencia de no proporcionar elementos constructivos para el dise˜ no de la ley de control.   0 0 0 0 0 1 . como se estudiar´a en esta tesis. 0 0 ξ ∈ IRn−r   ..      . .. forma can´onica lineal de Brunovski. Si las condiciones se cumplen de forma global.. . El sistema (2. En este caso diremos que el estado del sistema es linealizable por realimentaci´ on. que transformen el sistema en la  0 1 0 . .7. ... Otra definici´on importante desde el punto de vista entrada–salida es grado relativo del ´ sistema.      v. u ∈ R admita una transformaci´on de coordenadas z = T (x). .. ... .... .1) x˙ = f (x) + g(x)u. ∀x ∈ IRn u = k(x) + β(x)v.. en cuyo caso la ley de control u = x21 − x3 + v produce la relaci´on entrada–salida lineal y¨ = u y el sistema es controlable. Esto quiere decir que la ley de control u debe calcularse de modo que        ∂Hd ∂H q˙ 0 I2 ∂q ∂q = (Jd − Rd ) ∂Hd = + Gu.7. El m´etodo IDA-PBC persigue una din´amica en bucle cerrado con funci´on de Hamilton on generalizada de la Hd (q. 2. p) = −Jd (q. Igualando las ecuaciones de bucle abierto y del sistema deseado se obtiene la ley de control. donde el conjunto de . Sin embargo.Cap´ıtulo 2. En general todo sistema de grado relativo r bien definido en un conjunto en torno al origen es linealizable en sentido entrada–salida mediante una ley de realimentaci´on del tipo u = k(x) + β(x)v dando lugar al sistema lineal controlable y (r) = v Todas las condiciones para los resultados anteriores pueden ser consultadas en detalle en (Marino & Tomei 1995).3) ∂H p˙ −I2 0 ∂p ∂p donde Rd (q) ≥ 0 la matriz de disipaci´on en bucle cerrado. p) y una matriz antisim´etrica tambi´en llamada de interconexi´ forma Jd (q. M´etodo IDA-PBC El m´etodo basado en pasividad conocido como Interconnection and Damping Assignment– Passivity Based Control o IDA-PBC fue introducido en (Ortega & Spong 2000).7. (2. Esencialmente consiste en partir de una estructura PCH en bucle abierto y obtener otra en bucle cerrado con las propiedades de estabilidad deseadas. En el cap´ıtulo 4 se estudiar´a en detalle la aplicaci´on del m´etodo a sistemas mec´anicos subactuados. Para abordar este tipo de problemas se han desarrollado t´ecnicas de control como las basadas en la estructura hamiltoniana y lagrangiana en bucle cerrado que se comentar´an a continuaci´on y ser´an objeto de estudio detallado en esta tesis. pueden ser estabilizados en tiempo peque˜ no mediante leyes de control dise˜ nadas por procedimientos relativamente sistem´aticos. la filosof´ıa del mismo no es m´as que la b´ usqueda de una funci´on de energ´ıa y una estructura hamiltoniana para el sistema en bucle cerrado tal y como se describi´o en el cap´ıtulo introductorio. Las principales dificultades de este m´etodo aparecen en en el caso de sistemas subactuados. Las ecuaciones de estado en lazo abierto y cerrado se deben ajustar exactamente.2 M´etodos de s´ıntesis que preservan la estructura hamiltoniana/lagrangiana en bucle cerrado Existen en la literatura del control un gran n´ umero de ejemplos de sistemas subactuados que sin ser candidatos a la linealizaci´on por realimentaci´on ni verificar las condiciones de Sussman. p)T que permite aumentar los grados de libertad en el dise˜ no. Fundamentos te´ oricos y estado de la t´ecnica 35 Si derivamos dos veces la salida y se tiene y¨ = u + x21 − x3 . cumpli´endose que G⊥ G = 0. En esta tesis se har´an aportaciones esenciales al m´etodo y se aplicar´a a la resoluci´on de problemas cl´asicos de control subactuado. Proporcionar m´etodos de c´alculo de las (Hd . i = 1. el grupo de Bloch.7. del que se expondr´an sus fundamentos. Leonard y Marsden ha desarrollado en una serie de art´ıculos el m´etodo de “Lagrangianos Controlados”. En efecto. en el caso umero de grados de libertad. i = 1.4) ∂H d −I 0 2 ∂p ∂p Esta ecuaci´on ha de cumplirse para cualquier valor de la ley de control. Jd . Rd ) debe ser compatible con estas ecuaciones de ajuste y al mismo tiempo representar una din´amica en bucle cerrado con las propiedades deseadas en t´erminos de estabilidad. q) ˙ = g˜ij (q)q˙i q˙j − V˜ (q) 2 donde gij Y g˜ij representan los elementos de la matriz de inercia en bucle abierto y cerrado. El hecho de que (2. y depende de la resolubilidad de un sistema de ecuaciones diferenciales parciales. Una correcta elecci´on de los par´ametros (Hd . respectivamente. Si premul⊥ tiplicamos (2. la forma 1 L(q.7... Rd ) adecuadas y de leyes de control para el ajuste bucle abierto-bucle cerrado es la esencia del m´etodo IDA-PBC. los lagrangianos en bucle abierto y cerrado toman. En la notaci´on de (Bloch et al. Sistemas subactuados funciones de Hamilton Hd alcanzables en bucle cerrado es limitado. M´etodo de los lagrangianos controlados Paralelamente a la publicaci´on del m´etodo IDA-PBC. se propone un conjunto alcanzable de Lagrangianos controlados Lc y una ley de control tales que las soluciones q(t) de las trayectorias en bucle cerrado sean tambi´en las trayectorias de   d ∂Lc ∂Lc − = 0. Leonard & Marsden 2000) se enuncia un teorema que establece las condiciones que debe cumplir dicho conjunto de lagrangianos controlados.n (2. algunos de los t´erminos de control ui pueden ser nulos. Jd . las filas de G⊥ forman el n´ ucleo de G. y por lo tanto representa una restricci´on en el conjunto de sistemas hamiltonianos alcanzables en bucle cerrado definidos por las matrices (Hd .7. respectivamente.3) por G se obtiene      ∂Hd ∂H 0 I 2 ∂q ∂q G⊥ (Jd − Rd ) ∂H = G⊥ . es decir..n (2. Jd . Este resultado. descrito por las ecuaciones   ∂L d ∂L − = ui .7. Dado un sistema mec´anico. q) ˙ = gij (q)q˙i q˙j − V (q) 2 1 Lc (q. eventualmente.7.5) dt ∂ q˙i ∂qi donde.7. Rd ). (2. subactuado existe una matriz G⊥ de rango r < n siendo n el n´ que represente las direcciones en las que la ley de control no tiene efecto.36 2.. 2000).6) dt ∂ q˙i ∂qi En (Bloch. si G es una matriz constante. conocido como matching theorem o teorema de ajuste se resumir´a a continuaci´on.5) sea subactuado implica la existencia de una . consiste en determinar una din´amica objetivo y hallar una ley de control tal que la din´amica en bucle cerrado se ajuste asint´oticamente a dicho sistema objetivo. y suele implicar la resoluci´on de ecuaciones diferenciales parciales para las cuales. 2. con un punto de equilibrio x∗ ∈ con variables de estado x ∈ IRn y se˜ n IR para ser estabilizado. .3 Inmersi´on e invariancia Los m´etodos de control de sistemas subactuados mediante el ajuste (matching) de una din´amica hamiltoniana (lagrangiana) en bucle abierto con otra din´amica.π : IRp → IRn . puede no existir una soluci´on expl´ıcita. que introduce apreciables grados de libertad en el dise˜ no.7.7) nal de control u ∈ IRm . Empleando los s´ımbolos de i ij ˜ Christoffel Γijk y Gamma jk de las matrices gij y g . tienen la ventaja de abordar el problema de forma relativamente sistem´atica. Consid´erese el sistema x˙ = f (x) + g(x)u. Entonces el teorema de ajuste afirma que Lc cumple (2. . Sea p < n y supongamos que podemos encontrar aplicaciones α : IRp → IRp .Cap´ıtulo 2.7.c : IRp → IRm . Fundamentos te´ oricos y estado de la t´ecnica 37 variedad no nula denominada subespacio de las direcciones no actuadas. tambi´en hamiltoniana (lagrangiana) en bucle cerrado con las deseadas propiedades de estabilidad. φ : IRn → IRn−p . Esta idea se subsume en el m´etodo de Inmersi´ on e Invariancia introducido por (Astolfi & Ortega 2001) y cuyo resultado fundamental se enuncia a continuaci´on Proposici´ on 2.6) s´ı y s´olo si las siguientes condiciones se satisfacen (Hamberg 1999) l ≡ 0 ΛiA gil Tjk ∂ V˜ ∂V ΛiA hji j ≡ ΛiA i ∂q ∂q En este caso la ley de control para lograr (2. En la pr´actica la din´amica objetivo es de dimensi´on inferior a la del sistema en bucle abierto. m). ψ : IRn×(n−p) → IRm tales que: . (2. seg´ un la complejidad de cada caso. Un m´etodo para relajar las estrictas condiciones de ajuste. respectivamente.1. Sin embargo encontrar leyes de ajuste exactas a menudo es una tarea dif´ıcil.6) en bucle cerrado es ui = ˜ ∂V j ∂V l j k − h − gil Tjk q˙ q˙ i i j ∂q ∂q Este m´etodo tambi´en comprende la adici´on de un t´ermino de amortiguamiento para lograr la estabilidad asint´otica de sus equilibrios.7. La proyecci´on en este espacio se representa por ΛiA ui = 0 (A = 1 . y se define i ˜ ijk − Γijk Tjk = Γ hji = gik g˜jk ˜ j = g˜ik g jk h i n Tijk = hpi hqj hrk g˜pn Tqr donde g ij y g˜ij representan las inversas de gij y gij .7.7. 13) (2.7. 2.7. ηn−1 ) ∈ IRn−1 y ξ ∈ IR. x∗ es un equilibrio globalmente asint´ cerrado x˙ = f (x) + g(x)ψ(x.7. (H2) (Condici´on de inmersi´on ) Para todo ξ ∈ IRp f (π(ξ)) + g(π(ξ))c(ξ) = ∂π α(ξ) ∂ξ (2.13) en el origen de modo que el sistema η˙ = f (η) + g(η)u0 (η) es estable en el origen con funci´on de Lyapunov V0 tal que V˙ 0 = ∇η V0 (f (η) + g(η)u0 (η)) ≤ 0. uniformemente en x.7. ξ ∈ IRp } (2. ∞).7. Adem´ as.7. Sepulchre.14) donde η = (η1 . oticamente estable del sistema en bucle Entonces.4 Control de sistemas en cascada mediante backstepping Una t´ecnica de gran utilidad en una clase de sistemas subactuados y en general en sistemas con estructura triangular es la conocida como backstepping. Kanellakopoulos & Kokotovic 1995. η2 . consid´erese la siguiente clase de sistemas de orden n η˙ 1 = f (η) + g(η)ξ ξ˙ = u. tiene un equilibrio globalmente asint´ oticamente estable en cero.7. z)) ∂x (2. Krsti´c.8) con ξ ∈ IRp .10) (H4) (Atractividad de la variedad y acotamiento de las trayectorias ) El sistema z˙ = ∂φ (f (x) + g(x)ψ(x. Jankovic & Kokotovic 1997).12) est´ an acotadas para todo t ∈ [0. .9) (H3) (Variedad impl´ıcita) Se cumpla la identidad de conjuntos {x ∈ IRn | φ(x) = 0} = {x ∈ IRn | x = π(ξ).7. Sistemas subactuados (H1) (Sistema objetivo) El sistema ξ˙ = α(ξ).11) con variables de estado z. las trayectorias del sistema x˙ = f (x) + g(x)ψ(x.38 2. .7. φ(x)). . Para ilustrar sus fundamentos. tienen un equilibrio globalmente asint´oticamente estable en ξ∗ ∈ IRp y x∗ = π(ξ∗ ). (Khalil 1996. (2. Supongamos que existe una ley de control ξ = u0 (η) que estabiliza al subsistema (2. (2. z) (2.7. 19) que es la ley de realimentaci´on para el sistema (2.7.15) Empleando la variable z.7.7. las ecuaciones anteriores pueden escribir como η˙ = f (η) + g(η)u0 (η) + g(η)z z˙ = v (2.17) Proponiendo para este sistema la funci´on de Lyapunov 1 V1 = V0 + z 2 2 (2.13) se tiene η˙ = f (η) + g(η)u0 (η) + g(η)ξ − g(η)u0 (η) = f (η) + g(η)u0 (η) + g(η)(ξ − u0 (η)) = f (η) + g(η)u0 (η) + g(η)z.20) Esta t´ecnica se puede extender trivialmente a sistemas de orden mayor.7. Si definimos v = z˙ y recordamos que u = ξ˙ entonces u = ∇η u0 (η)η˙ + v. lo que equivale a u = ∇η u0 (η)η˙ − (∇η V0 g(η) + kz) = ∇η u0 (η)(f (η) + g(η)ξ) − ∇η V0 g(η) − k(ξ − u0 (η)) (2.7. Con esta ley V˙1 = ∇η V0 (f (η) + g(η)u0 (η)) − kz 2 ≤ −W (x) − kz 2 ≤ 0.13)-(2. Con el fin de lograr que V1 sea una funci´on de Lyapunov del sistema completo se har´a la elecci´on v = −(∇η V0 g(η) + kz). Derivando respecto al tiempo ˙ z˙ = ξ˙ − ∇η u0 (η)η. Fundamentos te´ oricos y estado de la t´ecnica 39 siendo W (η) una funci´on definida positiva excepto en el origen.7. Si sumamos y restamos g(η)u0 (η) al segundo miembro de la ecuaci´on (2. El m´etodo backstepping.7. se extender´a en esta tesis a la estabilizaci´on de ´orbitas peri´odicas. (2.  donde se ha introducido la variable de error z = ξ − u0 (η).Cap´ıtulo 2.14). (2.18) se obtiene V˙ 1 = ∇η V0 η˙ + z z˙ = ∇η V0 (f (η) + g(η)u0 (η)) + ∇η V0 g(η)z + zv ≤ −W (η) + ∇η V0 g(η)z + zv.7. .7.16) (2. inicialmente formulado para resolver problemas de estabilizaci´on de equilibrios. Sistemas subactuados .7.40 2. detecci´on de obst´aculos. faros. relativamente lento. En el caso de plataformas de sensores instaladas sobre veh´ıculos terrestres. siendo posible compensarlos con actuadores lentos (motores el´ectricos o hidr´aulicos) mediante la correcta realimentaci´on de la velocidad angular. provoca unas velocidades angulares en todas las direcciones del triedro de referencia. infrarrojos y similares donde la l´ınea de mira del sensor ha de mantenerse estable frente a los movimientos del veh´ıculo donde se asienta. antenas parab´olicas para comunicaciones v´ıa sat´elite (por ejemplo. radar. En la superficie del buque el oleaje.Cap´ıtulo 3 Control de una plataforma giroestabilizada de dos grados de libertad En este cap´ıtulo se abordar´a el problema de control basado en pasividad para sistemas hamiltonianos completamente actuados y se plantear´a el problema de la implementaci´on de un controlador realizado mediante estas t´ecnicas en una plataforma de dos grados de libertad sobre base m´ovil. var´ıa con m´as celeridad y por tanto es necesario contar con actuadores veloces como pueden ser los de tipo neum´atico y leyes de realimentaci´on r´apidas que deben ser dise˜ nadas con mayor refinamiento para mantener m´argenes de fase aceptables evitando posibles situaciones de inestabilidad y oscilaciones. como pueden ser los receptores GPS. como es el caso de las c´amaras montadas sobre veh´ıculos autoguiados. tel´emetro. c´amaras o sensores externos del tipo sonar. En todos estos casos la medida del sensor puede verse degradada por el movimiento aleatorio de la superficie sobre la que se asienta. puntos de referencia en la costa y por u ´ltimo en aplicaciones militares como sistemas de defensa antia´erea. inmarsat). veh´ıculos aut´onomos y otros sistemas realizan una navegaci´on basada en la percepci´on interna de las velocidades angulares y aceleraciones 41 .1 Sensores empleados en control inercial Una gran variedad de robots m´oviles. la perturbaci´on que obliga al veh´ıculo y la plataforma de sensores montada sobre ´el a a abandonar el movimiento inercial. En sistemas de navegaci´on tienen su aplicaci´on en los equipos que han de mantener contacto visual estable con elementos externos al buque. 3. Este tipo de plataformas se emplea en aplicaciones de rob´otica m´ovil y muchas otras en las que se desea incorporar antenas. . a una altitud espec´ıfica. • Aceler´ ometros Proporcionan una medida de la aceleraci´on en lineal proyectada en una direcci´on del movimiento como se describe en la figura 3. que pueden proporcionar medidas fiables del vector velocidad y aceleraci´on pero siempre bas´andose en una interacci´on (en este caso reflexi´on) con el entorno. durante una tiempo y distancia determinados.. Se dice que son medidas internas por no basarse en ninguna interacci´on con el exterior como ser´ıa el caso de los de sonares. • Gir´ oscopos Son empleados para medir velocidades angulares.. El V1 deb´ıa viajar en una direcci´on determinada. entre los que est´an la velocidad angular del s´olido y la aceleraci´on lineal. y mec´anicos en los que un disco sometido a un giro constante.1. Por esta raz´on los sensores inerciales est´an destinados a la medida de fen´omenos de aceleraci´on.42 3.2 mediante cuatro masas puntuales A. Por el principio de relatividad de los sistemas inerciales. Generalmente nos encontramos dos tipos de sensores..1: Funcionamiento de un aceler´ ometro lineal.B. .D en lugar del disco completo que se emplea habitualmente. Pueden ser ´opticos. Uno de los primeros usos de sensores inerciales pueden encontrarse en el trabajo del grupo alem´an Peenem¨ unde. en torno a un eje fijo. el V1 se asentaba en m´ ultiples sensores inerciales para guiar el arma hacia el objetivo. Muelles M Masa Sensor de desplazamiento Dirección de aceleración Figura 3.. El principio de funcionamiento del gir´oscopo mec´anico admite una sencilla interpretaci´on ausente de toda terminolog´ıa matem´atica.. Sensores empleados en control inercial a las que est´an sometidos. . El Vergeltungswaffe V1 (arma de venganza) era una aeronave aut´onoma que se basaba en el guiado inercial. Con un rango operacional de 200 km. sufre una torsi´on cuando el sistema de referencia en el que se sustenta posee cierta velocidad angular.1. Los sensores que se aplican en este tipo de sistemas son los denominados inerciales.. Este instrumento se representa esquem´aticamente la figura 3. . Estos sensores se destinan a medir las derivadas de las variables de posici´on del robot.. relacionados con la f´ısica del la luz sometida a aceleraci´on. La realimentaci´on de los sensores inerciales de este dispositivo permit´ıan evaluar las peque˜ nas desviaciones respeto a la trayectoria prevista y actuar en consecuencia..C. la velocidad lineal no es un par´ametro f´ısico directamente medible sin que medie interacci´on alguna con el entorno (una astronave no debe experimentar ning´ un cambio f´ısico relacionado con su velocidad respecto a la tierra). . Estas masas representan las ´areas del disco que m´as importantes a la hora de visualizar el funcionamiento del gir´oscopo. El punto A est´a a´ un desplaz´andose hacia arriba cuando se encuentra a π/2 rads en la (figura b). El eje rotar´a porque parte de la energ´ıa en los mivimientos arriba y abajo de A y C se emplea en cusar que los ejes roten en el plano de precesi´on. el punto C se encontrar´a donde estaba A en el momento inicial de aplicaci´on de la fuerza de torsi´on. La propiedad de precesi´on de un gir´oscopo se emplea para mantener los trenes monorrail verticales al tomar las curvas. 3. el eje se mover´ıa en el plano de precesi´on hacia la izquierda. Mientras mayor sea la fuerza de torsi´on sobre el eje. La cabeza del pedestal posee los sensores inerciales. Un cilindro hidr´aulico empuja y tira. Si en el ejemplo de giro horario la fuerza de torsi´on tirara en lugar de empujar. Si el gir´oscopo rotara en sentido antihorario. Dos gir´oscopos o´pticos orientados perpendicularmente proporcionan las siguientes medidas (suponiendo que la base se . Figura 3. Se compone de dos cuerpos principales: La base. y el punto C viajar´a hacia abajo.2: Funcionamiento de un gir´ oscopo mec´anico. montada sobre la base.Cap´ıtulo 3. gira solidaria con ´esta. la precesi´on ser´ıa hacia la izquierda. el punto ocupar´a el lugar del B tras un giro de π/2 rads. y posee adem´as un movimiento en elevaci´on en torno a un eje horizontal que corta al eje de acimut. El a´ngulo que determina la posici´on de la cabeza es θ. Al estar el gir´oscopo en rotaci´on en sentido horario. Entonces cuando los puntos A y C finalmente dan la vuelta hasta el lado contrario. la fuerza de torsi´on (constante) es mayor que las fuerzas de reacci´on verticales. el punto A sube y C desciende (figura a). que contiene dos motores de corriente continua sin escobillas y est´a sometida al movimiento de acimut. De hecho. Lo mismo sucede para los puntos C y D. en un eje de un pesado gir´oscopo. El movimiento combinado de A y C hace que el eje rote en el plano de precesi´ on hacia la derecha (figura b). Cuando el gir´oscopo ha rotado otros π/2 rads (figura c). en este caso a la derecha. Control de una plataforma giroestabilizada de dos grados de libertad 43 El punto inferior del eje se mantiene estacionario pero puede pivotar en todas direcciones. Este fen´omeno recibe el nombre de precesi´on. El movimiento hacia abajo de C es ahora contrario a la fuerza de torsi´on y el eje no rota en el plano de la fuerza de torsi´ on . la elevaci´on. m´as empujar´a el disco en el lado opuesto al eje hacia su posici´on inicial. El eje de un gir´oscopo se mover´ıa en ´angulo recto respecto del movimiento de rotaci´on. el eje rotar´a en el plano de torsi´on en este ejemplo. Su posici´on viene dada por el a´ngulo de acimut ϕ. seg´ u se necesite. La cabeza de sensores.2 Descripci´on de la plataforma inercial El sistema que se desea controlar es la plataforma de dos grados de libertad representada en la figura 3. Cuando una fuerza de torsi´on se aplica al eje superior.3. 3. Modelo de la plataforma asienta sobre un sistema de referencia inercial): • La velocidad angular de elevaci´on: θ˙ • La velocidad angular de acimut proyectada sobre la l´ınea de mira. Esto se debe a que ambos gir´oscopos est´an montados sobre la cabeza. El origen del a´ngulo de acimut es arbitrario. 3. La variable de elevaci´on toma el valor cero cuando la l´ınea de mira de la cabeza es perpendicular al eje de rotaci´on de la base. se equilibra la cabeza del pedestal mediante resortes. y por tanto est´an sometidos a sus movimientos. Esta t´ecnica tiene como contrapartida la inexactitud en el modelado.3 Modelo de la plataforma Las ecuaciones de movimiento se obtienen f´acilmente tanto en forma hamiltoniana como lagrangiana. La velocidad angular de orientaci´on se obtendr´a dividiendo la medida del gir´oscopo de elevaci´on por el coseno de la elevaci´on. el cuerpo de elevaci´on. si la intenci´on es la de estabilizar la l´ınea de mira de la elevaci´on (para la correcta operaci´on de una antena o c´amara). y situada en un sistema de . por otro lado.3: Plataforma de dos grados de libertad. es decir ϕ˙ cos θ. a fin de reducir el consumo de los motores. A menudo. De este modo la energ´ıa potencial es invariante y por tanto desaparece de las ecuaciones de movimiento. Este montaje con los dos gir´oscopos en el cuerpo de elevaci´on habitual en la pr´actica por dos razones: a menudo los fabricantes proveen dos estaciones girosc´opicas integradas capaces de medir dos ejes y por tanto ambos deben estar en uno de los dos cuerpos. quedando anulados los efectos gravitatorios. x y z φ y θ x z Figura 3. de modo que cualquier posici´on de elevaci´on es una posici´on de equilibrio. es decir. cuando se alcance el objetivo mediante este montaje ambos sensores dar´an una medida nula.44 3. Bajo las suposiciones expresadas previamente. EL t´ermino Γ(θ) representa la expresi´on  Γ(θ) = Izz1 + Ixx2 sen2 θ + Izz2 cos2 θ. mientras que Ixx2 . si se desea especificar con libertad la matriz de inercia de la estructura hamiltoniana en bucle cerrado. Control de una plataforma giroestabilizada de dos grados de libertad 45 referencia inercial. basta con despejarla del ajuste entre las ecuaciones de bucle abierto y cerrado. 3.y y z respectivamente. y a˜ nadir un efecto disipativo respecto a la funci´on de Hamilton moldeada. Iyy2 y Izz2 representan los momentos de inercia con respecto a los ejes x. La t´ecnica conocida como moldeo de energ´ıa consiste en calcular una acci´on de control que modifique la din´amica del sistema de modo que en bucle cerrado se obtenga la din´amica hamiltoniana deseada. De este modo la energ´ıa en bucle cerrado puede ser considerada como funci´on de Lyapunov del equilibrio estabilizado. A continuaci´on se a˜ nadir´a un t´ermino de amortiguamiento para que la funci´on de Hamilton tienda asint´oticamente hacia una posici´on estable con velocidad cero. las configuraciones de m´ınima energ´ıa Hd ser´an las configuraciones en r´egimen permanente para la plataforma.4 Control hamiltoniano Al ser un sistema completamente actuado. En el caso de sistemas completamente actuados.3.2) donde Izz1 es el momento de inercia de la base con respecto al eje z.1) 2 0 Iyy2 θ˙ que coincide con las funciones de Lagrange y de Hamilton al mismo tiempo. Por tanto. De lo anterior se desprende que la manera de especificar el comportamiento deseado consiste en dar forma a la funci´on de Hamilton en bucle cerrado. como se ver´a a continuaci´on. Al a˜ nadir al sistema amortiguamiento mediante un t´ermino de fricci´on viscosa. . los t´erminos de acoplamiento y la fricci´on existente. Al imponer estructura hamiltoniana lineal en bucle cerrado.Cap´ıtulo 3. Posteriormente estudiaremos c´omo es posible seleccionar el equilibrio objetivo arbitrariamente y dise˜ nar la funci´on de Hamilton de modo que el m´ımimo de energ´ıa coincida con el punto de referencia deseado. se obtendr´a una ley de realimentaci´on que cancele las no linealidades. el ajuste ha de realizarse en el sistema de coordenadas adecuado. optando la estructura lineal con matriz de inercia constante donde los dos grados de libertad aparecen desacoplados. el sistema perder´a gradualmente su energ´ıa y converger´a al m´ınimo donde se encuentra el objetivo. Los t´erminos de fricci´on a˜ nadidos pueden verse como la disipaci´on controlada que evita que el sistema permanezca indefinidamente en una ´orbita donde el hamiltoniano permaneciera constante (se obtendr´ıa un sistema conservativo respecto a Hd ). esto no representa ning´ un problema y no existen restricciones en cuanto a la din´amica objetivo (manteniendo del orden del sistema). Para obtener la ley de control. y ausencia de otros m´ınimos locales. de manera que ´esta presente un m´ınimo absoluto en el equilibrio que se desea estabilizar con velocidad cero. Sin embargo. la energ´ıa mec´anica de la planta se ve reducida al t´ermino de energ´ıa cin´etica:    ϕ˙ Γ(θ) 0 1 ˙ T = [ϕ˙ θ] (3. podemos imponer cualquier estructura deseada en bucle cerrado. (3.3. la energ´ıa mec´anica total del sistema vendr´a dada por 2 1 p1 p22 1 p21 p22 (3. la formulaci´on hamiltoniana del sistema en bucle abierto en la base (q.2) ∂H p˙ −I2 −K I u 2 θ ∂p donde I2 es la matriz identidad de segundo orden.4.4.1).1) expresada en la base (q.1) H= + = + 2 m1 (q) m2 (q) 2 Γ(θ) Iyy2 donde m1 y m2 representan las constantes de inercia efectivas asociadas a cada movimiento de rotaci´on. La ecuaci´on (3. p) .4. p) resulta         ∂H q˙ 0 I2 O u 2 ϕ ∂q = + (3. introducimos el cambio de base φ : (q.3. k2 } es la matriz constante de fricci´on viscosa. y K = diag{k1 .46 3.4. Control hamiltoniano Recordando la ecuaci´on (3. Dado que q˙ = [q˙1 q˙2 ]T . q) ˙ se convierte en   1 1 H= m1 (q)q˙12 + m2 (q)q˙22 = Γ(θ)ϕ˙ 2 + Iyy2 θ˙2 2 2 Definiendo q = [q1 q2 ]T y p = [p1 p2 ]T . 4) = ∂H dt q˙ ∂x ∂x ∂x −I2 −K I2 uθ ∂p lo cual. aplicado a la plataforma.4.7) Hd = 2 . q) ˙ de modo que ∂φ el jacobiano de la transformaci´on ∂x resulta   1 0 0 0    1 0 0  ∂φ  0  (3.4.→ (q.3) = −p1   −1 ∂x  Γ (θ) Γ (θ) 0 0   Γ(θ)2 0 0 −1 Iyy 2 0 Con estos elementos la formulaci´on hamiltoniana en la nueva base se obtiene directamente:             T ∂H u 0 I2 O ∂φ ∂φ d q ∂φ 2 ϕ ∂q + (3.6) Con el fin de expresar el sistema deseado en bucle cerrado como un par de sistemas lineales desacoplados. conduce a:     0 0 0 Γ−1 (θ) ϕ −1      0 0 0 Iyy d   θ   2   = k −1 1  −Γ (θ) 0 − −β ϕ ˙ dt  ϕ˙   2 Γ (θ)   k2 −1 0 −Iyy β ϕ ˙ − θ˙ 2 2 I yy2 ∂H ∂ϕ ∂H ∂θ ∂H ∂ ϕ˙ ∂H ∂ θ˙       +    0 0 0 0 −1 Γ (θ) 0 −1 0 Iyy 2       uϕ uθ  (3.4.4. deber´ıamos en primer lugar proponer la funci´on de energ´ıa deseada Hd como aquella en la que el t´ermino de acoplamiento Γ(θ) es reemplazado por una ΓC constante  1 Γc ϕ˙ 2 + Iyy2 θ˙2 (3.4.5) donde el t´ermino β se ha definido del siguiente modo −1 Iyy 2 β(θ) = Γ (θ) Γ(θ)  (3. la fricci´on existente en las articulaciones ser´an compensadas por el controlador y se a˜ nadir´a un t´ermino de fricci´on viscosa para lograr un descenso con el tiempo de la energ´ıa Hd y por tanto la estabilidad asint´otica del equilibrio deseado.4.8).8) Las derivadas parciales de Hd se obtienen de la ecuaci´on (3.4.5) y la de bucle cerrado (3.11) A partir de las ecuaciones (3.7). La ley de control se calcula igualando la din´amica en bucle abierto (3. propondremos una funci´on de Hamilton en bucle cerrado con un m´ınimo en dicho punto.4.4.4.4.1 Elecci´on de un punto de equilibrio arbitrario Si el punto de equilibrio viene especificado como (ϕd .4.4.(3. θd ).11) se deducen las leyes de control: ϕ˙ uϕ = Γ (θ)ϕ˙ θ˙ + k1 ϕ˙ − Kc1 Γ(θ)Γ−1   c  1 uθ = − Γ (θ)ϕ˙ 2 + k2 θ˙ − Kc2 θ˙    2 (3.4.Cap´ıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 47 y a continuaci´on se expresar´an las correspondientes ecuaciones de Hamilton como un par de sistemas lineales de segundo orden independientes con disipaci´on. La formulaci´on en bucle cerrado se convierte en:    0 0 0 Γ−1 ϕ c  −1  0 0 0 Iyy d   θ   2  = Kc1 −1 −Γ 0 − 0 dt  ϕ˙   c Γ2c  −1 ˙θ 0 −Iyy2 0 − IK2c2       yy2 ∂Hd ∂ϕ ∂Hd ∂θ ∂Hd ∂ ϕ˙ ∂Hd ∂ θ˙       (3.9) mientras que de las dos u ´ltimas se obtiene  Kc1 ˙ Γ (θ) −k1 ϕ˙ − Γ (θ)θϕ˙ + uϕ = − ϕ˙ Γc   1  Kc2 ˙ −1 Iyy Γ (θ)ϕ˙ 2 − k2 θ˙ + uθ = − θ 2 2 Iyy2 −1   (3.4.10). Una opci´on evidente ser´a una funci´on cuadr´atica del error y la velocidad 1 1 Hd = (Γc ϕ˙ 2 + Iyy2 θ˙2 ) + (Kd1 (ϕ − ϕd )2 + Kd2 (θ − θd )2 ) 2 2   Ha (3.4.10) (3. A fin de lograr que el sistema lineal transformado siga una referencia en posici´on o velocidad.13) . 3. En estas circunstancias las primeras dos filas resultan ∂H ∂Hd = Γc ⇒ ϕ˙ = ϕ˙ ∂ ϕ˙ ∂ ϕ˙ −1 ∂H −1 ∂Hd = Iyy ⇒ θ˙ = θ˙ Iyy 2 2 ˙ ∂θ ∂ θ˙ Γ−1 (θ) (3.4.12) En esta expresi´on los t´erminos subrayados representan la acci´on de control que ha de a˜ nadirse para crear al efecto de fricci´on deseado en el sistema linealizado. Cabe se˜ nalar que los u ´ltimos dos t´erminos de la se˜ nal de control pueden interpretarse como un controlador PD al ser una realimentaci´on el error en posici´on y su derivada. proporcionando ganancias de ajuste independientes (Kc1 . que permite un ajuste del transitorio homog´eneo en todas las regiones de trabajo. ∂θ (3.4.4. y dado que ∂Ha = Kd1 (ϕ − ϕd ) ∂ϕ ∂Ha = Kd2 (θ − θd ). derivado del moldeo de energ´ıa potencial Si definimos el error de seguimiento como e = [eϕ eθ ]T donde eϕ = (ϕ − ϕd ) and eθ = (θ − θd ) y suponemos que la referencia se mantiene constante se obtiene: uϕ = Γ (θ)ϕ˙ θ˙ + k1 ϕ˙ − ΓΓ−1 c (Kc1 e˙ϕ − Kd1 eϕ )    P D−acimut 1 uθ = − Γ (θ)ϕ˙ 2 + k2 θ˙ − Kc2 e˙θ − Kd2 eθ    2 (3.17) P D−elevacion Esta es la ley de control que se implementar´a. representa la energ´ıa a˜ nadida al sistema con respecto al de la ecuaci´on Eq. .14) siempre que la referencia sea puntual.4.16) D Donde los t´erminos de la ley de control no lineal pueden ser agrupados en funci´on de su significado f´ısico: • (A) Moldeo de la energ´ıa cin´etica para eliminar los efectos de acoplamiento entre articulaciones • (B) Compensaci´on de la fricci´on real del sistema • (C) Introducci´on de fricci´on en el sistema hamiltoniano objetivo • (D) Control proporcional del error.15) Procediendo de manera equivalente a la obtenci´on de la ecuaci´on (3.48 3.12) se llega a uϕ = Γ (θ)ϕ˙ θ˙ + k1 ϕ˙ − ΓΓ−1 K ϕ˙ − ΓΓ−1 K 1 (ϕ − ϕd )      c  c1   c d  B A C D 1 uθ = − Γ (θ)ϕ˙ 2 + k2 θ˙ − Kc2 θ˙ − Kd2 (θ − θd )        2   A B C (3.(3.4. Kd1 . Control hamiltoniano Donde el t´ermino denotado por Ha .7).4.4. Kc2 . (3. El t´ermino Γ(θ) multiplicando al PD en acimut hace que se trate de un PD no lineal.4. Kd2 ) que permiten obtener un transitorio optimo. 2. Esta funci´on es tal que: ∂Ha =0 ∂ q˙i i = 1. 6. De hecho el dotar al sistema de lazo cerrado con una estructura hamiltoniana desacoplada con el u ´nico fin de lograr controles independientes en orientaci´on y elevaci´on puede ser obviado. precisamente (ϕd = 0. es decir.4.6. Dada la desigualdad estricta en (3. Sin embargo.2 Estabilidad seg´un Lyapunov De lo visto anteriormente es f´acil comprobar que la funci´on de energ´ıa es una funci´on de Lyapunov del sistema en bucle cerrado. la derivada con respecto al tiempo de Hd es ˙ 2 Kc2 ≤ 0 H˙ d = (∇H)T x˙ = −(Γc ϕ) ˙ 2 Kc1 − (Iyy2 θ) (3. Haremos uso del teorema 2. 2 3. una versi´on sencilla de la linealizaci´on por realimentaci´on aplicable a sistemas rob´oticos completamente actuados.Cap´ıtulo 3.5.4. La matriz J(x) de interconexi´on en bucle cerrado y la de disipaci´on R(x) vienen dadas por     −1 0 0 0 0 0 0 Γc 0    0 −1   0 0 0 0  0 0 Iyy2     J(x) =  R(x) =   Kc1  0 0 0  −Γ−1  0 0 0 2 Γ   c 0 −1 −Iyy 2 c 0 0 0 0 0 Kc2 2 Iyy 2 es f´acil ver que J(x) = −J(x)T y que R(x) es globalmente semidefinida positiva. El sistema en bucle cerrado perturbado tiene la estructura x˙ = (J(x) − R(x))∇H + g1 (x)v + g2 (x)w (3. θd = 0).5 Rechazo de perturbaciones L2 Pudiera argumentarse que los resultados obtenidos previamente obedecen a una finalidad puramente est´etica. con lo que se prueba la estabilidad asint´otica global.16) posee un equilibrio globalmente asint´ oticamente estable en (ϕd .4. sobre las dos u ´ltimas filas . El sistema (3.18) y el hecho de que Hd es propia. Sin embargo.4.5. θ˙ = 0).4. En efecto. observando la ley de control.1) z = h(x)g1T (x)∇H donde v = [0 0 vϕ vθ ]T es el vector de control que se a˜ nadir´a a los pares uϕ y uθ calculados en (3. el u ´nico conjunto invariante con velocidades nulas es.16). En su lugar se podr´ıa recurrir a la t´ecnica del par calculado.1. el principio de invariancia de LaSalle garantiza la estabilidad asint´otica del m´aximo conjunto invariante contenido en (ϕ˙ = 0.3 all´ı presentado.4.3. la virtud de la expresi´on del sistema en bucle cerrado en forma hamiltoniana subyace en los resultados relativos a la robustez y al rechazo de perturbaciones originalmente presentados en (Van der Schaft 2000) y que se complementan con el teorema fundamental 2. 0) Demostraci´on.4. 0. Control de una plataforma giroestabilizada de dos grados de libertad 49 3.2) realimentado con la ley de control (3. θd . El problema de rechazo de perturbaciones con ganancia L2 se ha definido el la secci´on 3. Los pares de control que se a˜ nadan actuar´an sobre la aceleraci´on.18) Proposici´ on 3. 2) Con esta ley se garantiza el cumplimiento de la desigualdad de disipaci´on–γ a lo largo de las trayectorias del sistema en bucle cerrado. para cualquier constante c > 0. t´omese la matriz de ponderaci´on de la forma  h(x) = 0 0 1 0 0 0 0 1  de donde se tiene la se˜ nal de penalizaci´on  z= ∂Hd ∂ ϕ˙ ∂Hd ∂ θ˙   = Γc ϕ˙ Iyy2 θ˙  con lo que se calcula la ley de realimentaci´on (2.6. Rechazo de perturbaciones L2 50 de las ecuaciones de estado (3. por lo que la hip´otesis del teorema 2. dada por ˙ 2 Kc2 ≤ 1 {γ 2 w2 − z2 } H˙ + (Γc ϕ) ˙ 2 Kc1 + (Iyy2 θ) 2 con lo que son aplicables las tres implicaciones del problema de rechazo de perturbaciones descrito en la secci´on 3. de modo que se tienen las matrices de ganancias de control y perturbaci´on como    g1 (x) = g2 (x) =   0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1     = g1 (x)g1T (x) = g2 (x)g2T (x). Lo mismo suceder´a con los pares de perturbaci´on w. 2γ 2 Para la elecci´on de la se˜ nal de control.4.5.  de lo que se deduce que g1 (x)g1T (x) − g2 (x)g2T (x) = 0.8). ya que si la funci´on Hd (t) tal y como se defini´o en (3. .13) est´a acotada.5. se deduce que la norma del error en posici´on tambi´en est´a acotada (estabilidad entrada-estado).6.3 se cumple trivialmente para cualquier nivel de atenuaci´on γ ya que R− 1 [g2 (x)g2T (x) − g1 (x)g1T (x)] = R ≥ 0. En nuestro problema es un hecho esencial.4.3. un valor ρ(c) tal que si w(t) ≤ ρ entonces Hd (t) ≤ c.       0 0 Γc ϕ˙ Iyy2 θ˙      (3. Concretamente la tercera de ellas determina la posibilidad de encontrar.5.5)    1 1 T T u = − h (x)h(x) + 2 I4 g1 (x)∇H =   2 2γ  0 0 0 0 0 0 0 0 0 0 1 0 1 + 2γ 2 0 0 0 1 + 2γ12 . 3.1 Seguimiento visual El dise˜ no del primer bloque consiste en calcular la trayectoria deseada para las coordenadas de la plataforma. Las trayectorias de referencia ser´an aquellas que hagan nulas las coordenadas del objeto en la imagen captada por la c´amara y sus derivadas.4: Esquema de control para seguimiento visual. est´a contenida en el siguiente supuesto. El movimiento del objetivo respecto a la plataforma puede darse en una o ambas de las siguientes situaciones: • Seguimiento de objetos m´oviles desde una plataforma apoyada en tierra.6 Seguimiento de objetos m´oviles en superfices no inerciales Lo presentado hasta el momento parte de la suposici´on de que se desea estabilizar un punto del espacio de configuraciones frente a posibles perturbaciones externas. • Seguimiento de objetos fijos o m´oviles desde una plataforma apoyada en la cubierta de un buque u otra base m´ovil.Cap´ıtulo 3.y(t) Encoder/gyro q(t). Para ello se incluir´a un m´odulo de prec´alculo de la trayectoria de referencia en virtud de los movimientos del objetivo en la imagen de la c´amara. Perturbación (oleaje) D(t) Seguimiento de trayectoria basado en pasividad + Radar u Video + x(t). El problema se enriquece en gran medida cuando el objetivo de control es el seguimiento visual de un objeto m´ovil. En este caso el objeto a seguir tendr´a un vector de velocidad no nulo con respecto al sistema de referencia ligado a la cabeza del pedestal. Siendo el segundo caso el m´as general. θd (t)) de modo que la imagen del objeto m´ovil . Esto es deseable si sobre la plataforma se instalan antenas orientadas a emisores fijos y la plataforma en s´ı se encuentra en un soporte fijo. El esquema de control propuesto aparece en la figura 3. qd (t) = (ϕd (t). Esta velocidad ser´a la composici´on del movimiento del propio objeto con el movimiento de la plataforma debido a las oscilaciones provocadas en el buque por el oleaje.6. Se plantear´a el control como un seguimiento de trayectorias basado en pasividad con rechazo de perturbaciones. La soluci´on a este problema. tanto si el objeto est´a en movimiento como si no. Control de una plataforma giroestabilizada de dos grados de libertad 51 3. al ser un caso particular. ser´a el que abordaremos a continuaci´on.4.q'(t) Plataforma de sensores qd(t).q' d(t) Cálculo visual de la trayectoria de referencia Figura 3. es necesario expresar dicho error en coordenadas articulares (ϕ.5: Coordenadas en pantalla y coordenadas reales. 0) t→∞ Es admisible afirmar que las coordenadas en pantalla (x. θ). y(t)). La entrada de este bloque est´a formada por la posici´on 2D del objeto en la imagen. y as´ı se obtendr´a a continuaci´on. Y. Por semejanza de Vista lateral Plano de la Imagen Y y d Z Plano de la Imagen Vista superior X x d Z Figura 3. Supongamos que ´nica en las coordenadas articulares de la plataforma. 0). (X. y(t)) = (0. La posici´on 2D del objetivo en la imagen capturada se supone estimada por un algoritmo de visi´on por computador est´andar. nar´a un para estimar qd (t) y sus derivadas en cada instante t. como se ver´a a continuaci´on. tri´angulos. Seguimiento de objetos m´oviles en superfices no inerciales se estabilice en el centro de la pantalla de la imagen capturada por la c´amara CCD. se tiene X x = d Z y Y = d Z .Z). El c´alculo de las coordenadas (X. Sin embargo. existe una trayectoria qd (t) ∈ C 2 u tal que q(t) = qd (t) ⇒ (x(t). Z) del objeto referidas al sistema de referencia de la c´amara se deriva de las propiedades geom´etricas ilustradas en de la figura 3. Sin embargo.Y . as´ı como las coordenadas tridimensionales en el sistema de referencia de la c´amara. evidentemente desconocida. ∀t Esta trayectoria es. se dise˜ controlador basado en pasividad para lograr estabilidad asint´otica de la trayectoria.5. Denotaremos estas coordenadas (x(t).52 3. pues depende de los movimientos del buque y del objeto m´ovil. y consecuentemente lim (x(t). son medidas del error en seguimiento. Conocidas ´estas. y(t)) = (0.y). bastar´a con conocer las trayectorias de las coordenadas del objeto en la imagen capturada por la c´amara.6. referida al centro de la pantalla. 3) M= 0 Iyy2 y la formulaci´on de Euler–Lagrange est´andar en sistemas rob´oticos M (q)¨ q + C(q.6. q) ˙ viene expresada en t´erminos de los s´ımbolos de Christoffel de primera especie como 1 ∂mkj ∂mki ∂mij cijk (q) = { + − } 2 ∂qi ∂qj ∂qk . El error de orientaci´on de la c´amara en funci´on de x e y viene dado por x X = ϕd − ϕ eϕ = arctan( ) = arctan Z d y  Y = θd − θ eθ = arctan( ) = arctan Z d Si derivamos esta expresi´on. y emplearemos los resultados de (Van der Schaft 2000). Tras algunas manipulaciones se despejan las coordenadas 3D xD d2 + r2 yD = √ d2 + r2 X = √ Y donde r2 = x2 + y 2 .6. 3.1) θ(t) eθ (t)     ϕ(t) ˙ e˙ ϕ (t) q˙d (t) = + ˙ e˙ θ (t) θ(t) (3.6. y donde la matriz C(q.2 Subsistema de estabilizaci´on de trayectorias Para lograr el seguimiento de trayectorias partiremos de las ecuaciones de Euler–Lagrange. se tiene   d X d  x xd ˙ e˙ ϕ = = ϕ˙ d − ϕ˙ arctan = arctan = 2 dt Z dt d d + x2   Y d  y yd ˙ d ˙ arctan = arctan = 2 e˙ θ = = θ˙d − θ. q) ˙ q˙ = τ (3. Control de una plataforma giroestabilizada de dos grados de libertad 53 siendo d la distancia focal al plano de la imagen.6.Cap´ıtulo 3.6.2) Esta trayectoria objetivo calculada en tiempo real ser´a la referencia del bloque de estabilizaci´on de trayectorias que se dise˜ nar´a a continuaci´on con m´etodos basados en pasividad. un par´ametro caracter´ıstico (y a menudo ajustable) de la c´amara. dt Z dt d d + y2 De donde obtenemos trayectoria articular deseada y sus derivadas en el instante t     eϕ (t) ϕ(t) + qd (t) = (3.4) en la que se han omitido los t´erminos derivados de la energ´ıa potencial por razones anteriormente esgrimidas. Dada la matriz de inercia del pedestal   Γ(θ) 0 (3. 54 3.7) define un sistema disipativo con respecto a la tasa de suministro sT ν.5) ξ = q˙d − Λ(q − qd ) (3.6) donde T y Λ = Λ > 0. Para estabilizar la ´orbita qd (t) aplicaremos la ley de control (Van der Schaft 2000) τ = M (q)ξ˙ + C(q.6. Sustituyendo (3.6.4) resulta M (q)s˙ + C(q.6. se tiene que a lo largo de las trayectorias (3. Esta variable fue introducida por primera vez en el celebrado controlador de Slotine y Li (Slotine & Li 1987). (3.6.7)  donde se ha introducido la variable s = q˙ − ξ. q) = 1 T s M (q)s. Definiendo la funci´on de energ´ıa H(s. q)s ˙ = ν. Seguimiento de objetos m´oviles en superfices no inerciales siendo mab los t´erminos de la matriz de inercia en bucle abierto M (q).6.7) 2 1 d H = sT M (q)s˙ + sT M˙ (q)s dt 2 1 = −sT Cs + sT M˙ s + sT ν 2 T = s ν Esto u ´ltimo se debe a que la matriz M˙ −2C es antisim´etrica.6.6.6. y un mapa pasivo ν . Del hecho H ≥ 0 se desprende que el sistema (3. q)ξ ˙ +ν (3.5) en (3. 6. Si definimos adicionalmente  νˆ = Ks (3.6.q)s=n - ~ ~ n n=Ks s Figura 3. estabiliza asint´oticamente en el punto (0. 0) la posici´on (x. se estabilizar´a la trayectoria de referencia como indica la siguiente proposici´on. La ley de control ˙ q˙d − Λ(q − qd )) + K[q˙ − q˙d + Λ(q − qd )] τ = M (q)[¨ qd − Λ(q˙ − q˙d )] + C(q.6: Estructura de realimentaci´ on para seguimiento de trayectorias.1.8) un aparece en donde K = K T > 0 es una matriz definida positiva.→ s para toda condici´on inicial. Proposici´ on 3. te + n . . q)( ametros de ajuste. y) de la imagen en pantalla del objetivo m´ ovil en el sistema de la plataforma de sensores.6. .6.1). s M(q)s+C(q. y se realimenta seg´ la estructura de control de la figura 3. y qd (t) es la trayectoria donde K = K T > 0 y Λ = ΛT > 0 son par´ calculada en (3. Control de una plataforma giroestabilizada de dos grados de libertad 55 Demostraci´on.Cap´ıtulo 3.6.8 define un mapa estrictamente pasivo a la entrada s . La ecuaci´on 3. 2 3. de 882 milisegundos. apartado (ii). Este fen´omeno se entiende a la luz del momento de inercia rotacional. Como se . θ no se ve modificada por la velocidad de orientaci´on). pues en virtud de 3. Para ilustrar las capacidades del controlador. La figura 3. Se probar´a a continuaci´on que esto implica que e(t) → 0 para t → ∞. La curva inferior ilustra el caso en el que θ = 0. Este por tanto ν) est´en en τe ∈ Ln2 (v´ease la figura (3. la respuesta a una entrada en escal´on en el par de orientaci´on del sistema original.6 y s = q˙ − χ. para todo τe ∈ Ln2 tal que s (y nal de error estar´a en Ln2 . e˙ ∈ Ln2 . y por tanto un tiempo de subida mayor. se har´a una medida del tiempo de establecimiento.7 muestra el comportamiento del sistema sin compensaci´on de los t´erminos de acoplamiento de la matriz de inercia. Finalmente conectamos el controlador a la entrada de los motores para realizar medidas del tiempo de subida del sistema linealizado por realimentaci´on en dos simulaciones que comienzan en sendas posiciones de equilibrio de la plataforma (θ0 = 0 y θ0 = π2 ). con una mayor inercia en el movimiento de orientaci´on. seg´ un la teor´ıa de sistemas lineales. valores como el tiempo de subida dependen del punto de operaci´on. comportamiento usual en sistemas lineales. En efecto.→ νˆ. implica necesariamente que este valor l´ımite es cero.2.6). de amplitud 180 grados. El hecho de que e ∈ L2 y consecuentemente la integral en tiempo infinito de e2 (t) est´e acotada.9). controlado con una ley lineal.9) De la positividad de Λ se deduce. que como tal ha de converger a un valor finito para t → ∞.6.7 Simulaciones Los razonamientos expuestos en este cap´ıtulo se ilustran con mayor claridad mediante un conjunto de simulaciones implementadas en SIMULINK. se mostrar´a que la respuesta transitoria del sistema controlado no depende del estado inicial.7 corresponde al caso en el que θ0 = π2 . Entonces.6. la se˜ hecho es relevante. en virtud de la Proposici´on 2. que e ∈ Ln2 y por tanto.6. En este caso se ha controlado el eje de acimut con un simple control PD. Al situar inicialmente la plataforma con acimut cero e introduciendo un escal´on en la referencia. alcanzar´ıa el r´egimen permanente en un tiempo que ser´ıa funci´on de la configuraci´on de inicio del sistema. Se han lanzado las simulaciones a partir de dos condiciones iniciales (0 y π/2 grados en elevaci´on) por ser puntos de equilibrio relativos del sistema (en estas posiciones. La curva superior de la figura 3. el error e = q − qd satisface e˙ = −Λe + s (3. t2 → ∞ t1 t1 Por tanto.6. e intervendr´ıan en tal medida el acoplamiento de ambos cuerpos. mientras que el eje de elevaci´on se ha dejado libre de actuaci´on. si hacemos d 2 ˙ ⇒ e2 (t2 ) − e2 (t1 ) e (t) = 2e(t)e(t) dt  t2  t2 = 2 e(t)e(t) ˙ ≤ [e2 (t) + e˙ 2 (t)]dt → 0 para t1 . con una menor inercia efectiva γ(θ) en la rotaci´on acimutal y un per´ıodo transitorio m´as breve de 487 milisegundos. e2 (t). El sistema no lineal original. Como consecuencia de lo afirmado previamente. En sistemas no lineales. t ≥ 0 es una secuencia de Cauchy. por (3. tendr´ıa un tiempo de subida diferente para distintas posiciones iniciales del cuerpo de elevaci´on. 200 180 160 Acimut (grados) 140 120 100 80 60 40 20 0 200 400 600 800 1000 1200 1400 1600 1800 2000 Comparacion de tiempos de subida en orientacion. El tiempo de subida del sistema lineal desacoplado es 641 ms en todos los casos. Aracil & Rubio 2000). Este valor puede ser ajustado a trav´es de los par´ametros Kc . Aplicaci´on a una planta de laboratorio 200 180 160 Acimut (grados) 140 120 100 80 60 40 20 0 200 400 600 800 1000 1200 1400 1600 1800 2000 Comparacion de tiempos de subida en orientacion. • Dos motores DC sin escobillas con sus respectivos servoamplificadores de potencia.7: Tiempos de subida diferentes para ϕ bajo diferentes condiciones iniciales.8 ambas curvas est´an superpuestas dado que el periodo transitorio del seguimiento en orientaci´on ϕ ya no depende de la condici´on inicial θ0 . estando dotada del siguiente equipamiento: • Mesa desestabilizadora apoyada en r´otula. .8 Aplicaci´on a una planta de laboratorio A continuaci´on se pondr´an en pr´actica los resultados anteriores sobre una plataforma de sensores construida en el laboratorio del Dpto.56 3.9. • Reductoras con factor de reducci´on 800:1 en acimut y 400:1 en elevaci´on. Kd del controlador Γc . Los resultados que se presentar´an han sido publicados en (G´omez-Estern. 3. • Dos motores DC lineales controlados por variadores para el movimiento de la mesa. para elevaciones iniciales de 0 y 90 g Figura 3. con compensaci´on de pares de acoplamiento. aprecia en la figura 3. para elevaciones iniciales de 0 y 90 g Figura 3. que se muestra en la figura 3. de Ingenier´ıa de Sistemas y Autom´atica de la Universidad de Sevilla. • Dos gir´oscopos situados perpendicularmente. θ = π/2 y θ = 0.8.8: Seguimiento de la referencia en el eje de acimut para valores iniciales diferentes de θ. La plataforma ha sido desarrollada por los becarios y profesores del departamento ISA. Sus valores se relacionan con el momento de inercia del siguiente modo:  Γ0 = Izz1 + Izz2  Γπ/2 = Izz1 + Ixx2 (3. • Un encoder de alta precisi´on (10000 pulsos por vuelta) en la carga de cada eje.8. tarjetas A/D de adquisici´on y PC. es necesario un conocimiento preciso en tiempo real de la inercia efectiva y su derivada Γ(θ) = Izz1 + Ixx2 sen2 θ + Izz2 cos2 θ dΓ = (Ixx2 − Izz2 )sen2θ.9: Plataforma de laboratorio de dos grados de libertad. • Un encoder en el eje de cada motor. Control de una plataforma giroestabilizada de dos grados de libertad 57 Figura 3.  se emplear´a la nueva variable α = sen2 (θ) de modo que Γ es una funci´on lineal de la nueva variable α: (3.8. • C´amara de v´ıdeo CCD. se determinan las constantes Γ0 y Γ π2 . bϕ . a fin de implementar el controlador hamiltoniano basado en el modelo.8.4) (3. • Dos inclin´ometros para medir la inclinaci´on de la mesa. La funci´on Γ(θ) puede obtenerse de las constantes inerciales.Cap´ıtulo 3.1) (3. Γ (θ) = dθ (3.5) . • Circuitos de adaptaci´on de se˜ nales.3) Γ(θ) = Izz1 + Izz2 + α(Ixx2 − Izz2 ) Tomando dos observaciones en θ = 0 y en θ = π2 . Como se coment´o previamente. y bθ (los u viscosa medidas en el sistema real). Si estas no est´an disponibles.8.2) ´ltimos dos representan las constantes de fricci´on as´ı como los coeficientes Iyy2 .8. • Fuentes de alimentaci´on y dispositivo de parada de emergencia. (la cabeza de la plataforma se mantiene est´atica).8. La ecuaci´on (3. Bajo esta hip´otesis. τp = . τco = .9) Γ (θ) Que se puede considerar como la condici´on de arranque del movimiento del cuerpo de elevaci´on cuando ´este se origina exclusivamente por efecto del acoplamiento. que depende del servo y del motor de corriente continua.8.58 3.4) y (3. Ixx2 = . (3.8.(3. El par de control es proporcional a la tensi´on de entrada al servoamplificador1 τϕ = Ktϕ Vϕ A menudo no se dispone de un valor fiable y estable de la constante de par Kt .3) se obtiene Γ(θ) = Γ0 + α(Γπ/2 − Γ0 ) (3. la respuesta a una entrada en escal´on en el eje de acimut viene descrita por la ecuaci´on ϕ¨ = 1 (Vin + −bϕ ϕ˙ − τcoϕ ) Γ(θ) (3.8. La obtenci´on estos dθ valores se explicar´an a continuaci´on. viene dada por ˙ π/2 − Γ0 )sen2θ τϕ − F = Γ(θ)ϕ¨ + ϕ˙ θ(Γ (3. al tratarse ´esta de una variable c´ıclica. La din´amica de la planta. Aplicaci´on a una planta de laboratorio Susituyendo las ecuaciones (3.10) La ausencia de derivadas de orden cero en la variable ϕ.7) se simplifica para una entrada en escal´on de tal modo que la m´axima velocidad en orientaci´on no supera el siguiente valor:  2τcoθ ϕ˙ max ≤ . nmediante 1 Precisamente ´esta es la funci´on del servoamplificador: lograr que la corriente y por tanto el par aplicado sigan a la referencia proporcionada por la tensi´ on de entrada. convirtiendo la din´ amica de primer orden del motor DC en una relaci´ on de proporcionalidad .5) en Eq.8. permite la reducci´on de la ecuaci´on diferencial a una de primer orden. Ktϕ Ktϕ Ktϕ de modo que el sistema a identificar se transforma en  1  ˙ ϕ¨ = Vin + ϕ˙ θ(Γπ/2 − Γ0 )sen2θ − F Γ(θ) (3.8.8.8. modelando la fricci´on con los t´erminos b´asicos de Coulomb y fricci´on viscosa.6) por tanto bastar´a con encontrar las constantes Γ0 y Γ π2 de forma experimental a fin de poder calcular anal´ıticamente las funciones Γ(θ) y Γ (θ) = dΓ(θ) .7) donde F = bϕ ϕ˙ + τcoϕ es la fuerza de fricci´on y τcoϕ es la constante de fricci´on de Coulomb para el movimiento en el eje ϕ .8.8. Izz2 = Ktϕ Ktϕ Ktϕ  bϕ = bϕ  τco  τp . Este problema se solventa dividiendo ambos t´erminos de la ecuaci´on (3.8) donde el voltaje aplicado al servoamplificador aparece de forma expl´ıcita en as´ı como una serie de par´ametros relacionados con sus equivalente f´ısicos por la constante Kt .7) por Kt y empleando el cambio de variable  Γ(θ) = Γ(θ)  Ixx2  Izz2 . no apareciendo ´esta expl´ıcitamente.8. 8 1 1.11 donde se traza la m´axima velocidad de rotaci´on frente a la amplitud del voltaje de entrada.8.8.2 muestra los mismos resultados cuando el movimiento parte con una elevaci´on inicial de 45 grados.6 0. k2 = Γ(θ) (3.8 2 Figura 3. las tablas 3.4 0. La Angulo de acimut (verde). 1 tr = z∞ · k1 k1 = (3.12) La condici´on de movimiento implica necesariamente que k1 > 0 y k2 > 0.11) da lugar a:   (3.2 1.8. Control de una plataforma giroestabilizada de dos grados de libertad 59 el cambio de variable z = ϕ.Cap´ıtulo 3. tabla 3. La funci´on de saturaci´on es sim´etrica respecto a la tensi´on de entrada nula.10 se ha obtenido la respuesta del sistema a un par de entrada en escal´on. Esta no linealidad se puede apreciar con mayor claridad en la figura 3.6] .10: Respuesta de la velocidad en acimut (en grados/segundo) al escal´ on de entrada en bucle abierto.8. frente al tiempo (mseg) . A primera vista.14) k2 (3.2 revelan una saturaci´on abrupta en la entrada.8. La soluci´on de (3. a medida que se incrementa el tama˜ no del escal´on de entrada.6.1 muestra los diferentes valores de la velocidad m´axima alcanzada y los tiempos de subida para elevaci´on nula.11) Vin −τcoϕ Γ(θ) (3. Por tanto la se˜ nal de control est´a acotada en el intervalo [−0.2 0.1 y 3. La tabla 3. manteni´endose ambos valores constantes dentro del horizonte temporal del experimento. ˙ La u ´ltima ecuaci´on expresada en t´erminos de la velocidad z se transforma en z˙ + k1 z = k2  bϕ  k1 = .6 1.15) En la figura 3.13) z(t) = z∞ 1 − e−k1 t A trav´es de la experimentaci´on se determinar´an el tiempo de subida tr y la velocidad en r´egimen permanente z∞ .4 1. velocidad de acimut (azul) y tension de entrada (rojo) 45 40 35 30 25 20 15 10 5 0 −5 0 0. 0.8. se puede obtener la expresi´on anal´ıtica de la funci´on Γ(θ) en t´erminos de la . 3. la relaci´on lineal entre k2 y Γ(θ)−1 .0227 44.69 0.116 0.2 0.9 1 Figura 3.102 0. a trav´es de (3.60 3.8.8 0. m´ax.6 0.9311 44.4 0.16) ∂Vin Vin Γ(θ) Repitiendo el experimento en dos a´ngulos de elevaci´on est´aticos.2 0. La pendiente de la funci´on lineal es estimada mediante la obtenci´on de dos valores de k2 bajo diferentes tensiones de entrada Vin k2 1 ∂k2 = = (3.6888 45. Aplicaci´on a una planta de laboratorio Tabla 3.113 0.8 1 Tiempo de subida (s) 10.0424 27. concretamente θ = 0 y θ = π/2. input voltage 50 45 40 35 30 25 20 15 10 5 0 0.1 0. (grad/s) 0.061 0.8316 0.1 0.2: M´ axima velocidad de rotaci´ on y tiempo de subida para θ = 45.3912 26.4 0.1 Identificaci´on de los par´ametros El valor de Γ(θ) ser´a obtenido experimentalmente a diferentes a´ngulos empleando.2 0.8. Voltaje de entrada (V) Vel.056 Tabla 3.102 0.832 0. Voltaje de entrada (V) Vel.6 0.12).8.6 0. (grad/s) 0. m´ax.105 0.4 0.5196 44.7 0. rotation speed vs.5 0.62 Max.3 0.1: M´ axima velocidad de rotaci´ on y tiempo de subida para θ = 0.0524 44.8 1 Tiempo de subida (s) 11.8184 44.11: Efecto de la saturaci´ on de la velocidad m´ axima frente a la tensi´on de entrada.8. el mismo procedimiento se llevar´ıa a cabo.17) Γ(θ) = Γ0 + 2(Γπ/4 − Γ0 )sen2 θ Consecuentemente. Desde un valor de la entrada cercano a 0. siempre que θ permanezca constante. y usando la relaci´on (3. En primer lugar.0006.8.11.18) ´ltimo paso. ˚ Astr¨om & Lischinscky 1995). En todos los experimentos se mantiene el sentido de rotaci´on constante para no interferir con los fen´omenos de fricci´on est´atica2 . y la relativa a la posici´on del cabezal elevado a π/4 result´o Γπ/4 = 0. se muestra la saturaci´on en la velocidad de r´egimen permanente (debido a la saturaci´on del par de entrada) en la figura 3.2 voltios. s´olo deben obtenerse los valores de z∞ y tr .3) para cualquier valor de θ. Olsson. este par´ametro cambia dr´asticamente. la medida de Γ se mantiene constante hasta que alcanzamos el punto de saturaci´on. El valor medio obtenido para la inercia efectiva normalizada Γ(0) (con elevaci´on cero) es 0. como es el caso de nuestra plataforma de laboratorio. se deben llevar a cabo cuatro experimentos: • dos de ellos con elevaci´on nula a diferentes amplitudes del escal´on de entrada en acimut.9 Resultados experimentales 3. Control de una plataforma giroestabilizada de dos grados de libertad 61 ecuaci´on (3.16) deja de ser v´alida. se ha trazado el valor de Γ(0) para diferentes tensiones de entrada. A velocidades bajas. a velocidades mayores. Sin embargo. S´ı los l´ımites mec´anicos no permiten a´ngulos de elevaci´on tan altos como θ = π/2. En la figura 3. esta limitaci´on ha de ser tenida en cuenta a la hora de dise˜ nar controladores. Se han realizado c´alculos an´alogos para identificar la din´amica del eje de elevaci´on. siendo k2 y Γ(θ) los obtenidos en el u Esto es cierto a causa de la relaci´on bϕ = k1 · Γ(θ).9. a fin de determinar anal´ıticamente la funci´on de inercia efectiva Γ(θ). El par´ametro de fricci´on viscosa resulta τcoϕ = Vin − k2 · Γ(θ) (3. donde la relaci´on (3.8.12.). habr´ıa de emplear los m´etodos desarrollados por el grupo de LuGre (Canudas de Wit. haciendo los experimentos en θ = π/4. 3.8. Se observa. por tanto. Dado que su inercia Iyy2 no se ve afectada por el valor de ϕ. • y los otros dos con el a´ngulo de elevaci´on fijo a π/4 o´ π/2 radianes (s´olo uno de ellos a elegir). Claramente. .000596. el comportamiento de la plataforma se ajusta con gran exactitud al modelo aqu´ı desarrollado.1 Identificaci´on de la planta real Se aplicar´a el procedimiento de identificaci´on a la planta de laboratorio y se analizar´an los resultados de la identificaci´on.8. Esto se debe a los fen´omenos de fricci´on y holgura de los engranajes que sugiere la inclusi´on de un precompensador de fricci´on para aumentar la precisi´on (Canudas de Wit et al.Cap´ıtulo 3. que los altos ratios de las reductoras 2 Para una correcta identificaci´ on de los fen´ omenos asociados a los cambios de signo de velocidad (efecto de Stribeck etc. 1995). 16).4. Se han realizado experimentos similares para el eje de elevaci´on y se obtuvo un valor medio del momento de inercia Iyy2 en torno al eje y de 0.13 se ha obtenido tras la implementaci´on de un control en posici´on basado en la ley hamiltoniana (3. Los resultados son plenamente satisfactorios para se˜ nales de referencia de tipo escal´on o variaciones lentas en la referencia.7 0. en nuestro caso.001. al aparecer atenuaci´on y desfase entre la referencia y la salida.6 0.3 0.9 1 Figura 3. La figura 3. el rendimiento del controlador se degrada considerablemente (figuras 3.5 2 1.9. como sucede en el caso de seguimiento de trayectorias.4 0. a medida que aumentamos la frecuencia de la se˜ nal a seguir. Resultados experimentales −3 4 x 10 3. En estos casos es preciso cambiar la estrategia de control por la del seguimiento de trayectorias basado en pasividad presentado en la secci´on 3.5 0 0. los efectos de acoplamiento. 6 4 grados 2 0 −2 −4 Posición Referencia −6 0 5 10 15 Tiempo(s) Figura 3. 3.62 3.5 0.12: Inercia efectiva Γ frente a la tensi´on de entrada para una elevaci´ on nula.6. (400 y 800) hacen dif´ıcil de apreciar.15).2 Control hamiltoniano con prealimentaci´on de fricci´on La precisi´on de los resultados aumenta considerablemente cuando se una estrategia de prealimentaci´on de la fricci´on basada en el modelo de LuGre (Canudas de Wit et al. Sin embargo. Los detalles del compensador de fricci´on ser´an omitidos al no ser un objetivo central de esta tesis. 1995).14 y 3.9. .5 3 2. Referencia en escal´on.8 0.13: Seguimiento en posici´ on con perturbaciones.2 0.5 1 0. Referencia senoidal.3 Atenuaci´on de perturbaciones en la planta real Se ha tratado de medir el efecto de las perturbaciones en los pares de control debido a la composici´on de velocidades angulares producida por el movimiento de la mesa desestabilizadora. con el fin de ilustrar las propiedades de atenuaci´on de perturbaciones se ha a˜ nadido a la propia se˜ nal de control un ruido generado por el ordenador. baja frecuencia. Control de una plataforma giroestabilizada de dos grados de libertad 63 10 8 6 4 grados 2 0 −2 −4 Posición Referencia −6 −8 −10 0 5 10 15 Tiempo(s) Figura 3. la salida y la se˜ nal de perturbaci´on de gran amplitud superpuesta. Con un valor de γ = 0. En la figura 3.14: Seguimiento en posici´ on con perturbaciones.2 se obtiene un rechazo de perturbaciones muy satisfactorio. Por tanto. Se observ´o. sin embargo. 10 8 6 Posición Referencia 4 grados 2 0 −2 −4 −6 −8 −10 0 5 10 15 Tiempo(s) Figura 3. obteni´endose. para valores menores de este par´ametros. 3. de modo que para γ muy peque˜ no la din´amica del controlador es demasiado r´apida y presenta vibraciones probablemente relacionadas con las imprecisiones en los modelos de holgura y fricci´on.9.16 se representa la referencia. que esta mejora no se pod´ıa aumentar indefinidamente al estar γ relacionada con el t´ermino derivativo del control. un mejor rechazo de las perturbaciones en la salida. seg´ un lo previsto. Referencia senoidal de alta frecuencia. . En las distintas experiencias de laboratorio se hizo variar el valor de γ de la ley. Sin embargo se ha observado que las velocidades de esta u ´ltima son bajas y los altos ratios de reducci´on de los motores (1:400 y 1:800) impiden que este efecto se manifieste de forma apreciable como perturbaci´on.Cap´ıtulo 3. especialmente en el caso de ruido blanco.15: Seguimiento en posici´ on con perturbaciones. con dos envolventes distintas: ruido blando y oscilaciones senoidales lentas (el escenario esperado en la cubierta de un buque). 9. Como se observa en las figura 3. . Resultados experimentales 6 Posición Referencia 4 grados 2 0 −2 −4 −6 0 5 10 15 Tiempo(s) Figura 3.17 y 3.64 3.6 comprende un subsistema de seguimiento visual para el c´alculo de la trayectoria de referencia que excede los l´ımites de esta tesis.4 Seguimiento de trayectorias en la planta real La estructura de control presentada en la secci´on 3. Por tanto el comportamiento del controlador se ha estudiado bajo se˜ de referencia generadas por ordenador con forma senoidal a distintas frecuencias.18. salvando el problema de desfase detectado en el control hamiltoniano en posici´on. est´a m´as relacionado con la capacidad de seguir una referencia cambiante y rechazar las perturbaciones que con la manera de obtennales er la se˜ nal qd (t).16: Rechazo de perturbaciones para el seguimiento en posici´ on. El rendimiento del controlador. 3.9.17: Seguimiento de trayectoria senoidal con perturbaci´ on senoidal. sin embargo. el seguimiento de trayectorias basado en pasividad presenta un comportamiento o´ptimo incluso a frecuencias altas. 6 4 grados 2 0 −2 −4 Posición Referencia −6 0 5 10 15 Tiempo(s) Figura 3. .Cap´ıtulo 3.18: Seguimiento de trayectoria senoidal con perturbaci´ on en forma de ruido blanco. Control de una plataforma giroestabilizada de dos grados de libertad 65 6 4 grados 2 0 −2 Posición Referencia −4 −6 0 5 10 15 Tiempo(s) Figura 3. 9. Resultados experimentales .66 3. En el primer ejemplo se probar´a que para cualquier condici´on inicial (excepto un conjunto de medida cero). 67 . como los elementos de la matriz de interconexi´on. y sin necesidad alguna de sensores de velocidad. el p´endulo de disco inercial. conocida como interconexi´on y asignaci´on de amortiguamiento (IDA-PBC). Corke & Lozano 2001). se puede probar que el m´etodo de Lagrangianos controlados en su formulaci´on original puede verse como un caso particular del enfoque IDA-PBC. La principal contribuci´on es la caracterizaci´on de una clase de sistemas para la cual el IDA-PBC proporciona un controlador suave con estabilizaci´on asint´otica en un dominio de atracci´on garantizado. Una ventaja importante del m´etodo debida a su formulaci´on hamiltoniana (en oposici´on al m´as cl´asico m´etodo lagrangiano) es la introducci´on de nuevos grados de libertad para la soluci´on de estas ecuaciones. el moldeo de la energ´ıa cin´etica como v´ıa imprescindible para salvar los obst´aculos relacionados con la subactuaci´on. Con el fin de ilustrar la t´ecnica se dise˜ nar´an controladores asint´oticamente estables para el cl´asico problema de la bola en la viga. Asimismo. definiremos un dominio de atracci´on del equilibrio en el origen que garantiza que todas las trayectorias permanecen acotadas dentro de los l´ımites de la viga. introducido inicialmente en (Ortega & Spong 2000) a˜ nade a la modificaci´on de la energ´ıa potencial que se ha venido haciendo habitualmente. La clase en la que es aplicable esta t´ecnica se define en t´erminos resolubilidad de un conjunto de ecuaciones diferenciales parciales.Cap´ıtulo 4 Control de sistemas subactuados mediante el m´ etodo IDA-PBC Lo mayor parte de lo que se expondr´a en este cap´ıtulo aparece publicado en el art´ıculo (Ortega. Spong. En ´el estudiaremos la aplicaci´on de una nueva formulaci´on del problema del control. al problema de estabilizaci´on de sistemas mec´anicos subactuados. Usando este grado de libertad adicional. la resoluci´on de algunos problemas de control subactuado mediante esta t´ecnica. el controlador es capaz de conducir al sistema de la bola en la viga hacia la orientaci´on correcta. basada en pasividad. y el an´alisis transitorio de las soluciones. y para un sistema subactuado recientemente presentado (Spong. Para el p´endulo de disco inercial se probar´a que es posible levantar (swing–up) y estabilizar el p´endulo en la posici´on vertical superior sin conmutaci´on entre la ley de swing–up y la de estabilizaci´on. G´omez-Estern & Blankenstein 2002). Este m´etodo. conectados con la planta a trav´es de interconexiones que preservan la potencia (y por tanto conservan estructura de Euler-Lagrange). Van der Schaft 2000)). la estructura de Euler-Lagrange del sistema. sistemas de levitaci´on magn´etica. para estabilizar algunos sistemas mec´anicos subactuados. y la funci´on de almacenamiento del mapa pasivo (que es normalmente una funci´on cuadr´atica del error) carece de significado f´ısico. Para solventar esta dificultad se desarroll´o en (Ortega. Esto acarrea en estos casos que el sistema en bucle cerrado —aun definiendo un operador pasivo— deje de ser un sistema de Euler–Lagrange.1 del libro (Ortega et al. En algunos problemas de regulaci´on. es necesario modificar la funci´on de energ´ıa total (potencial m´as cin´etica). En (Ortega. Van der Schaft. Desafortunadamente. Mareels & Maschke 2001. Kelly & Praly 1995) se propone el uso de controladores din´amicos. y 2 la funci´on de energ´ıa en bucle cerrado se obtiene – tras resolver un sistema de ecuaciones diferenciales parciales – como resultado de nuestra elecci´on libre de interconexiones deseadas entre subsistemas y del amortiguamiento. destruye la estructura Euler–Lagrange. Sin embargo. para moldear la energ´ıa potencial de una clase de sistemas de Euler–Lagrange subactuados empleando medidas parciales del estado. incluidos sistemas el´ectricos y electromec´anicos. lo cual dificulta el an´alisis posterior del sistema controlado. como se ver´a en este texto. . en bucle cerrado. las cuales pueden ser elegidas cuidadosamente invocando consideraciones f´ısicas para resolverla.68 4. la EDP particular que aparece en IDA-PBC est´a parametrizada en t´erminos de las matrices de interconexi´on y amortiguamiento. se extiende la aplicaci´on del PBC a una amplia clase de sistemas descritos mediante ecuaciones de Euler–Lagrange. Van der Schaft. motores el´ectricos. Maschke & Escobar 2002) (v´ease tambi´en (Ortega. Este punto ha sido ilustrado en varias aplicaciones pr´acticas incluyendo sistemas de balance de masas. el moldeo de energ´ıa total por el procedimiento cl´asico PBC.3. En un profundo an´alisis en (Ortega et al. esta situaci´on proviene del hecho de que esto dise˜ nos involucran una inversi´on del sistema a lo largo de las trayectorias de referencia. control de sat´elite y veh´ıculos subacu´aticos. o IDA-PBC.1. que es una clase que contiene estrictamente los sistemas de Euler-Lagrange. Loria. 1998). sistemas de potencia. Las principales caracter´ısticas del m´etodo IDA-PBC son: 1 Est´a formulado para la clase de sistemas PCH. el m´etodo IDA-PBC incorpora la ventaja de resolver ciertos problemas de forma totalmente sistem´atica. Introducci´ on 4. un m´etodo de s´ıntesis basado en pasividad denominado Interconexi´ on y Asignaci´ on de Amortiguamiento. Tal y como se explica en la Secci´on 10. 1998). heredando las pobres propiedades de robustez de los dise˜ nos de linealizaci´on por realimentaci´on e imponiendo al sistema el artificial requisito de la invertibilidad. adem´as de la mayor´ıa de sistemas el´ectricos y electromec´anicos. Es bien sabido que la resoluci´on de sistemas de ecuaciones diferenciales parciales (EDPs) es una tarea dif´ıcil. donde en primer lugar se selecciona la funci´on de energ´ıa y despu´es se dise˜ na el control que fuerza la desigualdad de la disipaci´on. A˜ nadido a esto. proporciona un procedimiento natural para moldear la energ´ıa potencial preservando. Sin embargo.1 Introducci´on El control basado en pasividad (PBC) es una metodolog´ıa de dise˜ no para el control de sistemas no lineales ampliamente conocido en aplicaciones mec´anicas. excluyendo una amplia clase considerada en (M. Reyhanoglu & Kolmanovsky 2001). el m´etodo IDA-PBC se aplica s´olo a sistemas estabilizables mediante leyes suaves. se plantean las siguientes cuestiones: 1. Auckly. 1 Cabe puntualizar que. y continuados con el trabajo de (Auckly. Kelkar & White 2000). . nos centraremos en la aplicaci´on del IDA-PBC al problema de estabilizaci´on de sistemas subactuados1 . Una diferencia central entre ambos m´etodos recae en que mientras la din´amica EL objetivo en el m´etodo de Lagrangianos Controlados se obtiene modificando exclusivamente la matriz de inercia generalizada y la funci´on de energ´ıa potencial. el p´endulo de disco inercial.Cap´ıtulo 4. no es necesario tomar medidas directas de la velocidad. (v´ease (Bloch et al. Otro tema de inter´es tratado en este cap´ıtulo es situar el nuevo enfoque hamiltoniano en perspectiva con el de los “Lagrangianos Controlados” para estabilizaci´on de sistemas mec´anicos simples subactuados. ¿Cu´al es la elecci´on espec´ıfica de este par´ametro libre que proporciona los mismos controladores para ambos m´etodos?. ¿Podemos usar este grado de libertad adicional para simplificar la b´ usqueda de soluciones para las EDPs mencionadas? Para responder a esta pregunta escribiremos las EDPs en una forma tal que los par´ametros libres aparezcan expl´ıcitamente como “entradas de control” y trabajaremos con dos ejemplos cl´asicos para ilustrar c´omo se seleccionar´ıan dichas entradas. desarrollados en una serie de art´ıculos de Bloch et al. tal y como se presentado. 2 Como se coment´o en el cap´ıtulo 2. M´as a´ un. Para responder a esta cuesti´on usaremos los recientes resultados de (Blankenstein. se aplica tambi´en a problemas que involucren hamiltonianos variantes en el tiempo. 2000. 2 En (Hamberg 1999) aparece una extensi´on a los sistemas Lagrangianos en general. A este respecto. 2. Kapitanski & White 2002. Andreev. de nuevo para “casi” todas las condiciones iniciales se logra estabilizar el sistema en la posici´on vertical superior. Bloch. Leonard. Adem´as. el estudio de la estabilidad de los controladores. La principales contribuciones de este cap´ıtulo son: la caracterizaci´on de una clase de sistemas para la cual el m´etodo IDA-PBC proporciona una ley de control suave. Para el p´endulo de disco de inercia se presentar´a una realimentaci´on din´amica de la salida para la cual. es decir. A modo de ilustraci´on dise˜ naremos controladores IDAPBC asint´oticamente estables para los cl´asicos sistemas de la bola en la viga y para un p´endulo invertido de reciente aparici´on (Spong et al. Kapitanski. Ortega & Van der Schaft 2001). la versi´ on de IDA-PBC de (Fujimoto & Sugie 2001). los m´etodos IDA-PBC y Lagrangianos Controlados comparten objetivos y en cierta medida su fundamento te´orico. Gosavi. Marsden & Woolsey 2002)). y el an´alisis del comportamiento transitorio del cl´asico sistema de la bola y la viga en bucle cerrado. la aplicaci´on a dos problemas de control subactuado. Chang. La clase de sistemas de aplicaci´on del m´etodo est´a definida en t´erminos de resolubilidad de dos EDPs que corresponden a sendas etapas de moldeo de la energ´ıa potencial y cin´etica. Para el sistema bola y viga se probar´a que para cualquier condici´on inicial (excepto un conjunto de medida cero) el controlador lleva la viga a la posici´on horizontal con la bola al centro de la viga. Control de sistemas subactuados mediante el m´etodo IDA-PBC 69 En este cap´ıtulo. en IDA-PBC tenemos tambi´en la posibilidad de cambiar la matriz de interconexi´on. Sin embargo. Esto quiere decir que es posible levantar el p´endulo desde su posici´on estable en bucle abierto y estabilizar arriba sin necesidad de conmutaci´on. definiremos un dominio de atracci´on que garantice que la bola permanece dentro de los l´ımites de longitud de la viga. permitiendo la estabilizaci´ on con controladores variantes en el tiempo. la estructura de Poisson del sistema. 2001). principal obst´aculo en ambos enfoques. 0). se presentar´a un an´alisis novedoso de los comportamientos transitorios del sistema de la bola y la viga en bucle cerrado controlado mediante IDA–PBC. entonces las ecuaciones de movimiento pueden escribirse del siguiente modo        ∇q H 0 q˙ 0 In + u (4. para mantener la interpretaci´on del mecanismo de estabilizaci´on necesitaremos. M (q) = M  (q) > 0 es la matriz de inercia. 2000) caracterizan una clase de sistemas mec´anicos tales que sus funciones de energ´ıa cin´etica puede ser moldeada sin resolver las mencionadas EDPs.1) 2 donde q ∈ IRn . 3 Para clarificar m´as a´ un las conexiones entre IDA-PBC y Lagrangianos Controlados—de nuevo invocando(Blankenstein et al. (Chang et al. a˜ nadir t´erminos girosc´opicos al sistema en bucle cerrado.2 Estabilizaci´on de sistemas mec´anicos subactuados En esta secci´on aplicaremos el enfoque IDA-PBC para regular la posici´on de sistemas mec´anicos subactuados cuya energ´ıa total viene dada por 1 H(q. que el sistema en bucle cerrado est´e en forma hamiltoniana (Van der Schaft 2000). mostrando que con IDA-PBC podemos aun preservando la estructura EL. En la secci´on 4.2.2 presentamos la aplicaci´on de IDA-PBC a sistemas mec´anicos subactuados.2) = −In 0 G(q) ∇p H p˙ ua La matriz G ∈ IRn×m es determinada por el modo en que el controlador u ∈ IRm act´ sobre el sistema y es invertible en el caso de que el sistema sea completamente actuado. ¿Es el conjunto de modelos EL en bucle cerrado alcanzable por medio de IDAPBC “mayor” que el que se obtiene mediante m´etodos Lagrangianos? Si fuera as´ı. y por tanto lka matriz de control es tal que rango(G) = m < n. 2001)—probaremos que las condiciones de ajuste (matching conditions) de (Bloch et al. 2002) han extendido el m´etodo de Lagrangianos controlados para obtener un m´etodo equivalente al IDA-PBC.3 y 4. adem´as. p) = p M −1 (q)p + V (q) (4. En el m´etodo IDA-PBC se siguen dos pasos b´asicos del control basado en pasividad o PBC (Ortega & Spong 2000): 1) moldeo de energ´ıa.2. y 2) inyecci´ de amortiguamiento para lograr estabilidad asint´otica. Obviando la necesidad de resolver dichas ecuaciones. Consideraremos aqu´ı el caso m´as dif´ıcil en el que el sistema es subactuado. respectivamente. p ∈ IRn son los momentos y coordenadas generalizados. Como se explic´o previamente. Por u ´ltimo. donde modificamos la funci´on de on energ´ıa total del sistema para asignar el punto de equilibrio deseado (q ∗ . El resto del cap´ıtulo se organizar´a del siguiente modo. i. . claramente aumenta la aplicabilidad de estos m´etodos de dise˜ no.2. ¿podr´ıamos caracterizar la diferencia? Proporcionaremos una respuesta a ambas cuestiones. m = n. respectivamente. una caracter´ıstica que no aparece en la literatura del enfoque lagrangiano. 4. Si suponemos que el sistema no tiene amortiguamiento natural.70 4. Estabilizaci´on de sistemas mec´anicos subactuados 3. y V (q) es la energ´ıa potencial. Las secciones 4.4 contienen las derivaciones de IDA-PBC para los sistemas p´endulo de disco inercial y la bola en la viga. Bloch et al. 3 Recientemente.e. p)] (4. Van der Schaft. Control de sistemas subactuados mediante el m´etodo IDA-PBC 71 4.2. para una elecci´ on particular de J2 antisim´etrica . (4.2) se tiene que q˙ = M −1 p. respectivamente. p) (4. Esto justifica el bloque (2.2.1) propondremos a siguiente forma para la funci´on de energ´ıa (en bucle cerrado) 1 Hd (q. 6 En el apartado 4.1 Din´amica objetivo Motivado por (4. Proporcionar estos grados de libertad adicionales es la esencia del m´etodo IDAPBC6 . 5 V´ease (Ortega. – Se mostrar´a que la matriz antisim´etrica J2 (y algunos de los elementos de Md ) pueden ser usados como par´ ametros libres para lograr el moldeo de energ´ıa cin´etica.7) representan las estructuras deseadas de interconexi´on y amortiguamiento.2.2.4) q∗ = arg min Vd (q) En PBC la se˜ nal de control se descompone de forma natural en4 u = ues (q. 2) de Rd . Es razonable esperar que la posibilidad de elegir entre la clase completa de matrices antisim´etricas aumenta la clase de sistemas estabilizables.2. p)   Rd = Rd = 0 0 0 GKv G  ≥0 (4. Como es sabido. esto se logra mediante realimentaci´on negativa de la (nueva) salida pasiva (esta t´ecnica tambi´en se conoce como control Lg V ).2.3) y (4. IDA-PBC se reduce al esquema de lagrangianos controlados de (Auckly et al. Maschke & Escobar 2002. que en este caso toma la forma G ∇p Hd .2.2.6) ∇p H d p˙ donde los t´erminos  Jd = −Jd = 0 M −1 Md −Md M −1 J2 (q. p) − Rd (q. (4. Hamberg 1999.3) 2 donde Md = Md > 0 y Vd representan respectivamente la matriz de inercia y funci´on de energ´ıa potencial (ambas por definir). a las palabras energy shaping (moldeo de energ´ıa) y damping injection (inyecci´on de amortiguamiento).2. Van der Schaft 2000) para una justificaci´ on f´ısica de esta elecci´on. Se requerir´a que Vd tenga un m´ınimo local aislado en q∗ .4 se mostrar´ a que.8) donde tomamos Kv = Kv > 0. 4 Los sub´ındices “es” y “di” hacen referencia.6) se determina el bloque (1.Cap´ıtulo 4. p) + udi (q. 2002).2. p) = p Md−1 (q)p + Vd (q) (4. De lo previamente dicho se desprenden las siguientes observaciones – De (4.2. es decir.5) como udi = −Kv G ∇p Hd (4. – la matriz Rd se incluye para introducir amortiguamiento en el sistema. 2002. Chang et al. . La din´amica hamiltoniana deseada se toma en la forma5     q˙ ∇q H d = [Jd (q.2.2.5) donde el primer t´ermino se dise˜ na para lograr el moldeo de energ´ıa y el segundo es responsable de la inyecci´on de amortiguamiento.2. Esto quiere decir que seleccionaremos el segundo t´ermino de (4. Fijando (4. Al ser esta una coordenada no actuada la relaci´on debe ser v´alida en bucle cerrado.1). 2) de Jd . 6)         0 M −1 Md 0 In ∇q H 0 ∇q Hd + ues = ∇p H −In 0 G −Md M −1 J2 (q.8) en (4. 0). ues .3 Moldeo de energ´ıa Para obtener el t´ermino de moldeo de energ´ıa. bajo la suposici´on de detectabilidad. Este equilibrio es asint´oticamente estable si es localmente detectable desde la salida7 G (q)∇p Hd (q.3) y (4.2 Estabilidad Para la din´amica deseada en bucle cerrado se tiene la siguiente proposici´on.4). H˙ d satisface H˙ d = (∇q Hd ) q˙ + (∇p Hd ) p˙ = −(∇p Hd ) GKv G ∇p Hd ≤ −λmin {Kv }|(∇p Hd ) G|2 ≤ 0 al ser Jd antisim´etrica y Kv definida positiva. al ser Hd propia (por definici´on) en su subconjunto de nivel Ωc¯.6).2.2. la cual revela las propiedades de estabilizaci´on del enfoque IDA-PBC: Proposici´ on 4.6). todas las trayectorias comenzando en Ωc¯ est´an acotadas are bounded. La estabilidad asint´otica.4) tenemos que Hd es una funci´on definida positiva en un entorno de (q∗ . (q∗ .2.2.2.2 de (Byrnes. ∀t ≥ 0 ⇒ lim (q(t). 0).2. Finalmente.2. El sistema (4. Una estimaci´ on del dominio de atracci´ on est´a dado  por Ωc¯ donde Ωc = {(q.3) y (4. Adicionalmente. p(t)) ≡ 0. Un c´alculo sencillo muestra que a lo largo de las trayectorias de (4.1. con (4. 4. se establece invocando el teorema de Barbashin–Krasovskii y los argumentos usados en la prueba del Teorema 3. t→∞ . G (q(t))∇p Hd (q(t).2.2. sustituiremos (4. del controlador. es decir. Consecuentemente. est´a claro que si G es invertible. la estimaci´on del dominio de atracci´on proviene del 2 hecho de que Ωc¯ es el mayor subconjunto de nivel acotado de Hd . que para cualquier soluci´ on (q(t). Estabilizaci´on de sistemas mec´anicos subactuados 4.72 4. el segundo conjunto puede ser expresado como Gues = ∇q H − Md M −1 ∇q Hd + J2 Md−1 p Ahora bien. si el sistema es completamente actuado. tiene un punto de equilibrio estable en (q∗ .2.2. De (4. p) ∈ IR2n | Hd (q. entonces podemos resolver de forma u ´nica para la se˜ nal de control ues dado 7 Es decir. 0) | Ωc est´ (4. 0). p). la siguiente implicaci´ on sea cierta. p) ∇p H d Mientras que las primeras n ecuaciones son claramente satisfechas.5) y (4. 0) es un equilibrio estable.2. p(t)) del sistema en bucle cerrado perteneciente a alg´ un entorno abierto del equilibrio. p(t)) = (q∗ .9) Demostraci´ on.2) y lo igualaremos a (4.2.2. p) < c} y  a acotado} c¯ = sup{c > Hd (q∗ .2. Isidori & Willems 1991). es decir.2. y ues puede s´olo influenciar a los t´erminos dentro del espacio imagen de G. la ecuaci´on (4. Se tomar´a J2 como par´ametro libre.10). es un conjunto de EDPs no lineales cuyas inc´ognitas son Md y Vd . reparametrizando J2 en t´erminos de las matrices Uk (q) = −Uk (q) ∈ IRn×n como n  2J2 = Uk pk (4.2. Por tanto.Cap´ıtulo 4.k) + Uk Md ∇q (M(·. La ecuaci´on (4. de la forma ! "    −1 −1 −1 ⊥ −1 G ∇q (Md )(·. aplicando la identidad ∇q (P (q)z) = n  ∇q (P(·. y p es una coordenada independiente. otra matriz B cuyas filas est´ an en el espacio n´ ucleo de A.2. En el caso subactuado. G no es invertible sino s´olamente de rango completo por columnas.13) La primera ecuaci´on es una EDP no lineal que ha de resolverse para los elementos desconocidos de la matriz de inercia en bucle cerrado Md .15) 8 Se entiende por anulador por la izquierda de una matriz A. expresadas s´olo en t´erminos de la variable independiente q.2.12). G⊥ {∇q H − Md M −1 ∇q Hd + J2 Md−1 p} = 0 (4.12) puede expresarse en una forma m´as expl´ıcita con las siguientes derivaciones.2.2. es decir. Dado Md . aquellos que corresponden a las energ´ıas cin´etica y potencial.2.2.10) donde G⊥ es un anulador por la izquierda de rango completo de G8 . Control de sistemas subactuados mediante el m´etodo IDA-PBC 73 cualquier Hd y J2 .2. con Hd dado por (4.k) ) − Md M =0 (4.2. Esto lleva al siguiente juego de ecuaciones de restricci´on el cual debe ser satisfecho para cualquier elecci´on de ues .10) pueden separarse de forma natural en los t´erminos que dependen en p y t´erminos que son independientes de p. el sistema de ecuaciones de (4. . Entonces. donde P(·.13) es una simple EDP lineal cuya inc´ognita es Vd .2.12) G⊥ {∇q V − Md M −1 ∇q Vd } = 0 (4. G⊥ G = 0. Dicho anulador es de rango completo si el espacio generado por las filas de B coincide con el n´ ucleo de A. Si se obtiene una soluci´on para esta EDP. En primer lugar usemos el hecho de que ∇q (z  P (q)z) = [∇q (P (q)z)] z. La ecuaci´on (4.k) denota la columna k–´esima de la matriz P . para escribir (4.14) k=1 e igualando los t´erminos pk se obtienen n EDPs. k=1 v´alida para todo z ∈ IRn y todo P ∈ IRn×n .k) )zk .12) como   G⊥ [∇q (M −1 p)] − Md M −1 [∇q (Md−1 p)] + 2J2 Md−1 p = 0.2.10) puede reescribirse como  G⊥ ∇q (p M −1 p) − Md M −1 ∇q (p Md−1 p) + 2J2 Md−1 p = 0 (4. la ley de control resultante ues vendr´a dada por ues = (G G)−1 G (∇q H − Md M −1 ∇q Hd + J2 Md−1 p) (4. para toda z ∈ IRn y cualquier matriz sim´etrica P (q) ∈ IRn×n .11) Las EDPs (4.3).2.2. respectivamente. y por tanto la principal dificultad se halla en la resoluci´on de (4. 2000) que aseguran que las soluciones (q(t).2. En el extremo opuesto. si no modificamos la energ´ıa potencial.12).2.2. Es decir. se desea encontrar una realimentaci´on est´atica del estado tal que el comportamiento . y buscaremos una soluci´on Vd que satisfaga (4.20). si no modificamos la matriz de interconexi´on entonces recuperaremos el cl´asico procedimiento de moldeo de energ´ıa potencial de PBC. transformar (4. sino s´olo la cin´etica.2.6) para una matriz de inercia definida positiva Md . entonces la ecuaci´on del controlador (4. 4. Aunque es bien sabido que resolver EDPs es una tarea en general dif´ıcil. (4.2. como se ver´a en el siguiente apartado. tenemos la ventaja de que el grado de libertad a˜ nadido —la matriz de interconexi´on en bucle cerrado J2 (equivalentemente. y una matriz antisim´etrica arbitraria J2 . por ejemplo en el caso de sistemas mec´anicos. si Md = M y J2 = 0.2. – Hay dos casos particulares “extremos” en el procedimiento.2) en (4.2. A continuaci´on. se recupera el m´etodo de Lagrangianos Controlados de (Bloch et al. entonces. que es una EDP lineal. Ciertamente. para una elecci´on particular de J2 . La clase viene dada en t´erminos de resolubilidad de la EDP no lineal (4. Este punto se desarrollar´a con m´as detalle en los ejemplos del cap´ıtulo. Por otro lado si moldeamos tanto la energ´ıa cin´etica como la potencial. (4. la sustituiremos en (4.2.2.1). Visto desde esta perspectiva. La idea fundamental es elegir entonces los par´ametros libres Uk que definen J2 de tal manera que (4.11) se reduce a ues = (G G)−1 G (∇q V − ∇q Vd ) que es el conocido control de moldeo de energ´ıa potencial. 2002.4 Comparaci´on entre los enfoques lagrangiano y hamiltoniano El m´etodo IDA-PBC puede ser interpretado como un procedimiento para generar controladores de realimentaci´on del estado que transforman un sistema hamiltoniano controlado por puertos (PCH) en otro sistema hamiltoniano PCH con ciertas propiedades de estabilidad deseadas.2. una funci´on de energ´ıa potencial Vd que satisfaga (4. (o de la m´as expl´ıcita (4.2.74 4. es decir. q) ˙ − ∇q L(q. 2000). partiendo de un sistema de Euler–Lagrange d ∇q˙ L(q.2. entonces IDA-PBC coincide con el m´etodo propuesto en (Auckly et al.2.2. De lo anterior se desprenden los siguientes comentarios – Los desarrollos previos caracterizan una clase de sistemas subactuados para los cuales el m´etodo dise˜ no IDA-PBC proporciona estabilizaci´on suave. Un enfoque similar puede tomarse a partir de un perspectiva lagrangiana. y la EDP lineal (4. Hamberg 1999). (4. En primer lugar. p(t)) de ambos sistemas son las mismas).15) admita una soluci´on con Md sim´etrica y definida positiva.13). definido como la diferencia entre las energ´ıas cin´etica y potencial.13).2. pero fijamos J2 a (4.3). q) ˙ = G(q)u dt donde L es el lagrangiano.20).4).15)). Estabilizaci´on de sistemas mec´anicos subactuados donde Uk son las matrices elegidas por el dise˜ nador. El grado de libertad adicional proporcionado por Uk es la principal caracter´ıstica que distingue al m´etodo IDAPBC de los m´etodos lagrangianos que revisaremos en la siguiente secci´on.2.4). Uk )—simplifica este trabajo. las ecuaciones diferenciales parciales del metodo IDA-PBC (ver cap´ıtulo 4) constituyen en cierto modo las conocidas condiciones de ajuste (matching conditions) introducidas en (Bloch et al. 2001). ajustan los t´erminos de energ´ıa cin´etica y potencial10 .19) coincide exactamente con (4. q) ˙ − ∇q Lc (q. M´as a´ un. Recordando que p = M q˙ y definiendo una matriz  Mc (q) = M Md−1 M. se desarrollan las condiciones de ajuste —expresadas en t´erminos de restricciones algebraicas—para moldeo de energ´ıa potencial de sistemas EL en bucle cerrado con controladores EL din´ amicos.2. . vemos que (4.2. 2001) comprobando que la parte conservadora de energ´ıa del sistema PCH (4. la cual es. (4. la ecuaci´on (4.2. v´ease tambi´en (Blankenstein et al.6) es equivalente al sistema mec´anico EL      0 In ∇q H c q˙ = p˙c −In 0 ∇ pc H c −1 donde pc = Mc q˙ and Hc (q.2. claramente sim´etrica y definida positiva. Para el caso que nos interesa. p) = Md M −1 [∇q (M Md−1 p)] − ∇q (M Md−1 p) M −1 Md Aunque la expresi´on de arriba puede ser comprobada mediante sustituci´on directa.3).16) donde Lc es el lagrangiano deseado. j) de una matriz. v´ease tambi´en (Ortega.2. 2 (4. Una forma alternativa para J2 puede obtenerse como   (J2 )(i. Maschke & Escobar 2002).2. de forma similar a (4.2. pc ) = 12 p c Mc (q)pc + Vc (q). Para evitar notaciones adicionales se usar´ a preferentemente la forma expresada hasta ahora.i) .j) representa el t´ermino (i. Control de sistemas subactuados mediante el m´etodo IDA-PBC 75 en bucle cerrado sea descrito por el sistema lagrangiano controlado d ∇q˙ Lc (q. Tambi´en se ha mostrado en (Blankenstein et al.19) lo cual. Este problema ha sido estudiado con gran generalidad en (Hamberg 1999).20) J2 (q.2. Hamberg 1999) que el conjunto de Lagrangianos Lc alcanzables en bucle cerrado se caracteriza por la resolubilidad de las EDPs9 ! "  1 ⊥ −1  −1  [∇q (M q) G ˙ − M Mc ∇q (Mc q)] ˙ q˙ − ∇q (q˙ M q) ˙ − M Mc ∇q (q˙ Mc q) ˙ = 0(4.j) siendo [·.12).2.18) si y s´olo si  (4.2.17) se ha mostrado en (Auckly et al. lo cual lleva a una notaci´ on m´as elegante y compacta.2.13)—haciendo Vc = Vd .2. Van der Schaft. 10 En (Ortega et al.2.20) −1  −1 una matriz antisim´etrica de la forma Md M {[∇q Q(q)] − ∇q Q(q)}M Md . 2001) que podemos a˜ nadir a (4. q) ˙ =0 dt (4.2.2. una prueba m´as elegante aparece en (Blankenstein et al. (M −1 Md )(·.18) 2 G⊥ {∇q V − M Mc−1 ∇q Vc } = 0(4. 1995).18) se expresan usando los s´ımbolos de Christoffel de segunda especie.13) del IDA-PBC. siendo Q 9 En las referencias citadas (4. restringido a Lagrangianos de la forma 1 L = q˙ M (q)q˙ − V (q).Cap´ıtulo 4. 2002. 2 1 Lc = q˙ Mc (q)q˙ − Vc (q). (4. ·] los corchetes de Lie y (·)(i.j) = −p Md−1 M (M −1 Md )(·.12) se reduce a (4. como es usual en PBC (Ortega. y lo estabiliza en la posici´on vertical superior11 . Esencialmente.16). Maschke & Escobar 2002). para todas las condiciones iniciales excepto un conjunto de medida cero. Recientemente (Chang et al. .76 4.2. Mostraremos el IDA-PBC proporciona una respuesta afirmativa a la cuesti´on de la existencia de una ley de control continua que. que resultan ser intr´ınsecos—o dicho manera sencilla. como los que se presentar´an en este cap´ıtulo.16) no sea necesariamente igual a cero. 2001).1. levanta el p´endulo desde su posici´on naturalmente estable abajo. 4. los cuales no han sido considerados en la literatura del enfoque lagrangiano. 2002) establece que el m´etodo de Lagrangianos Controlados es equivalente al m´etodo IDA-PBC. El p´endulo de disco inercial una funci´on arbitraria de q. Este sistema. es posible escribir cualquier sistema mec´anico hamiltoniano en un formato Euler-Lagrange incluyendo la parte no integrable del sistema hamiltoniano como un fuerza externa (girosc´opica) del sistema de Euler-Lagrange.2. Esto corresponde al lagrangiano en bucle cerrado 1 Lc = q˙ Mc q˙ + q˙ Q − Vc 2 que incluye los t´erminos girosc´opicos q˙ Q. 2000). a´ un preservando la estructura EL en bucle cerrado (4.3 El p´endulo de disco inercial En esta secci´on aplicaremos la metodolog´ıa de dise˜ no precedente al problema de estabilizaci´on de la posici´on invertida del p´endulo de disco inercial mostrado en la figura 4.16). tambi´en permiten incluir fuerzas externas en el sistema de Euler Lagrange en bucle cerrado (por esto se entiende que el segundo miembro de (4. que no pueden ser eliminados mediante un cambio de coordenadas. Van der Schaft. Considerando esta clase m´as amplia de sistemas Euler–Lagrange en bucle cerrado (Chang et al. que ha sido definido recientemente en (Spong et al. El par motor produce una aceleraci´on angular de la masa del extremo lo cual genera un par de acoplamiento en el eje del p´endulo. Tambi´en mostramos que. 2002) han mostrado que un peque˜ no ajuste en el m´etodo de los Lagrangianos Controlados da lugar a un m´etodo que es completamente equivalente al IDA-PBC descrito en el cap´ıtulo 4. De este modo. en lugar de restringir los sistemas a la forma (4.2. 11 Esto significa que la cuenca de atracci´ on de nuestro controlador es un conjunto abierto denso en el espacio de estados.3.16). N´otese que este m´etodo s´olo funciona para la clase de sistemas mec´anicos simples. En otras palabras IDA-PBC general naturalmente una clase m´as ‘rica’ de sistemas EL ajustables de la forma (4. la propiedad de pasividad nos permite reemplazar la ley de realimentaci´on de estado por una realimentaci´on din´amica de la salida que no requiere la medida de velocidades. sino cualquier fuerza externa). consiste en un p´endulo f´ısico con un rotor equilibrado situado el extremo.2. lo cual es lo mejor que se puede esperar al usar una realimentaci´on continua (Shiriaev & et al. Cap´ıtulo 4. Control de sistemas subactuados mediante el m´etodo IDA-PBC 77 θ2 u θ1 Figura 4.1: P´endulo de disco inercial. 4.3.1 Modelo Las ecuaciones din´amicas del dispositivo pueden ser escritas de una forma est´andar usando la formulaci´on EL (Spong & Vidyasagar 1989) como       0 θ¨1 −mgLsenθ1 I 1 + I2 I2 = u + θ¨2 I2 I2 0 1 donde θ1 , θ2 y I1 , I2 son los a´ngulos respectivos y momentos de inercia de p´endulo y disco, m es la masa del p´endulo, L es su longitud, g es la constante de gravedad, y u es el par de control de entrada actuando entre el disco y el p´endulo. El cambio de coordenadas     θ1 q1 = q2 θ1 + θ2 lleva a la descripci´on simplificada       I1 0 q¨1 −m3 senq1 −1 + = u q¨2 0 1 0 I2 (4.3.1)  donde m3 = mgL. El sistema puede ser escrito en forma hamiltoniana (4.2.2) con p = [I1 q˙1 , I2 q˙2 ] , la funci´on de energ´ıa total (4.2.1) y     −1 I1 0 , G= , V (q1 ) = m3 (cos q1 − 1) M= 1 0 I2 El equilibrio a estabilizar es la posici´on vertical con el disco inercial alineado, lo cual se corresponde con q1∗ = q2∗ = 012 . Comentario 4.3.1. El modelo del p´endulo inercial de disco puede verse de dos maneras: como un sistema definido en IR4 , o tomando q1 modulo 2π, over S × IR3 , siendo S el c´ırculo unidad. Para permitir leyes de realimentaci´on que no sean necesariamente 2π– no del controlador. Sin embargo para peri´odicas en q1 adoptaremos la primera para el dise˜ determinar el dominio de atracci´on observaremos el sistema en el cilindro. 2 12 al ser sim´etrica la distribuci´ on de masas del disco inercial, puede argumentarse que no hay raz´ on particular para alinearlo. A pesar de ello impondremos este objetivo para ilustrar la generalidad del enfoque. 78 4.3. El p´endulo de disco inercial 4.3.2 Dise˜no del controlador Se dise˜ nar´a el controlador IDA-PBC en tres pasos. En primer lugar se obtendr´a una realimentaci´on del estado que moldear´a la energ´ıa en bucle cerrado funci´on de energ´ıa para estabilizar globalmente la posici´on vertical superior, y a continuaci´on se inyectar´a el amortiguamiento necesario para lograr estabilidad asint´otica mediante la realimentaci´on negativa de la salida pasiva. Finalmente, se mostrar´a que es posible reemplazar la realimentaci´on de la velocidad por su derivada “sucia”, manteni´endose el resultado de estabilidad asint´otica. A. Moldeo de energ´ıa Obs´ervese, en primer lugar, que los elementos de la matriz de inercia M no dependen de q (sistema plano, del ingl´es flat), y por tanto podemos hacer J2 = 0 y elegir Md como una matriz constante, cuyos elementos ser´an:   a 1 a2 (4.3.2) Md = a2 a3 a1 > 0, a1 a3 > a22 (4.3.3) Las desigualdad que se imponen a estos coeficientes tienen como finalidad asegurar que la matriz Md es globalmente definida positiva. La u ´nica EDP que habr´a que resolver, por tanto, es la de la energ´ıa potencial, que viene dada por la ecuaci´on (4.2.13), es decir  a1 + a2 I1  ∂Vd + ∂q1  a2 + a3 I2  ∂Vd = −m3 senq1 ∂q2 Esta es una EDP lineal trivial cuya soluci´on general es de la forma I1 m 3 cos(q1 ) + Φ (z(q)) a1 + a2 z(q) = q2 + γ2 q1 Vd (q) = (4.3.4) (4.3.5) donde Φ es una funci´on diferenciable arbitraria que debemos escoger para satisfacer la  condici´on (4.2.4) para q∗ = 0. Asimismo se ha definido la constante γ2 = −I1 (a2 + a3 )/(I2 (a1 + a2 )). Tras algunos c´alculos sencillos se prueba que la condici´on necesaria de estabilidad ∇q Vd (0) = 0 se satisface si y s´olo si ∇Φ(z(0)) = 0, mientras que la condici´on suficiente de m´ınimo (suponiendo que es cierta la anterior) ∇2q Vd (0) > 0 se cumplir´a si la matriz hessiana de Φ en el origen es definida positiva, y a2 < −a1 La positividad del hessiano se satisface con la elecci´on13 Φ(z) = representa una ganancia ajustable. (4.3.6) k1 2 z , 2 donde k1 > 0 13 Para simplicidad hemos tomado una funci´ on cuadr´ atica de Φ. Claramente otras opciones, que pueden ser seleccionadas para mejorar el rendimiento transitorio, son posibles; por ejemplo una funci´ on de saturaci´on. Cap´ıtulo 4. Control de sistemas subactuados mediante el m´etodo IDA-PBC 79 El t´ermino de moldeo de energ´ıa de la entrada de control (4.2.11) viene dado por ues = (G G)−1 G (∇q V − Md M −1 ∇q Vd )     a2 − a3 ∂Vd a1 − a2 ∂Vd 1 + + m3 senq1 = 2 I1 ∂q1 I2 ∂q2 = γ1 senq1 + kp (q2 + γ2 q1 ) (4.3.7) donde hemos definido a2 m3 γ1 = a1 + a2   kp = −k1 a1 a3 − a22 I2 (a1 + a2 ) Recu´erdese que a1 , a2 , a3 deber´ıa satisfacer las desigualdades (4.3.3) y (4.3.6). Algunos c´alculos simples muestran que estas condiciones se traducen en γ1 > m 3 γ2 > I1 γ 1 I2 γ1 − m 3 (4.3.8) lo cual, unido a kp > 0, define la regi´ on admisible para el ajuste de las ganancias (figura 4.2). 8 7 6 5 Región permitida para γ1 y γ2 4 γ2 3 2 I1 γ2= I2 1 0 −1 γ =m 1 3 −2 −3 −2 0 m 3 2 4 6 8 10 γ 1 Figura 4.2: Regi´on admisible para el ajuste de las constantes γ1 y γ2 . B. Inyecci´on de amortiguamiento y an´alisis de estabilidad La ley de control u = ues + udi produce el sistema      ∇q H d 0 q˙ 0 M −1 Md + udi = −Md M −1 0 ∇p H d G p˙ para el cual tenemos H˙ d = ∇p Hd  Gudi . Claramente, sin inyecci´on de amortiguamiento el origen es un equilibrio estable. Para lograr que este equilibrio sea asint´oticamente estable 80 4.3. El p´endulo de disco inercial proponemos a˜ nadir amortiguamiento realimentando la nueva salida pasiva ∇p Hd  G, la cual puede ser calculada como 1 [−(a2 + a3 )p1 + (a1 + a2 )p2 ] a1 a3 − a22 = k2 (q˙2 + γ2 q˙1 ) G ∇ p H d = (4.3.9)  2) donde hemos definido k2 = − Ia21(aa13+a > 0, con positividad derivada de (4.3.3) y (4.3.6). −a2 2 Estamos en posici´on de presentar el primer resultado de estabilizaci´on, que establece que para toda condici´on inicial —excepto un conjunto de medida cero—el IDA-PBC lleva el p´endulo a su posici´on vertical superior con el disco alineado. Proposici´ on 4.3.1. El p´endulo de disco inercial (4.3.1) en bucle cerrado con la realimentaci´ on est´atica del estado IDA-PBC u = γ1 sen(q1 ) + kp (q2 + γ2 q1 ) − kv (q˙2 + γ2 q˙1 ) (4.3.10) donde γ1 , γ2 satisfacen (4.3.8), kp > 0 es una ganancia proporcional, y kv > 0 es una ganancia de inyecci´ on de amortiguamiento, tiene un equilibrio asint´ oticamente estable en cero, siendo el dominio de atracci´ on el completo espacio de estados menos un conjunto de medida cero Lebesgue. Demostraci´ on. Primero observaremos que el sistema en bucle cerrado tiene los equilibrios q ) = 0. Recu´erdese de (¯ q , 0), donde q¯ = (jπ, kπ), j, k ∈ IN , son las soluciones de ∇q Vd (¯ la figura 4.1 que los puntos q¯1 con k par corresponden a la posici´on deseada vertical, mientras aquiellos con k impar corresponden al p´endulo colgando De la Proposici´on 1 y los anteriores desarrollos sabemos que los equilibrios correspondientes a la posici´on vertical superior son estables. M´as a´ un, con alg´ un control b´asico de las se˜ nales, es posible mostrar que—en una vecindad del cero—las trayectorias del sistema en bucle cerrado satisfacen las condici´on (fuerte) de observabilidad: H˙ d ≡ 0 ⇒ (q(t), p(t)) ≡ 0. Por tanto, la Proposici´on 1 asegura que el equilibrio deseado es asint´oticamente estable. Aunque la Proposici´on 1 proporciona tambi´en una estimaci´on de su dominio de atracci´on, se mostrar´a m´as adelante que la estabilidad asint´otica es “casi” global—en el sentido de la Proposici´on 2. A este fin, haremos la importante observaci´on de que la introducci´on en el control (4.3.10) de una funci´on no peri´odica de q1 obliga a considerar el sistema en IR4 en lugar de en S × IR3 , y entonces Hd no ser´ıa una funci´on propia de (q, p) y no se podr´ıa asegurar el acotamiento de trayectorias (empezando fuera de Ωc¯.) Sin embargo, en las coordenadas (q1 , q˜2 , p1 , p2 ), con q˜2 = q2 + γ2 q1 , el sistema en bucle cerrado est´a en realidad definido en S × IR3 , y la funci´on de energ´ıa ˜ d (q1 , q˜2 , p1 , p2 ) = 1 p M −1 p + I1 m3 [cos(q1 ) − 1] + k1 q˜22 H d 2 a1 + a2 2 es definida positiva y por tanto propia an lo largo de S × IR3 . Entonces, dado que ˜˙ d = −kv k2 q˜22 ≤ 0, se tiene que todas las soluciones est´an acotadas en S × IR3 . Del H an´alisis previo sabemos que el equilibrio en cero es asint´oticamente estable. Mostraremos ahora que los otros equilibrios son inestables. De hecho, la linealizaci´on del sistema en bucle cerrado en estos equilibrios tiene autovalores con parte real estrictamente positiva Asociado al u ´ltimo hay una variedad estable. τ > 0 algunos par´ametros del filtro. udi es un t´ermino de inyecci´ on de amortiguamiento generado a partir de la derivada sucia de las posiciones como kv 1 ϑ˙ = − ϑ + 2 (q2 + γ2 q1 ) τ τ kv udi = ϑ − (q2 + γ2 q1 ) τ (4. siendo atrapado en tiempo finito en un entorno suficientemente peque˜ no del mismo. como es bien sabido una variedad invariante s–dimensional de un sistema n–dimensional tiene medida cero Lebesgue si s < n. Adem´as se ha mostrado que casi cualquier soluci´on converge al equilibrio estable. Sepulchre & Praly 1995). La prueba resulta a lo largo de las l´ıneas en la siguiente proposici´on. 0) o (π. 0. Consecuentemente el conjunto condiciones iniciales que convergen al equilibrio “indeseable” tiene medida cero. v´ease. τD + 1  siendo D = dtd . Esta consideraci´on nos lleva a nuestro resultado final contenido en la proposici´on abajo. 0. . Consid´erese el p´endulo de disco inercial (4. en S ×IR3 . para toda condici´on inicial —excepto un conjunto de medida cero—el p´endulo converge hacia su posici´ on vertical superior con todas las se˜ nales internas acotadas uniformemente. (Krsti´c. Proposici´ on 4. Hemos visto que los desarrollos previos demuestran que. y consideramos los conjuntos de IR4 los cuales corresponden a N0 sobre el cilindro.3. 0. kp > 0 es una ganancia proporcional. El primer equilibrio es asint´oticamente estable y el segundo es hiperb´olico.1) en bucle cerrado con la realimentaci´ on din´amica de la salida IDA-PBC u = −γ1 sen(q1 ) + kp (q2 + γ2 q1 ) + udi donde γ1 . y las trayectorias que comienzan en ´el converger´an en la posici´on de abajo.11) con τ. kv > 0. 4 entonces estos conjuntos en IR no se intersectan.Cap´ıtulo 4. Como las soluciones en el cilindro no abandonan N0 la inmersi´on de las trayectorias no abandonar´a el entorno correspondiente en IR4 . Esto completa la prueba.3. La idea relevante es que udi es implementable sin realimentaci´on de la velocidad. Esta caracter´ıstica proviene del hecho de que para la interconexi´on de mapas pasivos podemos reemplazar una realimentaci´on constante por otra realimentaci´on a trav´es de cualquier funci´on de transferencia real positiva preservando la estabilidad.3.2. 2 C. Realimentaci´on de la salida Es bien conocido en dise˜ nos basados en pasividad que a veces es posible obviar la medida de la velocidad realimentando en su lugar la derivada sucia de las posiciones (Kelly 1993). Si N0 se escoge suficientemente peque˜ no. Control de sistemas subactuados mediante el m´etodo IDA-PBC 81 y al menos un autovalor con parte real estrictamente negativa. para implementar la inyecci´on de amortiguamiento podemos usar la realimentaci´on udi = − kv D (q2 + γ2 q1 ). ll´amese N0 . Entonces. Si ahora sumergimos el cilindro en el espacio Eucl´ıdeo IR4 .8). y kv . Para completar la prueba estableceremos ahora que las trayectorias tambi´en est´an acotadas en IR4 . γ2 satisfacen (4. 0. todas las trayectorias est´an acotadas y tienden a uno de los equilibrios (0. 0). a este respecto. Sin embargo. En particular.3. se han mostrado juntos varias gr´aficas de q1 (t) y q2 (t). Con el fin de ilustrar la influencia de la elecci´on de kp y kv en el comportamiento transitorio. 2kv di ˙ = − k2 (udi )2 . primero cambiando solamente kp dejando kv constante en un valor de 10 como se muestra en la figura 4. Una simple observaci´on muestra que valores mayores de kp ralentizan la convergencia hacia el equilibrio. p. n´otese que de (4. dejando kv = 10. se obtienen las gr´aficas de figura 4. contra toda intuici´on pero de forma no totalmente inesperada. Las siguientes gr´aficas muestran la respuesta del sistema comenzando en reposo con configuraci´on inicial q(0) = (3. .5 1 Kp=1 1 Kp=0.2. Si dejamos kp constante y cambiamos kv de 10 a 100.4.3.3: Evoluci´ on de q1 (t) (izquierda) and q2 (t) (derecha) para valores diferentes de kp .3. La prueba se completa procediendo como en la Proposici´on Tenemos W kv 2@@@. udi ) = Hd + podemos escribir el sistema en bucle cerrado en forma PCH como          0 0 M −1 Md q˙ ∇q W     −M M −1 kv   ∇p W  G 0 d  p˙  =   k τ 2     kv kv  u˙ di ∇udi W − k2 τ 2 0 − k2 τ G k2 τ 2 u . I2 = 0. la figura 4.3.5 muestra el par de control aplicado cuando kp = 0. El p´endulo de disco inercial Demostraci´ on. 2 4.3 Resultados de simulaci´on Se ha simulado la respuesta del p´endulo de disco inercial usando los par´ametros I1 = 0.1 2 0 0 −1 −0.9) y (4.5 0 5 10 15 20 25 tiempo (segundos) 30 35 40 −3 0 10 20 30 40 50 60 tiempo (segundos) Figura 4.3.11) se obtiene 1 kv  G ∇p H d u˙ di = − udi − τ k2 τ  Consecuentemente.1 y kv = 10.1. 0).3. las oscilaciones se aten´ uan m´as r´apidamente para valores menores de kv ! Finalmente. γ2 = 0. si definimos la nueva funci´on de energ´ıa W (q.5 −2 −1 −1. Estas gr´aficas muestran que. 3 2 Kp=1 1. En primer lugar.2. m3 = 10 y el controlador completo de realimentaci´on de estado con ganancias de ajuste γ1 = 30.1 0. Por tanto el p´endulo cuelga casi en posici´on vertical inferior.82 4.5 q2 (rad) q1 (rad) Kp=0. Control de sistemas subactuados mediante el m´etodo IDA-PBC 2.4.5 −3 0 2 4 6 8 10 12 14 16 18 20 0 5 10 15 20 25 30 tiempo (segundos) tiempo (segundos) Figura 4.6. y kp = 0.1. y kp = 0. En primer lugar. para el modelado se desprecia la inercia rotacional de la bola. 4.5 Kv=10 2 1 0 0 −0. se demostrar´a que para toda condici´on inicial (excepto un conjunto de medida cero) el controlador IDA-PBC llevar´a la viga a la orientaci´on correcta.5: Se˜ nal de control para kv = 10. Existen configuraciones alternativas y las ligeras variaciones en la construcci´on pueden dar lugar modelos con estructuras muy diferentes.Cap´ıtulo 4.7).5 −1 −2 Kv=50 −1 Kv=50 −1. En general.1 Modelo Este sistema es un cl´asico que ocupa un lugar en los laboratorios de control de las universidades de todo el mundo.4 El sistema de la bola en la viga En esta secci´on se dise˜ nar´a un controlador IDA-PBC para el conocido sistema de la bola en la viga mostrado en la figura 4. A continuaci´on definiremos un dominio de atracci´on para el equilibrio en el origen que garantiza que la bola se mantiene dentro de los l´ımites f´ısicos de la viga.5 3 Kv=10 Kv=100 q2 (rad) q1 (rad) 1 0.5 6 2 5 83 Kv=100 4 1. 15 Control Torque (Nm) 10 5 0 −5 −10 −15 0 5 10 15 20 25 tiempo (segundos) Figura 4.4: Evoluci´ on de q1 (t) (izquierda) y q2 (t) (derecha) para valores diferentes de kv . 4. Esta configuraci´on tiene . Este hecho es a´ un m´as razonable cuando en lugar de la bola tenemos un peque˜ no carro sobre railes como el construido recientemente en la universidad de Linz (figura 4.1. 4. Finalmente. una caracter´ıstica peculiar. El modelo que emplearemos.6: Sistema de la bola en la viga. Austria. a diferencia del modelo que emplearemos en nuestro desarrollo.84 4. R su radio y g la aceleraci´on de la gravedad de valor 9. donde se proponen las siguientes ecuaciones de Euler–Lagrange   Jb + m q¨1 + mgsenθ − mq1 θ˙2 = 0 2 R   2 mq1 + J + Jb θ¨ + 2mq1 q˙1 θ˙ + mgq1 cos θ = τ (4. Sastry & Kokotovic 1992). respectivamente. La principal consecuencia de este desplazamiento es que en el modelo aparecen elementos no diagonales en la matriz de inercia en bucle abierto. q2 son la posici´on de la bola y el a´ngulo de la viga. dividimos ambas ecuaciones entre la masa de la bola m. este u ´ltimo sirve como aproximaci´on bona fide y ser´a descrito a continuaci´on. haremos unas leves modificaciones. y definimos u = τ /m . Para traer al primer plano los par´ametros relevantes de nuestro desarrollo. En cualquier caso. respectivamente.8m/s. τ es el par de control aplicado a la viga. El sistema de la bola en la viga u q1 q2 Figura 4. mientras que m es la masa de la bola.7: Sistema de la bola en la viga.1) donde q1 . Universidad de Linz. Las constantes J y Jb representan los momentos de inercia de la viga y la bola. Si se desprecia la inercia rotacional de la bola frente a la de  la viga. El carro est´a levemente desplazado hacia arriba. el m´as aludido en la literatura. Figura 4.4. fue presentado por Hauser et al. consistente en que la l´ınea de avance del carro no intersecta con el eje de giro de la viga o rail. (Hauser. la constante L aparecer´a de forma aislada en las ecuaciones Euler–Lagrange15 .2) se obtiene definiendo las matrices  M (q1 ) = 1 0 2 0 L + q12   . Como estamos interesados en que las trayectorias de la bola no superen esta longitud.2) ahora bien. G= 0 1  y la funci´on de energ´ıa potencial V (q) = gq1 sen(q2 ). (4.3. a2 . Si el sistema se construyera tal que la masa de la barra sea exactamente 12 veces la de la bola14 . De nuevo. y por tanto lo razonable es proponer Md de la forma (4. estabilidad asint´otica por inyecci´on de amortiguamiento. Definiremos la matriz  J2 (q. es conveniente para la claridad de la exposici´ on. moldeo de energ´ıa potencial. . y an´alisis del transitorio. hemos incluido expl´ıcitamente L en el modelo. a3 funciones (a definir) tambi´en de q1 . Control de sistemas subactuados mediante el m´etodo IDA-PBC 85 tendremos  q12 + J m q¨1 + gsenθ − q1 θ˙2 = 0  θ¨ + 2q1 q˙1 θ˙ + grq1 cos θ = u (4.2. p) = 14 15 0 j(q.Cap´ıtulo 4. El objetivo del control es estabilizar la bola y la viga en su posici´on de reposo con q1∗ = q2∗ = 0.2). siendo los coeficientes a1 .4. se separar´a el dise˜ no del IDA-PBC en moldeo de energ´ıa cin´etica. el modelo puede verse tanto como un sistema definido en IR4 como en IR × S × IR2 . 4. Moldeo de energ´ıa cin´etica N´otese en primer lugar que M es funci´on exclusivamente de q1 . A.4. dado que el momento de inercia de un barra de longitud L y masa M es M L2 /12. q¨1 + gsen(q2 ) − q1 q˙22 = 0 (L2 + q12 )¨ q2 + 2q1 q˙1 q˙2 + gq1 cos(q2 ) = u (4.2 Dise˜no del controlador Por razones pedag´ogicas.1). tendremos J/m = M L2 /(12m). hecho que se explotar´a en el resto del desarrollo para asegurar que la bola permanece dentro de la viga. una medida razonable.2. El modelo hamiltoniano (4.3) donde L es la longitud de la viga.4. p) −j(q. p) 0  No es imprescindible para el desarrollo. como se deseaba.12). realizaremos una transformaci´on motivada por la siguiente descomposici´on matricial ∇q1 Md−1 = −Md−1 (∇q1 Md )Md−1 en la ecuaci´on original de moldeo de energ´ıa cin´etica (4.2.5) Md = (L2 + q12 )  $ 2 2 2(L + q1 ) 1 El moldeo de energ´ıa cin´etica es completado evaluando j en (4. y bas´andose en lo publicado en (G´omez-Estern. Es evidente que a1 > 0 para todo κ > 0.2. Ortega. a2 .4) siendo κ una constante de integraci´on libre que ha de ser escogida para asegurar que Md sea definida positiva.12) y la Md calculada arriba   √ j = q1 p1 − 2(L2 + q12 )−1/2 p2 (4.4. Tras una serie de manipulaciones que ser´an estudiadas con la m´axima generalidad en el cap´ıtulo 5. a2 = L2 + q12 (4. las ecuaciones diferenciales parciales del m´etodo IDA-PBC. se transforman en un sistema de ecuaciones diferenciales ordinarias en los elementos de Md . La matriz Md resultante es entonces   √ 1 2(L2 + q12 )−1/2  (4. se tomar´a κ = L2 en adelante.86 4. Rubio & Aracil 2001).4. para todo κ > L2 . La ecuaci´on de moldeo de la energ´ıa cin´etica.6) . Para obtener dos ecuaciones con dos inc´ognitas. y el determinante de Md resulta    a3 a1 − a22 = L2 + q12 q12 + 2κ − L2 2 que es globalmente definido positivo.4. 2q1 a22 d a1 (q1 ) = dq1 (L2 + q12 )2 a1 2q1 d a2 a3 a2 (q1 ) = dq1 (L2 + q12 )2 a1 que ha de ser resuelto para a1 . toma la forma 2 ja2 (q1 )p1 2 q1 −2 (L2p+q + 2 ja1 (q∆1 )p2 2 )2 − 2 ∆ 1    0= p1 a3 (q1 ) dqd a1 (q1 ) a3 (q1 )+a1 (q1 ) dqd a3 (q1 )−2 a2 (q1 ) dqd a2 (q1 ) p1 dqd a3 (q1 ) 1 1 1 1 −a1 (q1 ) − ∆ ∆2    p2 a2 (q1 ) dqd a1 (q1 ) a3 (q1 )+a1 (q1 ) dqd a3 (q1 )−2 a2 (q1 ) dqd a2 (q1 ) p2 dqd a2 (q1 ) 1 1 1 1 p1 + − + ∆ ∆2     p1 a2 (q1 ) dqd a1 (q1 ) a3 (q1 )+a1 (q1 ) dqd a3 (q1 )−2 a2 (q1 ) dqd a2 (q1 ) p1 d a2 (q1 ) 1 1 1 − dq1∆ + ∆2     p2 a1 (q1 ) dqd a1 (q1 ) a3 (q1 )+a1 (q1 ) dqd a3 (q1 )−2 a2 (q1 ) dqd a2 (q1 ) p2 dqd a1 (q1 ) 1 1 1 1 p2 + − ∆ ∆2 Para enfrentarnos a la complejidad de estas ecuaciones. fijaremos a3 = a2 a1 . tras desarrollar sus componentes. El sistema de la bola en la viga con la funci´on j tambi´en a definir. de modo que observaremos a3 como un par´ametro “libre”.4. Por tanto podremos f´acilmente obtener soluciones expl´ıcitas del sistema de ecuaciones como # a1 = 2(κ + q12 ). Por simplicidad. 2.7) Substituyendo las soluciones obtenidas para a1 y a2 en (4. que en este caso se expresa del siguiente modo a1 (q1 ) ∂Vd a2 (q1 ) ∂Vd (q) + 2 (q) = gsen(q2 ) ∂q1 L + q12 ∂q2 (4. Cabe comentar que.4) con q∗ = 0. Los comandos de Maple requeridos son >equ:=a*diff(Vd(x1. esta propiedad es significativa a efectos pr´acticos s´olo si somos capaces de mostrar que en las trayectorias se cumple |q1 (t)| ≤ L para todo t ≥ 0. al ser z(0) = 0 q ) = 0 tiene y senh(·) una funci´on mon´otona creciente de primer y√tercer cuadrante. se tiene que s´olo el equilibrio donde.13). tarea que se emprender´a m´as adelante.x2). evaluaremos el gradiente   √ −12 2 ∇z Φ(z(q)) 2(L +q1 ) ∇q Vd (q) = gsen(q2 ) + ∇z Φ(z(q)) Evidentemente.x2)=sin(x2). Esta funci´on debe ser escogida para asegurar la asignaci´on del punto de equilibrio. Moldeo de energ´ıa potencial Una vez determinadas la matrices de inercia e interconexi´on deseadas se proceder´a a definir la energ´ıa potencial en bucle cerrado de la soluci´on de (4. Se 16 Independientemente de la forma de obtener la soluci´ on. Es importante recordar que. lo cual produce (tras deshacer el cambio de variables) el siguiente resultado16 Vd (q) = −g cos(q2 ) + Φ (z(q)) q  1  1 z(q) = q2 − √ arcsenh L 2 En esta ecuaci´on. es decir. Por supuesto. ∇q Vd (¯ un n´ umero contable de ra´ıces dados por q¯ = (Lsenh( 2iπ). los equilibrios q¯2 = iπ con i par corresponden a la viga en su orientaci´on original. con i ∈ IN . .4. x2 = q2 . >sol:=pdsolve(equ). una condici´on necesaria para asignar el equilibrio en cero es ∇z Φ(z(0)) = 0.2. iπ).x2).x1)*sqrt(1+x1\^2)+b*diff(Vd(x1. independientemente de la elecci´on de Φ. (o la constante de integraci´on κ).4. Por otro lado. Para ayudar a Maple a encontrar una soluci´on adecuada introduciremos el cambio de coordenadas x1 = L1 q1 . para satisfacer (4.Cap´ıtulo 4. el bucle cerrado tiene otros puntos de equilibrio. Ciertamente. y la EDP puede ser entonces reescrita como sigue # ∂Vd ∂Vd a 1 + x21 (x) + b (x) = sen(x2 ) ∂x1 ∂x2  donde hemos definido a = √ 2L g  and b = g1 . Φ una funci´on arbitraria diferenciable de z.4) se obtiene # ∂Vd ∂Vd 2(L2 + q12 ) + = gsen(q2 ) ∂q1 ∂q2 Se resolver´a esta EDP empleando el programa de c´alculo simb´olico Maple. |¯ q1 | ≤ L es el equilibrio en cero. Control de sistemas subactuados mediante el m´etodo IDA-PBC 87 B. su validez se puede verificar por sustituci´ on. A este fin. mientras que para i impar la viga aparece rotada 180◦ . 10. evaluado en q¯. que toma la forma   1 2 q )) − √ 12 2 ∇2z Φ(z(¯ q )) 2 ) ∇z Φ(z(¯ 2 +¯ 2(L q 2(L +¯ q1 ) 1  q) =  ∇2q Vd (¯ 1 2 − √ 2 2 ∇z Φ(z(¯ q )) g cos(¯ q2 ) + ∇2z Φ(z(¯ q )) 2(L +¯ q1 ) 4 3 8 2 6 1 4 0 2 −1 −2 0 −0. El sistema de la bola en la viga demostrar´a a continuaci´on que. Al compararlas se aprecia que las curvas de nivel de Vd sufren una especie de escalado en el eje q1 al aumentar el valor de kp . utilizado concienzudamente. para una elecci´on adecuada de Φ.2) p2 . Para estudiar la estabilidad de los equilibrios comprobaremos la positividad del Hessiano de Vd .4 −3 −0. puede servir para moldear los subconjuntos de nivel de la funci´on de Lyapunov a fin de mejorar el comportamiento transitorio.9 y 4.2 0.1) ∇q1 Hd − (Md M −1 )(2. podremos hacer los primeros equilibrios estables y los u ´ltimos inestables.88 4.4.6 −0.4. Este hecho. como se ver´a m´as adelante en este cap´ıtulo.8) Vd = g[1 − cos(q2 )] + q2 − √ arcsenh 2 L 2 donde hemos a˜ nadido una constante para trasladar el m´ınimo a cero. dependiendo de si la viga est´a en su posici´on original o rotada 180◦ . que en este caso toma la forma ues = ∇q2 H − (Md M −1 )(2.2.6 Figura 4. An´alisis de estabilidad asint´otica Para calcular la ley de control final determinaremos en primer lugar el t´ermino de moldeo de energ´ıa ues a partir de (4. toma la forma  q  2 kp 1 1 (4. mientras que aquellos con la barra rotada son inestables. los equilibrios correspondientes a la orientaci´on original de la barra ser´an estables. C. Teniendo en cuenta que cos(¯ q2 ) = ±1.8: Energ´ıa potencial Vd en bucle cerrado.8). La nueva energ´ıa potencial (v´ease la figura 4.2) ∇q2 Hd + (J2 Md−1 )(2.2 0 0.4 −4 0. estabilidad (inestabilidad) del equilibrio queda determinada por el signo de ∇ Φ(z(¯ kp 2 Elegiremos entonces Φ(z) = 2 z . De este modo. el determinante de esta matriz es ± 2(L2g+¯q2 ) ∇2 Φ(z(¯ q )). Obs´ervense las l´ıneas de nivel de la energ´ıa potencial en bucle cerrado en las figuras 4. con kp > 0.11). y la 1 2 q )).1) p1 + (J2 Md−1 )(2. Figura 4.4.11) L + q12 L2 + q12 Es importante subrayar que. que resulta  & ' kv 2 udi = 2 p2 p1 − (4. y kv inyecta amortiguamiento a lo largo de una direcci´on especificada de las velocidades. Adem´as.8). El ajuste del controlador se simplificar´a por esta caracter´ıstica.Cap´ıtulo 4. as´ı como la complejidad del c´alculo. .2. a pesar de su aparente complejidad. el papel de los par´ametros de ajuste admite un sencillo an´alisis: kp es un ganancia proporcional bona fide en posici´on. ya que multiplica t´erminos que crecen linealmente en q.10: Curvas de nivel de Vd (q) alrededor del origen para kp = 0. ya que la saturaci´on debe ser evitada en aplicaciones pr´acticas.9) − L2 + q12 p1 + 2p1 p2 + $ 2(L2 + q12 ) L2 + q12 donde %  #  q  2 + q2 1 L 1 1 2 ξ(q) = gq1 cos q2 − g 2(L2 + q1 )senq2 − kp q2 − √ arcsenh 2 L 2  La fase de dise˜ no del controlador se culmina con el t´ermino de inyecci´on de amortiguamiento (4. Reemplazando las funciones obtenidas para Md y j. tal y como se ilustra en el apartado de simulaciones. Esta es una propiedad muy importante para el control.9: Curvas de nivel de Vd (q) alrededor del origen para kp = 0. el controlador est´a definido globalmente y en su exponente m´aximo es cuadr´atico. y tras algunos c´alculos directos se obtiene la expresi´on   # √ q1 1 2 2 p2 + ξ(q) ues = √ (4. Control de sistemas subactuados mediante el m´etodo IDA-PBC 89 Figura 4.05.01.4. 90 4. Proposici´ on 4.4. .4. Un resultado m´as pr´actico. pero con la diferencia fundamental de que la convergencia a cero de la bola s´olo es local.3. Por otro lado. q2 ) = g(1 − cos q2 ) + q˜12 2 (4. en lugar de comprobar la detectabilidad se invocar´a el teorema de Matrosov17 . para todas las condiciones iniciales. p) = q1 .4. q2 )p + V˜d (˜ q1 .11). y kp .2.11). Entonces. Para sumergir el sistema en este cilindro cambiaremos la primera coordenada por q  1 1 q˜1 = q2 − √ arcsenh (4.4. se desarrollar´a en el pr´oximo apartado. el origen es un equilibrio asint´ oticamente estable con dominio de  atracci´ on Ωc¯ donde Ωc¯ = {(q. por ejemplo.3).1. p) ≤ c¯}. y con derivada semidefinida negativa. donde Hd toma la forma (4. El sistema de la bola en la viga Daremos en este momento un primer resultado de estabilidad asint´otica similar a aqu´el obtenido para el p´endulo de disco inercial.4.2.14) que es propia y definida positiva en IR × S × IR2 .4.4.5).4. ∞)) define un sector triangular dentro del primer y tercer cuadrante del plano p1 − p2 .8). para establecer la estabilidad asint´otica. excepto un conjunto de medida cero. De forma similar a la prueba de la Proposici´on 4. para probar la propiedad de “cuasi” convergencia establecida previamente observaremos al sistema en IR × S × IR2 para establecer el acotamiento de todas las trayectorias.4. Consecuentemente se obtiene que W ˙ donde W ˙ es una funci´on no desvaneciente definida en el conjunto {(q. q2 ) p M d 2 kp  V˜d (˜ q1 . Md viene dada por (4.4. es decir. Consid´erese el modelo de la bola en la viga (4. Adicionalmente. para “casi” todas las trayectorias se tiene que limt→∞ q2 (t) = 0. y las condiciones del teorema se satisfacen (en un entorno de cero) siendo Hd la funci´on de Lyapunov requerida. el teorema 5. respectivamente. el cual (dado que el rango de q1 comprende (−∞.12) L 2 y definiremos coherentemente la funci´on de energ´ıa  1  ˜ d (˜ ˜ −1 (˜ H q1 . Sin embargo. q2 .5 de (Rouche & Mawhin 1980). p) ∈ IR4 | Hd (q. El resto de la prueba 17 V´ease. y Vd y c¯ definidas seg´ un (4. (4.13) (4.9)–(4. p)|Hd = 0}. Esto prueba la acotaci´on de todas trayectorias en IR × S × IR2 .1.4.9).3) en bucle cerrado con la realimentaci´ on est´atica del estado IDA-PBC u = ues + udi .2. con (4. La estabilidad del equilibrio en cero se desprende de verificar las condiciones de la Proposici´on 4. que toma en consideraci´on la longitud finita de la viga. Demostraci´on. kv > 0. el sector ˙ = 0 vive en el los cuadrantes dos y cuatro. H˙ d = 0 si y s´olo si 1 p2 L2 + q12  p1 = L2 2 p2 + q12 v´ease (4. Para ello se tomar´a una funci´on auxiliar W (q) = q1 + q2 cuya derivada a lo largo de las trayectorias del sistema en bucle cerrado es ˙ = p1 + W Ahora. la bola converger´ a asint´oticamente al origen con inclinaci´ on nula cd la viga.1. 1 que en bucle cerrado el origen es un equilibrio asint´oticamente estable con la energ´ıa total como funci´on de Lyapunov. q2 . estudiando el efecto del par´ametro de ajuste no del dominio de atracci´on. . algunos conjuntos de nivel definidos como {x ∈ IRn |Vd (x) < c} pueden descomponerse en una serie infinita discreta de componentes conexas. Control de sistemas subactuados mediante el m´etodo IDA-PBC 91 es similar a la presentada para el p´endulo de disco inercial. y cuantificando expl´ıcitamente un conjunto de kp en el tama˜ condiciones iniciales tales que la bola permanece todo el tiempo dentro de los l´ımites de la viga es decir. Esto se debe a que en el controlador de la bola en la viga.. el t´ermino de moldeo de energ´ıa depende expl´ıcitamente de p... entonces los conjuntos acotados proporcionan una estimaci´on del dominio de atracci´on... En estas coordenadas la funci´on de energ´ıa po18 N´otese que el mapeo de coordenadas (q1 . debido a la existencia de funciones peri´odicas. q2 ) .. Si ´este es el caso. Antes de continuar cabe puntualizar que en un campo potencial como el de Vd .. adem´as del t´ermino de inyecci´on de amortiguamiento. q1 Subconjunto conexo de Vd<c conteniendo al origen q2 Componentes del conjunto de nivel Vd<c Figura 4. tendremos que Vd (q(t)) ≤ Hd (q(0). p(0)).. donde q˜1 se introdujo en (4. D.11: Componentes desconectadas del conjunto de nivel Vd (x) < c. .. nos interesaremos por la componente que contiene al origen.. |q1 (t)| ≤ L para todo t ≥ 0. cabe destacar que a medida que Hd decrece y siempre que la energ´ıa cin´etica sea no negativa. 2 Antes de cerrar este apartado cabe destacar que en este ejemplo no es posible reemplazar medidas de velocidades por las derivadas sucias de la posici´on. .11). al ser ´este el equilibrio a estabilizar (v´ease la figura 4. Para estudiar estos conjuntos es conveniente trabajar en las nuevas coordenadas (˜ q1 .4.Cap´ıtulo 4.4. y por tanto los subconjuntos de nivel Vd (definidos por Vd ≤ c para cada constante c) son conjuntos invariantes para q(t).. Adicionalmente.. desconectadas entre s´ı. En este apartado se refinar´a este an´alisis. si podemos demostrar que la energ´ıa cin´etica est´a acotada. . . recordando que para todo esquilibrio estable tendremos el comportamiento asint´otico deseado en q2 . En primer lugar. Comportamiento transitorio Se ha establecido en la Proposici´on 4. p1 . . mientras que los otros equilibrios son inestables. p2 ).12)18 . y recu´erdese .→ (˜ q1 . q2 ) define un difeomorfismo global. En este apartado {(˜ q1 . Por tanto nos concentraremos exclusivamente en la acotaci´on de q2 . y kv > 0. q2 ) ≤ c}. que la acotaci´on de los subconjuntos de nivel es invariante bajo la acci´ on de difeomorfismos. toman la forma mostrada en la figura 4.12: Curvas de nivel de V˜ (˜ q1 . q2 ).4. q2 ) | q˜1 = 0}.2. al ser k2p q˜12 ≤ c − g(1 − cos q2 ). y consecuentemente q2 est´a acotada. y que denotaremos por Ξc . El conjunto Ξc est´ a acotado si y s´olo si c < 2g. q2 ) | V˜d (˜ estamos interesados en la partici´on conexa que contiene al origen. π)}. Para simplificar la notaci´on usaremos (·)o para designar el valor de las funciones en el instante inicial t = 0.4. con (4. .11).14)—que tiene la misma expresi´on anal´ıtica que la funci´on de energ´ıa total del p´endulo simple—y los asociados subconjuntos de nivel.3. q1 . y 2 consecuentemente q2 es no acotada. q2 ) | q2 ∈ (−π. Consid´erese el modelo de la bola en la viga (4.3) en bucle cerrado con la realimentaci´ on est´atica del estado IDA-PBC u = ues + udi . q2 ) < c ⇒ cos(q2 ) > 1 − > −1 g donde se ha usado la positividad de kp en la primera desigualdad y c < 2g para obtener la segunda. Nos encontramos en situaci´on de presentar el principal resultado de esta secci´on. supondremos que c ≥ 2g.12.4.4. Lema 4. El hecho de que todos los elementos q˜1 en Ξc est´an acotados para cualquier c finita es obvio.4.92 4. (⇒) La necesidad se demostrar´a por contradicci´on. es decir. Para ello. El sistema de la bola en la viga tencial se convierte en (4. Entonces est´a claro que Ξc ⊃ {(˜ q1 . 20 18 16 14 12 q1 Ξ c 10 8 6 4 2 10 20 30 40 50 60 70 q2 Figura 4. Esto demuestra que Ξc ⊂ {(˜ q1 . Proposici´ on 4. Cabe destacar que la desigualdad estricta excluye un intervalo en torno a q2 = π y q2 = −π de Ξc . El siguiente lema b´asico ser´a instrumental en adelante.4.4.9)–(4. Demostraci´on. que es un conjunto no acotado. (⇐) Se tiene la siguiente implicaci´on c V˜ (˜ q1 . !   q  1 k g " 1  −1 kp 1 1 p < (q. Demostraci´on.2 se desprende que este conjunto estar´a acotado si y s´olo si 1 kp Hdo = (po ) Md−1 (q o )po + g(1 − cos(q2o )) + q˜12 < 2g 2 2 Claro est´a que. p) | p Md (q)p + g(1 − cos q2 ) + q2 − √ arcsenh 2 2 L 8 2kp + g 2 (4. 12 ].Cap´ıtulo 4.17) donde hemos usado el hecho de que arcsenh(·) es impar y mon´otona. A continuaci´on. . el Lema 4. todas las trayectorias que comiencen con velocidad cero y q2o ∈ (−π.16) es un dominio de atracci´ on del equilibrio en cero. de (5. concluimos que en este conjunto Md−1 (q(t)) > I para cierta constante  > 019 . Adicionalmente. que es v´alida en la mencionada banda.4. Esto. funci´on de las condiciones iniciales (q o .9.4.4. Nuestro problema es entonces calcular el mayor valor de c tal que el conjunto Ξc no intersecte las l´ıneas q˜1 = q2 ± √1 arcsenh(1).4. π) converger´ an asint´oticamente al origen. 2 2 2 y comprobaremos la intersecci´on con las l´ıneas m´as “cercanas” q˜1 = q2 ± 12 en la banda q2 ∈ [− 12 . Para simplificar las expresiones usaremos la desigualdad √1 arcsenh(1) > 1 . para obtener la primera de las siguientes desigualdades     kp 1 1 q22 kp g(1 − cos q2 ) + q2 + >g + q2 + >c 2 2 4 2 2 19 En estas circunstancias se dice que la matriz de inercia es uniformemente definida positiva. La prueba de (ii) procede a continuaci´on. haciendo c = Hdo en el Lema 4. el conjunto 1 {(q. En particular. Por tanto. unido al hecho de que 12 p (t)Md−1 (q(t))p(t) < Hdo .15) es una estimaci´on del dominio de atracci´on. Control de sistemas subactuados mediante el m´etodo IDA-PBC 93 (i) Siempre es posible calcular una constante kpM > 0.4. (ii) Fijemos kp ≤ kpM y supongamos que |q1o | < L. substituiremos q˜1 = q2 + 12 en la ecuaci´on del contorno de q2 Ξc .11).15).4. si los dos primeros t´erminos son estrictamente menores que g. Entonces.4. q(t) est´a acotado. La regi´on definida por (4. Se ha mostrado previamente que los subconjuntos de nivel de Vd (q) son conjuntos invariantes para q(t). podremos siempre encontrar una cota superior para kp tal que la desigualdad se mantenga.12) se tiene que 1 |q1 | ≤ L ⇔ |q2 − q˜1 | ≤ √ arcsenh(1) 2 (4. y emplearemos la cota cos q2 < 1 − 42 .2 establece que la partici´on conexa de los subconjuntos de nivel de Vd (q) que contenga el origen est´a acotada si y s´olo si c < 2g. p) | p Md−1 (q)p + g(1 − cos q2 ) < 2g} 2 (4. para todas las trayectorias comenzando en el conjunto (4.13 junto a los dos conjuntos Ξc . po ). establece que la correspondiente p(t) tambi´en est´a acotada y el conjunto (4.15) es una estimaci´ on del dominio de atracci´ on del equilibrio en el origen. De (4.4. Para completar la prueba del punto (i) de la proposici´on cabe comentar que.17) aparece en la figura 4. Por tanto.4. tal que todas las trayectorias comenzando en este conjunto satisfacen |q1 (t)| < L para todo t ≥ 0. tales que para todo kp ≤ kpM . Esto demuestra que el contorno de Ξc no intersecta las l´ıneas l´ımite dentro de la banda. tendremos que la energ´ıa inicial determina que . El sistema de la bola en la viga g La segunda desigualdad se cumple para todo c < 18 2kkpp+g y todo q2 en la banda.4. y lo que nos proponemos es determinar si todos los subconjuntos de nivel de Vd por debajo de esa cota son conjuntos cerrados y acotados. Se basa en una aproximaci´on de tercer orden del desarrollo en serie de Taylor que permite determinar si una elipse contiene ´ıntegramente a una determinada curva de nivel de Vd . Como se ha comentado previamente la ecuaci´on Vd (t) ≤ Hd (0) establece una cota superior para la energ´ıa potencial. |q2 | < 12 . con m = √1 arcsenh(1). ´esta es una soluci´on afortunada que deriva de la similitud entre la funci´on de energ´ıa potencial tras el cambio de variable q1 ⇒ q˜1 y la energ´ıa mec´anica del p´endulo simple. Bajo la suposici´on de que no siempre nos encontraremos en tales circunstancias.3 M´etodo aproximado de la elipse exterior Pese a haber determinado de forma exacta el m´aximo conjunto de nivel acotado de la funci´on de energ´ıa potencial en el sistema bola y viga controlado mediante IDA-PBC. Por otra parte no pueden intersectar fuera del intervalo porque c > g(1 − cos( 12 )) implica que g en Ξc . Esto completa la demostraci´on.94 4. 2 2 4.4. en cuyo caso se concluye que ´esta es cerrada. p) = (q(0). Sea una trayectoria comienza en cierta posici´on inicial (q.13: Interpretaci´ on gr´ afica de |q1 | < L. En caso afirmativo. p(0)). se mostrar´a a continuaci´on un m´etodo alternativo que inicialmente sirvi´o para abordar el mismo problema de la bola y la viga de manera aproximada y que presenta la ventaja de admitir formas m´as generales para la funci´on Vd obtenida como soluci´on en el m´etodo IDA-PBC. y esta cota en c es menos estricta que c < 18 2kkpp+g . p(0)) con energ´ıa inicial Hd (0) ≡ Hd (q(0). 20 18 q1=q2+m 16 14 q =q −m 1 V >c ≠ |q |<L 12 d 2 2 1 V <c ⇒ |q |<L q1 d 2 1 10 V c ≠ |q |<L d 2 8 1 6 4 2 10 20 30 40 50 60 70 q2  Figura 4. 4.4. kp > 0. p1 . emplearemos un cambio de coordenadas 1 (z. p1 .4. q2 ) | V˜ (z. Esto nos lleva al siguiente lema:  Lema 4. q2 ) > (Sc ∩ D) = Sc γg 2 q 4 2 + kp 2 z 2 ⇒ (Ωc ∩ D) ⊂ Pero al ser Ωc ∩ D un conjunto conexo que contiene al origen. p2 ).11) y def´ınase el conjunto  Sc = {(z. q2 ) = −γg(1 − cos q2 ) + z 2 2 (4. V˜ (z.19) ˜ d (z. Por tanto se deduce de (i) y (ii) que Ω0c ⊂ D y necesariamente Ω0c ⊂ Sc . q2 ) | q2 ∈ − 2π . y probaremos que Ω0c ∩ D = Ω0c (⇔ Ω0c ⊂ D) por contradicci´on: i) Ωc ∩ D = ∅ lo cual es imposible.4. q¯1 ) de V˜ (z.Cap´ıtulo 4. La funci´on de energ´ıa en las nuevas variables H toma la forma  γ T ˜ −1 p + V˜ (z. q2 ) = c kp 2 γg 2 no puede satisfacer la ecuaci´on 4 q2 + 2 z = c. un subconjunto de nivel de la funci´on V˜ (z. p) morfismo global.19). q2 ) ha sido tambi´en introducida para recalcar la donde la matriz M dependencia lineal de Md con γ1 . 2 Para todo c que satisfaga c < γg π9 se tiene Ω0c ⊂ Sc   2  }. q2 ) ˜d = p M H d 2 kp  V˜ (z.20) 1 − cos q2 > 4 3 3 Para demostrarlo s´olo hay que observar el t´ermino indeterminado de cuarto orden en forma diferencial (lagrangiana) del desarrollo en serie de Taylor de la funci´on cos(x) en torno a x = 0.4. que γg 4 2 En virtud de (4. q2 ) ≤ c}. Sea Ω0c el mayor subconjunto conectado de Ωc que incluya al origen (v´ease la figura 4.20) se tiene ∀ (z. recordando que dicho cambio representa un difeo˜ d (z. ya que {0} ∈ Ωc ∩ D Ω0c ⊂ D ⇔ ii) Ωc ∩ (R2 \D) = ∅ y (i) ⇒ ∂Ω0c ∩ ∂Sc = ∅ (porque Ω0c es conexo) donde ∂Ω0c y ∂Sc son las l´ıneas de contorno de Ω0c y Sc respectivamente. 2 . q2 .4. Sea Ωc = {(z. Evidentemente. entonces ∃ z ∈ IR tal Demostraci´on. Control de sistemas subactuados mediante el m´etodo IDA-PBC 95 las trayectorias est´an contenidas en curvas de nivel cerradas que permiten calcular cotas para las trayectorias. Sin embargo ´estas no intersectan dentro de D porque en este conjunto una soluci´on (¯ z . Sea D = {(z. q2 ) = γMd (q1 .4. Hd (0) depende de las condiciones iniciales del sistema. 2π 3 3 q 2 + k2p z 2 = c. (4. z = q2 − √2 arcsenh √q1κ . y por tanto Sc ⊂ D. para cierto valor c > 0. Si c > γg π9 . p2 ) = Hd (q. q2 ) | γg q 2 + k2p z 2 ≤ c} que est´a delimitado por una elipse para cualesquiera 4 2 valores γ > 0. q2 ) definida en (4. q2 ) ∈ D. entonces Ωc ∩ D = Ω0c ∩ D. Al igual que se hizo en la secci´  on anterior.18) (4. q2 . Para encontrar una estimaci´on de la regi´on de atracci´on con trayectorias acotadas emplearemos un hecho matem´atico elemental q22 2π 2π ∀q2 ∈ − . p0 ) ∈ Ωc . ∀(z0 . Lema 4. y en el siguiente lema se mostrar´a que. Este resultado caracteriza la regi´on de atracci´on del origen como una condici´on sobre la energ´ıa inicial Hd (0) y define un rango v´alido para kγp .01 (4. q20 . Un caso interesante es el sistema arrancando con velocidad nula. Si ahora hacemos c = Hd (0) en el lema 4. p0 ) el estado del sistema de la bola y la viga en el instante t = 0. ´estas deben caer enteramente dentro del intervalo q2 ∈ [−π. Sustituyendo este punto en la ecuaci´on V˜ (z. q2 ) ≤ c} est´a acotado = 2γ El resto del an´alisis (garant´ıa de permanencia de la bola dentro de los l´ımites de la viga) es equivalente a lo presentado en la secci´on anterior. π2 . Entonces.  ˜ −1 (z0 . 0) se encuentra dentro del dominio de atracci´on del origen. N´otese tambi´en que para velocidades iniciales distintas de cero la energ´ıa cin´etica es un t´ermino positivo a˜ nadido al segundo miembro de (4. dado que (z(t). q20 . q20 )p0 + g(1 − cos q20 ). y se convierte en una condici´on necesaria pero no suficiente.21). Entonces 12 pT Md−1 p > α||p||2 y empleando el hecho de que Vd (t) ≥ 0 ⇒ 12 pT Md−1 p < Hd (0) 2 se deduce que α||p||2 < Hd (0) para concluir que p ∈ L∞ . 9 y kp γ < 2 z02 π2 9 −h . p0 ) ∈ {h < π2 }. z) < c dentro de Sc en torno al origen para un rango de valores de c. para que la pertenencia de (z0 . Otro hecho importante es que la construcci´on de curvas de nivel acotadas que satisfagan ˜ V (z. pero la elecci´on de kγp s´ı lo hace. El sistema de la bola en la viga Este lema demuestra la existencia de un subconjunto conexo de V˜ (q2 . M´as a´ un. lo cual es cierto para todas las condiciones iniciales que cumplan q20 ∈ [−π. γ tal que en bucle cerrado el estado inicial (z0 . si no se cierran en este intervalo. q2 (t)) ∈ L∞ ⇒ ∃α > 0 | α < λmin (Md−1 (z(t). p0 ) al conjunto Sc se reduzca a π2 cos(q2 ) > 1 − ≈ −0. Esto sucede porque si las curvas de nivel de V˜ han de ser cerradas.4 se tiene que Ω0c = {(V˜ (z. 0 0 y por tanto (z(t).4.4. q20 . Si embargo vamos a observar .96 4. Esto puede interpretarse como una condici´on suficiente para la existencia de un par de valores kp . Demostraci´ on.21) 9   condici´on que se satisface para todo q20 ∈ − π2 . no se cierran nunca). π] (debido a la periodicidad de q2 . N´otese que esta condici´on no depende de z y por tanto tampoco de q1 . se trata de un invariante. p0 ) = 12 pT0 M d 9 ∀ kp γ < 2 z02 π2 9 − h las trayectorias (z(t). Al ser Ω0c un subconjunto conexo completo de Ωc = {˜ q |V˜ (˜ q ) < c}. Sea (z0 . Sea h(z0 . q2 ) = c al aumentar el valor de c termina por encontrar un l´ımite superior absoluto.4. q2 ) = c se obtiene ) ( ˜ max c > 0 | {V (z. q20 . Por tanto la mayor curva de nivel contenida en este intervalo es aqu´ella que intersecta el eje q2 en q2 = π.4. 0. Partiendo del hecho de la disipatividad con respecto a Hd en bucle cerrado hemos mostrado que todas las trayectorias est´an confinadas en el conjunto V˜ (z. bajo ciertas condiciones. π] y tengan una energ´ıa menor que Hd (0). contendr´a todas las trayectorias del sistema. q2 ) < kp 2 π2 Hd (0)) ∩ D} est´a acotado por la elipse  Sc si Hd (0) = γh + 2 z0 < γg 9 lo cual es cierto si y s´olo si h < π2 . Este conjunto Ω0c es u ´nico en el intervalo q2 ∈ [−π. q2 (t)) ⊂ Ωc si (z0 . y p(t) ∈ L∞ . q2 (t)) caen en Ω0c ⊂ Sc . q2 ) < Hd (0). π].5. q2 . q2 (t))) ∀t. q20 .4. q2 ). En las coordenadas (z.22) |q1 | ≤ L ⇔ |q2 − z| ≤ √ arcsenh √ κ 2 Esto se debe a que     . una trayectoria dentro de los l´ımites de la barra satisface el hecho ! "   1 L  =m (4.4. Control de sistemas subactuados mediante el m´etodo IDA-PBC 97 el efecto de la constante κ (que antes se hizo igual a 1) sobre la posici´on de los equilibrios.Cap´ıtulo 4. . √ √ L −L L . . |q1 | ≤ L ⇔ . senh 2(q2 − z) . q2 ) de pendiente 1 (ver figura 4. Las gr´aficas en la fila superior representan la posici´on de la bola q1 y el ´angulo de la viga q2 para una velocidad inicial nula y diferentes posiciones iniciales y valores de los par´ametros.3. Esto proporciona un m´aximo absoluto para m en √12 arcsenh(2). 1.15. El efecto de la viga de longitud finita y el uso de la u ´ltima parte de la Proposici´on 4. Consecuentemente. q2 )|V˜ (z. La tercera simulaci´on comienza en reposo con la viga en posici´on horizontal y la bola en el extremo de la viga.3 se ilustra mediante simulaci´on en la figura 4. al entrar en escena nuevas oscilaciones. q2 ) < c} est´a completamente contenido en |q1 | < L si y s´olo si el contorno ∂Ω0c no intersecta la l´ınea z = q2 ± m. Los resultados aparecen en la figura 4. Por tanto. N´otese que la convergencia no es siempre acelerada para valores mayores de kv .8.14.22) define dos l´ıneas paralelas z = q2 ± m sobre el plano (z. se ha observado que el controlador funciona mejor comenzando en q2 (0) = 0 y cualquier valor de q1 (0).5.1038. En la segunda simulaci´on el sistema parte del estado (q 0 . 4. 0. El valor de m es.0928. La primera simulaci´on comienza en el estado (q 0 .13). kp se ha escogido por debajo de kpM de acuerdo con la Proposici´on 4. kv = 50. La figura 4. Al pie de cada una de ellas se muestran las gr´aficas correspondientes con el hamiltoniano deseado Hd y la funci´on de energ´ıa potencial Vd . kp = 1. Los valores asignados a los par´ametros son g = 9. fundamental para dise˜ no con especificaciones de sobreoscilaci´on y puede ser alejado de la curvas de nivel de inter´es reduciendo el valor de κ 2 hasta su m´ınimo permitido. En las dos primeras simulaciones se puede observar el efecto de aumentar la constante de amortiguamiento kv comenzando con la bola en posici´on vertical.14 tambi´en ilustra la naturaleza mon´otona de Hd junto al hecho de que Vd (t) < Hd (t) < Hd (0) para todo t. 0.4 Simulaciones Se ha realizado un conjunto de simulaciones del sistema de la bola en la viga tomando g = 9. p0 ) = (8.8. 0. por tanto. y L = 10. el conjunto Ω0c = {(z. En sucesivas simulaciones. p0 ) = (6. 1) con Hd (0) = 0.4. Cada columna en la gr´afica corresponde a una simulaci´on aislada.4. La ecuaci´on (4. el controlador es incapaz de atrapar la bola antes de abandonar el l´ımite de la barra (L = 10).4. Debido a la velocidad inicial. 1) no y as´ı los y Hd (0) = 0.4. la cota |q1 | < L est´a garantizada por el dise˜ corroboran los resultados de la simulaci´on. Se ha calculado que la condici´on para mantener la bola dentro de los l´ımites de la viga es Hd (0) < 0. Para asegurar que la condici´on inicial se halla en el dominio de atracci´on. < √ ⇔ arcsenh √ ≤ 2(q2 − z) ≤ arcsenh √ κ κ κ donde se ha empleado el hecho de que arcsenh(x) es mon´otona impar (de clase K∞ ). kp = 1 . que se encuentra en L2 +  para cierto valor  > 0 peque˜ no pero no nulo.1837. . ).) q1(0)=0.).6.) -150 q1(0)=0.5 q1(0)=10.0.1 0. Kv=50.).6.). L=0. q2(0)=0. q2(discont. L=0. 300 .). L=0.) q1(cont. q2(discont.14: Simulaciones de la bola en la viga comenzando en reposo.). L=10.0.6.2 Hd(cont. q2(0)=1. q2(0)=0. q2(discont.15 0.0.) Hd(cont.). El sistema de la bola en la viga 0 -50 -100 0 0 -50 -100 -150 50 100 0 Posicion frente al tiempo(s) Hd(cont.0 15 0.0.0 50 10 q1(cont.05 50 100 Energia frente al tiempo(s) 0 0 100 200 300 Energia frente al tiempo(s) Figura 4.98 4.).6. Kv=20.) 6 2 0 2 0 -2 -2 -4 -4 -6 -8 0 50 100 150 tiempo(s) 200 250 300 -6 0 50 100 150 tiempo(s) 200 250 Figura 4. La bola sobrepasa el extremo de la barra 12 La posición de la bola es siempre inferior a L 8 10 6 8 4 4 q1(cont. q2(0)=1.) q1(0)=0. q2(0)=1. L=10. Kv=1.) q1(cont.) q1(cont.5 q1(0)=10. Vd(discont. q2(discont.15: sistema de la bola en la viga comenzando con velocidad inicial no nula.0. Vd(discont.0. Kv=1. q2(0)=1.5 15 10 5 0 0 50 100 Posicion frente al tiempo(s) 5 0 -5 -10 0 100 200 300 Posicion frente al tiempo(s) q1(0)=0. Kv=50.0. L=0. q2(discont.0.4.5 50 10 50 100 Energia frente al tiempo(s) 5 0 0 0. Kv=20. Vd(discont. Estas ecuaciones son f´aciles de resolver. En primer lugar. Dichas soluciones proporcionan la matriz de inercia Md (moldeo energ´ıa cin´etica) y la funci´on de energ´ıa potencial Vd . se presentar´an los antecedentes existentes en cuanto a m´etodos de reducci´on y resoluci´on de ecuaciones de ajuste (matching conditions) para m´etodos de control basados en la estructura la99 . para sistemas de dos grados de libertad y un actuador. especialmente en sistemas de dos grados de libertad. este sistema es en general de dif´ıcil soluci´on. analizando las ecuaciones reducidas . M´as a´ un. Las soluciones obtenidas mediante esta t´ecnica se aplican al moldeo de energ´ıa en problemas de estabilizaci´on de sistemas subactuados con cierto grado de generalidad. La exposici´on se desarrollar´a en el siguiente orden. como es el caso del p´endulo en su posici´on horizontal. La principal aportaci´on de este cap´ıtulo es la definici´on de una clase de sistemas mediante un conjunto de condiciones f´acilmente satisfechas. Adem´as. se obtiene un controlador suave con una amplia cuenca de atracci´on para los sistemas de la bola en la viga y el p´endulo invertido en carro. Este procedimiento completo se ilustra con el ejemplo del p´endulo invertido. comprendidos en esta clase. Mediante la nueva formulaci´on. Tal y como ilustran los ejemplos analizados. Para dise˜ nar la ley de control el resto del procedimiento presentado en el cap´ıtulo anterior es de directa aplicaci´on. se arroja una luz sobre problemas como la p´erdida de controlabilidad en ciertos puntos. ambos en bucle cerrado.Cap´ıtulo 5 Reducci´ on del m´ etodo IDA-PBC para sistemas subactuados 5.1 Introducci´on Se observ´o en el cap´ıtulo anterior que la principal virtud del m´etodo IDA-PBC reside en que la funci´on de energ´ıa total en bucle cerrado se obtiene –mediante la soluci´on de una ecuaci´on diferencial parcial (EDP)– como un resultado de nuestra elecci´on de la interconexi´on de subsistemas y el amortiguamiento. las EDOs admiten una reparametrizaci´on de los elementos de la matriz de inercia en bucle cerrado que conducen a una soluci´on algebraica directa del sistema de ecuaciones. que admiten ciertas manipulaciones algebraicas de las EDPs dadas por el m´etodo IDA-PBC para dar lugar a un sistema reducido equivalente de ecuaciones diferenciales ordinarias (EDOs). 2. A continuaci´on se dar´a una definici´on de la clase de sistemas hamiltonianos para los que es v´alida la reducci´on aqu´ı propuesta. se ha demostrado que en algunas casos que incluyen conocidos ejemplos. (iii) La matriz M tiene el bloque M θθ constante. En las secciones siguientes se detallan los desarrollos que conducen a las reducciones de las ecuaciones de moldeo de energ´ıa cin´etica y potencial. En una serie de interesantes art´ıculos. .2. Reducci´on de las EDPs de ajuste en m´etodos lagrangianos grangiana. q) al igual que en (Bloch et al. q) ˙ = 12 q˙ M (x)q˙ − V (x). resulta conveniente particionar las coordenadas generalizadas como q = [x . θ ] . . 5. k = 1. ilustrando su aplicaci´on de forma paralela mediante conocidos ejemplos de sistemas subactuados. 2000). (ii). es decir. . Esto induce una partici´on natural de la matriz de inercia como   M xx M xθ M= M θx M θθ Como en (Bloch et al. θ ∈ IRn−r . 2000. (N´otese que.19) se reduce a una ecuaci´on algebraica   I ∇x V = 0 [I 0](I − M Mc−1 ) (5. Chang et al. Con este fin. . introduciremos las siguientes suposiciones: (i) El lagrangiano es independiente de las coordenadas θ. la soluci´on de estas EDPs puede ser obviada. En este caso el lagrangiano toma la forma L(x. 2000). . son variables c´ıclicas. j = 1. con x ∈ IRr . la condici´on de ajuste (4. bajo las suposiciones (i). G = [0 I] . es necesario resolver ciertas EDPs de ajuste—una tarea casi siempre dif´ıcil. 2001) se han interpretado estas condiciones usando la notaci´on empleada en este cap´ıtulo.2. . es decir. Ortega. Rubio & Aracil 2001). Se ampliar´a el estudio a un sistema de orden mayor que dos contenido en la clase reducible y a un sistema no controlable. Los resultados del cap´ıtulo dieron lugar a la publicaci´on (G´omez-Estern. y satisface1 ∇xj M xi θk = ∇xi M xj θk . . En (Blankenstein et al. respectivamente. 2002).100 5. . entre ellos (Bloch et al.) Una primera observaci´on que se desprende es que en este caso.2 Reducci´on de las EDPs de ajuste en m´etodos lagrangianos Se ha puntualizado repetidamente que en los m´etodos de control lagrangiano o hamiltoniano. Ahora resumiremos brevemente estos resultados. A continuaci´on tomemos el lagrangiano como Lc (x. . n − r ˙ = 12 q˙ Mc (x)q˙ − V (x). 2000). s´olo aspiramos al moldeo de la energ´ıa cin´etica. El cap´ıtulo se concluye con la presentaci´on de resultados de simulaci´on de dichos sistemas. Recordaremos algunos resultados publicados en la literatura que permiten simplificar este problema. r. (ii) Las coordenadas θ–son completamente actuadas.1) 0 1 Estos son las condiciones de ajuste 2 y 4 simplificadas de (Bloch et al. i. satisfaciendo las llamadas condiciones de ajuste simplificadas. de la forma (x = x¯. θ˙ = 0). 2002).18) son satisfechas autom´aticamente. En (Blankenstein et al. κM θx 0 con κ ∈ IR. x˙ = 0. su primera condici´on de ajuste M-1 es equivalente a la acondici´on algebraica   I [I 0](I − M Mc−1 ) = 0. por tanto la energ´ıa cin´etica deber´ıa tambi´en tener un m´aximo en este punto. las EDPs (4.19).19) es s´olo el primer paso en el procedimiento de dise˜ no. Aunque es de dif´ıcil justificaci´on desde un punto de vista f´ısico.2. esto da lugar a un juego de una ecuaci´on cuadr´atico y dos EDPs lineales de primer orden.2.2. Esta caracter´ıstica es esencial en (Bloch et al.1). 2000) coinciden exactamente con la EDP (4. 2001) las t´ecnicas empleadas en (Auckly et al.18). v´ease tambi´en (Andreev et al. 2000) donde la energ´ıa potencial no se modifica por el control y tendr´a t´ıpicamente un m´aximo en el equilibrio deseado.2. basados en consideraciones geom´etricas dan lugar a las llamadas ecuaciones–λ. y adem´as. Los desarrollos de (Auckly et al. (4. de sistemas conservativos son estables si el Hessiano de la energ´ıa total es de signo definido (positivo o negativo). Auckly y Kapitanski (Auckly & Kapitanski 2001) realizan una de las principales contribuciones en la l´ınea iniciada por (Bloch et al. De hecho. es la prueba de que todas las soluciones de esta ecuaci´on pueden ser obtenidas secuencialmente resolviendo un conjunto de tres EDPs lineales. 2000). 2000). (Auckly & Kapitanski 2001).18). (4.2. La primera EDP es cuadr´atica en el sentido de que contiene t´erminos cuadr´aticos de las variables a despejar.Cap´ıtulo 5. para la clase de Mc considereda en (Bloch et al.1 la matriz Md deber´ıa ser definida positiva (al menos en un entorno del equilibrio q∗ ). tambi´en est´a establecido que las condiciones de ajuste M-2 y M-3 de (Bloch et al. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 101 Una contribuci´on fundamental de (Bloch et al.2. 2000) se ha mostrado que los equilibrios relativos. De hecho para establecer la estabilidad usando la Proposici´on 4. podemos de este modo usar estos m´etodos para estabilizar localmente los (equilibrios relativos de) sistemas mec´anicos conservativos con una matriz de inercia en bucle cerrado definida negativa.1 Las ecuaciones λ En una serie de art´ıculos. En el teorema 3. La contribuci´on m´as importante de (Auckly et al. M´as a´ un. 2000) es la demostraci´on de que. 0 la cual a la luz de (5.4 de (Bloch et al. 2002). Deber´ıamos recordar que resolver las EDPs (4. 2001) se muestra que. los cuales incorporan el par´ametro libre Uk . Para su interpretaci´on conviene notar que en geometr´ıa . claramente obvia la EDP de energ´ıa potencial (4. 5. 2002) pueden ser extendidas al estudio de la EDP (4. Vd deber´ıa tener un m´ınimo local aislado en q∗ .2. aunque las derivadas siguen apareciendo de forma lineal en la ecuaci´on.2. Para ello la soluci´on de las EDPs proporciona ciertos grados de libertad en el dise˜ no.2. Como se muestra en (Blankenstein et al.12). 2000) con el fin de transformar las ecuaciones de ajuste para el control de sistemas subactuados preservando la estructura lagrangiana. para siguiente clase particular de Mc .2.19).   κ(κ + 1)M xθ (M θθ )−1 M θx κM xθ Mc = M + . . seg´ un admiten los propios autores en (Andreev et al. En el marco de esta tesis. λja Cˆr = Ca λja ∂ Vˆ ∂ Vˆ = ∂xr ∂xa siendo Cr i y Cˆa los t´erminos disipativos en bucle abierto y cerrado. Cˆr y Vˆ . si elegimos la matriz de inercia como tensor m´etrico denot´ando gij a los elementos de dicha matriz en bucle abierto y gˆij en bucle cerrado. Estas ecuaciones permitir´ıan obtener. no obtiene siquiera el rendimiento alcanzado con un controlador lineal. respectivamente.2. En este contexto es un hecho que gik g kj = δij (5. pero en casos como la bola en la viga. En virtud de (5. a] λra [j k. la soluci´on propuesta por Auckly y Kapitanski. aunque podr´ıan derivarse unas ecuaciones–λ equivalentes a partir de las de Auckly bas´andose en la equivalencia entre las ecuaciones de Lagrange y las de Hamilton.2. Una vez halladas las inc´ognitas gij gˆij . Por el contrario. Adem´as si se define el s´ımbolo de Christoffel de segunda especie como:   1 ∂gjk ∂gik ∂gij [i j. si dicha integral no tuviera primitiva conocida. no se conoce un enfoque similar. Reducci´on de las EDPs de ajuste en m´etodos lagrangianos Riemanniana es posible dotar al espacio de configuraci´on de un tensor m´etrico distinto de la identidad expresado como gij en coordenadas covariantes y g ij en coordenadas contravariantes. en algunos casos se resuelven de manera tan simple como la obtenci´on de la integral indefinida de una funci´on de variable u ´nica. existen grados de libertad suficientes para buscar otras integrales “mejores candidatas”.2) se deduce que g ij (ˆ g ij ) denota los elementos de la inversa de la matriz de inercia en bucle abierto (cerrado). en los que dichas ecuaciones se transforman en otro sistema de ecuaciones diferenciales ordinarias que admiten una soluci´on general para el moldeo de la energ´ıa cin´etica y potencial. En este cap´ıtulo se aborda el problema de manera diferente: se partir´a de las ecuaciones generales del m´etodo IDA-PBC introducido en el cap´ıtulo anterior y se definir´a una clase de sistemas que abarca buena parte de los subactuados m´as estudiados en control. la ley de control viene dada directamente por ˆ ˆ r])x˙ j x˙ k + (Cl − gli g ij Cˆj ) + ( ∂V − gli g ij ∂ V ) ul = ([jk.2. impl´ıcitamente.2) Este concepto puede ser utilizado para el control de sistemas mec´anicos. Estas ecuaciones reducidas. l] − gli gˆir [jk. k] = + − k 2 ∂xi ∂xj ∂x y definimos las variables λ como sigue λra = gai gˆir se llega a que todo lagrangiano controlado en bucle cerrado con matriz de inercia gˆij y energ´ıa potencial Vˆ debe satisfacer las ecuaciones ˆ r] = [j k. ∂xl ∂xj Estas ecuaciones han dado unos resultados interesantes con algunos sistemas subactuados.102 5. las variables de la matriz de inercia gˆij y la funci´on de energ´ıa potencial Vˆ en bucle cerrado. el control basado en la estructura hamiltoniana. 2000). Cap´ıtulo 5. Sea k el ´ındice de la coordenada no actuada.2.2. que al realizar la comparaci´on entre los enfoques lagrangiano y hamiltoniano del cap´ıtulo anterior. Las filas de la matriz G⊥ .20). esta es una caracter´ıstica muy com´ un para sistemas mec´anicos 2 Algunos autores (Weibel 1997) emplean el t´ermino variables de forma (shape variables) para designar aqu´ellas que aparecen en la matriz de inercia. la hip´ otesis citada equivale a decir que las u ´nicas variables de forma son las no actuadas. en primer lugar.2.. forman el n´ ucleo de la matriz de control G. 2000).3. el p´endulo invertido lineal (Bloch et al. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 103 5.3.1). y el p´endulo rotatorio de Furuta (˚ Astr¨om & Furuta 1996) pertenecen a una amplia clase de sistemas de n grados de libertad y n − 1 actuadores (codimensi´on 1).3. se asume que la matriz G⊥ coincide con la transpuesta del vector ek . A su vez.1) (5.n el resto. Con este t´ermino. Paralelamente a los avances de presentados en el ajuste de ecuaciones para los m´etodos basados en la estructura lagrangiana. .3. Entonces la EDP no lineal (4.3 Reducci´on de las ecuaciones de ajuste en IDA-PBC Cabe se˜ nalar.3) Estas condiciones se interpretan del siguiente modo. 0]1×n G= 0 In−1 n×n donde In−1 es la matriz identidad de orden n − 1. al igual que en el cap´ıtulo 4.. la condici´on (5.2) (5.2.3.2. se coment´o que si fijamos J2 en el m´etodo IDA-PBC como (4. comparten ciertas propiedades. donde se pueden hacer las siguientes hip´otesis G⊥ = eTk dMij dqk d(Md )ij = ek dqk ∇q Mij = ek ∇q (Md )ij (5. Por u ´ltimo. Si no fuera este el caso siempre se puede realizar una transformaci´on de coordenadas de modo que el subespacio subactuado aparezca de forma aislada (Isidori 1989).18).16).12) se reduce a (4. Llamamos ek al vector columna de dimensi´on n cuyos elementos son todos nulos excepto el que ocupa la posici´on k cuyo valor es 1. en este caso se tiene:   0 0 G⊥ = eTk = [1 .3. en virtud de (5. . Aunque pueda resultar extra˜ na.1 Definici´on de la clase de sistemas Gran parte de los sistemas subactuados propuestos como “retos” (benchmarks) de control en congresos y revistas de investigaci´on (v´ease la convocatoria del American Control Conference de 1998). El bien conocido sistema de la bola en la viga (Hauser et al.2) expresa el hecho de que los elementos de la matriz de inercia en bucle abierto M (q) s´olo dependen de qk . la coordenada no actuada2 .17). 1992). 5. (4. Un escenario t´ıpico ser´a aquel en el que q1 represente la coordenada no actuada y q2 . se asegura que el sistema en bucle cerrado admite una representaci´on EL de la forma (4. se presentar´a a continuaci´on un nuevo m´etodo para la resoluci´on de ecuaciones de ajuste del m´etodo IDA-PBC en una clase de sistemas mec´anicos subactuados. . 4. . La submatriz de disipaci´on R2 es definida positiva.. y se supone que toma la forma R2 = diag{r1 . Como consecuencia.4.4..8) La ecuaci´on (5.9) . rn } ri ≥ 0 (5. . p.4. las derivadas de los elementos de dicha matriz con respecto al vector de posici´on q = [q1 .3.4.2) se extiende a la matriz de inercia en bucle cerrado.1.3.1) (5. En virtud de la hip´otesis (5.7) Comentario 5. Este escalar aparecer´a en la forma [Md M −1 ]kk en adelante.6) debe cumplirse para cualquier valor del factor de los momentos generalizados.4. los elementos de la matriz de inercia propuesta para el sistema en bucle cerrado s´olo depender´an de qk .4.4. . Reducci´on de las ecuaciones de moldeo de la energ´ıa cin´etica subactuados. En los c´alculos que aparecen a continuaci´on el operador derivada dqdk (·) ser´a reemplazado por ∇qk .3) en  1 T p (∇qk M −1 )p − eTk Md M −1 ek pT (∇qk Md−1 )p + eTk (J2 − R2 )Md−1 p = 0 2 (5.6) (5. Definamos la matriz de interconexi´on deseada tal y como aparece en (4.2.2) y (5. y por tanto 1 T p Q + eTk (J2 − R2 )Md−1 = 0 2 (5..4.4) lo que sirve para transformar la ecuaci´on (5.3) transformamos el t´ermino ∇q (pT Md−1 p) = ek pT (∇qk Md−1 )p (5.3) Usando la hip´otesis (5.3.4.10) del siguiente modo  1 T p (∇qk M −1 )p − eTk Md M −1 ∇q (pT Md−1 p) + eTk (J2 − R2 )Md−1 p = 0 2 (5.2) Esto permite reescribir la ecuaci´on (4. Es natural proponer la matriz de inercia Md (q) como s´olo dependiente de la coordenada no actuada qk .4.104 5.2. .3) la propiedad (5. En virtud de (5.7). que ha de ser antisim´etrica.4 Reducci´on de las ecuaciones de moldeo de la energ´ıa cin´etica Estas ecuaciones son las m´as dif´ıciles de resolver y por tanto se considera la contribuci´on principal de este cap´ıtulo.3.5) ´ Esta u ´ltima expresi´on puede verse como 1 T p Qp + eTk (J2 − R2 )Md−1 p = 0 2  Q = ∇qk M −1 − eTk Md M −1 ek ∇qk Md−1 (5. .3) se obtiene eTk ∇q (pT M −1 p) = pT ∇qk M −1 p eTk ∇q (pT Md−1 p) = pT ∇qk Md−1 p (5. De (5.4.3. Q es sim´etrica al ser la suma de dos matrices sim´etricas: ∇qk M −1 (por la simetr´ıa de M −1 ) y la matriz ∇qk Md−1 multiplicada por el escalar −eTk Md M −1 ek . qn ]T se reducen a una u ´nica derivada con respecto a qk .3).3. 5.4. 4.10) dando lugar a n ecuaciones diferenciales ordinarias separadas con los elementos de Md como inc´ognitas.10) 2 El elemento k-´esimo de la diagonal de R2 resulta ser cero.4.11) Sustituyendo (5. Este resultado simplifica notablemente la tarea de resolver la ecuaci´on (4.4. podemos transponer la u ´ltima expresi´on y multiplicarla por la derecha por Md para llegar a 1 Md Qp = ek (J2 − R2 ) (5. y mediante restricciones adicionales impuestas a dicho t´ermino podremos garantizar que la matriz Md es definida positiva.10) en el sistema formado por de las n ecuaciones diferenciales ordinarias no lineales. Este resultado convierte la ecuaci´on matricial (5.2.2.4. con lo que se obtiene un sistema de n ecuaciones y n2 − (n2 − n)/2 = n2 /2+n/2 > n inc´ognitas. . la matriz de inercia consta de n2 elementos de los cuales los (n2 − n)/2 por debajo de la diagonal quedan determinados por la simetr´ıa.4. En el caso de sistemas de dos grados de libertad. multiplicando por la izquierda la ecuaci´on (5.4.12). Esto conduce a la conclusi´on de que no se puede inyectar amortiguamiento en la direcci´on de la coordenada no actuada.10) por el vector eTk se obtiene 1 eTk Md Qp = rk 2 que es una funci´on lineal con respecto a p y no admite una soluci´on para rk globalmente positivo (lo cual es necesario por ser un t´ermino de disipaci´on). De hecho. eTk Md Q = 0 Comentario 5. al haber una elecci´on de tres par´ametros en Md .12) [Md M −1 ]kk siempre que el escalar [Md M −1 ]kk sea distinto de cero. De ello se deduce que aumenta considerablemente el n´ umero de grados de libertad con el orden del sistema. se deduce que un elemento de la matriz de inercia es un par´ametro libre. La derivaci´on del producto (Md Md−1 ) con respecto a qk proporciona la siguiente descomposici´on ∇qk Md−1 = −Md−1 (∇qk Md )Md−1 (5.4. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 105 Al ser Q una matriz sim´etrica como se demostr´o. En sistemas con m´as de dos grados de libertad.10) se obtiene eTk Md Q = eTk [Md (∇qk M −1 ) + (∇qk Md )Md−1 [Md M −1 ]kk ] = 0 Si hacemos uso de la relaci´on eTk ∇qk Md = ∇qk eTk Md podremos finalmente aislar las derivadas de los elementos de la fila k de la matriz Md con respecto a qk [Md (∇qk M −1 )Md ]k · ∇qk [eTk Md ] = − (5. con las derivadas aisladas en el primer miembro. manteniendo su validez la sencilla formulaci´on (5.4.11) en el t´ermino apropiado de la matriz Q en (5.4.Cap´ıtulo 5. En el caso de un sistema de dos grados de libertad J2 ser´ıa el u ´nico par´ametro libre restante para el moldeo de la energ´ıa cin´etica en la variable no actuada. q2 son la posici´on de la bola y el a´ngulo de la barra. respectivamente. Denotaremos tambi´en  ∆ = det(M ) La coordenada no actuada es q1 . Por tanto es razonable proponer una matriz de inercia en bucle cerrado de la forma   a1 (q1 ) a2 (q1 ) Md = a2 (q1 ) a3 (q1 ) siendo las ai funciones a definir.106 5.4. k = 1 0 y G⊥ = eTk = [1 0]. Por tanto. figura 4. los t´erminos de M (q) s´olo dependen de la coordenada no actuada. .1.14) A˜ nadiendo a estas ecuaciones la elecci´on a3 = γa1 a2 con la constante γ > 0 lleva a la soluci´on con Md globalmente definida positiva que ha sido presentada en el cap´ıtulo anterior. Los detalles de modelado deben ser consultados en dicho cap´ıtulo.4.12) calculando los diversos t´erminos que en ella aparecen da1 da2 T ∇qk ek Md = dq1 dq1    0 0 a a 2m1 m2 q1 a1 1 2 [Md (∇qk M −1 )Md ]k · = [a1 a2 ] [a2 a3 ] =− −2m1 q1 (1 + m1 q12 )2 0 (1+m1 q2 )2 a2 a3 1   1 a1 [Md M −1 ]kk = [a1 a2 ] m2 = m2 0 Con todo ello obtenemos el conjunto de ecuaciones diferenciales ordinarias 2m1 m2 q1 a22 d a1 (q1 ) = dq1 (1 + m1 q12 )2 a1 d 2m1 m2 q1 a2 a3 a2 (q1 ) = dq1 (1 + m1 q12 )2 a1 (5.4.6.2.13) (5. Aplicaci´on de las ecuaciones reducidas al moldeo de energ´ıa cin´etica de la bola en la viga Con la nueva formulaci´on estamos en disposici´on de resolver el problema del moldeo de energ´ıa cin´etica en el sistema de la bola en la viga del cap´ıtulo anterior de una forma mucho m´as elegante. Reducci´on de las ecuaciones de moldeo de la energ´ıa cin´etica Ejemplo 1.4.3. Por facilidad de lectura recordaremos que la din´amica hamiltoniana (4. Entonces podremos aplicar directamente la ecuaci´on (5. G= 2 1 0 1 + m 1 q1 donde m1 y m2 son constantes del modelo. y q1 .2) de este sistema viene descrita por la funci´on de energ´ıa potencial V (q) = gq1 sen(q2 ) y las matrices     m2 0 0 M (q1 ) = . De acuerdo con las hip´otesis dadas en la secci´on 5. El conocido sistema a controlar se present´o en el cap´ıtulo 4. De nuevo.  Adem´as ∆ = det(M ) y M s´olo depende de q2 . Ejemplo 2. G= 1 0  En este caso q2 es la coordenada no actuada y consecuentemente k = 2 y G⊥ = eTk = [0 1].12) llegamos a un par de ecuaciones diferenciales no .4. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 107 q2 u q1 Figura 5. Moldeo de energ´ıa cin´etica en el p´endulo invertido en carro Los mismos resultados se pueden aplicar a un problema cl´asico en control no lineal subactuado. se trata de un sistema de dos grados de libertad (n = 2) descrito por las ecuaciones de Hamilton dadas en (4.2. El sistema del p´endulo invertido sobre carro aparece esquem´aticamente en la figura 5.4. Por tanto la matriz de inercia deseada se propondr´a de la forma   a1 (q2 ) a2 (q2 ) Md = a2 (q2 ) a3 (q2 ) De nuevo.2) con las matrices  M (q1 ) = a c cos q2 c cos q2 b   .12).1: P´endulo invertido en carro. se calcular´an todos los t´erminos de las f´ormulas (5.Cap´ıtulo 5.1. da2 da3 dq2 dq2  cs2  − −a1 a2 (2bcc2 ) + a1 a3 (ab + c2 c22 ) + a22 (ab + c2 c22 ) − a2 a3 (2acc2 ) ∆  cs2  2 − −a2 (2bcc2 ) + 2a2 a3 (ab + c2 c22 ) − a23 (2acc2 ) ∆ −a2 cc2 + a3 a ∆ ∇qk eTk Md = [Md (∇qk M −1 )Md ]k1 = [Md (∇qk M −1 )Md ]k2 = [Md M −1 ]kk = Y finalmente sustituyendo en (5. Por simplicidad se   denotar´a en adelante c2 = cos q2 y s2 = senq2 . ya que la u ´nica condici´on que podr´ıa invalidar (5.19) (5.4.15) admite una soluci´on de la forma * a3 (x) = γe F (x)dx (5.15). dado que debido a la simetr´ıa del sistema con respecto a q2 . f12 quedar´a determinada por la soluci´on de(5.4.18) Siendo γ una constante positiva ajustable.15) se conviertan en funciones racionales de cos q2 .4. es posible deshacerse de todas las funciones trigonom´etricas.4. de modo que los segundos miembros del sistema (5.4. se obtiene el sistema   da2 cs2 = − −a1 a2 (2bcc2 ) + a1 a3 (ab + c2 c22 ) + a22 (ab + c2 c22 ) − a2 a3 (2acc2 ) dq2 −a2 cc2 + a3 a   2 cs2 da3 = − (5. Suponiendo que los elementos ai son todos funciones de q2 .20) es a3 = 0.3.15) −a2 (2bcc22 ) + 2a2 a3 (ab + c2 c22 ) − a23 (2acc2 ) dq2 −a2 cc2 + a3 a Ahora bien.4.20) Comentario 5.4.4. Comentario 5. Es f´acil probar que siempre y cuando el t´ermino [Md M −1 ]kk no se anule.19) o´ (5.4.17) ya que en ella aparecen s´olo dos de los elementos de la matriz Md .  Comentario 5. .108 5. Las funciones f23 y f13 son inc´ognitas con un grado de libertad.5.  Esto es cierto ya que si definimos x = cos q2 se tiene d d (·) = −senq2 (·) dq2 dx debido al factor com´ un s2 a la derecha del sistema (5.4. El cambio de variable x = cos(q2 ) no implica una p´erdida de generalidad.4. β(x) es una funci´on integrable y por tanto la ecuaci´on (5.4. N´otese que esta parametrizaci´on est´a bien definida. ya que a3 es un t´ermino diagonal de una matriz que es definida positiva en el dominio de definici´on del controlador. las soluciones a las ecuaciones deben ser pares y por tanto podr´an siempre ser expresadas en funci´on del coseno de q2 Las EDOs no lineales expresadas en funci´on de x se transforman en da2 = α(x) (5.4.17) dx   c  α(x) = −a1 a2 (2bcx) + a1 a3 (ab + c2 x2 ) + a22 (ab + c2 x2 ) − a2 a3 (2acx) −a2 cx + a3 a   2 c  β(x) = −a2 (2bcx) + 2a2 a3 (ab + c2 x2 ) − a23 (2acx) −a2 cx + a3 a Nos centraremos en la soluci´on de (5.16) dx da3 = β(x) (5.15). Reducci´on de las ecuaciones de moldeo de la energ´ıa cin´etica lineales. una vez elegida f23 arbitrariamente.4.4. por ejemplo. Pero esto no puede suceder. Con el fin de obtener la funci´on F (x) propondremos una nueva parametrizaci´on de los elementos de Md a2 = f23 (q2 )a3 a1 = f13 (q2 )a3 (5.4.4.4. por tanto a3 > 0. 14) del sistema de la bola y la viga. que debe ser una elecci´on del dise˜ posible conservar este grado de libertad para la fase de moldeo de energ´ıa potencial.4. 2 y tenemos en cuenta que eTk Md representa la fila k de Md y Md ej es la columna j (la fila j traspuesta).4.4. Se mostrar´a a continuaci´on que esta propiedad es extensible a todos los sistemas de dos grados de libertad de la clase estudiada en este cap´ıtulo.4. escogeremos akk al ser diagonal y por tanto siempre positivo (consecuencia de Md > 0).12) los t´erminos [Md (∇qk M −1 )Md ]kj j = 1.4. Si j = k entonces (5.4.4. para parametrizar el resto de Md en funci´on de ´el.4.23) sea positiva para cualquier valor de q2 se garantiza que Md es una matriz definida positiva de la forma   f13 (q2 ) f23 (q2 ) (5.19)–(5. 5. Esta caracter´ıstica tambi´en se presenta en la ecuaci´on (5.19) se obtiene a23 como factor com´ un del numerador. Si los reescribimos en la forma eTk Md (∇qk M −1 )Md ej j = 1.4.Cap´ıtulo 5.4. Sustituyendo todas las apariciones de a2 por la reparametrizaci´on del segundo miembro de (5.25) contiene los tres elementos (a1 .25) donde k = j. Por tanto el sistema de ecuaciones completo (5. s´olo aparecer´an los dos elementos de la fila k de Md .12) de moldeo de la energ´ıa cin´etica para n = 2 posee una ecuaci´on donde s´olo aparecen dos t´erminos de Md . en la ecuaci´on (5.24) Md = a3 (q2 ) f23 (q2 ) 1 Con la elecci´on de Md se concluye la fase de moldeo de energ´ıa cin´etica del m´etodo IDA–PBC reducido. .4.22) Eligiendo f23 (q2 ) tal que 2 det(Md ) = a23 (f13 − f23 ) (5. 2 (5.4.19) surge del hecho de que en la segunda de las ecuaciones (5. concluimos que en el t´ermino de (5. Entre ellos.4. En efecto.4.4. donde se dispondr´a de m´as argumentos para la elecci´on. a2 . resulta ser un polinomio de grado dos en las variables a2 y a3 .16)– (5.17) s´olo aparecen dos de los elementos de la matriz Md : a2 y a3 . dividido por una funci´on lineal en ambos t´erminos. a3 ) de Md .25) son cuadr´aticos en los elementos de Md y pueden contener dos o tres elementos de dicha matriz. Sin embargo los elementos de dicha matriz han sido parametrizados nador y siempre es en t´erminos de una funci´on f23 (q).21) (5.1 Generalizaci´on de la parametrizaci´on de Md para sistemas dos grados de libertad El paso clave para la validez de la parametrizaci´on (5. β(x) = a3 F (x)   2 c  F (x) = −f23 (2bcx2 ) + 2f23 (ab + c2 c22 ) − (2acx) −f23 cx + a (5. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 109 Si se observa detalladamente la funci´on β(x).4. y a3 del denominator. La soluci´on particular de la ecuaci´on completa resulta  q2 ∆ ∂V (2)   (5.5. 5 Si ´este no es el caso.3.5 Moldeo de la energ´ıa potencial El objetivo del moldeo de la energ´ıa potencial es asignar libremente puntos de equilibrio en la funci´on de energ´ıa potencial en bucle cerrado. 4 La derivada mencionada es funci´ on de la variable no actuada. como sucede en el caso de la bola en la viga.110 5. mediante unos pasos sencillos.4) Por simplicidad se supondr´a que k = 2 sin p´erdida de generalidad5 . es funci´on de una s´ola de las coordenadas3 .3) (5.1) est´an contenidas en la expresi´on (1) Vd = Vd 3 (2) + Vd (5. obtendremos una reducci´on de la ecuaci´on en derivadas parciales a la integral indefinida de una funci´on monovariable.1). .5.5..1) Suponiendo que se cumplen todas las condiciones descritas en (5. cuando n = 2.. Bajo la conocida suposici´on de que [Md M −1 ]kk = 0 en el dominio de definici´on del controlador.5.5. la ecuaci´on (5. pero como se demostrar´a en el siguiente ejemplo.5.5. podemos expresar la soluci´on general de la ecuaci´on homog´enea como & '   q2  ¯ −1 Md M (1)  k1 (5. las coordenadas pueden ser reordenadas de modo que la no actuada aparezca en segundo lugar.n} (5. podemos calcular la soluci´on de la ecuaci´on de moldeo de energ´ıa potencial para el caso n = 2. Una vez obtenida la matriz de inercia Md aplicando la reducci´on introducida previamente. todas las soluciones de (5. es un obst´aculo salvable. concretamente.6) Vd = ¯ −1 ∂qk dq˜2 Md M k2 En consecuencia.2) ∂qk que se interpreta del siguiente modo: la derivada de la energ´ıa potencial del sistema en bucle abierto con respecto a la coordenada no actuada.5.1) admite la siguiente expansi´on   ∂Vd   ∂Vd ∂V ¯ −1 ¯ −1 Md M M + M = ∆ d k1 ∂q k2 ∂q ∂qk 1 2  ¯ −1 = ∆M −1 M (5. En efecto. Moldeo de la energ´ıa potencial 5. La funci´on Vd se obtiene como soluci´on a la ecuaci´on G⊥ {∇q V − Md M −1 ∇q Vd } = 0 (5.5.5.7) Lo cual no es incompatible con que V (q) dependa tambi´en de variables actuadas. Esto no es cierto en el sistema de la bola en la viga. Se supondr´a que i = k sin p´erdida de generalidad4 . y a˜ nadiendo la siguiente ∂V = f (qi ) i ∈ {1.5) Vd = Φ q1 − ¯ −1 dq˜2 Md M k2 donde Φ es una funci´on arbitraria que se emplear´a para asignar el equilibrio. Esto es cierto para todos los ejemplos presentados anteriormente. Para sistemas de dos grados de libertad. 12) Siendo kp > 0 una ganancia ajustable 2  √ γ m2 √ kp Vd = −γ m1 m2 m3 cos(q2 ) + q2 − $ √ arcsenh( m1 q1 ) 2 2 m1 √ Ejemplo 4.8) (5.9) (5.5. Reducci´on de las ecuaciones de moldeo de energ´ıa potencial en la bola y la viga La funci´on de energ´ıa potencial del sistema en bucle abierto viene dada por V = m3 q1 cos q2 (5.7) para dar lugar a   √ γ m2 √ √ Vd = −γ m1 m2 m3 cos(q2 ) + Φ q2 − $ √ arcsenh( m1 q1 ) 2 m1 Una elecci´on apropiada que verifica las condiciones (5.5.5.5).5.13) .8). La aplicaci´on de la ecuaci´on (5.6) y (5.5.5.5.5.10) Ejemplo 3.5. (5.5.11) donde m3 es una constante positiva del modelo. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 111 Si hemos de asignar un punto de equilibrio estable en q = q ∗ . Reducci´on de las ecuaciones del moldeo de energ´ıa potencial en el p´endulo simple La funci´on de energ´ıa potencial en bucle abierto toma la forma V = mgl cos q2 (5.1) conduce a $ 1 + ml q1 2 ∂Vd 1 ∂Vd (q) + (q) = m3 senq2 √ m1 ∂q1 γm2 m1 ∂q2 la cual se resuelve empleando las ecuaciones (5.5.Cap´ıtulo 5. estas condiciones se traducen en ∇q Φ(q ∗ ) = 0 ∂ 2 Φ(q ∗ ) >0 ∂x2 (2) ∂ 2 Vd (q ∗ ) >0 ∂x2 (5.10) en q ∗ = 0 es Φ(z) = kp 2 z 2 (5.5. (5.5. entonces Vd debe ser tal que ∇q Vd (q ∗ ) = 0 ∂ 2 Vd (q ∗ ) >0 ∂x2 Como regla general.9) y (5. el determinante de M (q).5.5. y se concluy´o que no era compatible con ninguna soluci´on global para la energ´ıa cin´etica. 1] (5.16) unida a al hecho de que [Md M −1 ]kk = 0 se extiende a todo el rango de x.5.5. lo cual significa que a3 (−cf23 (x)x + a) < 0 ∀x ∈ [−1. En esta figura las regiones permitidas para f23 son los lados de las curvas apartados del origen en el primer y tercer cuadrante. . f23 deber´ıa tender a infinito. La siguiente secci´on restringir´a el problema de la estabilizaci´on a un intervalo de la forma q2 ∈ (−π/2 + . Se ha estudiado.15) dq˜2 Vd = Φ q1 − −cf23 cos(q˜2 ) + a la cual es integrable dado que −cf23 cos(q2 ) + a = 0. Vd .5.5.5.17) se siga cumpliendo al aproximarse la variable q2 a ± π2 .19) y (5.4.5. sin embargo. la funci´on f23 debe ser tal que (5.20) y el cambio de variable (5.2. la posibilidad de que este t´ermino se anule en q2 = ±π/2. ∂Vd ∂Vd a3 (bf23 − cx) + a3 (−cf23 x + a) = −∆mglsenq2 (5. En este caso i = k = 2.112 5. Para que la condici´on (5.5.8) y (5.5. Las condiciones (5.16) podremos calcular cada t´ermino de la ecuaci´on de moldeo de energ´ıa potencial. π/2 − ). Este efecto se relaciona por tanto con una p´erdida de controlabilidad del p´endulo en q2 = ± π2 . Estas regiones. La soluci´on de la parte homog´enea toma la forma    q2 bf23 − c cos(q˜2 ) (1) (5. Moldeo de la energ´ıa potencial Su derivada con respecto a qk es.9) se cumplen mediante la elecci´on de la funci´on libre Φ = k2p z 2 . De hecho.10) se cumple en q ∗ = 0.14) ∂q1 ∂q2  donde se define ∆ = ab−c2 x2 . 6 Obs´ervese que hasta el momento no se ha tomado partido por ninguna forma concreta de f23 con lo cual el resultado es general salvo por la condici´on [Md M −1 ]kk = 0. dependiente de una s´ola de las coordenadas. q2 . Haciendo uso de la factorizaci´on introducida en (5.4. como de costumbre. siendo  una constante positiva todo lo peque˜ na que se desee teniendo en cuenta que afectar´a a la forma de la funci´on f23 . (2) En lo que respecta a la segunda parte de la soluci´on. en q ∗ = 0 ∂V (2) (q ∗ ) obtenemos x = 1 y el t´ermino d∂x2 se convierte en & '   q2 ∂ ∆ ∂V ∆ ∂2 ∂V   ¯ −1 ∂qk dq˜2 = ∂q2 a3 (−cxf23 (q) + a) ∂qk = ∂q22 Md M k2   ∆ ∆ ∂ 2 V (q ∗ ) ∂V (q ∗ ) ∂ + = a3 (−cf23 (q ∗ ) + a) ∂qk2 ∂qk ∂q2 a3 (−cxf23 (q) + a) El u ´ltimo t´ermino es cero ya que al contiene el factor s´olo queda ∂V (q ∗ ) ∂qk = mglsenq ∗ = 0.16) La condici´on (5. son inconexas. y por tanto ∂ 2 V (q ∗ ) ∆ >0 a3 (−cf23 (q ∗ ) + a) ∂qk2 para lo cual es necesario que a3 (−cf23 (q ∗ ) + a) < 0 (5.4. obviamente. Esto impone una condici´on en f23 que restringe las posibles soluciones de las ecuaciones de moldeo de la energ´ıa cin´etica.17) Esta restricci´on para f23 presenta una singularidad en x = 0 (o equivalentemente q2 = ± π2 ) como ha sido representado en la figura 5. De esto se concluye que no es posible dise˜ nar un controlador v´alido IDA-PBC sin conmutaci´on en el espacio de estados completo6 . El t´ermino de amortiguamiento que ha de ser a˜ nadido a al se˜ nal de control para lograr un decrecimiento de Hd hacia el m´ınimo consiste en realimentar la un la ecuaci´on (4. p) J2 = −j(q. sabemos que toma la forma (4.Cap´ıtulo 5. 5. El t´ermino de amortiguamiento . p) 0 Una vez obtenidos Md y Vd y J. el sistema permanecer´ıa en ´orbitas de valor constante de Hd y no se lograr´ıa estabilidad asint´otica (aunque s´ı estabilidad en el sentido de Lyapunov siendo Hd la funci´on de Lyapunov). En este apartado se resumir´an los c´alculos finales necesarios para la obtenci´on de la ley de control.4.2. y por tanto la matriz J2 en estos casos (n = 2) toma la forma   0 j(q. p) = GMd Qp 2 siendo j(q.11).2: Regiones prohibidas (en gris) para f23 . se calcula el t´ermino ues de la ley de control que produce un sistema conservativo en bucle cerrado mediante la aplicaci´on directa de (4.7). donde la submatriz J2 se calcula en virtud de la ecuaci´on (5.8).6 C´alculo de la ley de control Las secciones previas proporcionan un m´etodo de resoluci´on de las ecuaciones de moldeo de energ´ıa en el m´etodo IDA-PBC. puesto que para el sistema de la bola y la viga no representa ninguna novedad. se premultiplica por la matriz de control G para dar 1 j(q. seg´ la bola en la viga.2. en primer lugar se obtiene la matriz de interconexi´on J a partir del conocimiento de Md mediante la ecuaci´on (4.10) (recu´erdese que G⊥ = eTk ) 1 Md Qp = G⊥ (J2 − R2 ) 2 la cual. en el caso de dos grados de libertad. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 113 Figura 5. Nos centraremos al caso de dos grados de libertad y complementaremos los resultados con el ejemplo del p´endulo invertido. Mediante ues se transforma la funci´on de energ´ıa de modo que en bucle cerrado tenga la forma deseada con el m´ınimo en el punto de equilibrio objetivo.2. Para el c´alculo de ues (moldeo de energ´ıa sin amortiguamiento). Mediante los sucesivos ejemplos se ha ilustrado la potencia y sencillez del m´etodo.4.11). p) un escalar. Si no se a˜ nade amortiguamiento. Para el caso de salida pasiva con una ganancia ajustable Kv . 6. que sugiere una ejecuci´ on del m´etodo un iterativamente hasta satisfacer esta condici´on. mientras que la tercera implica que a 1 > f0 + δx cx 7 Este es un aspecto cr´ıtico. Esto se puede demostrar sustituyendo f23 y el valor de a1 como una soluci´on de (5. queda mejor expresado en t´erminos de la nueva parametrizaci´on de Md : udi = −kv p1 − f23 p2 2 f13 − f23 (5. . 3. Para lograr que Md sea definida positiva.1) Ejemplo 5: Ley de control en el p´endulo invertido La ley de control en cualquiera de los casos se obtiene sumando los t´erminos de moldeo de energ´ıa e inyecci´on de amortiguamiento.16) en det(Md ) = a1 a3 −a22 .17). Este es el caso de una funci´on que tome la forma f23 (x) = 1 f0 + δx Si δ < 0. Adem´as.6. La u ´ltima condici´on permite expresar f23 en t´erminos de la nueva variable x.114 5. se ha visto que cualquier ley de control IDA-PBC est´a limitada a un intervalo del tipo (−π/2 + . f23 > a c cos q2 2. f0 > 0 y f0 > |δ|.4. dando lugar a que el determinante tiene el signo de dfdx23 . π/2 − ) se debe actuar en conjunci´on con una ley de swing up que levante el p´endulo hasta la regi´on de atracci´on del controlador IDA-PBC y realizar una conmutaci´on entre ambos. N´otese tambi´en que la primera condici´on es tambi´en suficiente para la integrabilidad de F (x). Para el c´alculo de la ley de control hemos observado que la soluci´on de las EDPs queda reducida a encontrar una funci´on monovariable f23 (q2 ) sujeta a las siguientes condiciones dentro del intervalo q2 ∈ (−π/2 + . f23 debe ser par con respecto a q2 .5. C´alculo de la ley de control del p´endulo invertido. u = ues + udi En el caso del p´endulo invertido lineal. f23 debe ser mon´otona creciente con respecto a x. debido a su complejidad. f23 debe ser elegida juiciosamente de modo que todas las integrales de una variable que aparecen en el procedimiento posean una primitiva conocida7 . π/2 − ): 1. De la ecuaci´on (5. las dos primeras condiciones son satisfechas. para que las ecuaciones en bucle cerrado sean pares y puedan expresarse en funci´on de x. 3).3 representa el a´ngulo de la viga comenzando en (1. A pesar de la complejidad aparente.2. Demostraci´on.1. con una constante de amortiguamiento kv = 10. p) ≤ c¯}. Se refiere al lector a la prueba de la proposici´on (4. es decir.2) ∆ (af0 + (aδ − c) x) Bajo las condiciones expresadas anteriormente esta funci´on no presenta singularidades dentro del intervalo de inter´es.Cap´ıtulo 5.2) esbozada para el control de la bola en la viga en el cap´ıtulo 4. y por lo tanto puede ser integrada.4. Vd = Vd + Vd y c¯ definida seg´ un (4. Entonces.11) se deduce claramente que s´olo se requiere el conocimiento de las derivadas Vd para implementar el controlador. La gr´afica de la izquierda en la figura 5. de la ecuaci´on (4. Consid´erese el modelo del p´endulo invertido lineal (5. Md viene dada por (5.2. x ∈ [x . un caso de simulaci´on comenzando en q2 = π (viga boca abajo) puede ser conducido a la posici´on (0. Para cualquier valor espec´ıfico de f0 . p) ∈ IR | Hd (q. se trata de una funci´on racional de x cuya primitiva se ha obtenido usando la aplicaci´on de c´alculo simb´olico Maple. 0) para distintos valores de kv . Se observa una gran cuenca de atracci´on.1) en bucle cerrado con la realimentaci´ on est´atica del estado IDA-PBC u = ues + udi obtenida en las oticamente estable secciones anteriores y kv > 0. la funci´on F (x) toma la forma   bc2 x 2 2 2 −2 f0 +δ x + 2 ab + 2 c x − 2 ac x F (x) = (5. Por ejemplo. 1.9). el origen es un equilibrio asint´  4 con dominio de atracci´ on Ωc¯ donde Ωc¯ = {(q. 1]. 0) mediante el controlador dise˜ nado para un conjunto de valores iniciales positivos de q1 . La gr´afica de la derecha muestra la trayectoria de la bola comenzando en (1. Entonces los t´erminos de Md se calculan como * a3 (x) = γe F (x)dx a2 (x) = f23 a3 (x) 2 − a2 2 (ab + c2 x2 ) + 2 a2 a3 acx ∆ (−a2 cx + a3 a) da dx a1 (x) = −2 a2 bcx + a3 (ab + c2 x2 ) donde γ es una ganancia ajustable positiva que no tiene efecto alguno en el signo de det(Md ).6. En cuanto a los t´erminos de energ´ıa potencial.24). La bola en la viga se simul´o con las constantes m1 = m2 = kp = 1 y g = 9. . Proposici´ on 5. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 115  donde se ha definido x = cos(− π2 + ) como el l´ımite inferior del intervalo de validez del controlador en t´erminos de x.4.8. donde Hd toma la (1) (2) forma (4.6.2. y por tanto no se requiere el c´alculo de la integral indefinida (excepto para algunas elecciones de la funci´on libre φ(z) de la soluci´on de la ecuaci´on homog´enea).7 Simulaciones En esta secci´on se muestra el comportamiento simulado de los sistemas controlados de la bola en la viga y p´endulo invertido lineal cuando se emplea el m´etodo descrito previamente. la constante δ debe ser tal que c f0 − |δ| > x a Para nuestra soluci´on particular.5). 2 5. 14 kg. que . En la simulaci´on del p´endulo invertido.4 1.02 1 0 0.08 −0.4 0. y l=0. Los valores empleados en el dise˜ no del controlador son f0 = 1.5 1 0. Velocidad del pendulo 1. El p´endulo comienza en una posici´on pr´acticamente horizontal q2 (0) = π/2 − 0. δ = −0.215 m.2 rad.0064715 b = M + m = 0.6 Angulo del pendulo (rad) 0.4 Kv=10 0. 5.2 0. Las constates de nuestro modelo se obtienen indirectamente a partir derivan de ellas: a = ml2 = 0.4) muestra los resultados de la simulaci´on.44 kg.8 y γ = 1014 (este u ´ltimo con el criterio de minimizar el rango de variaci´on de a3 en el dominio de definici´on).8 Velocidad angular (rad/s) Angulo del pendulo 0.2 0 0 −0. mostrando la amplia cuenca de atracci´on del equilibrio con el p´endulo levantado.116 5.4: Resultados de la simulaci´ on del p´endulo invertido comenzando en q2 = 1.3: Resultados de la simulaci´ on de la bola en la viga. La figura (5.0301.4 20 Kv=1 0 5 10 15 20 Tiempo (s) 25 30 35 40 45 50 Tiempo (s) Figura 5.04 −0.4 0.8 Comparaci´on de leyes de control Existe en la literatura un creciente n´ umero de controladores para el conocido sistema de la bola en la viga.6 0.04 1.5 0 2 4 6 8 10 12 14 16 18 −0.2 −0.02 −0.6 0.1 −0.2 tiempo (s) 0 0.3 rad.5 0.06 0 −0. los par´ametros del modelo son los propuestos en el art´ıculo de (Bloch et al. concretamente m = 0.58 y c = ml = 0. El comportamiento es el deseado incluso partiendo de puntos cercanos al l´ımite del dominio de atracci´on. Comparaci´on de leyes de control 1.8. 2000).6 0.4 Velocidad del carro 0 50 100 150 200 250 300 350 400 450 500 −0. Continuamente aparecen nuevos trabajos en este sentido. La posici´on y velocidad deseada del carro es 0 m/s.8 1 Figura 5.8 Posicion de la bola (m) Angulo de la viga (rad) 1 0.2 −0. M = 0.2 −0. El rendimiento del controlador es muy satisfactorio como se puede apreciar por el transitorio de tipo deadbeat que aparece en las gr´aficas.2 0. hc en la figura 5.5: Carro en viga con centro de masas desplazado. β son constantes positivas derivadas de los par´ametros f´ısicos. El modelo del sistema con hc > 0 posee el lagrangiano: 1 L = [ϕ˙ z] ˙ 2  1 + α + β + z 2 −1 − β −1 − β 1+β  ϕ˙ z˙  − (zsenϕ + cos ϕ) (5. En adelante se har´an simulaciones a efectos de comparaci´on de los transitorios y las cuencas de atracci´on. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 117 reivindican una mejora en las propiedades de estabilidad en bucle cerrado o amplian el grado de detalle del modelo empleado.4. En ella se representa un carro en lugar de una bola. aunque es preciso recordar que bajo estos paradigmas de control no se han descrito t´ecnicas para acotar las trayectorias en los transitorios de manera an´aloga a la expuesta en el cap´ıtulo 4. ecuaci´on (4.1 Control lineal Para el control lineal emplearemos el modelo del cap´ıtulo anterior.5 es responsable de la aparici´on de elementos no diagonales en la matriz de inercia del modelo de la bola en la viga.Cap´ıtulo 5. que es una configuraci´on bastante habitual que presenta una peculiaridad: el centro de masas del carro est´a desplazado hacia arriba y por tanto nunca pasa por el eje de giro de la viga. Para la linealizaci´on en el origen se partir´a de la descripci´on en variables de estado que se . El segundo cobra inter´es en el marco de las comparaciones de car´acter te´orico que se han llevado a cabo entre los m´etodos basados en pasividad y la teor´ıa de lagrangianos controlados.5. Esta separaci´on. Figura 5.1) donde α. El primer aspecto que merece la pena destacar es la desafortunada disparidad entre los modelos empleados en las distintas publicaciones. La raz´on de este hecho se ilustra observando la figura 5. A fin de contrastar los el controlador basado en pasividad desarrollado en esta tesis con otros trabajos afines.8. Este modelo es empleado en los controladores basados en el m´etodo de los lagrangianos controlados y su reducci´on mediante las ecuaciones λ.8. El primero se ha elegido por su sencillez y por ser uno de los m´as implementados en los laboratorios con finalidades acad´emicas. 5. se realizar´a un estudio simulado comparativo con otros dos controladores: uno lineal basado en una estructura de control anidada y otro basado en la teor´ıa de lagrangianos controlados presentado en (Hamberg 1999).1).  donde x = [q1 . p2 ]T . Este sistema equivale a q¨1 = −gq2 Una estructura de control PD para la estabilizaci´on de la bola en el origen dar´ıa −gqd2 = −kp1 q1 − kd1 q˙1 ⇒ 1 qd2 = (kp1 q1 + kd1 q˙1 ) g .8. una estructura t´ıpica empleada en el aplicaciones pr´acticas comprende la anidaci´on de dos subsistemas control (figura 5. q˙1 = p1 p2 + q12 p22 ∗ q1 = − gsenq2 (L2 + q12 )2 = −gq1 cos q2 + τ q˙2 = p˙1 p˙2 L2 La linealizaci´on jacobiana del sistema en el origen resulta    x˙ =   0 0 1 0 0 0 0 −g 0 −g 0 0 0       x +   0  0 1 L2 0 0 0 τ    . y un sistema lento que toma la posici´on de la viga como entrada de un subsistema de control de la posici´on de la bola. Sin embargo. p1 . Por tanto. la t´ecnica de asignaci´on de polos es de directa aplicaci´on. donde q2 se considera la entrada. posici´on de la bola es q˙1 = p1 p˙1 = −gq2 .118 5. Comparaci´on de leyes de control desprende de la descripci´on Hamiltoniana. En este caso el subsistema de la rd PD Qd torque Q(s) PID Q r Ball & Beam Gear angle loop Ball position loop Figura 5.6): un subsistema r´apido que lleva la viga a una posici´on deseada. Es f´acil observar que el sistema lineal es controlable y observable en el origen.6: Estructura anidada para el control lineal de la bola y la viga. q2 . 00. Esto contrasta con el controlador IDA–PBC del cap´ıtulo anterior en el que se lograba estabilizar desde condiciones iniciales muy pr´oximas a π/2. que se estabiliza en la referencia dada por el subsistema lento q2d mediante una nueva ley de control PD: v = kp2 (qd2 − q2) + kd2 (q˙d2 − q˙2 ) de donde se obtiene la ley para el sistema completo: 1 1 τ = gq1 cos q2 + L2 (kp2 ( (kp1 q1 + kd1 q˙1 ) − q2) + kd2 ( (kp1 q˙1 + kd1 q¨1 ) − q˙2 )) g g Este controlador se ha simulado aplicado al modelo no lineal con constantes L = 10m y g = 9. que debe ser controlada mediante un lazo PD interno r´apido (respecto al cual la referencia q2d sea cuasi-constante). El modelo empleado en este caso es el .5 0 −50 −1 −100 −1. Ahora bien.1 donde se ha hecho aumentar progresivamente el a´ngulo inicial de la viga. q2 (0) = 0. Sin embargo se observa una limitaci´on: el controlador se desestabiliza para a´ngulos iniciales de la viga superiores a 1 rad. Los resultados de simulaci´on de este son satisfactorios para un amplio rango de valores iniciales de q1 . q (0)=0.30 1 2 1 100 0. y qd2 representa el ´angulo de la viga deseado.).1.) 0 1 −0.8. La din´amica linealizada de la viga viene dada por p2 L2 = −gq1 cos q2 + τ q˙2 = p˙2 haciendo τ = gq1 cos q2 + vL2 se transforma el sistema en q¨2 = v.5 −2 0 5 10 15 20 tiempo(s) 25 30 35 40 −150 0 5 10 15 20 tiempo(s) 25 30 35 40 Figura 5. este a´ngulo tiene su din´amica propia. donde kp1 y kd1 son ganancias ajustables.8.8. kp2 = 4 y kd2 = 2. Los par´ametros del controlador son kp1 = 1. kd1 = 0.8. q (disc. q2 (0).8m/s2 . 5.3 rad.Cap´ıtulo 5.7: Resultados de simulaci´ on del control lineal de la bola en la viga.2 Control por lagrangianos controlados En el art´ıculo (Hamberg 1999) se ha presentado un controlador de la bola en la viga basado en esta t´ecnica de control de subactuados.5.5 50 Señal de Control 2 q (cont. Los resultados se muestran en las gr´aficas de las figuras 5. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 119 q (0)=0. 5.1 y 5. 5 q (0)=0.7 rad. q (0)=0. q2 (0) = 1 rad.). q2(disc.).70 1 2 1 150 100 0 50 −1 Señal de Control q1(cont. Comparaci´on de leyes de control q (0)=0. .) 0 −2 −3 −50 −100 −150 −200 −4 −250 −5 −300 −6 0 5 10 15 20 tiempo(s) 25 30 35 −350 40 0 5 10 15 20 tiempo(s) 25 30 35 40 Figura 5.9: Control lineal de la bola en la viga. q (0)=1. q2(disc. Comportamiento inestable.8.8: Control lineal de la bola en la viga. q2 (0) = 0.00.00 1 0 2 x 10 5000 −2 0 Señal de Control q1(cont.120 5.00.) −4 −5000 −6 −10000 −8 −15000 −20000 −10 0 5 10 15 20 tiempo(s) 25 30 35 40 −12 0 5 10 15 20 tiempo(s) 25 30 35 40 Figura 5. 10.1 Moldeo de energ´ıa cin´etica del robot PPR El robot m´ovil PPR. se ha mostrado una trayectoria comenzando en (q1 = 1. puede estabilizar posiciones iniciales tan pr´oximas a π/2 como se quiera.0m.1) que en este caso comprende un sistema de cuatro ecuaciones con k = 4 y M es la matriz de inercia en bucle abierto. Para el moldeo de la energ´ıa cin´etica emplearemos la f´ormula reducida de IDA-PBC presentada anteriormente ∇qk [eTk Md ] = − [Md (∇qk M −1 )Md ]k · [Md M −1 ]kk (5. El lector debe referirse a este art´ıculo para m´as detalles sobre el modelado.1 Sistemas de orden mayor Las f´ormulas obtenidas en (5. con este mismo controlador. Sira-Ram´ırez & R´ıos-Bolivar 2000) desde un punto de vista h´ıbrido entre la pasividad y la platitud (flatness). es un sistema de cuatro grados de libertad y tres actuadores. representado esquem´aticamente en la figura 5. q2 ) = V0 (q1 .5rad). dada por .9 Extensi´on de la soluci´on a otros sistemas 5. q1 − 3q2 ) + (q1 − 3q2 )2 2 donde V0 (q1 .1).9. Sin embargo las ecuaciones que se desprenden de dichas f´ormulas pueden ser dif´ıciles de resolver. La resoluci´on de las ecuaciones de ajuste proporciona el lagrangiano controlado dado por la m´etrica (matriz de inercia en bucle cerrado)   2 −q1 5 −2 g = e 6+6β −2 1 y la funci´on de energ´ıa potencial γ V (q1 . Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 121 descrito por las ecuaciones (5. Ha sido estudiado en (Espinosa-P´erez. Se ha estudiado un caso en el que se consigue satisfactoriamente el moldeo de energ´ıa cin´etica gracias a dicha formulaci´on. 5. q2 = 0. 5.9.1. sin embargo queda abierta la resoluci´on de la ecuaci´on de energ´ıa potencial en la que las reducciones anteriores no son efectivas. las propiedades transitorias son poco satisfactorias. mientras que el controlador IDA–PBC. como hemos mostrado.4.Cap´ıtulo 5.12) se aplican sin dificultad en sistemas subactuados de orden mayor. q2 ) − V0 (0. estabilizar trayectorias comenzando con a´ngulos superiores a 1 rad. q2 ) = −e −(1+β) 6 %    q 1 + β − iq1 π i( 31 −q2 ) √ Erfi Re e 6 + 6β 6 + 6β Los resultados de simulaci´on de este controlador han sido publicados en el conocido art´ıculo (Hamberg 1999) y a la luz de las gr´aficas all´ı presentadas.9. En la simulaci´on de Hamberg.8. a lo que cabe a˜ nadir el argumento de la inexistencia de un adecuado an´alisis del comportamiento transitorio. Tras varios intentos de simulaci´on el autor de esta tesis no ha logrado. 122 5.9. Sin embargo el an´alisis del signo de la matriz puede tornarse bastante complejo. Propondremos la siguiente matriz de inercia en bucle cerrado  a1    0 Md =    0  0 0 0 a2 0 0 a3 a4 0 0    a4    0   a5 (5. que debe ser positivo siguiendo las directrices del m´etodo. La matriz de inercia en bucle cerrado consta de diez elementos libres si se quiere preservar la simetr´ıa.9. el sistema de ecuaciones diferenciales obtenido con las f´ormulas reducidas es d a4 (x) = −ml2 M dx    a4 mx a4 2 a5  − −2 + a2 − (a4 xml − a5 δ)−1 δM lM lM 0=− ml (−2 a4 mlx2 + a4 ml + a5 xδ) a1 (−a4 xml + a5 δ) δ (5.9. de modo que vamos a prescindir de buena parte de estos elementos.4) (5. Extensi´on de la soluci´ on a otros sistemas z T θ y x ψ F2 F1 Figura 5.10: Robot m´ ovil PPR.2) ´ Este es un problema con gran cantidad de grados de libertad.9.     M =    M +m 0 0 −mlsenθ 0   ml cos θ     0  2 ml M +m 0 0 0  J −mlsenθ ml cos θ 0 (5.3) cuyo determinante es det(Md ) = a1 (a2 a3 a5 − a4 2 a3 ) .  Tras el cambio de variable x = cos θ.5) .9. 9. ya que a1 no se puede anular (por estar en la diagonal de Md ). con lo cual basta con seleccionarlos garantizando el signo del determinante de Md . 1. 3. restan numerosas opciones en la tarea de dise˜ no. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados   a4 mx a4 a5  a5  d 2 a5 (x) = −ml M − −2 + a4 − (a4 xml − a5 δ)−1 dx δM lM lM 123 (5. (como sucede en la matriz de inercia en bucle abierto M ). Lo m´as interesante en este paso es el hecho de que a1 y a3 no intervienen en las ecuaciones de energ´ıa cin´etica.6) An´alisis de las posibles soluciones Debido a la riqueza en grados de libertad del problema. 5. que se transforma en una ecuaci´on algebraica de la que despejamos a2 : (2 x4 − 1) C1 δ 2 .5) resulta a5 = C1 √ 2 x2 − 1 (5.9. a3 .Cap´ıtulo 5. del numerador de (5.9. obtendremos a4 directamente de (5.4) se emplea el grado de libertad a2 .7) C1 xδ (5. con la restricci´on a2 > 0. Para enmarcar el problema.7) (5. Para hallar la soluci´on se despeja.9. Conocido a5 .9. La ecuaci´on (5. (5.9.5) a4 en funci´on de a5 : a4 = a5 xδ ml (2 x2 − 1) Sustituyendo en (5.9.5) es algebraica y establece una relaci´on entre a4 y a5 . 4. incluso despu´es de haber anulado diez de los elementos de Md . a5 y el determinante son positivos. M . Esto permite expresar a4 en funci´on de a5 . a2 . analizaremos las posibles soluciones y las restricciones que aparecen en el moldeo de energ´ıa cin´etica.  6.8) siendo C1 una constante real a elegir. l.9. Para simplificar las ecuaciones se recurre al cambio x = senθ lo cual implica que los elementos de Md van a ser sim´etricos respecto a θ.9.9.9) a4 = √ 2 x2 − 1ml quedando a´ un por ajustar la ecuaci´on 5.9. m. 2. Md es definida positiva si y s´olo si a1 . y δ son constantes positivas.4. Para resolver la ecuaci´on (5.10) a2 = (2 x2 − 1)3/2 l2 m2 . 14) (5.9. Extensi´on de la soluci´ on a otros sistemas con lo que la matriz de inercia en bucle cerrado queda  0 a1    0  Md =    0  0 (2 x4 −1)C1 δ2 (2 x2 −1)3/2 l2 m2  0 0 0 √ C1 xδ 2 x2 −1ml 0 a3 √ C1 xδ 2 x2 −1ml 0 C1 √ 0 2 x2 − 1         (5.  0 a1    0  Md (θ = 0) =    0  0 0 0 0 √ C1 xδ 2 x2 −1ml 0 a3 0 √ C1 xδ 2 x2 −1ml 0 (2 x4 −1)C1 δ2 (2 x2 −1)3/2 l2 m2 C1 √ 2 x2 − 1          (5.15) . Estudiaremos la positividad de Md en torno al origen θ = 0 ´o equivalentemente x = 1.9.11) un conveniencia.9. ) 4 4 (5.13) En cuanto al dominio de definici´on del controlador. que emplearemos en el siendo a1 y a3 funciones positivas a escoger seg´ ajuste de energ´ıa potencial.9. δ δ  (5.9.9. Los elementos de la matriz Md deben ser reales.12) Esta matriz ser´a definida positiva si los menores descendentes de la matriz Md son positivos.124 5. para lo cual debe cumplirse 1 0 < 1 − 2 x2 ⇒ sen2 (θ) < 2 π π ⇒ |θ| ∈ (− . es decir (2 x4 − 1) C1 δ 2 >0 (2 x2 − 1)3/2 l2 m2 a1 > 0 a3 > 0 al igual que el determinante a1 C1 2 δ 2 a3 (2 x4 − 1 − x2 ) det(Md ) = >0 (2 x2 − 1) l2 m2 Para garantizar la positividad de la matriz Md se debe escoger la constante C1 en el siguiente intervalo  C1 ∈ a4 ml 2a4 ml . El sistema consiste en una masa puntual restringida a moverse sobre una circunferencia que gira en torno a un eje vertical que pasa por su centro. sirve de ejemplo ilustrativo para explicar c´omo se manifiesta esta imposibilidad en la nueva formulaci´on. ya que estando la perla en la semicircunferencia superior. x2 . la masa est´a “ensartada” en la circunferencia como una perla en la gu´ıa del collar. x4 ) # − 2 (cos(x4 ))2 − 1ml2 M Sin embargo. La peculiaridad de este sistema consiste en que si aplicamos el m´etodo IDA-PBC para estabilizar la perla en cualquier posici´on en la mitad de la superior de la circunferencia (lo cual se consigue con momentos generalizados no nulos. Mediante la linealizaci´on del sistema en estos puntos se puede comprobar sencillamente que esto se debe a que el sistema deja de ser controlable. Las obtenidas mediante Maple presentan singularidades dif´ıcilmente salvables. 5.16) Particularizando los t´erminos de la soluci´on del balance de energ´ıa cin´etica se llega a la ecuaci´on 0 = −x3 k + x4 k   C1 sen(x4 ) −1 + (cos(x4 ))2 ∂x∂ 1 V d(x1 .9.2 Efecto de la p´erdida de controlabilidad en IDA-PBC Se ha observado que el p´endulo invertido presenta un problema intr´ınseco de continuidad de las soluciones obtenidas mediante el m´etodo IDA-PBC en los puntos q2 = ±π/2. el sistema subactuado conocido como p´endulo esf´erico de Rice o simplemente sistema de la “perla giratoria”.9. x3 . Sin embargo. Como se represent´o esquem´aticamente en la figura 2. la suma vectorial de fuerzas (gravitatoria y centr´ıfuga) proyectadas en la direcci´on tangente al aro8 . esta limitaci´on es previsible desde el punto de vista f´ısico. x4 ) # + 2 (cos(x4 ))2 − 1mlM   C1 δ −1 + (cos(x4 ))2 ∂x∂ 4 V d(x1 . s´olo puede apuntar en sentido descendente. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 125 5. . Este sistema fue introducido en el cap´ıtulo 2. x2 . las ecuaciones llevan a una contradicci´on. emplearemos el modelo descrito por las ecuaciones de Hamilton 8 La perpendicular es cancelada por las fuerzas de reacci´ on de la ligadura.9. Para aplicar IDA-PBC.2.1.Cap´ıtulo 5. no se ha llegado a ninguna soluci´on satisfactoria para esta soluci´on. Existe un caso m´as patol´ogico a´ un. obviamente).2 Moldeo de la energ´ıa potencial En este caso la ecuaci´on a resolver es G⊥ {∇q V − Md M −1 ∇q Vd } = 0 (5. x3 . x2 . x4 ) # − 2 (cos(x4 ))2 − 1lM   C1 cos(x4 ) −M − m + m (cos(x4 ))2 ∂x∂ 2 V d(x1 . Por supuesto. x3 . la siguiente igualdad debe ser cierta para la funci´on de energ´ıa potencial deseada Vd : G⊥ {∇q V − Md M −1 ∇q Vd } = 0 .1)–(4. Los elementos de Md resultan % 2 (β + αsen2 q1 ) a1 = k 1 a2 = (β + αsen2 q1 ) αk √ 3 2 2 2 a3 = 3 (β + αsen q1 ) αk 2 Sin embargo. que posee muchas analog´ıas con este. se llega a una matriz Md definida positiva para cualquier valor de q1 . En este caso.9.18) del m´etodo IDA-PBC no admite ninguna soluci´on con Md definida positiva en un entorno de q1∗ = 0 (perla en el cenit de la circunferencia).2). compatible con la existencia de un m´ınimo de Vd en dicho punto. con una elecci´on apropiada de las constantes de integraci´on. El sistema de ecuaciones (5.9. Consid´erese el sistema descrito por (5.18) para cierto valor positivo de la constante k. Proposici´ on 5. De hecho.9.18). independiente de que la elecci´on de a3 sea diferente (5.17). Sustituyendo todos los t´erminos esta ecuaci´on se traduce en d 2α2 senq1 cos q1 a22 a1 (q1 ) = dq1 (β + αsen2 (q1 ))2 a1 d 2α2 sen(q1 ) cos(q1 ) a2 a3 a2 (q1 ) = dq1 (β + αsen2 (q1 ))2 a1 lo cual admite el cambio de variable x = sen(q1 ) dando lugar por tanto a d 2α2 x a22 a1 (x) = − dx β + αx2 a1 d 2α2 x a2 a3 a2 (x) = − dx β + αx2 a1 Al igual que en el ejemplo de la bola en la viga.9.2. Demostraci´ on.126 5.2. G = . tomando en particular los valores     0 α 0 . la ecuaci´on de energ´ıa potencial no admite ninguna soluci´on con un m´ınimo local en q1∗ = 0 (perla vertical superior).17) Para el moldeo de energ´ıa cin´etica debemos encontrar una matriz Md definida positiva que cumpla las conocidas EDOs reducidas (5.1.9.12) con k = 1.9. V = mg cos q1 M (q1 ) = 1 0 β + αsen2 q1 (5. se demostrar´a en adelante que si a1 ha de ser positivo (lo cual es necesario para la positividad de Md ).9.4. se encontrar´a una soluci´on a este sistema de ecuaciones mediante la elecci´on a3 = ka2 a1 (5. Extensi´on de la soluci´ on a otros sistemas (4. 24) (5. La matriz Hessiana de (5.21) (5.23) ∂z ∂z ∂z 2 2 2 ∗ ∗ ∇ Φ| ( ) ∇ Φ| 0 0 q=q q=q z ∂q1 ∂q2 z ∂q2 N´otese que la segunda matriz de esta expresi´on corresponde a la soluci´on no homog´enea.9. mientras que la u ´ltima depende u ´nicamente del signo del factor derivativo.9.22) es     ∂z 2 2 ∂z ∂z ∂ αmg senq1 2 ∗ ∗ ) ∇ Φ| ∇ Φ| ( 0 − q=q q=q z z ∂q1 ∂q1 ∂q2 ∂q a1 + ∇2q Vd (q ∗ ) = .9.25) La primera condici´on se cumple mediante una apropiada elecci´on de Φ.9. La soluci´on Vd tendr´a un m´ınimo en q1∗ = 0 si y s´olo si ∂Vd ∗ (q ) = 0 ∂q ∂ 2 Vd ∗ (q ) > 0 ∂q 2 (5. la soluci´on de esta EDP se expresa como la suma de una soluci´on general de la ecuaci´on homog´enea m´as la particular de la completa:   q1   q1 a2 α αmgsenq1 dq˜1 (5. Observando los elementos diagonales y el determinante podemos concluir que esta matriz es definida positiva si y s´olo si ∇2z Φ|q=q∗ >= 0 ∂ αmgsenq1 > 0. La primera matriz es singular al ser el Hessiano de una funci´on escalar Φ. que se calcula derivando por partes .9.9.21) sea cierta es necesario que ∇z Φ = 0. Reducci´ on del m´etodo IDA-PBC para sistemas subactuados 127 lo cual en nuestro sistema se convierte en a1 ∂Vd a2 ∂V ∂Vd + = 2 α ∂q1 β + αsen q1 ∂q2 ∂qk (5. (5.20) Vd = Φ q2 − dq˜1 − 2 a1 (β + αsen q1 ) a1 donde Φ = Φ(z) es la funci´on arbitraria de la soluci´on homog´enea y z servir´a para designar el argumento de la funci´on libre Φ (z es funci´on de q1 y q2 ).9.9. −∇2z Φ|q=q∗ ∂q a1 (5.9.19) Suponiendo que a1 es distinto de cero.Cap´ıtulo 5.22) A fin de que la ecuaci´on (5. . ∂ αmgsenq1 . . αmg . . 9.26) . − (5. ∗ = − a1 . 9. con matriz de inercia definida positiva. ∂q a1 q=q q=q Esta condici´on no puede ser cierta si a1 > 0.20) presenta un m´ınimo.9. |q=q∗ = − 2 =− ∂q 2 ∂q a1 a1 a1 dq1 q∗ (5. ∗ > 0. se obtendr´a el conjunto de posiciones q ∗ donde la funci´on de energ´ıa potencial (5. Continuando con el razonamiento.27) . Dado que ∂ 2 Vd ∂ 2 αmgsenq1∗ αmg sen(q1∗ ) da1 ∗ cos(q1 ) + . que es una suposici´on natural que se desprende de la exigencia de que el sistema en bucle cerrado posea estructura hamiltoniana. lo cual limita los posibles puntos de equilibrio del sistema hamiltoniano en bucle cerrado al intervalo q1 ∗ ∈ [ π2 .9.9. .9. 2 2 ´ Este es un resultado previsible que se desprende de las consideraciones f´ısicas apuntadas al comienzo de este apartado.9. pero con ´el se ha pretendido ilustrar c´omo se manifiestan estos fen´omenos al aplicar el m´etodo IDA-PBC.29) sea mayor que cero es haciendo cos q1∗ < 0.128 El t´ermino 5.29) |q=q∗ = − ∂q 2 a1 (β + αsen2 q1∗ )2 a1 La u ´nica manera de lograr que (5.27) y reordenando los elementos se llega a   ∂ 2 Vd 2α2 sen2 q1∗ a22 cos q1∗ 1+ (5. Extensi´on de la soluci´ on a otros sistemas da1 dq1 se calcula por medio de 2α2 senq1 a22 d a1 (q1 ) = − dq1 (β + αsen2 q1 )2 a1 Sustituyendo esta u ´ltima expresi´on en (5. El problema surge del hecho de que el m´etodo obvia las consideraciones de controlabilidad previas al dise˜ no de un controlador. la mitad inferior de la circunferencia. 3π ]. En la parte final del cap´ıtulo se presentar´a otra t´ecnica alternativa para la estabilizaci´on de oscilaciones por realimentaci´on del estado. extenderemos el resultado principal de esta t´ecnica que en su origen se aplica a la estabilizaci´on de equilibrios. A fin de ilustrar el m´etodo descrito se ha realizado una implementaci´on sobre un sistema de levitac´ıon magn´etica y se ha simulado el funcionamiento sobre un cl´asico sistema mec´anico subactuado: la bola y la viga. La estabilizaci´on de oscilaciones es un problema que se ha considerado en la literatura (Fradkov & Pogromsky 1998. el controlador se extiende a sistemas de orden mayor mediante backstepping. Para ello definiremos un sistema de dimensi´on dos que exhibe oscilaciones peri´odicas estables y robustas y lo sumergimos en el espacio de estados de orden mayor del sistema a controlar. empleando la t´ecnica de Inmersi´ on e Invariancia de (Astolfi & Ortega 2001).Cap´ıtulo 6 Estabilizaci´ on de oscilaciones en sistemas no lineales 6. As´ı sucede. Con este fin. En el segundo paso. un sistema de segundo orden ser´a controlado para dar lugar a uno nuevo que experimenta una bifurcaci´on de Hopf all´ı donde emerge un ciclo l´ımite. Las oscilaciones est´an asociadas a un ciclo l´ımite que surge a trav´es de una bifurcaci´on de Hopf supercr´ıtica. Sin embargo. En primer lugar. El m´etodo que se introduce a continuaci´on consiste en dos pasos. Bloch & Marsden 1998) empleando diferentes metodolog´ıas. con el m´etodo IDA-PBC estudiado en cap´ıtulos previos de esta tesis. en algunos sistemas—incluyendo conversores de alterna y robots caminantes—el objetivo consiste en obtener oscilaciones estables y robustas. El objetivo propuesto es la estabilizaci´on basada en la energ´ıa de oscilaciones en sistemas mec´anicos no lineales en cascada.1 Introducci´on La mayor parte de las t´ecnicas de control desarrolladas en las ultimas d´ecadas abordan los problemas de estabilizaci´on asint´otica de puntos de equilibrio y el seguimiento de trayectorias. La ventaja principal de una ley de estabilizaci´on de oscilaciones mediante una reali129 . por ejemplo. Con peque˜ nas modificaciones el resultado se traslada tambi´en a la estabilizaci´on de ´orbitas peri´odicas como se pretende aqu´ı. Se presentar´a en este cap´ıtulo un m´etodo para la generaci´on de oscilaciones estables por realimentaci´on del estado en una clase de sistemas de control no lineales. Leonard. lo cual puede dar lugar a una variable de medida del error mayor y retrasar el transitorio hasta la convergencia en el l´ımite. Este hecho se emplea en este cap´ıtulo para generar de oscilaciones estables y robustas mediante el dise˜ no de un controlador capaz de lograr que los sistemas pertenecientes a una clase no lineal. y por tanto el error en seguimiento es una medida de la distancia al punto m´as cercano de la o´rbita. Kuznetsov 1995) que aparece asociada a un par´ametro del controlador que propondremos. Entonces. Trayectoria de la garra del robot Trayectoria de referencia con información de fase Trayectoria de la garra del robot error en t=0 error en t=0 Orbita objetivo sin información de fase Posición de la órbita de referencia en el punto de alcance Posición inicial de la órbita de referencia Figura 6. Gordillo & Acosta. consiguientemente. en un segundo paso.1.130 6. nuestro objetivo se ha transformado en la consecuci´on de un ciclo limite en r´egimen . El m´etodo empleado para obtener la ley de realimentaci´on para el subsistema del primera fase de dise˜ no pertenece a la familia de controladores no lineales relacionados con m´etodos de moldeo de energ´ıa (Ortega et al. En el caso tradicional de seguimiento de trayectorias. adem´as de no depender de se˜ nales variantes en el tiempo. 1997) se aplica para extender la ley de control al sistema completo de orden mayor de tal manera que la bifurcaci´on de Hopf se mantiene y. En el primero se considera un sistema de segundo orden en bucle abierto. el comportamiento oscilante del subsistema de segundo orden se propaga hacia todas la variables. En este cap´ıtulo tambi´en estudiaremos la bifurcaci´on de Hopf (Hale & Ko¸cak 1991.1: Comparaci´on entre el seguimiento de trayectorias dependientes del tiempo (izquierda) y la estabilizaci´ on de o´rbitas peri´ odicas sin informaci´ on de fase (derecha). 1998). un comportamiento oscilante (Aracil. Sin embargo. est´a en el hecho de que mediante la t´ecnica que se presentar´a no se persigue una trayectoria con informaci´on de fase. Tal y como se ha publicado recientemente la mayor´ıa de estos m´etodos proporcionan leyes de realimentaci´on que dirigen al sistema controlado hacia un punto de equilibrio aislado (el punto de trabajo). este subsistema es transformado en otro con una bifurcaci´on de Hopf y. Sepulchre et al.1. La bifurcaci´on de Hopf es uno de los escasos m´etodos que permiten para determinar la existencia de ciclos l´ımite en sistemas de dimensi´on alta. la referencia posee una informaci´on de fase que obliga al sistema a incorporarse a la o´rbita en punto exacto. con lo cual el sistema puede entrar en oscilaci´on desde cualquier punto de la o´rbita. Krsti´c. Introducci´ on mentaci´on pura del estado frente a la posibilidad alternativa de seguimiento de trayectorias sinusoidales de referencia es. entonces. que incluye una variedad de sistemas subactuados. 2002). El m´etodo introducido en este cap´ıtulo para dise˜ nar el controlador comprende dos pasos principales. Con la ley de realimentaci´on apropiada. Este efecto se ilustra en la figura 6. lo cual dificulta tanto la implementaci´on como las pruebas de estabilidad y robustez. experimenten una bifurcaci´on de este tipo. la t´ecnica denominada backstepping (Khalil 1996. Kanellakopoulos & Kokotovic 1995. La soluci´on viene de la mano de un procedimiento recursivo basado en el backstepping. El resto del cap´ıtulo se organiza como sigue. el m´etodo que se presenta en estas p´aginas comienza con la bifuraci´on de Hopf (y por tanto del ciclo l´ımite) en este subespacio. Las secciones 6. Este es el espacio natural en el que se define el subsistema de segundo orden en bucle abierto considerado en la primera fase del m´etodo. se introduce una ley sencilla para la estabilizaci´on de oscilaciones en sistemas de segundo orden que sirve de base a los desarrollos posteriores. De este modo. y entonces se extiende al espacio de estados completo. pero la metodolog´ıa no se restringe a ellos. Uno de los resultados clave del cap´ıtulo se centra en el hecho de que la bifurcaci´on de Hopf detectada en el sistema de segundo orden se mantiene gracias a la t´ecnica de backstepping en los sistemas completos de orden mayor aqu´ı considerados. quinto.6 se presentan los resultados te´oricos destinados a extender el m´etodo de dise˜ no a sistemas subactuados de cualquier orden que posean estructura en cascada. seguidamente.2. Una vez concluido el dise˜ no del controlador para el sistema de segundo orden. Igualmente cabe destacar que un sistema que presente una bifurcaci´on de Hopf es tal que para ciertos valores del par´ametro de bifurcaci´on µ el sistema tiene un punto atractor.5 describen una t´ecnica inspirada en el backstepping que se emplear´a recursivamente para calcular una ley de control para sistemas de tercer orden. quedando abierta una interesante l´ınea de investigaci´on. se presenta una funci´on de Lyapunov de control apropiada para la obtenci´on del comportamiento oscilante en el sistema de segundo orden en bucle cerrado. en cuyo caso la soluci´on es trivial. Empleando dicha funci´on como hamiltoniano del sistema. Una implicaci´on muy interesante reside en el hecho de que el sistema bucle cerrado obtenido tras aplicar la t´ecnica basada en backstepping a la clase de sistemas aqu´ı considerada tiene estructura hamiltoniana generalizada. El m´etodo propuesto en este cap´ıtulo funciona debidamente para sistemas completamente actuados. sin embargo para otros valores de µ el conjunto l´ımite del sistema din´amico se transforma en un ciclo l´ımite y el sistema oscila de un modo estable y robusto. En la secci´on 6. Este sistema es considerado como la din´amica objetivo para un sistema de bucle abierto de segundo orden. En la segunda fase de dise˜ no comenzaremos con el controlador y la funci´on de Lyapunov obtenidos en la primera fase. se obtiene un sistema en bucle cerrado que presenta una bifurcaci´on de Hopf. De hecho.4 y 6. Se probar´a que la bifurcaci´on de Hopf se mantiene a lo largo de cada iteraci´on del procedimiento de . se ha detectado una sorprendente interrelaci´on entre backstepping y la estructura hamiltoniana generalizada. Este hecho subraya la relevancia de la bifurcaci´on de Hopf como fundamento te´orico del enfoque presentado. mediante backstepping un controlador y una funci´on de Lyapunov de control para un subsistema de tercer orden. La clase de sistemas considerada en los ejemplos de este cap´ıtulo no excede el cuarto orden. Estabilizaci´ on de oscilaciones en sistemas no lineales 131 permanente. y para una clase de subactuados que es la que se tratar´a en detalle. El proceso se repite para pasar a cuarto orden. para obtener. y as´ı sucesivamente. que es el caso normalmente considerado en sistemas control no lineales convencionales.Cap´ıtulo 6. En la secci´on 6.3. En la secci´on 6. que nace en una bifurcaci´on de Hopf. Conviene notar que el nacimiento del ciclo l´ımite asociado a una bifurcaci´on de Hopf tiene lugar en un espacio de dos dimensiones. Las consecuencias de este hecho son exploradas de manera superficial. el problema consiste en la extensi´on del comportamiento oscilante a todas las variables de estado. A fin de ilustrar el m´etodo se han seleccionado como ejemplos dos sistemas mec´anicos subactuados bien conocidos en la literatura y en el desarrollo de esta tesis: el sistema de levitaci´on magn´etica y la bola en la viga. M´as adelante se dise˜ nar´a la ley de control que ajuste este sistema con el de bucle abierto. como se muestra en la figura 6. 4 2 4 (6.2. La secci´on 6. Adicionalmente se demostrar´a la existencia de una bifurcaci´on de Hopf en el sistema controlado. El apartado 6. La aparici´on del denominador ωc2 x21 + x22 − µ en los elementos de la matriz simpl´ectica no debe sorprender pues est´an destinados a cancelar el factor com´ un P que aparece en las derivadas de V0 .10 trata el problema de estabilizaci´on de oscilaciones mediante una t´ecnica alternativa de reciente desarrollo.2) 4 El m´ınimo de V0 se alcanza en P = 0.2.2. Dependiendo de los valores del par´ametro µ la funci´on V0 adopta dos formas geom´etricas muy diferentes. no estrictamente en cascada. En el apartado 6. x2 ) ∈ IR2 . La secci´on 6.2 Un sistema hamiltoniano generalizado oscilatorio de segundo orden El objetivo de este apartado es definir sistema bidimensional no lineal de la forma x˙ = f (x). De hecho lo que se persigue es que . el m´etodo de Inmersi´ on e Invariancia(Astolfi & Ortega 2001). A este fin. x = (x1 . Definiendo P (x1 . Se espera que los conjuntos l´ımite sean puntos de equilibrio para µ < 0. En el caso de la bola en la viga se analizar´an las cuencas de atracci´on limitadas al emplear un controlador basado en un modelo aproximado. la posibilidad de extender los resultados del cap´ıtulo a sistemas con estructuras m´as generales. y para µ > 0 ciclos l´ımite. Un modo de lograr un sistea din´amico con V0 como funci´on de Lyapunov es definir el sistema hamiltoniano generalizado (Van der Schaft 2000)  x˙ 1 x˙ 2   = 1 0 1 − ω2 x2 +x 2 −µ c 1 2 ωc2 x21 +x22 −µ 0   Dx1 V0 . Un sistema hamiltoniano generalizado oscilatorio de segundo orden backstepping. 6.3). se tiene 1 V0 = P 2 (6. x2 ) = 2 2 2 ωc x1 + x2 − µ.132 6.1)  donde ωc ∈ IR and µ ∈ IR ser´an los par´ametros de dise˜ no. consid´erese la funci´on µ µ2  1 V0 (x1 . x2 ). La forma de la funci´on V0 invita a considerar los sistemas para los cuales V0 es una funci´on de Lyapunov (Mees & Chua 1979).2.7 discute.7. que presente un ciclo l´ımite. Para µ < 0 poseer´a un m´ınimo u ´nico en el origen del plano (x1 . sin embargo para µ > 0 los m´ınimos de V0 se alcanzan en la curva cerrada ωc2 x21 + x22 = µ (figura 6.8 presenta una expresi´on cerrada para ley de control de estabilizaci´on de oscilaciones que se aplica a la clase de sistemas descrita en 6.2. x2 ) = (ωc2 x21 + x22 )2 − (ωc2 x21 + x22 ) + . Dx2 V0 (6. En el primero de ellos se verificar´an los resultados te´oricos en un sistema real de laboratorio.9 el m´etodo se aplicar´a a dos conocidos sistemas subactuados: el sistema de levitaci´on magn´etica (tercer orden) y la bola en la viga (cuarto orden).3) donde V0 es la funci´on de Hamilton. en virtud de los teoremas de linealizaci´on por realimentaci´on. Figura 6. Estabilizaci´ on de oscilaciones en sistemas no lineales Figura 6.Cap´ıtulo 6. con un u ´nico m´ınimo.2: V0 para µ < 0. 133 .3: V0 para µ > 0 con un conjunto m´ınimo formado por una curva cerrada. El sistema (6.7). el efecto ser´a el mismo.2.2.2.2. se ha de realizar una ligera modificaci´on en la ecuaci´on (6. (6.7) puede escribirse como x˙ 1 = x2 x˙ 2 = −ωc2 x1 − ka P x2 . nadir amortiguamienPara obtener un sistema din´amico tal que V˙ 0 < 0.8)–(6. si un t´ermino de este tipo aparece en alg´ un punto del desarrollo.2. a˜ nadiendo un t´ermino de amortiguamiento con el que se obtiene      1 0 2 2 D x˙ 1 V 2 x1 0 ωc x1 +x2 −µ = . Con esta finalidad. (6.9) No siempre ser´a necesario incluir de forma expl´ıcita un t´ermino de amortiguamiento para lograr la desigualdad en sentido estricto en la derivada de la funci´on de Lyapunov. (6. .2.134 6.2. debemos a˜ to.7) 1 x˙ 2 − ω2 x2 +x −k D 2 −µ a x2 V0 c 1 2 siendo ka > 0 un coeficiente de amortiguamiento1 . el m´ınimo aislado que exist´ıa originalmente para valores negativos de µ > 0 se transforma en una elipse en torno al origen (figura 6. por tanto. El sistema (6.8) (6.5) se obtiene V˙ 0 = 0 a lo largo de las trayectorias de este sistema.4)  .6) Empleando la ecuaci´on (6.2.3. Esto se debe al hecho de que el t´ermino de amortiguamiento de la ecuaci´on (6. el cual. o equivalementemente  x˙ 1 x˙ 2   = x2 −ωc2 x1 (6. esto es exactamente lo que ocurre cuando aplicamos backstepping en sistemas de orden mayor que dos. x2 ) = 0. Un sistema hamiltoniano generalizado oscilatorio de segundo orden en ausencia de amortiguamiento la segunda ecuaci´on de estado coincida con la del cl´asico movimiento arm´onico simple u oscilador arm´onico x¨1 = −ωc2 x1 . Estas formas proporcionan una intuici´on geom´etrica sobre los comportamientos esperados del sistema.2.2.9) tiene la forma P x2 .3) descrita por la ecuaci´on con P (x1 . (6.2.3).2. Por tanto.2. Como se ver´a m´as adelante. Este hecho se puede apreciar de forma intuitiva en las gr´aficas 6.9) tiene la muy interesante propiedad de exhibir una bifurcaci´on de Hopf para µ = 0. donde se hace visible que para µ = 0 la geometr´ıa de V0 sufre un cambio radical. incluso sin haber introducido expl´ıcitamente el amortiguamiento. 1 Se podr´ıa argumentar que la disipaci´ on puede igualmente introducirse en la primera l´ınea de (6.2.2 y 6. En la pr´ actica esto no es viable porque esta primera fila toma la forma x˙ 1 = x2 invariablemente en sistemas mec´anicos. es un sistema conservativo con respecto a la funci´on de almacenamiento V0 .5) La derivada con respecto al tiempo de la funci´on V0 es  V˙ 0 = ∂V0 ∂x  T x˙ = [ ωc2 x1 P x2 P ] x˙ 1 x˙ 2  . A partir de este punto. (6. El sistema (6.2.2. Es palpable que el origen representa un punto de equilibrio para cualquier valor del par´ametro µ.2.2.9) atraviesa una bifurcaci´ on de Hopf asociada al equilibrio x1 = x2 = 0 cuando µ = 0. para µ < 0.8)–(6. (6.8)–(6.2.2. $ ka µ ± (ka µ)2 − 4ωc2 λ1.Cap´ıtulo 6. se tiene Re(λ) < 0 y el origen es estable.2 = . λ = ±jωc y el origen es un equilibrio no hiperb´olico. La condici´on de transversalidad se satisface dado que .1.11) 2 Entonces. Estabilizaci´ on de oscilaciones en sistemas no lineales 135 Proposici´ on 6. y para µ > 0 este equilibrio se torna inestable. y para µ > 0. Consecuentemente el sistema (6. Re(λ) > 0 y el origen es inestable. La linealizaci´on en este punto viene dada por      x1 0 1 x˙ 1 = . a su vez.2. Demostraci´on.9) tiene un equilibrio u ´nico en el origen para µ < 0.10) x˙ 2 x2 −ωc2 ka µ cuyo polinomio caracter´ıstico es λ2 − ka µλ + ωc2 y los correspondientes autovalores son. para µ = 0. ka dRe[λ(µ0 )] . . = = 0 . 2. para cualquier condici´ on inicial salvo el origen. En principio. la siguiente proposici´on extiende la validez de la aproximaci´on y m´as a´ un. Demostraci´on. Cuando µ > 0 los efectos de la no linealidad se manifiestan en la aparici´on del ciclo l´ımite (que no es un fen´omeno reproducible en sistemas lineales).9) se reduce a x¨ = −ωc2 x.2. ayuda a comprender el comportamiento del sistema lejos del punto de bifuraci´on.2. un sistema cuyo retrato de estados lo forma un continuo de orbitas cerradas que llena densamente el espacio de estados.1. Resulta de inter´es considerar que para ka = 0.2.2. esta aproximaci´on es razonablemente buena para peque˜ nos valores de µ.8)–(6. ωc es un par´ametro que se puede emplear para obtener la frecuencia deseada en las oscilaciones. Si µ < 0 el origen es globalmente asint´ oticamente estable.9). Proposici´ on 6. . Comentario 6. Sin embargo. El per´ıodo inicial (de la oscilaci´on de amplitud nula) es T0 = 2π ωc ya que ±jωc son los autovalores de (6. El sistema alcanzar´a y se mantendr´a en dicha orbita de forma estable y robusta. las trayectorias tienden al ciclo l´ımite P = 0 con periodo 2π/ωc . De este modo.10) para µ = 0 en el punto de equilibrio. Es f´acil de comprobar que la funci´on radialmente no acotada V0 satisface V˙ 0 = −ka P 2 x22 ≤ 0. Procedamos a calcular los conjuntos invariantes para los cuales V˙ 0 = 0.2.2. Si µ > 0.8)-(6.2. T0 es una estimaci´on del periodo esperado de las oscilaciones. el sistema (6. Consid´erese el sistema (6. Sin embargo estos comportamientos oscilatorios no son estructuralmente estables. dµ 2 µ=0 2 2 Comentario 6.2.2. El efecto del amortiguamiento no es mas que seleccionar entre todos las orbitas peri´odicas una en particular a la que se le asignar´a un estado de “m´ınima energ´ıa”. 9) con P = 0 se tiene x1 = 0.3.3.1 es supercr´ıtica. una curva cerrada para µ > 0 y un punto aislado para µ < 0. (6. En consecuencia con la aplicaci´on del principio de invariancia de LaSalle (Khalil 1996) se prueba la primera parte de la proposici´on.9) se reduce a (6.2) puede ser ajustado para obtener el comportamiento en bucle cerrado (6.2.3. (6. Finalmente para P = 0.2. los resultados de las secciones previas permiten tratar con el problema de dise˜ no de un controlador que haga que el sistema oscile.2.136 6.3.2. Por linealizaci´on se puede ver que este punto es localmente estable para µ < 0 y localmente inestable para µ > 0.3.2.2.2.2.2.8)–(6.3. En consecuencia. Procederemos por contradicci´on: sup´ongase que existe dicho equilibrio en P = 0. x2 ) = (0.3. 2 Esta estructura se puede extender trivialmente a la forma x˙ 1 x˙ 2 . demostraremos la ausencia de puntos de equilibrio sobre P = 0. V0 es una funci´on de Lyapunov de control del sistema. este caso corresponde al punto (x1 . Pero x1 = x2 = P = 0 s´olo es posible si µ = 0. es decir. se desprende el siguiente corolario. Al ser el ciclo l´ımite estable y. el sistema (6.3) son los m´ınimos de V0 . x2 ) + g(u) .3.2) donde g −1 (·) existe sobre el dominio de inter´es. Estabilizaci´on de oscilaciones en sistemas de orden dos • Una primera posibilidad est´a asociada a x2 (t) ≡ 0. Esto significa que los conjuntos l´ımite del sistema (6.2.5) mediante la ley de control u = g −1 (−ωc2 x1 − ka P x2 ). Es claro que el sistema en bucle abierto (6. a´ un hemos de demostrar que la curva P = 0 es realmente un ciclo l´ımite.8)) y x˙ 2 = 0 (del signo de identidad). para µ > 0. lo cual implica que x˙ 1 = 0 (de (6. 0).1)-(6. = x2 = f (x1 .3.3 Estabilizaci´on de oscilaciones en sistemas de orden dos Para un sistema de segundo orden de la forma2 x˙ 1 = x2 x˙ 2 = g(u). Corolario 6. De (6. La bifurcaci´ on de Hopf de la proposici´ on 6.3) Adicionalmente.3. existe cuando el equilibrio es localmente estable. Empleando (6.1)-(6.1) (6. Entonces el comportamiento del sistema en bucle cerrado ser´a oscilatorio o asint´oticamente estable. • La segunda posibilidad es la de P = 0. se tiene x2 = 0 y de (6. Este conjunto no existe para µ < 0.2) tras la aplicaci´on de (6. 6. Para la segunda. o dicho de otro modo.8).9) esto significa que ωc x21 = 0 ⇒ x1 = 0.4) para el cual el 2 periodo de las oscilaciones es 2π/ωc . ξ ∗ ). Kanellakopoulos & Kokotovic 1995.3.4. Con el fin de aplicar backstepping. donde η ∈ IR2 .Cap´ıtulo 6. Por ejemplo.4. Esto puede ser enunciado alternativamente indicado que el sistema atraviesa una bifurcaci´on de Hopf cuando µ = 0. consid´erese en primer lugar el sistema (6. 6. .4. Sin embargo sirve de base para la extensi´on a una clase de sistemas subactuados de orden ilimitado. si el sistema a controlar es un robot con actuadores en todas sus articulaciones. o al menos sus trayectorias est´an acotadas.3). Estabilizaci´ on de oscilaciones en sistemas no lineales 137 dependiendo del signo del par´ametro µ.  g(ξ) = 0 1 (6.1) tiene las propiedades de estabilidad deseadas. ξ ∈ IR. 1997) introducido en la secci´on 2.4 Backstepping para una clase de sistemas no afines La estabilizaci´on de oscilaciones tal y como se ha presentado en sistemas de orden dos es trivial.7.4. Krsti´c. Dicho de otro modo. Sumando y restando g(u0 (η)) al segundo miembro de la ecuaci´on (6. Suponga que este sistema tiene un punto de equilibrio en (0.1)–(6. es decir f (0) = 0 y h(ξ ∗ ) = 0. el dise˜ no de un controlador para un sistema de segundo orden con un actuador de la forma (6.1) con ξ como control virtual.1) (6. 0. Sup´ongase que existe una ley de realimentaci´on ξ = u0 (η) tal que el sistema (6. Con estos resultados. Consid´erese el sistema η˙ = f (η) + g(ξ) ξ˙ = u. entonces se podr´ıa aplicar a cada una de ellas una ley del tipo (6.4.3) se tiene η˙ = f (η) + g(u0 (η)) + g(ξ) − g(u0 (η)) = f (η) + g(u0 (η)) + b(h(ξ) − h(u0 (η))) = f (η) + g(u0 (η)) + bz. De este modo cada una de las diferentes articulaciones puede entrar en oscilaci´on de forma independiente. y adicionalmente h (ξ ∗ ) = 0.2)  h(ξ) = bh(ξ). En esta secci´on.3.3) es estable. La segunda herramienta que se precisa para la extensi´on a orden mayor est´a basada en el m´etodo backstepping (Khalil 1996.2) puede lograrse si las condiciones apropiadas son satisfechas. se desarrollar´a la aplicaci´on del m´etodo backstepping para sistemas que no son afines en las variables que se emplear´an como control virtual. que ser´a objeto de inter´es en este cap´ıtulo. Adicionalmente.4. supondremos que existe una funci´on de Lyapunov V0 tal que ∇η V0 (f (η) + g(u0 (η))) ≤ 0.4. el sistema η˙ = f (η) + g(u0 (η)) (6. Sepulchre et al. Este resultado admite una generalizaci´on a sistemas con muchos actuadores e incluso a una clase m´as amplia.3. De acuerdo con esta u ´ltima definici´on de z se tiene ˙ z˙ = h ξ˙ − h ∇η u0 η.1)-(6. 6. (6.5 Un m´etodo para la estabilizaci´on de oscilaciones mediante backstepping El m´etodo presentado en la secci´on 6.4.5. Si definimos v = z˙ y recordamos que u = ξ˙ entonces u = ∇η u0 η˙ + v . Para un comienzo motivador.9) que es menor o igual que cero. emplearemos la t´ecnica backstepping para sistemas no afines de la secci´on anterior.5) (6.138 6.2) se pueden escribir como sigue η˙ = f (η) + g(u0 (η)) + bz z˙ = v (6. (6.4.4.4.4) Las ecuaciones (6.4.6) Proponiendo para este sistema la funci´on de Lyapunov 1 V1 = V0 + z 2 2 (6.1)-(6.5. Con este objetivo.2).4. Un m´etodo para la estabilizaci´ on de oscilaciones mediante backstepping  donde hemos introducido z = h(ξ) − h(u0 (η)).3 puede ser extendido a sistemas en cascada cuya dimensi´on es superior a dos.4. incluyendo una amplia clase de subactuados.4.8) que es la ley de realimentaci´on para el sistema (6. Con esta ley V˙1 = ∇η V0 (f (η) + g(u0 (η))) − kz 2 . es decir u = ∇η u0 η˙ − ∇η V0 b + kz h = ∇η u0 (f (η) + g(ξ)) − 1 k (h(ξ) − h(u0 (η))) ∇η V0 b −   h h (ξ) (6.1) . consid´erese la siguiente clase de sistemas de tercer orden η˙ 1 = η2 η˙ 2 = h(ξ) ξ˙ = u.4.7) se obtiene V˙ 1 = ∇η V0 η˙ + z z˙ = ∇η V0 (f (η) + g(u0 (η))) + ∇η V0 bz + zv.4. Entonces para lograr que V˙ 1 ≤ 0 una elecci´on razonable es v = −(∇η V0 b + kz). h (6. 2. h (ξ) Comentario 6. A continuaci´on procederemos a calcular los conjuntos invariantes donde V˙1 = 0: V˙ 1 ≡ 0 ⇒ z1 (t) ≡ 0 ⇒ h(ξ) + ωc2 η1 ≡ 0.3) asegura que la funci´on 1 V1 = V0 + z12 .5.5.1.4). Empleando la expresi´on (6. es decir. Supongamos que h(ξ) es invertible y h (ξ) = 0 en todo el dominio de inter´es Ω ⊂ IR3 . satisface V˙ 1 = −k1 z12 ≤ 0 (v´ease (6. Esta u ´ltima expresi´on puede ser satisfecha en dos casos: 3 T´engase en cuenta el signo de identidad mantenido a lo largo del tiempo. De este modo.3)  1  V˙ 1 ≡ 0 ⇒ −  η2 P + k1 (h(ξ) + ωc2 η1 ) ≡ 0. que puede ser transformada en la forma (6. para cualquier condici´ on inicial en Ω. V˙ 1 ≡ 0 ⇒ ξ − u0 (η1 ) ≡ 0 y por tanto3 V˙ 1 ≡ 0 ⇒ ξ˙ − u0 (η1 )η˙1 ≡ 0 ⇒ u − u0 (η1 )η2 ≡ 0. es decir h(ξ ∗ ) = 0. η2 ) ∈ IR2 y ξ ∈ IR.5.8) con la V0 definida (6.5.5. Estabilizaci´ on de oscilaciones en sistemas no lineales 139 donde η = (η1 .2). 2 (6. Asimismo. el control mediante backstepping (6. Las razones se aportar´an m´as adelante.3) se tender´a al punto (0. (6. .9) en la secci´on 6. ξ ∗ ) cuando t → ∞. supongamos que el sistema.5.4). Si µ > 0.1) con la ley de control (6. Proposici´ on 6. posee un punto de equilibrio en (0.2.5. 0.4. Si µ < 0. Demostraci´on.Cap´ıtulo 6.1) a la segunda. A fin de trasladar la acci´on de control desde la tercera ecuaci´on de (6.5) haciendo h(ξ) = −ωc2 η1 . excepto el punto ∗ a al ciclo l´ımite (0. el amortiguamiento a´ un no ha sido introducido en esta fase de dise˜ no. Al ser la funci´on h(·) invertible y u0 (η1 ) = h−1 (−ωc2 η1 ). en ausencia de acci´on de control.2. Las dos primeras ecuaciones dan un subsistema de segundo orden con ξ como variable de control virtual.5.3) u = u1 (η1 . Esto significa que la ley de realimentaci´on (6. 0. y por tanto V˙ 1 ≡ 0 ⇒ −η2 P ≡ 0. η2 ) = P 2 /4 satisface V˙ 0 = 0.3) se aproximar´ P (η) = 0 cuando t → ∞. que tomar´a el papel de ka P x2 en (6. N´otese que para la elecci´on de V0 dada en (6. η2 .5.1).1) con la ley de control (6.4. con la ley de control virtual  ξ = u0 (η1 ) = h−1 (−ωc2 η1 ).5.5.1. Esta es la raz´on para no introducir amortiguamiento en (6. Empleando la ecuaci´on (6.4) con z1 = h(ξ) + ωc2 η1 . 0. ξ) = u0 (η1 )η2 −  η2 P + k1 (h(ξ) + ωc2 η1 ) .5.1) se obtiene la siguiente ley de control:  1  (6. obtendremos ∇η V0 b = x2 P . ξ ).2.5. Sea  P (η) = ωc2 η12 + η22 − µ = 0 el conjunto l´ımite deseado. que estamos asumiendo igual a cero. para cualquier condici´ on inicial en Ω. el sistema (6. ξ ∗ ). podemos hacer uso del procedimiento de backstepping (v´ease la secci´on 6.5. h (ξ) El factor multiplicado por k1 es igual a z1 . el sistema (6.3) est´a dotada de un t´ermino de amortiguamiento.9). la funci´on V0 (η1 .2) Pese a que la construcci´on del subsistema oscilante de segundo orden as´ı lo suger´ıa. Consid´erese el sistema (6. Este conjunto no existe para µ < 0.5. . Por tanto.1) tras aplicar la ley de realimentaci´ on (6. Proposici´ on 6.5. En la secci´on 6.6) 1 = u0 (x1 )x2 −  (k1 ωc2 x1 + x2 P + k1 h(x3 )).5. aplicando el principio de LaSalle y siguiendo el mismo razonamiento que al t´ermino de la prueba de la Proposici´on 6.5.5.5.2.. Tras la aplicaci´on de la ley de realimentaci´on (6.1) es reemplazado por η˙ 1 η˙ 2 η˙ 3 η˙ 4 = = = = . 0. Demostraci´ on.9.5. Corolario 6.3.2.5) η˙ n−1 = ξ ξ˙ = u. se obtiene el mismo resultado.2. Esta situaci´on corresponde al equilibrio (0.5. • η2 ≡ 0 ⇒ h(ξ) = 0 ⇒ ωc2 η1 = 0 ⇒ η1 = 0.5.140 6. En r´egimen permanente. Si el sistema (6.3). El sistema experimenta una bifurcaci´ on de Hopf para µ = 0.3).7 se presenta un ejemplo de la aplicaci´on del Corolario 6.5. y continuando con el procedimiento basado en backstepping. el sistema en bucle cerrado es x˙ 1 = x2 x˙ 2 = h(x3 ) x˙ 3 (6.1 queda demostrado. 2 Comentario 6.5. Por linealizaci´on puede comprobarse que el equilibrio es inestable cuando µ > 0 y estable cuando µ < 0.5. h (x3 ) A fin de obtener la linealizaci´on de este sistema en torno al origen debe hacerse notar que u0 (0) = −ωc2 /h (x∗3 ) y por tanto .2. Un m´etodo para la estabilizaci´ on de oscilaciones mediante backstepping • P ≡ 0. η2 h(η3 ) η4 η5 (6. ξ ∗ ). la variable ξ tambi´en oscila ya que z1 → 0 ⇒ h(ξ) → −ωc2 η1 ⇒ ξ → h−1 (−ωc2 η1 ). el enunciado de la Proposici´on 6.2.   2 . (h ) − h h . . ∂u . . = −k1 . ∂x3 . 0. y el resto de la matriz jacobiana toma la forma     0 1 0 x˙ 1     (6.x∗ ) (h )2 (0.5.x∗ ) 3 3 pero al ser h(x∗3 ) = 0 este t´ermino es igual a −k1 .0.(0.7) 0 κ   x˙ 2  =  0 k1 ωc2 ωc2 −µ x˙ 3 −k1 − κ − κ . 9) 1 P (6. La matriz del sistema tiene una deseable propiedad estructural: admite la descomposici´on en la suma de una diagonal negativa y una antisim´etrica. −1 −k1 z1 (6.5. h h (6. el sistema es estable para µ < 0. Recordando (2.10) es la versi´on en dimensi´on tres de (6. N´otese que el sistema (6. 0 −1 0 z˙1 0 0 −k1 .8) en el espacio (η1 . a1 a2 = a 0 .Cap´ıtulo 6.5. y la estabilidad se pierde para µ = 0 cuando se produce la bifurcaci´on de Hopf.5.5. Para este u ´ltimo valor cr´ıtico de µ el polinomio caracter´ıstico de la matriz Jacobiana se transforma en s3 + k1 s2 + ωc2 s + ωc2 k1 ≡ (s2 + ωc2 )(s + k1 ) donde la existencia de dos ra´ıces puramente imaginarias para µ = 0 se hace patente.5. Tras la aplicaci´on de la ley de realimentaci´on (6. Escribiendo la ecuaci´on (6. Estabilizaci´ on de oscilaciones en sistemas no lineales 141 donde κ = h (x∗3 ).2. η2 . lo cual implica que µ = 0. 2 A continuaci´on se demostrar´a que mediante un sencillo cambio de variable el sistema en bucle cerrado admite una descripci´on hamiltoniana generalizada.7).8) donde z1 = h(ξ) + ωc2 η1 .1) se obtiene η˙ 1 = η2 η˙ 2 = h(ξ) ω2 1 ξ˙ = − 0 η2 −  (η2 P + k1 z1 ). Por consiguiente.5.11)  η˙ 2  =  − P1 0 1  ∇x V1 +  0 0 0  ∇x V1 .5. El polinomio caracter´ıstico del jacobiano viene dado por s3 + k1 s2 + (ωc2 − µ)s + ωc2 k1 que es un polinomio Hurwitz si son satisfechas las siguientes condiciones: 1) k1 > 0 y (ωc2 − µ) > 0. Tambi´en puede ser reescrito como       1 0 0 0 0 0 η˙ 1 P       (6.10) como un sistema hamiltoniano generalizado (Van der Schaft 2000).10) donde la u ´ltima columna es ∇x V1 .5. es decir µ < 0.5.1)-(2. z1 ) obtendremos η˙ 1 = η2 η˙ 2 = −ωc2 η1 + z1 z˙1 = −η2 P − k1 z1 .3) a (6.5. La u ´ltima condici´on conduce a k1 ωc2 = k1 (ωc2 − µ).2) las condiciones de existencia de un par de autovalores imaginarios para n = 3 son a0 > 0 . que puede ser reescrito como    η˙ 1 0    1  η˙ 2  =  − P 0 z˙1   0 η1 P   0 1   η2 P  . a2 > 0 . y 2) k1 (ωc2 − µ) > k1 ωc2 . Esto permite interpretar el sistema (6.5. La condici´on de transversalidad es satisfecha al cambiar el signo a1 a2 − a3 = µ cuando cambia el signo de µ. siendo x = [η1 η2 z1 ]T . El subsistema conservativo es tal que la cantidad conservada es precisamente V1 . 6. modelado por la parte disipativa del comportamiento en bucle cerrado. Si extendemos el sistema a tercer orden x˙ 1 = x2 x˙ 2 = h3 (x3 ) x˙ 3 = u˜3 y definimos  u2 ) u2 = h−1 3 (˜  z3 = h3 (x3 ) − h3 (u2 ) = h3 (x3 ) − u˜2 1 V3 = V2 + z32 2 tendremos. x˙ 1 = x2 x˙ 2 = u˜2 Donde u˜2 es la ley de control que estabiliza el sistema en la oscilaci´on deseada con funci´on de Lyapunov V2 = P 2 /4. Concretamente u˜2 = −ωc2 x1 − k2 P x2 siendo k2 > 0 un par´ametro libre. = = x2 h3 (x3 ) h4 (x4 ) h5 (x5 ) (6. x2 ). Para ello comenzaremos con el subsistema de segundo orden (x1 . Por tanto. la funci´on de Lyapunov obtenida mediante backstepping proporciona una cantidad conservativa para el sistema en bucle cerrado.6. De este modo el comportamiento del sistema puede comprenderse como la uni´on de un movimiento conservativo al que se superpone un efecto de amortiguamiento para alcanzar el comportamiento oscilatorio. en virtud de lo expuesto anteriormente.. Sistemas de orden mayor donde el sistema ha sido disociado en partes conservativa y disipativa. que la ley 1 ∂V2  − k3 z3 u˜3 =  h (u2 )u˙ 2 − h3 (x3 ) 3 ∂x2 .6 Sistemas de orden mayor A continuaci´on se extender´an los resultados previos a sistemas no lineales no afines con estructura en cascada de la forma x˙ 1 x˙ 2 x˙ 3 x˙ 4 x˙ n−1 x˙ n = = = = .6. .1) hn (xn ) u.142 6. sino que se realizar´a un c´alculo recursivo que facilitar´a su comprensi´on. Para el c´alculo de la ley de control no se presentar´a una f´ormula expl´ıcita. Sup´ongase que el subsistema de orden k > 2 formado por las k − 1 primeras ecuaciones de estado m´ as la ecuaci´ on x˙ k = u se estabiliza asint´oticamente en la o´rbita P = 0 con la ley u = u˜k .1). hi+1 (xi+1 ) i+1 ∂xi donde  ui ) ui = h−1 i+1 (˜  zi = hi (xi ) − hi (ui−1 ) = hi (xi ) − u˜i−1 1 Vi = Vi−1 + zi2 2 estabiliza asint´ oticamente el sistema de orden n en la ´orbita P = 0..n (6. de nuevo  u3 = h−1 u3 ) 4 (˜  z4 = h4 (x4 ) − h4 (u3 ) = h4 (x4 ) − u˜3 1 V4 = V3 + z42 2 entonces la ley de control calculada recursivamente 1 ∂V3  u˜4 =  − k4 z4 h (u3 )u˙ 3 − h4 (x4 ) 4 ∂x3 estabiliza asint´oticamente el sistema de cuarto orden en la o´rbita P = 0 con funci´on de Lyapunov V4 . como se afirma en la siguiente proposici´on Proposici´ on 6. con funci´on de Lyapunov V3 .Cap´ıtulo 6. Por el principio de invariancia de LaSalle se deduce que al ser el u ´nico conjunto invariante con funci´on de Lyapunov cero la o´rbita peri´odica P = 0. el sistema converger´a asint´oticamente a dicho conjunto. T´omese Vn como funci´on de Lyapunov para comprobar que V˙ n = −k2 P x22 − k3 z32 − k4 z42 .6.6. Entonces la ley un calculada recursivamente seg´ un la f´ormula 1 ∂Vi  u˜i+1 =  h (ui )u˙ i − i = k.. 2 . es preciso repetir el proceso para un sistema de orden cuatro x˙ 1 x˙ 2 x˙ 3 x˙ 4 = = = = x2 h3 (x3 ) h4 (x4 ) u˜4 y definamos. Para llegar a identificar el t´ermino general de control para un sistema de mayor dimensi´on.2) − ki+1 zi+1 . Estabilizaci´ on de oscilaciones en sistemas no lineales 143 estabiliza asint´oticamente el conjunto P = 0 en el sistema de tercer orden. Sea el sistema de orden n con la estructura en cascada (6. Demostraci´on. A partir de aqu´ı es de f´acil deducci´on la ley de control gen´erica.1..6.. − kn zn2 Que es nula si y s´olo si zi = 0 y P = 0. . . ··· ··· ··· . . ∂xi ∂zi ∂xi i = 3. Sistemas de orden mayor Tomando la derivada temporal de la variable de error gen´erica zi : z˙i = hi (xi )zi+1 − ∂Vi−1 − ki zi . ∂xi−1 i>2 y dado que ∂Vi ∂zi ∂Vi = = zi hi (xi ). .4) . . . i3 ..  ..  . .2) y el cambio de variables  z1 = x1  z2 = x2  z3 = h3 (x3 ) − h3 (u2 ) . .3)     ≥0    (6. siendo la matriz de interconexi´ on  1 0 0 0 ··· 0 P  1 1 0 0 ···  −P 0    0 −1 0 ··· 0 h3 (x3 )   0 0 −h3 (x3 ) 0 h4 (x4 ) · · · J(z) =    0 0 ··· 0 0 −h4 (x4 )  ..6. .. . n de la que se desprende el siguiente corolario Corolario 6.  zn = hn (xn ) − hn (un−1 ) posee la estructura PCH con disipaci´ on z˙ = (J(z) − R(z))∇z Vn con funci´ on de energ´ıa Vn . El sistema de orden n con la estructura en cascada (6. 0 0 0 0 0             hn−1 (xn−1 )  −hn−1 (xn−1 ) 0 (6.. 0 · · · kn 0 0 0 0 0 .. ..6..6..6.. .2. 0 0 0 0 ··· 0 on que cumple J(z) = −J(z T ) y la de disipaci´     R(z) =     0 0 0 0 k2 0 0 0 k3 . . .6. .1) realimentado con la ley u = un obtenida recursivamente seg´ un (6..144 6.n se llega a la expresi´on z˙i = hi (xi )zi+1 − hi−1 (xi−1 )zi−1 − ki zi .6.... 0 0 0 0 0 . .6. . gi (·) : IRi → IR son funciones no lineales de sus argumentos..5) de orden k formado por las k −1 primeras ecuaciones m´ as x˙ k = u. x˙ k−1 = fk−1 (ηk−1 ) + gk−1 (ηk−1 )hk (xk ) x˙ n = u. .1 Caso m´as general Un caso m´as general al que podemos aplicar este procedimiento de forma sistem´atica es el de la estructura triangular x˙ 1 x˙ 2 x˙ 3 x˙ 4 x˙ n−1 x˙ n = = = = . ηk = [x1 . .5) fn−1 (ηn−1 ) + gn−1 (ηn−1 )hn (xn ) u.. . con funci´on de Lyapunov Vk+1 . es decir x˙ 1 = x2 x˙ 2 = f2 (η2 ) + g2 (η2 )h3 (x3 ) . n − 1. on de Lyapunov Vk . x˙ k = fk (ηk ) + gk (ηk )hk+1 (xk+1 ) x˙ k+1 = u. y definimos se estabiliza con la ley u = u˜k (ηk ) y funci´   −fk (ηk ) + u˜k  −1 uk = hk+1 gk (ηk )  zk+1 = hk+1 (xk+1 ) − hk+1 (uk ) 1 2  Vk+1 = Vk + zk+1 2 entonces la ley de control u = u˜k+1 1 ∂Vk  =  gk (ηk ) − kk+1 zk+1 h (uk )u˙ k − hk+1 (xk+1 ) k+1 ∂xk estabiliza el sistema de orden k + 1 x˙ 1 = x2 x˙ 2 = f2 (η2 ) + g2 (η2 )h3 (x3 ) .6.3. . . xk ]T .6.Cap´ıtulo 6. con gi = 0 y hi (·) = 0 en todo el dominio de inter´es. Si el subsistema de (6. .6. donde fi (·). Estabilizaci´ on de oscilaciones en sistemas no lineales 145 6. x2 . = = x2 f2 (η2 ) + g2 (η2 )h3 (x3 ) f3 (η3 ) + g3 (η3 )h4 (x4 ) f4 (η4 ) + g4 (η4 )h5 (x5 ) (6. Proposici´ on 6. Adem´as se han definido los vectores de dimensi´on k k = 1 . . 6. . .. .... x3 .7. dn−3 ξn = ξ3 dtn−3 Pero esta u ´ltima derivada se puede descomponer en dos t´erminos. pero generalizado a orden mayor. dn (n) (n−1) (h(x3 )) = h (x3 )x3 + ψ(h (x3 ).      u.hn (x3 ). .7.x3 ) dtn (n) = h (x3 )x3 + ψ(x3 .xn+2 ) = ψ(x) + h (x3 )u Este sistema posee un grado relativo bien definido si h(x3 ) = 0.7 Revisi´on del m´etodo empleando linealizaci´on por realimentaci´on Alternativamente al empleo de la extensi´on de backstepping para sistemas no afines... x˙ n         +       0 0 0 0 .. para finalmente enunciar un resultado bas´andose en la linealizaci´on por realimentaci´on que permite extender el m´etodo a sistemas de estructura no triangular. h(3) (x3 )... x4 . Inicialmente se partir´a de una estructura semejante al sistema de la bola en la viga. Consid´erese un sistema gen´erico de la forma         x˙ 1 x˙ 2 x˙ 3 . ilustraremos un m´etodo de estabilizaci´on de oscilaciones que explota un cambio de variable previo para obtener un sistema lineal en cascada sobre el que aplicar la versi´on cl´asica de backstepping.1) 1 Se define el cambio ξ3 = h(x3 ) ξ4 = h (x3 )x4 = ξ˙3 ξ5 = h (x3 )x24 + h (x3 )x5 = ξ˙4 .. Revisi´on del m´etodo empleando linealizaci´ on por realimentaci´ on Hemos construido un m´etodo recursivo directo para el c´alculo de la ley de control. x5 . Sin embargo por la inclusi´on del t´ermino gk ha resulta inviable la obtenci´on de una formulaci´on en forma PCH de las ecuaciones de estado. donde se deduce que la condici´on h(x3 ) = 0 es suficiente para que la realimentaci´on u= ψ+v h (x3 ) .146 6. .    (6. El controlador obtenido difiere ligeramente de los proporcionados por los m´etodos anteriores al ser las variables de la funci´on de Lyapunov diferentes. x3 . las condiciones de realizabilidad son pr´acticamente las mismas y la estructura hamiltoniana generalizada se recupera con la misma facilidad.         =       x2 h(x3 ) x4 . Sin embargo a efectos pr´acticos los resultados son muy similares. Cap´ıtulo 6. Estabilizaci´ on de oscilaciones en sistemas no lineales 147 unida al cambio de variable x . 1. N´otese que el cambio de coordenadas x . ξ˙4 = v Comentario 6. dando lugar a x˙ 1 = x2 x˙ 2 = ξ3 ξ˙3 = ξ4 (6.7.→ ξ linealice por realimentac´ıon el sistema (3).7. ..2) ξ˙4 = ξ5 . . . . . que ahora expresaremos del siguiente modo ∂V0 − k1 (ξ3 + u0 ) ∂x2 ∂V1 = u˙ 1 − − k2 (ξ4 − u1 ) ∂x3 u1 = u˙ 0 − u2 .. y as´ı sucesivamente. 2 2 . . ui = u˙ i−1 − ∂Vi−1 − k2 (ξ4 − u1 ) ∂ξi+1 Las funciones de Lyapunov de cada paso ser´an 1 2 P 4 1 2 = P + 4 1 2 = P + 4 V0 = V1 V2 1 (ξ3 − u0 )2 2 1 1 (ξ3 − u0 )2 + (ξ4 − u1 )2 ..→ ξ es invertible si y s´olo si h(·) es invertible (para lo que es necesario que h (x3 ) = 0).. dado que x3 = h−1 (ξ3 ) ξ4 x4 =  h (x3 ) . xi−1 ) xi = h (x3 ) El nuevo sistema linealizado admite la estabilizaci´on de ´orbitas peri´odicas mediante la implementaci´on recursiva del backstepping y la obtenci´on de las sucesivas leyes de control en cascada..3) .. ξi − fi (x3 . Definiendo un nuevo cambio de variable z3 = ξ3 − u0 z4 = ξ4 − u1 .7... (6. Esto implica que en los sistemas que cumplen las condiciones del teorema de linealizaci´on por realimentaci´on es aplicable el m´etodo presentado de estabilizaci´on de oscilaciones basado en backstepping.  (6. El punto de partida del presente estudio es un sistema de orden n en la forma can´onica de Brunovski. se deduce que la estructura hamiltoniana generalizada no es una caracter´ıstica particular que s´olo se manifieste en estas coordenadas.1). De hecho. Los resultados que se expondr´an se han publicado en (Aracil.3) resuelve el problema de estabilizaci´on de o´rbitas peri´odicas en sistemas linealizables por realimentaci´on. adif g}.7. . El deshacernos de la recursividad del m´etodo pretende generar una familia de sistemas de cualquier orden con una din´amica expl´ıcita que simplifica el an´alisis posterior.4) Cabe destacar que al ser la estructura simpl´ectica invariante con respecto al sistema de coordenadas (v´ease la secci´on 2. La ley recursiva es susceptible de obtenerse como una funci´on expl´ıcita del estado. Realizaci´on de una familia de sistemas oscilantes a partir de la linealizaci´ on por realimentaci´ on Se recupera la estructura PCH dada por      1 0 0 x˙ 1 0 P  x˙   − 1 0  1 0    2   P   ∇z V2 −   =  z˙1   0 −1 0 1   0 0 −1 0 z˙2 0 0 0 0 0 k0 0 0 0 0 k1 0 0 0 0 k2     ∇z V2 .8.2) est´a expresado en la forma can´onica de Brunovski (2.148 6. .8 Realizaci´on de una familia de sistemas oscilantes a partir de la linealizaci´on por realimentaci´on Seg´ un se comenta en el apartado anterior. . x˙ 1 = x2 x˙ 2 = x3 . deshaciendo el cambio de variable volver´ıamos a una estructura semejante con matrices de interconexi´on y disipaci´on expresadas en funci´on de x. x˙ n = um  (m = n − 2) .7. Una consecuencia importante es que se abre una v´ıa para salvar la exigencia de la estructura en cascada. se deduce que el desarrollo previo es aplicable a cualquier sistema en esta forma. en dicha regi´on. . en un sistema linealizado por realimentaci´on.7. Sin embargo el teorema de linealizaci´ on por realimentaci´ on (Marino & Tomei 1995) afirma que un sistema de entrada u ´nica del tipo x ∈ IRn .3. Son involutivas y de rango constante i + 1. u ∈ IR x˙ = f (x) + g(x)u. el procedimiento recursivo expresado en la ecuaci´on (6. Si observamos que el sistema (6. es transformable mediante linealizaci´on por realimentaci´on y cambio de variables a la forma can´onica de Brunovski en una regi´on U0 pr´oxima al origen si y s´olo si.2). las distribuciones 0≤i≤n−1 Gi = span{g. . 6..7. G´omez-Estern & Gordillo 2002). Se aplica la siguiente f´ormula recursiva ui = u˙ i−1 − ∂Vi−1 g(xi+1 ) − ki zi i+1 ∂x i = 1... Estabilizaci´ on de oscilaciones en sistemas no lineales 149 que supuestamente resulta de la linealizaci´on por realimentaci´on del sistema en lazo abierto.   . El objetivo es encontrar una ley de realimentaci´on del estado para cualquier valor de n. y su forma general viene dada por f0 = 0 f1 = −P x2 − k1 x3 fi = xi+1 − ki xi+2 i = 2.. evitando la forma recursiva (6.m .m donde se han empleado las definiciones i = 1..m 4 2 2 2 zi = xi+2 − ui−1 i = 1.......m Adem´as.. el vector de control gi (xi ) tiene i filas y toma la forma   0    0   g(xi ) =   .. produce la siguiente ley • Sistema de segundo orden: u0 = −x1 − k0 P x2 • Sistemas de orden n mayor que 2.. xi ]T 2 P V0 = 4 P 2 z12 z22 z2 Vi = + + + .Cap´ıtulo 6.. La parte no recursiva de ui se denominar´a fi en adelante. .7.. Recordemos que el procedimiento backstepping est´andar para sistemas en la forma can´onica de Brunovski.  1 de donde se obtiene que ∂zi−1 ∂Vi−1 ∂Vi−1 g(xi+1 ) = = zi−1 = xi+1 − ui−2 i+1 ∂x ∂xi+1 ∂xi+1 ∂V0 g(x2 ) = P x2 ∂x2 i = 2. x2 .3)....m Por tanto estamos en posici´on de deshacernos de derivada de la funci´on de Lyapunov en la formulaci´on recursiva u0 = −x1 − k0 P x2 u1 = u˙ 0 − x2 P − k1 (x3 − u0 ) ui = u˙ i−1 + ui−2 + ki ui−1 − xi+1 − ki xi+2       parterecursiva i = 2.n xi = [x1 .. + i i = 1..m partenorecursiva En esta expresi´on se han diferenciado dos partes: la recursiva y la no recursiva a efectos de los c´alculos posteriores. ... N´otese que la matriz Γi posee i + 1 filas e i columnas. Comentario 6.. .m     + f i = Γi ui−1 + f i   i = 1.   0  ... La descomposici´on sucesiva del vector ui en t´erminos de la matriz Γi .m donde se han definido los siguientes vectores y matrices  ui = [ui . donde se emplea el vector e1 = [1 0 . . ..8. Realizaci´on de una familia de sistemas oscilantes a partir de la linealizaci´ on por realimentaci´ on Si definimos el operador lineal  γi = ki + d dt se obtiene la siguiente sucesi´on u0 = −x1 − k0 P x2 u1 = γ1 u˙ 0 − x2 P − k1 x3 ui = γi ui−1 + ui−2 + fi que nos permite usar la notaci´on matricial   1 0 · · · 0 γ   i    0 γi−1 1 · · · 0  ui−1 ui      ..1) un = eT1 i=m j=1 k=m . .    . la funci´on fi y el vector ui−1 da lugar a ui = eT1 ui = eT1 (Γi ui−1 + f i ) = eT1 (Γi (Γi−1 ui−2 + f i−1 ) + f i ) . . u0 ]T i = 1.  .. . el producto est´a bien definido... 2 .. por los cual el producto Γi Γi−1 es el producto de una matriz de i columnas por otra de i filas. .     u u i−1 . 0 · · · γ2 1   . . .8.150 6. f0 ]T i = 1. Consecuentemente. Como resultado fundamental.  0 0 ··· =  i−2 ui ≡    . . m   0 ··· 0 γi 1    0 γi−1 1 · · · 0     .  0 0 · · · 0 γ1  u0 u0   0 0 ··· 0 1 i = 2. fi−1 . .    0 0 ··· . .1. .8.  Γi =  i = 1. . hemos obtenido la forma general del t´ermino n-´esimo: & 1 ' & j+1 ' m−1 +  + Γi u0 + eT1 Γk f j (6. .. 2 . . m  f i = [fi . 2 . m   0 0 · · · γ2 1     0 0 · · · 0 γ1    0 0 ··· 0 1 Para la multiplicaci´on de matrices conviene tener en cuenta el siguiente comentario. 0]T con la dimensi´on apropiada. . ui−1 .. . & x˙ n = eT1 1 + ' Γi u0 + eT1 m−1  & j+1 + j=1 k=m i=m ' Γk fj (6.. Γj k>j (6. .2) i=k Proposici´ on 6. Haremos uso del principio de inducci´on matem´atica. En la familia de sistemas de orden n x˙ 1 = x2 x˙ 2 = x3 .8.3) es GAS con respecto a la o´rbita P = 0 y zi = 0 ∀i con funci´on de Lyapunov Vn−2 = z2 P 2 z12 z22 + + + . .8. + m 4 2 2 2 Demostraci´on. n−2 4 2 2 2 y probaremos que el sistema de orden n + 1 con estructure (6. si en el sistema  Σn : 0 1 0 ··· 0   0 0 1 ··· 0  . n x˙ =  .. la ley de control u0 = −x1 − k0 P x2 estabiliza el sistema de segundo orden en P = 0 con funci´on de Lyapunov V0 = P 2 /4..Cap´ıtulo 6..3) las trayectorias convergen asint´ oticamente a la o´rbita oscilatoria donde P = 0 y zi = 0 ∀i con funci´ on de Lyapunov V = P 2 z12 z22 z2 + + + . Si n > 2.1. es decir j + Γi = Γk Γk−1 .. zi = 0 ∀i} y funci´on de Lyapunov Vn−1 2 2 zn−1 zn−1 P 2 z12 z22 = + + + . .3) es GAS con respecto {P = 0. supondremos que el sistema de orden n con estructura (6. .8.. Para n = 2. = Vn−2 + 4 2 2 2 2 Efectivamente..8.. . .8.  0 0 ···   0 0 ··· 0 1 0 0 ··· 0 0 se cumple que  V˙ m = 4 ∂Vm ∂xn     n  x + g(xn )un−2    T x˙ n ≤ 0 The only possible way according to matrix dimensions. Estabilizaci´ on de oscilaciones en sistemas no lineales 151 donde el s´ımbolo del producto debe ser entendido en orden decreciente de los ´ındices de izquierda a derecha4 . .m Entonces los u ´nicos conjuntos invariantes donde V˙ i = 0 son {x|P (x) = 0.8...m lo cual produce V˙ i = −k0 P x22 − k1 z12 − k2 z22 − ki zi2 i = 1. excepto la condici´on inicial (xi = 0. y concluimos del principio de LaSalle principio que el sistema Σn es GAS con respecto a la ´orbita {x|P (x) = 0. Este u ´ltima es un punto de equilibrio. Realizaci´on de una familia de sistemas oscilantes a partir de la linealizaci´ on por realimentaci´ on entonces. en el sistema Σn+1 tenemos  2 T T T  ∂Vm+1 ∂Vm 1 ∂zm+1 n+1 n+1 x˙ = x˙ + x˙ n+1 ∂xn+1 ∂xn+1 2 ∂xn+1 T  T   2 T ∂zm+1 ∂Vm 1 ∂zm+1 n n+1 = x˙ + x˙ ≤ zm+1 x˙ n+1 ∂xn 2 ∂xn+1 ∂xn+1 & ' T  ∂un−2 = zm+1 x˙ n+1 − x˙ n+1 = zm+1 (x˙ n+1 − u˙ n−2 ) ∂xn+1  V˙ m+1 = = zm+1 (un−1 − u˙ n−2 ) = zm+1 (−(xn − un−3 ) − kn−1 (xn+1 − un−2 )) 2 = −kn−1 zm+1 <0 La estabilidad asint´otica se demuestra analizando los conjuntos invariantes donde V˙ i = 0. 2 . zi = 0 ∀i} con funci´on de Lyapunov Vn−1 para todo n..152 6. zi = 0 ∀i} y x(t) ≡ 0 ∀t. ∀i). A partir de los c´alculos previos es f´acil comprobar que that V˙ i = V˙ i−1 − ki zi2 V˙ 0 = −k0 P x22 i = 1. Estabilizaci´ on de oscilaciones en sistemas no lineales 153 Ejemplos Sistema de dimensi´ on 3 A fin de ilustrar el empleo de la ecuaci´on (6. En este caso m = 1.Cap´ıtulo 6. aunque conceptualmente no presenta dificultad alguna. se obtendr´a a continuaci´on la ley de control para n = 3. Para ello se emplear´an las matrices     1 0 k3 + dtd d     + 1 k 2 dt   d d   k1 + dt 1 0 k2 + dt       Γ3 =  Γ1 =  Γ2 =  0 k1 + dtd       0 0 k1 + dtd  1   0 1 0 0 1 . N´otese tambi´en que el hamiltoniano en este caso es la funci´on de Lyapunov que se obtendr´ıa con el procedimiento de backstepping. la ley de control es u1 y las u ´nicas matrices y vectores involucrados son     γ1 − k x −P x 2 1 3 1  Γ1 =  f 0 = 0.8. Calcularemos la ley de control para un sistema de orden n = 5 y por tanto m = 2 en forma can´onica de Brunovski.1). A partir de orden 4 es preferible recurrir a una herramienta software de c´alculo simb´olico. f = 0 1 tras simples c´alculos se llega a u1 = [1 0](Γ1 u0 + f 1 ) = (−x1 − k0 P x2 )k1 − P x2 − k1 x3 − x2 − k0 (2 x1 x2 + 2 x2 x3 )x2 − k0 P x3 Es f´acil comprobar que con esta ley de control el sistema en bucle cerrado puede ser escrito en forma hamiltoniana:     β   −1 0 0 0 0 P P x˙ 1           + ∇V 0 − α−P −β k 0 −k   ∇V1   x˙ 2  =  −P −1 1 0 0 P     x˙ 3 β α−P 2 −P 0 0 −β k0 −β k0 − k1 P  α = −1 − 2k0 x1 x2  β = −2k0 x22 − k0 P donde la parte conservativa (matriz antisim´etrica a la izquierda) y la disipativa ( matriz semidefinida negativa a la derecha) han sido separadas para visualizar la estructura hamiltoniana. . es decir V1 = P 2 (x3 + x1 + x0 x2 P )2 + 4 2 Sistema de dimensi´ on 5 A medida que aumenta el orden del sistema el c´alculo gana en complejidad. 8.1) para n = 5:   u3 = [1 0 0 0 ] Γ3 Γ2 Γ1 u0 + Γ3 Γ2 f 1 + Γ3 f 2 + f 3   = −k0 x5 P − 3 k0 x4 (2 x1 x2 + 2 x2 x3 ) − 3 k0 x3 2 x2 2 + 2 x1 x3 + 2 x3 2 + 2 x2 x4 − k0 x2 (6 x2 x3 + 2 x1 x4 + 6 x3 x4 + 2 x2 x5 ) − k0 x4 P (k3 + k2 + k1 ) − 2 k0 x3 (2 x1 x2 + 2 x2 x3 ) (k3 + k2 + k1 )   − k0 x2 2 x2 2 + 2 x1 x3 + 2 x3 2 + 2 x2 x4 (k3 + k2 + k1 )   − 2 x2 2 + 2 x1 x3 + 2 x3 2 + 2 x2 x4 x2 − 2 (2 x1 x2 + 2 x2 x3 ) x3 − P x4 − k1 x5 + x4 − k2 x5 − k0 x3 P (k3 k2 + (k3 + k2 ) k1 + 2) − k0 x2 (2 x1 x2 + 2 x2 x3 ) (k3 k2 + (k3 + k2 ) k1 + 2) + (k3 + k2 ) (− (2 x1 x2 + 2 x2 x3 ) x2 − P x3 − k1 x4 ) − k0 x2 P (k3 k2 k1 + k1 + k3 ) + k3 (x3 − k2 x4 ) + k3 k2 (−P x2 − k1 x3 ) + x4 − k3 x5 − P x2 − k1 x3 Si bien es cierto que esta ley es bastante compleja.  .8. . Realizaci´on de una familia de sistemas oscilantes a partir de la linealizaci´ on por realimentaci´ on y los vectores    f3 =   x4 − k3 x5 x3 − k2 x4 −P x2 − k1 x3 0      − k x x 3 2 4  −P x2 − k1 x3  2   1 . f =  0 0 Mediante c´alculo simb´olico. f 0 = 0.154 6. que su validez es totalmente general para sistemas linealizables por realimentaci´on de quinto orden.8. se obtiene la f´ormula (6. cabe resaltar que el procedimiento de c´alculo es completamente sistem´atico. f =  −P x2 − k1 x3  . y que en virtud de la proposici´on 6. empleando las rutinas presentadas en el ap´endice B.1 estabiliza asint´oticamente al sistema en el conjunto deseado. 4. y consiste en una esfera met´alica homog´enea inmersa en un campo magn´etico vertical creado por un electroim´an sencillo. La posici´on vertical de la bola es la variable x1 .1 Sistema de levitaci´on magn´etica Para ilustrar la aplicaci´on del m´etodo a un sistema de tercer orden se ha escogido el sistema de levitaci´on magn´etica. Aplicando un primer lazo de realimentaci´on interna R (6. 6.9 Aplicaci´on a sistemas subactuados Se ha presentado en las secciones anteriores anterior un m´etodo para la generaci´on de oscilaciones estables por realimentaci´on en una clase de sistemas de control no lineales. estando el eje x1 orientado hacia arriba. Estabilizaci´ on de oscilaciones en sistemas no lineales 155 6. El flujo magn´etico en la bobina es la variable x3 .4: Sistema de levitaci´on magn´etica.1) donde x2 = mx˙ 1 . A fin de ilustrar el m´etodo se han seleccionado como ejemplos dos sistemas mec´anicos subactuados bien conocidos en la literatura y en el desarrollo de esta tesis: el sistema de levitaci´on magn´etica y la bola en la viga. en cuyo caso la soluci´on es trivial. Este sistema aparece representado esquem´aticamente en la figura 6. Las ecuaciones en bucle abierto del sistema de levitaci´on magn´etica vienen dadas por (Ortega et al.9.Cap´ıtulo 6. u i g x3 x1 m Figura 6.9. 1998) x˙ 1 = x2 1 2 x˙ 2 = x − mg 2k 3 R x˙ 3 = − (1 − x1 )x3 + u k (6. siendo m la masa de la esfera.2) − (1 − x1 )x3 + u = v k . y para una clase de subactuados que es la que se tratar´a en los ejemplos a continuaci´on.9. El m´etodo propuesto en el para la estabilizaci´on de oscilaciones funciona debidamente para sistemas completamente actuados. 9. la ecuaci´on (6.1 y µ = 0. por consiguiente.5.9.9.1.3) pertenece a la clase de sistemas (6.1) y consecuentemente es apropi1 2 x3 − mg y u0 (x1 ) = h−1 (−ωc2 x1 ) = ada para el backstepping.3) El sistema (6. Esto sugiere una estrategia de dise˜ no de un controlador en cascada. El equipamiento usado se muestra en la figura (6.4) que es la ley de realimentaci´on deseada.9.3 Modelo del sistema de laboratorio Aunque el sistema real est´a compuesto de los mismos elementos descritos en la secci´on 6. 6.9. Bajo cada uno de estos escenarios. Se muestran en ella tres simulaciones. Los resultados se ilustran en la figura 6. Cada gr´afica contenida en la fila superior de la figura representa las variables de estado oscilantes.1. como es el caso del m´etodo backstepping. Aplicaci´on a sistemas subactuados al sistema (6.156 6. h(x3 ) = 2k $ 2k(mg − ωc2 x1 ) y.9. el modelo difiere de manera significante del all´ı descrito.9. k1 = 0. Desde SIMULINK se registra la informaci´on generada por la rutina a una velocidad de diez veces inferior para evitar sobrecargar el algoritmo de control.1) se obtiene el siguiente sistema en cascada x˙ 1 = x2 1 2 x˙ 2 = x − mg 2k 3 x˙ 3 = v. 6. pero esto es logrado a su vez excitando un circuito de inducci´on con una ley de control aplicada como voltaje de entrada.2 Implementaci´on en un sistema de laboratorio Los resultados anteriores pueden ser trasladados a un sistema real de laboratorio con poco esfuerzo adicional. Si nuestro objetivo es hacer oscilar una bola met´alica inmersa en un campo magn´etico. El algoritmo de control se ejecuta peri´odicamente con una frecuencia de muestreo de 500Hz. El ordenador ejecuta una rutina de tiempo real que se comunica con MATLAB mediante una librer´ıa de enlace din´amico (DLL).9. el flujo magn´etico seguir´a una cierta forma de onda. ωc = 0. (6. las dos primeras de las cuales tienen constantes k = 1. En este caso. y en la tercera µ se ha hecho igual a −0.5. El m´etodo de dise˜ no propuesto admite una interesante interpretaci´on f´ısica en el caso del levitador magn´etico.5. para las mismas simulaciones. Esta ley a sido comprobada por simulaci´on dado el comportamiento deseado tanto para µ > 0 (oscilaciones) y para µ < 0 (equilibrio estable). El sistema de levitaci´on est´a conectado a un ordenador mediante una tarjeta conversora con canales anal´ogico/digital y digital/anal´ogico.2). x1 y x2 con respecto al tiempo en tres escenarios de simulaci´on diferentes.3) conduce a −ωc2 kx2 kx2 P k1 k u = −$ − − x3 x3 2k(mg − ωc2 x1 )  1 2 x − mg + ωc2 x1 2k 3  (6. se muestra la funci´on de Lyapunov obtenida en cada paso del procedimiento de backstepping. Esto es debido a la existencia a un lazo interior que compensa la din´amica de la que relaciona la tensi´on de entrada .9.5.1 para lograr un comportamiento de estabilizaci´on. ).00.) 2 x (cont. . mu=−0.00.).1 4 4 0 0 20 tiempo(s) −2 0 20 tiempo(s) 40 30 20 10 0 20 tiempo(s) 40 0 0 20 40 tiempo(s) 60 0 20 40 tiempo(s) 60 80 60 40 20 0 0 2 −4 40 Función de Lyapunov 50 2 −2 80 Función de Lyapunov Función de Lyapunov 60 −10 0 −4 40 1 4 1 −2 x (0)=1. x (0)=0. Estabilizaci´ on de oscilaciones en sistemas no lineales x (0)=0. mu=0.). x (0)=−3. x (0)=−3. x (discont.1 2 2 2 2 −4 1 x1(cont.10.Cap´ıtulo 6. mu=0.00.1 x (0)=1.) x1(cont.) 1 157 60 40 20 0 0 20 tiempo(s) 40 Figura 6.6: Sistema de levitaci´on magn´etica de laboratorio. Figura 6. x2(discont.00. x2(discont.5: Resultados de simulaci´ on en el levitador magn´etico.00. 15(u + u0 ) donde u0 es una constante. Los par´ametros a identificar son k. Con este experimento se obtienen una serie de puntos de equilibrio estabilizados que forman pares entrada-salida (u∗ .15.6) es. Por tanto la u ´nica manera de identificarlo experimentalmente es mediante la identificaci´on en bucle cerrado.9. como es habitual en control basado en pasividad.4). 6. Esto significa que el rendimiento depende en gran medida de un conocimiento preciso del modelo.3. k˜ = k/0. El hecho de que esta relaci´on sea puramente algebraica convierte a la ecuaci´on (6. La distancia vertical hacia abajo entre el electroim´an y la bola. altamente no lineal.4 Identificaci´on de par´ametros El controlador propuesto en (6. u0 y x0 son constantes del modelo que deben ser identificadas. Aplicaci´on a sistemas subactuados con la corriente de la bobina y por tanto con el campo magn´etico.158 6.9.5) (6.9.u0 y x0 . cada uno a un lado de la bola. En nuestro procedimiento de identificaci´on la referencia del control se incrementa de forma escalonada con un periodo lo suficientemente largo para lograr la estabilizaci´on.5)–(6. A este fin se ha empleado una red lineal de avance–retraso anal´ogica capaz de estabilizar la bola con una peque˜ na regi´on de atracci´on.1) en un modelo de segundo orden. mediante la cancelaci´on directa de t´erminos inestables. En este caso el campo magn´etico compensa con exactitud la fuerza constante de la gravedad.9. se basa en el ajuste de las ecuaciones de bucle abierto y cerrado. El sistema (6. Esto hace innecesaria la aplicaci´on de la extensi´on del m´etodo backstepping como se hizo en la secci´on anterior.9.9. A efectos pr´acticos la corriente viene dado por I = 0.6) donde k. e inestable.3).9.9. se mide mediante un emisor y receptor de infrarrojos. x1 . La din´amica en bucle abierto est´a descrita por las ecuaciones en variables de estado de son: x˙ 1 = x2 x˙ 2 = g − k˜  I X 2  =g−k u + u0 x1 + x0 2 (6. si se permite la incorrecci´on. Estos puntos deben ajustarse a la caracter´ıstica de r´egimen permanente dada por la ecuaci´on de equilibrio  ∗ 2 u + u0 0=g−k x∗1 + x0 la cual a trav´es del apropiado convenio de signos representa una relaci´on lineal est´atica u∗ . Un posici´on de la bola estable corresponde a una corriente (y tensi´on de entrada) constantes. x∗1 ) (v´ease la figura 6. Las se˜ nales de entrada (u) y salida (y = x1 ) son registradas desde el PC con una tarjeta A/D a una frecuencia de 500 Hz. → x∗1 . de la ecuaci´on de la recta s´olo podemos extraer dos par´ametros.  k ∗ x∗1 = −x0 + (u + u0 ) g Incluso si la informaci´on obtenida del r´egimen permanente es lo suficientemente precisa para continuar. ya que la ecuaci´on general es: x∗1 = b1 u∗ + b0 . Para caracterizar la respuesta transitoria con la mayor cantidad de informaci´on posible se ha hecho variar la referencia siguiendo una secuencia aleatoria de escalones. De b1 derivamos el valor k = 11.5 −0. para el cual las se˜ nales. donde las inc´ognitas x0 y u0 aparecen de linealmente. x0 .Cap´ıtulo 6. De este modo el problema se ha transformado en la identificaci´on no lineal de un sistema linealmente parametrizado. Los escalones deben sucederse a una frecuencia suficientemente alta para que la bola no alcance a estabilizarse.86. x + x0 las cuales pueden ser reordenadas para dar lugar a la ecuaci´on vectorial %  % x¨ − g x¨ − g x−u= − k k  1 x0 u0  .73 V y u0 = 4. Para emplear la informaci´on recabada las ecuaciones del modelo pueden reescribirse del siguiente modo √ u + u0 $ x¨ − g = k .5 0 Posición en regimen permanente entrada (V) y posición (mm) Respuesta a la secuencia de escalones 0 −0.5 0. Estabilizaci´ on de oscilaciones en sistemas no lineales Grafico x−y de regimen permanente 1 0.5 0 0. La informaci´on adicional necesaria no puede obtenerse del comportamiento en r´egimen permanente. Por tanto hemos de obtener una tercera ecuaci´on para identificar los tres par´ametros (u0 .5 −2 0 10 20 tiempo (s) 30 −2. dentro del rango de validez del controlador no lineal. han sido prefiltradas con un filtro digital de Butterworth con frecuencia de corte digital wn = 0. k) e identificar completamente el modelo.5 1 Tensión de entrada en régimen permanente Figura 6. De nuevo se muestrean la entrada y la salida a una frecuencia de 500Hz y se registran en MATLAB.5 −2 159 −0. .9 V.5 −1 −1. para el cual la aplicaci´on directa de la formulaci´on de m´ınimos cuadrados proporciona los valores x0 = 6.5 −1 −1.7: Identificaci´ on de la recta de r´egimen permanente.8 rad/s. # donde b1 = kg es la pendiente identificada y b0 = −x0 + b1 u0 es la intersecci´on con el eje u∗ de la recta que se ha identificado. La principal dificultad detectada en este enfoque es la obtenci´on de un vector de aceleraci´on limpio a partir de las muestras de la posici´on. 5 Posicion (mm) Posicion (mm) 160 −0. (6.5 22 22.8) al sistema de levitaci´on magn´etica real. 6. u= k Esta ley se aplica a trav´es del convertidor sample and hold digital–anal´ogico.5 10 −2. En el primer experimento.20. el valor de ωc .8: Respuesta transitoria al variar µ entre los valores 0.5 20 20.10. Los resultados aparecen en la figura 6.5 −1.9. mientras que la constante µ.5 23 Tiempo (s) 23. la frecuencia deseada de la oscilaci´on se ha fijado a 20 rad/s.5 −1 −1.3 tendremos la siguiente ley de control % g + ωc x21 + ka P (x)x2 (6. y 0. A la constante ka se le ha dado el valor 0.6 Resultados experimentales Analizaremos los resultados obtenidos al aplicar la ley de control (6.5 −2 −2 −2 −2. 10.5 −1 −0.9.9. no ha sido considerado necesario hacer ninguna transformaci´on para operar en tiempo discreto. Para la frecuencia de muestreo especificada. Aplicaci´on a sistemas subactuados 1 1 0.5 Dise˜no del controlador Si se cuenta con un conocimiento preciso de los par´ametros del sistema.5 −1. responsable de la amplitud de las oscilaciones toma los valores 0.5 0 0 0 −0.5 49 49. por medio de la aproximaci´on de Euler hacia atr´as de la derivada.5 25 −2. .0. la constante ka se fija a 0.0 y de vuelta a 0.7) Si ahora escogemos v2 = −ωc x21 − ka P (x)x2 tal y como se explic´o en la secci´on 6. All´ı se puede apreciar en detalle el comportamiento transitorio al variar µ escalonadamente de 0 a 10.5 46 46. la ecuaci´on (6.5 7 7.5 24 24.0.0005. 6.5 0. k Y en consecuencia el sistema se transforma en x˙ 1 = x2 x˙ 2 = v2 .9.7) se linealiza por realimentaci´on aplicando la ley u = −u0 + v1 (x1 + x0 ) % g − v2  v1 = . 500 Hz.0005. a 10 y de nuevo a 0.5 Tiempo (s) 8 8.5 −1 Posicion (mm) 1 0. 20. despu´es a 20.9.5 47 47.5 5 5.0.5 48 Tiempo (s) 48.5 6 6. x2 .5 50 Figura 6.9. habiendo observado que es conveniente para un mejor rendimiento reducir su valor a medida que se hace crecer la amplitud de las oscilaciones.10.9.5 9 9.5 21 21.6. m´as all´a del c´alculo de la velocidad de la bola.0.8) (x1 + x0 ) − u0 . 10. de nuevo. el sistema admite la descripci´on alternativa      x˙ 1 x˙ 2 x˙ 3 x˙ 4       =   x2 2 B(x1 x4 − Gsenx3 ) x4 0       +   0 0 0 1     u.2. Estabilizaci´ on de oscilaciones en sistemas no lineales 161 A continuaci´on se enumerar´an las ventajas de el empleo de este controlador frente a t´ecnicas m´as sencillas como el control lineal o el de trayectorias 1. q2 . lo cual es en general ventajoso para la calidad de los transitorios.5.Cap´ıtulo 6. Un control por PID o una red de avance. y x3 el ´angulo de la barra (q1 y q2 respectivamente en la figura 4. el sistema (6. 2. 5. . 1992) obtenida al ignona rar el t´ermino de aceleraci´on centr´ıfuga x1 x24 . q˙2 ] y aplicando la ley de linealizaci´on parcial τ = (−2q1 q˙1 q˙2 − gq1 cos(q2 ))/(L2 + q12 ) + u para cancelar los t´erminos de la cuarta fila. El ancho de banda del controlador es mayor que el de un controlador lineal. 4. x4 ] = [q1 . aunque en la pr´actica encontrar´a sus l´ımites en la frecuencia de Nyquist y en la din´amica del lazo interno de corriente que se supuso ideal. El enfoque aqu´ı propuesto est´a te´oricamente ilimitado en la frecuencia de oscilaci´on.1) en variables de estado. 1992). Esto no suceder´ıa en un control lineal.9) La variable x1 denota la posici´on de la bola. suponiendo una velocidad angular peque˜ de la bola. El controlador propuesto no emplea se˜ nales dependientes del tiempo como trayectorias de referencia. la trayectoria objetivo del sistema no posee informaci´on de fase. Emplearemos el resultado del corolario 6. Definiendo el vector de estado como [x1 .9) puede ser normalizado haciendo B = G = 1. sin presentar distorsiones en la forma de la oscilaci´on al aumentar la amplitud. q˙1 . con anchos de banda limitados.9. Con la intenci´on de escribir el sistema en la forma (6.7 Oscilaciones en la bola en la viga Esta secci´on presenta un ejemplo de aplicaci´on de los resultados previos a un sistema de cuarto orden. es la bola en la viga que fue representado en la figura 4. El sistema que se tratar´a. x3 . x2 . El controlador no lineal funciona uniformemente en todo el rango del sensor de posici´on. se emplear´a una aproximaci´on frecuentemente utilizada (Hauser et al.6.4. M´as a´ un.  (6. seg´ un se aparece en (Hauser et al. para finalmente demostrar la recursividad y sencillez del m´etodo.6).9.1). ya que en nuestro caso el sistema puede entrar en la o´rbita peri´odica en cualquier punto de ´esta. En la pr´actica la regi´on de atracci´on del controlador presentado coincide con el rango de funcionamiento de dicho sensor. 6. podr´ıa seguir trayectorias de referencia senoidal hasta una determinada frecuencia m´axima.6.9. A frecuencias superiores la amplitud de las oscilaciones decrecer´ıa. Para escribir el modelo en una forma en la que se pueda aplicar f´acilmente el m´etodo descrito reescribiremos el modelo de Euler–Lagrange (4. 3. Como se apunt´o en la introducci´on. la aplicaci´on recursiva del procedimiento de backstepping para sistemas de orden mayor dada en la ecuaci´on (6. En primer lugar. proporciona las siguientes leyes de control: u1 u2   1 ∂V0  =  − k1 (−senx3 + senu0 ) h (u0 )u˙ 0 − h (x3 ) ∂x2 ∂V1 = u˙ 1 − − k2 (x4 − u1 ) ∂x3 (6.13) (6.11) Este sistema. Aplicaci´on a sistemas subactuados Entonces se tiene      x˙ 1 x˙ 2 x˙ 3 x˙ 4       =   x2 −senx3 x4 0       +   0 0 0 1     u. la realimentaci´on (6. unido a la ecuaci´on x˙ 3 = x4 posee la misma estructura que las ecuaciones (6.10) Este sistema tiene la forma (6.5. en el primer paso.9.6.  (6.14) Las funciones de Lyapunov obtenidas en cada paso son 1 2 P 4 1 2 = P + 4 1 2 = P + 4 V0 = V1 V2 1 1 1 (−senx3 + senu0 )2 = P 2 + z12 2 4 2 1 1 1 1 1 (−senx3 + senu0 )2 + (x4 − u1 )2 = P 2 + z12 + z22 2 2 4 2 2 donde las variables de error zi se definen como  z1 = h(x3 ) − h(u0 ) = −senx3 + ωc2 x1 + k0 x2 P (6. x2 ) = sen−1 (ωc2 x1 + k0 x2 P ). el m´etodo introducido en las secciones previas le es de aplicaci´on. (6.9. (6.12) Entonces.9.1) para m = 2.162 6.9.1).6.9.9.2). por consiguiente. Consecuentemente.3. es decir  x˙ 1 x˙ 2   = x2 −senx3  . consid´erese el sistema de segundo orden formado por las dos primeras ecuaciones de (6.16) .15)  z2 = x4 − u1 .1) (tomando x4 como una variable de control virtual) y. (6.9.5.9.3) puede aplicarse dando lugar a x3 = u0 (x1 . que se demostr´o en la secci´on 2.3) y (6. respectivamente.17) 6 k0 (senx3 )2 x2 − ((P + 2 x2 2 ) k0 k1 + 6 k0 x2 ωc 2 x1 + ωc 2 + 2 x2 2 + P ) senx3 cos x3 2 2 2 2 (2 k0 x2 ωc + 2 x2 ωc x1 + k1 ωc + 2 k1 k0 x2 ωc 2 x1 ) x2 + cos x3 ((k1 k0 x2 + x2 ) x4 P + (ωc 2 x2 + 2 k0 x2 2 ωc 2 x1 + k1 ωc 2 x1 ) x4 ) senx3 + (cos x3 )2     − k0 x4 P + k1 + 2 k0 x2 2 x4 (tan x3 )2 (6. Para completar la afirmaci´on basta probar que esta propiedad tambi´en es cierta cuando el sistema est´a expresado en variables x.1. Estabilizaci´ on de oscilaciones en sistemas no lineales 163 Desarrollando (6. seg´ un (6.9. las ecuaciones en bucle cerrado toman la forma x˙ 1 x˙ 2 x˙ 3 x˙ 4 = = = = + + + − x2 −senx3 x4   z1 cos x3 + −k1 − k0 P − 2 k0 x2 2 x4 − k2 z2 (6.19) 6 k0 (senx3 )2 x2 − ((P + 2 x2 2 ) k0 k1 + 6 k0 x2 ωc 2 x1 + ωc 2 + 2 x2 2 + P ) senx3 cos x3 (2 k0 x2 2 ωc 2 + 2 x2 ωc 2 x1 + k1 ωc 2 + 2 k1 k0 x2 ωc 2 x1 ) x2 cos x3 ((k1 k0 x2 + x2 ) x4 P + (ωc 2 x2 + 2 k0 x2 2 ωc 2 x1 + k1 ωc 2 x1 ) x4 ) senx3 (cos x3 )2     k0 x4 P + k1 + 2 k0 x2 2 x4 (tan x3 )2 Comentario 6. en virtud del corolario 6. Pero este hecho se desprende de la invariabilidad de la estructura hamiltoniana frente al cambio de variables.3. a pesar de su complejidad.14).9. Recu´erdese que este sistema.9. z1 z2 ]T donde J(z) y R(z) poseen la forma (6.9.Cap´ıtulo 6.2 que el cambio x˙ 1 x˙ 2 z˙1 z˙2 = = = = x2 z1 − ωc2 x1 − k0 x2 P h (x3 )z2 − x2 P − k1 z1 −h (x3 )z1 − k2 z2 conduce a la descripci´on en variables de estado z˙ = (J(z) − R(z))∇z V2 (z)  z = [x1 x2 . est´a descrito en forma hamiltoniana generalizada disipativa con funci´on de Hamilton V2 .9.9. .6.13)-(6.6.6.10) y la cuarta ecuaci´on de estado se convierte en x˙ 4 = u2 . Para comprobar este hecho basta observar.19).9.18) + donde u = u2 es la ley de control que ha de aplicarse a (6.1. Con esta ley.4). se obtiene k1 z1 + ωc 2 x2 + 2 k0 x2 2 ωc 2 x1 − k0 P senx3 − 2 k0 x22 senx3 + P x2 cos x3   = z1 cos x3 + −k1 − k0 P − 2 k0 x2 2 x4 − k2 z2 u1 = u2 (6.9. calcularemos la matriz jacobiana evaluada en el origen del sistema de cuarto orden en bucle cerrado .8 Bifurcaciones en el sistema de la bola y la viga En este apartado detectaremos la aparici´on de una bifurcaci´on de Hopf asociada al par´ametro µ en el sistema (6.19) en bucle cerrado.5. Consid´erese el sistema (6.5. Proposici´ on 6.      0 0 0 1   2 2 2 2 2 ωc + ωc k1 k2 k1 ωc + k2 ωc − k2 µ −1 − ωc + µ − k2 k1 −k1 − k2 cuyo polinomio caracter´ıstico es     s4 + (k1 + k2 ) s3 + 1 + ωc 2 − µ + k2 k1 s2 + (k1 + k2 ) ωc 2 − k2 µ s + (1 + k2 k1 ) ωc 2 .9.9. A fin de verificar que las condiciones para la ocurrencia de una bifurcaci´on. Aunque la proposici´on 6.9.20) Las dos primeras condiciones son satisfechas para µ< (k1 + k2 ) (1 + k2 k1 )  = µmax . Esto es cierto cuando k1 > 0 y k2 > 0.164 6.   0 1 0 0     0 0 −1 0   .2)) son k1 + k2 > 0. Aplicaci´on a sistemas subactuados 6. 2 .1.1)–(2. Esta ecuaci´on tiene dos de sus ra´ıces en s = ±jωc mientras que las otras tienen parte real negativa siempre que k1 > 0 y k2 > 0. ´este es un sistema de cuarto orden que experimenta una bifurcaci´on de Hopf en virtud de la siguiente proposici´on. La condici´on para la existencia de ra´ıces puramente imaginarias (recu´erdese las ecuaciones (2.19). k1 mientras que la u ´ltima tiene dos ra´ıces reales para µ.20) cambia de signo al hacerlo µ. Demostraci´on. k1 − k1 µ + k2 k1 + k2 + k2 2 k1 > 0. a saber   (k1 + k2 ) k1 ωc 2 + k2 2 k1 + k2 µ1 = 0 µ2 = k2 k1 Observando que µ2 > µmax concluiremos que el u ´nico valor del par´ametro µ tal que exista un par de ra´ıces puramente imaginarias es µ = 0. 2 (6. Este sistema presenta una bifurcaci´ on de Hopf para µ = 0. La transversalidad ser´a satisfecha si el primer miembro de (6.3 se ha demostrado para el caso de dimensi´on tres.9.9.9.   k1 k2 µ2 − (k1 + k2 ) k1 ωc 2 + k2 2 k1 + k2 µ = 0.9.5. Entonces el polinomio puede ser factorizado como    2 ωc + s2 s2 + sk1 + sk2 + 1 + k2 k1 = 0. G = 1.10 muestra la cuenca de atracci´on del ciclo l´ımite obtenida por simulaci´on al hacer µ = 0.9) en lugar del aproximado (6. si la ley de realimentaci´on (6.9. k1 = 0. . la figura 6.18).9.9. el comportamiento deseado (oscilatorio o estabilidad asint´otica) sigue obteni´endose.9.9.9. al menos de forma local en torno al equilibrio. mientras que las tres u ´ltimas se obtienen con µ < 0 y por tanto estabilizando el sistema en el origen. G = 3.1.9. en este caso. Las condiciones iniciales var´ıan de una simulaci´on a la siguiente. Sin embargo.0 en la simulaci´on) la forma de la oscilaci´on l´ımite en x2 se aleja progresivamente del perfil senoidal.9.10). la bifurcaci´on mantiene su naturaleza supercr´ıtica. Esta regi´on es notablemente menor que la obtenida en el sistema de levitaci´on magn´etica.9 Efecto de la aceleraci´on centr´ıfuga La ley de realimentaci´on (6. Pero. Adem´as de la existencia de una regi´on de atracci´on limitada. El t´ermino x1 x24 afectar´a a la forma y tama˜ no de la cuenca de atracci´on del ciclo l´ımite. otra consecuencia de ignorar el t´ermino x1 x24 en (6.9) y (6. El resto de los par´ametros son B = 1. La primera gr´afica ilustra un comportamiento cuasi-arm´onico puro para valores peque˜ nos de µ (en la simulaci´on µ=0. Esto se debe al hecho de que el t´ermino ignorado x1 x24 no afecta a la matriz de linealizaci´on Jacobiana de (6. k2 = 10.9). pero no la producci´on de la bifurcaci´on misma.9. Esto se ilustra en la figura 6.4).9 muestra los resultados de simulaci´on del sistema de la bola en la viga empleando la ley de control (6.1 (se ha incrementado el valor de G para subrayar dicho t´ermino de distorsi´on). Finalmente. obteniendo un comportamiento oscilatorio. Podr´ıa afectar a la naturaleza (subcr´ıtica o supercr´ıtica) de la bifurcaci´on de Hopf. Las tres gr´aficas superiores corresponden a valores positivos de µ. como se ha comprobado en las simulaciones.9) es la distorsi´on de oscilaciones que aparecen al crecer µ. pero al crecer µ (4.18) se aplica al modelo (6.9. Las zonas oscuras indican condiciones iniciales de velocidad nula para las cuales las trayectorias convergen al conjunto l´ımite deseado.11.10).Cap´ıtulo 6. k2 = ωc = 0. Estabilizaci´ on de oscilaciones en sistemas no lineales 165 6.9. La figura 6.18) logra el comportamiento deseado al aplicarse al sistema (6. dentro de la cuenta de atracci´on. pero el sistema de la bola y la viga se modela con m´as precisi´on mediante las ecuaciones (6. Esto se debe al uso de un modelo simplificado de la bola en la viga en el procedimiento de dise˜ no del controlador. y por consiguiente la bifurcaci´on de Hopf se produce en el mismo punto ya se trate del sistema completo o el aproximado. donde el sistema en bucle cerrado se ha simulado con los valores B = 1.10). k1 = 0. ωc = 0.5. 1 1 0 −1 0 100 200 tiempo(s) 300 0 −0. x (trazos) x1(cont. x3(0)=0.01.00. µ=0.00.5 1 Puntos fuera del dominio de atraccion (area en blanco) x3(0) 0. µ=−0.5 0 Puntos dentro del dominio de atraccion (area punteada) −0.5 2 0 −1 −1.80. µ=−0.1 4 2 3 1. µ=−0.10: Estimaci´ on num´erica de la cuenca de atracci´on. x3(0)=0.166 6.). x2(trazos) x1(0)=2. x (trazos) 2 −0.5 2 100 200 tiempo(s) 0 1 0. x2(trazos) x1(0)=0. µ=0.5 2 1 1 −0. Aplicaci´on a sistemas subactuados x1(0)=3.5 0.30.1 0. x3(0)=0. µ=0.5 0 100 200 tiempo(s) 300 Figura 6.5 1 0 0 x (cont.00. x3(0)=0.9: Resultados de simulaci´ on del sistema de la bola en la viga.5 3 1.5 1 1 1 −1 1 2 2 0 x (cont.).1 x (cont.5 −0.1 4 x (cont. 1. x3(0)=0. x (trazos) 0.5 x1(cont.).1 x1(0)=2.).30.80. x3(0)=0.).9.90.01.00.). x (trazos) −1.5 −6 −4 −2 0 2 4 6 x1(0) Figura 6.5 0 200 tiempo(s) 0 100 200 tiempo(s) 300 −1 400 0 100 200 tiempo(s) 300 x1(0)=3. .5 2 −1 300 x1(0)=0.90.5 −1 −1. 3). a el caso de estabilizaci´on de conjuntos l´ımite de mayor dimensi´on como es el caso de ´orbitas peri´odicas.1 del m´etodo de Inmersi´on e Invariancia de (Astolfi & Ortega 2001) al modelo simplificado normalizado (6. se abordar´a el problema de la estabilizaci´on de ´orbitas peri´odicas desde una perspectiva diferente. En este espacio se definir´a una variedad atractiva en la que las trayectorias siguen una oscilaci´on sinusoidal pura. Estabilizaci´ on de oscilaciones en sistemas no lineales 167 Figura 6. Asimismo supone una alternativa viable para el caso de sistemas no lineales de orden mayor que dos que no posean estructura en cascada.11: Distorsi´ on para grandes amplitudes.7. Ortega & Aracil 2002).cuyos resultados se han publicado en (Gordillo. La novedad de este enfoque reside en la extensi´on del m´etodo de Inmersi´ on e Invariancia (v´ease la proposici´on 2.10) del sistema de la bola en la viga (figura 4. en un espacio de orden cuatro que es el espacio de estados del sistema original.9.2.7) y V0 = P 2 /4. de modo que esta variedad sea invariante y atractiva en el espacio m-dimensional.7. Para ello se har´a una inmersi´on de la din´amica objetivo del sistema oscilante definido en (6. 6.6) con din´amica objetivo (6. En nuestro caso la variedad de orden mayor.1). aplicaremos la proposici´on 2.7. Se pretende servir´a para ilustrar una t´ecnica de reciente desarrollo y extenderla al dominio de las oscilaciones. El sistema de orden menor correspondiente a la din´amica objetivo (ecuaci´on (2.7.Cap´ıtulo 6. Ortega & Aracil 2002). G´omez-Estern.2. .3). inicialmente concebido para la estabilizaci´on de equilibrios. De nuevo se evitar´a tratar el problema de las oscilaciones como un seguimiento de trayectorias sinusoidales la inconveniencia de tratar con se˜ nales dependientes del tiempo. El m´etodo de Inmersi´ on e Invariancia est´a dise˜ nado con la idea de convertir una din´amica objetivo estable de orden n en una variedad diferenciable inmersa en un espacio de orden m > n. viene dada por el sistema de la bola en la viga. Como se indica en (Gordillo.1).7) en la proposici´on (2.8)en la proposici´on de Inmersi´on e Invariancia) ser´a el sistema hamiltoniano oscilatorio de segundo orden (6.2. representada por (2.7.10 Estabilizaci´on de oscilaciones por Inmersi´on e Invariancia En esta secci´on. G´omez-Estern. 1 Resultados de la simulaci´on A fin de mostrar el comportamiento de la ley de control obtenida se presenta una simulaci´on para µ = 0. Finalmente.1.3) ∂S ∂S ∂S x2 − senx3 + x4 ∂x1 ∂x2 ∂x3 (6. es obvio que φ˙ 1 = φ2 .2) La elecci´on obvia para el primer elemento de la variedad impl´ıcita (6. 0.10. x2 . la figura 6.14 muestra el retrato de estados proyectado en el plano (x1 − x2 ).2. La figura 6. Sea φ2 φ2 (x) = x4 − ∂π3 |x ∂π3 |x x2 − (−senx3 ) ∂x1 ∂x2 N´otese que la identidad de la variedad impl´ıcita (6. k1 = 1 y k2 = 1. φ2 = 0} ⇒ x4 = ∂π3 ∂π3 ξ2 + (−ξ1 − ka ξ2 P (ξ)) ∂ξ1 ∂ξ2 Con esta elecci´on.1. 0]. 0. x3 ) = − ∂π3 |x ∂π3 |x x2 + senx3 ∂x1 ∂x2 se obtendr´a el sistema exterior a la variedad (donde z = 0 implica estar en ella) (2. es φ1 (x) = x3 − sen−1 (x1 + ka x2 P (x1 .10. que resulta π3 (ξ) = sen−1 (ξ1 + ka ξ2 P (ξ)) ∂π3 ∂π3 π4 (ξ) = ξ2 + (−ξ1 − ka ξ2 P (ξ)) ∂ξ1 ∂ξ2 (6. mientras que la figura 6.10.7) es cierta.12 muestra las trayectorias de las coordenadas fuera de la variedad z1 y z2 tendiendo a cero. 6.1) (6.9. Entonces.11) como sigue z˙1 = z2 z˙2 = v + (6.4) Entonces. . Las funciones π3 y π4 pueden determinarse imponiendo la condici´on de invariancia. una posible ley de control estabilizante es v=− ∂S ∂S ∂S x2 + senx3 − x4 − k1 φ1 (x) − k2 φ2 (x) ∂x1 ∂x2 ∂x3 con k1 .10.7).2. definiendo  S(x1 . x2 )).13 muestra que. ka = 1.10. φ1 .10. las √ variables x1 y x2 de hecho exhiben oscilaciones sinusoidales con la amplitud deseada µ. Las condiciones iniciales son x(0) = [0. tras un periodo transitorio. Para forzar las oscilaciones en la coordenada de la bola escogeremos π1 = ξ1 y π2 = ξ2 .168 6. k2 > 0.7. Estabilizaci´on de oscilaciones por Inmersi´ on e Invariancia El primer paso del m´etodo es la determinaci´on del mapeo π(ξ). dado que {φ1 = 0. 12: Evoluci´ on de z1 y z2 .8 0.6 0.6 x (cont.4 2 0.Cap´ıtulo 6.2 x2 0 −0. 0.2 −0.6 0.13: Evoluci´ on de x1 y x2 .5 0 5 10 15 Tiempo (s) 20 25 30 Figura 6.6 −0.) x (discont.) 0.) φ (discont.4 −0.) 0.2 0. .6 −0.8 −0.6 −0.14: Retrato de estados proyectado en (x1 − x2 ).4 −0. 1 0.5 −1 −1.2 1 0 −0.4 −0.8 1 x1 Figura 6.2 0 0.2 −0.5 φ 1 −0.4 0. Estabilizaci´ on de oscilaciones en sistemas no lineales 169 1 0 2 (cont.4 0.8 −0.8 0 5 10 15 Tiempo 20 25 30 Figura 6. Estabilizaci´on de oscilaciones por Inmersi´ on e Invariancia .10.170 6. La clase viene dada en t´erminos de resolubilidad de dos sistemas de ecuaciones diferenciales parciales (4. Posteriormente se ha desarrollado un controlador basado en pasividad para el seguimiento visual de objetivos m´oviles. as´ı como el m´etodo empleado para la identificaci´on de los par´ametros del sistema.2. Finalmente se han presentado los resultados experimentales en bucle cerrado. La ley de control se obtuvo imponiendo ciertas condiciones a las ecuaciones de lazo cerrado. El m´etodo se basa en la modificaci´on de la funci´on de energ´ıa del sistema y su formulaci´on hamiltoniana.Cap´ıtulo 7 Conclusiones y desarrollos futuros Este cap´ıtulo se dedica a la exposici´on resumida de las aportaciones de esta tesis comenzando por el cap´ıtulo 3. para la que se ha dise˜ nado un controlador basado en estas t´ecnicas. como para estabilizar puntos de equilibrio.1 Conclusiones del cap´ıtulo 3 En el cap´ıtulo 3 se ha presentado el desarrollo te´orico y la implementaci´on pr´actica de un m´etodo de control no lineal que tiene su utilidad tanto para linealizar y desacoplar las articulaciones de un sistema multivariable. 7.13). de los que se obtuvo un juego de par´ametros del modelo fiables con los que ajustar el controlador para estabilidad asint´otica global. Se ha realizado una serie de experimentos de identificaci´on. 7. El hecho de obtener un sistema en bucle cerrado con estructura hamiltoniana ha sido explotado para resolver el problema de rechazo de perturbaciones con ganancia L2 . Aunque es bien sabido que resolver EDPs es 171 . (4.2 Conclusiones del cap´ıtulo 4 En el cap´ıtulo 4 se ha caracterizado un clase de sistemas mec´anicos subactuados para los cuales la recientemente desarrollada metodolog´ıa IDA-PBC proporciona una estabilizaci´on suave. de Ingenier´ıa de sistemas y Autom´atica de la Universidad de Sevilla.2. Al final del cap´ıtulo se propondr´an una serie de trabajos de desarrollos futuros a modo de continuaci´on de la investigaci´on desarrollada en esta tesis. Las dificultades detectadas durante la implementaci´on real del sistema han sido descritas.12). Se ha resuelto el caso particular de una plataforma de sensores de dos grados de libertad construida en el laboratorio del Depto. V´ease tambi´en (Praly.3. Para ilustrar la t´ecnica. Algunos resultados preliminares a lo largo de estas l´ıneas para sistemas de levitaci´on magn´etica y motores el´ectricos son muy prometedores (Rodr´ıguez & Ortega 2002). no basta con encontrar cualquier soluci´on Md y Vd de las PDE’s. en esencia. que comprende algunos de los m´as estudiados en la literatura. desarrollando condiciones para la no resolubilidad de las EDPs. y tratando de resolver la ecuaci´on algebraica para Jd .172 7. y por otro. En primer lugar se puede tratar de evitar resolver las (infames) ecuaciones diferenciales parciales. Esto es. Esta reducci´on se aplica a una amplia clase de sistemas subactuados. fijando la funci´on de energ´ıa Hd a cierta forma deseada. en opini´on del autor de esta tesis. En tercer lugar ser´ıa deseable. para llevar a t´ermino las limitaciones intr´ınsecas de la metodolog´ıa (por ejemplo. se han a˜ nadido algunos grados de libertad—la matriz de interconexi´on en bucle cerrado J2 —para simplificar la tarea. En opini´on del autor de esta tesis. ya discutimos en la secci´on 4. mediante transformaciones algebraicas de las ecuaciones de moldeo de energ´ıa. Hay muchos posibles extensiones para el trabajo de este cap´ıtulo. manteniendo la bola dentro de la longitud de la viga. adem´as de dar algunas claves para su resoluci´on. Para ello se ha propuesto nueva parametrizaci´on de los de los elementos . De nuevo.4 que el IDA-PBC permite la consideraci´on de fuerzas girosc´opicas en la funci´on de energ´ıa. Las f´ormulas resultantes tienen una estructura que permite en el caso de dos grados de libertad. 2001). v´ease tambi´en (Rodr´ıguez & Ortega 2002). El estudio de esta restricci´on adicional est´a esencialmente abierto. planteando el problema dual. Ortega & Kaliora 2001) para una soluci´on alternativa. se ha presentado una realimentaci´on no lineal de la salida IDAPBC que estabiliza para cualquier condici´on inicial (excepto un conjunto de medida cero) la posici´on vertical superior de un p´endulo invertido recientemente presentado (Spong et al.) Un aspecto particularmente importante es que a efectos de estabilidad. el enfoque adoptado en el reciente art´ıculo de (Fujimoto & Sugie 2001). sino una que satisfaga cierta clase de “condiciones de contorno”. tener un mejor entendimiento de las EDPs que aparecen en IDA-PBC. usando un variaci´on del forwarding. para obtener un procedimiento de dise˜ no m´as sistem´atico. con realimentaci´on del estado completo.2. se trata del primer resultado de swingup y estabilizaci´on de un p´endulo subactuado sin el empleo de conmutaci´on ni haciendo medida alguna de la velocidad. por supuesto. Tambi´en hemos derivado una ley de realimentaci´on est´atica del estado IDAPBC para el conocido sistema de la bola en la viga. En segundo lugar. Aunque no es claro a estas alturas c´omo pueden ser aprovechadas en aplicaciones mec´anicas. la construcci´on de una soluci´on por medio de la integraci´on de una funci´on monovariable. capaz de estabilizar asint´oticamente el equilibrio en cero para un conjunto bien definido de condiciones iniciales. 7. no existe en la literatura ning´ un resultado semejante relativo a la calidad del transitorio de este sistema. se sabe que juegan un papel fundamental en aplicaciones electromec´anicas. donde el equilibrio deseado no ocurre para una energ´ıa cin´etica nula. Conclusiones del cap´ıtulo 5 en general dif´ıcil. por un lado.3 Conclusiones del cap´ıtulo 5 En el cap´ıtulo 5 se ha obtenido una descripci´on m´as sencilla y pr´actica del m´etodo IDAPBC. Sin embargo. es que independientemente del orden del sistema. cabe recalcar que las dificultades computacionales aumentan considerablemente cuando se trata de sistemas de m´as de dos grados de libertad. en bucle cerrado se obtiene una estructura hamiltoniana generalizada con disipaci´on con respecto a la funci´on de Lyapunov constru´ ida en la fase de backstepping.Cap´ıtulo 7. la reducci´on propuesta no pierde generalidad con respecto al m´etodo general IDA-PBC descrito en el cap´ıtulo anterior y por tanto en muchos casos se dispone de grados de libertad suficientes para resolver el problema. as´ı como las posibilidades de ajuste de constantes con significado f´ısico ilustra las ventajas del m´etodo. La metodolog´ıa se extiende a orden mayor. El segundo resultado que se desprende de esta t´ecnica. Finalmente se ha abordado el problema de la oscilaci´on con din´amica objetivo el sistema hamiltoniano generalizado empleando un m´etodo novedoso. El ciclo l´ımite est´a asociado a la aparici´on de una bifurcaci´on de Hopf en un sistema hamiltoniano generalizado. Un resultado interesante recae en el hecho de que la bifurcaci´on de Hopf se mantiene a medida que aumenta el orden del sistema gracias a la t´ecnica basada en backstepping. Conclusiones y desarrollos futuros 173 de Md . como se aprecia en las simulaciones. sin un l´ımite te´orico. Esto es m´as complicado a´ un en sistemas de m´as de dos grados de libertad. Finalmente se ha abordado el problema de la oscilaci´on con din´amica objetivo el sistema hamiltoniano generalizado empleando un m´etodo novedoso. obteniendo resultados similares en el caso de la bola y la viga 1 Las inc´ognitas de la fase de moldeo de energ´ıa potencial. A continuaci´on. Este es un hecho a explorar por las posibilidades que abre en cuanto a robustez y rechazo de perturbaciones L2 . la Inmersi´on e Invariancia. Esta realimentaci´on pertenece a la familia de m´etodos de dise˜ no basados en el moldeo de energ´ıa. La respuesta transitoria y la cuenca de atracci´on del control PBC de la bola en la viga y el p´endulo invertido. El m´etodo de dise˜ no ha sido ilustrado mediante su aplicaci´on a dos sistemas cl´asicos subactuados: el levitador magn´etico y la bola en la viga. Sin embargo. El rendimiento de los controladores no lineales es muy satisfactorio incluso lejos de la regi´on donde el modelo puede ser linealizado y controlado por t´ecnicas lineales. mediante backstepping la ley de control se obtiene recursivamente para el sistema completo. inclusive algunos sistemas mec´anicos subactuados. la matriz de inercia en bucle cerrado1 . 7. obteniendo resultados similares. Con este m´etodo se han obtenido leyes de control suaves con una amplia cuenca de atracci´on para problemas cl´asicos de control de sistemas subactuados.4 Conclusiones del cap´ıtulo 6 En este cap´ıtulo se ha presentado una t´ecnica para la obtenci´on de oscilaciones estables y robustas en una clase de sistemas no lineales. y simultanear este resultado con la asignaci´on del m´ınimo de energ´ıa potencial. la Inmersi´on e Invariancia. sin limitaci´on en el orden de ´este. Para lograr esto se ha presentado una ley de realimentaci´on capaz de conducir a un sistema mec´anico de segundo orden hacia un ciclo l´ımite estable. La principal dificultad estriba en garantizar que Md sea globalmente definida positiva. . en cierta medida sorprendente. Este objetivo de control puede ser expresado como mantener constantes las .5 Desarrollos futuros Los problemas que se abordan en esta tesis abren las puertas a una serie de l´ıneas de investigaci´on futuras destinadas b´asicamente a extender el a´mbito de aplicaci´on de los razonamientos te´oricos aqu´ı expuestos y a refinar los resultados.1 Sistema de solidario al veh´ıculo o buque. o como se hace en el cap´ıtulo (3).R. 7. Un estudio m´as exhaustivo involucrar´ıa un conocimiento expl´ıcito de la cinem´atica y din´amica del sistema completo soporte–plataforma.R. aceler´ometros y gir´oscopos en la superficie del buque. y P 1 al vector director unitario de la l´ınea de mira de la plataforma expresado en las coordenadas del sistema (1). A partir de estas medidas. hasta tal punto que los pares centr´ıfugos y de coriolis pueden ser ignorados. Si estamos interesados en plataformas de sensores sometidas a din´amicas m´as r´apidas del sistema de referencia que las soporta. este enfoque pierde su validez. Desarrollos futuros 7. Un sencillo sistema de inclin´ometros. como es el caso de la cubierta de un buque. respectivamente seg´ un el criterio empleado en el cap´ıtulo (3). Esto implica ignorar los pares centr´ıfugos y de coriolis que aparecen debido a giros y aceleraciones del sistema de referencia sobre el que se instala la plataforma. Denominaremos R01 a la matriz unitaria de rotaci´on desde el sistema de referencia 0 al 1. • S. las oscilaciones de cubierta debidas al oleaje son de peque˜ na velocidad angular.1) • S. Supongamos que el objetivo de control es mantener estable la l´ınea de mira de la plataforma hacia un sat´elite geostacionario de comunicaciones. En aplicaciones de este tipo (navales). Es evidente que el sistema que da soporte a la plataforma est´a sometido a movimientos y perturbaciones aleatorias.174 7. como puede suceder en veh´ıculos terrestres o aplicaciones aeroespaciales. En el estudio de la din´amica del pedestal de sensores se ha empleado un modelo hamiltoniano basado en la hip´otesis de un sistema inmerso en un sistema de referencia inercial. con respecto a unos ejes fijos en tierra. estas perturbaciones pueden ser medibles. asociado al soporte inm´ovil de la plataforma de sensores.0 Sistema de referencia inercial fijo en tierra. subsumidos en un t´ermino acotado de perturbaciones cuyo efecto en el vector de estado ser´a rechazado mediante un control basado en la atenuaci´on de perturbaciones con ganancia L2 . pero a diferencia de el tratamiento presentado.1 Cinem´atica de la plataforma de sensores En primer lugar se tratar´a el tema del control inercial. el apuntamiento (ϕc .5. formada por los senos y cosenos de los a´ngulos de Euler. Dado que la distancia desde la superficie terrestre de la o´rbita fija (35900 km).5. θc ) se puede expresar como una funci´on de la latitud y la longitud terrestre. se tiene P 1 = [cos θ cos ϕ senϕ cos θ senϕ]T siendo ϕ θ y los a´ngulos de acimut y elevaci´on de la plataforma. definiendo los sistemas de referencia (v´ease figura 7. proporcionar´ıa una medida en tiempo real de la velocidad del origen y los a´ngulos de Euler del sistema de referencia de la plataforma. El dise˜ no de esta ley plantea la dificultad a˜ nadida de realimentar la velocidad en lugar de la posici´on.Cap´ıtulo 7. T´engase en cuenta que en este problema no es necesario conocer las velocidades de traslaci´on del origen del sistema (1) respecto a tierra. En este caso se tiene que la salida del sistema es y = P 0 = R01 P 1 .1: Composici´on de sistemas coordenados en la plataforma de sensores. θc ) El problema se enunciar´ıa del siguiente modo: conocido P 1 dise˜ nar un sistema de sensores de precisi´on para obtener R01 y sus derivadas. que permita al sistema corregir la deriva acumulada. para el que a´ un no se ha propuesto un marco te´orico completo de an´alisis de estabilidad y rendimiento. Un problema a˜ nadido es determinar una ley de control que logre este objetivo. y una ley de control robusta que estabilice la salida del sistema en y∞ . a partir de las medidas de dos gir´oscopos montados sobre la cabeza de la plataforma. de mucha menor frecuencia. ya que no se dispone de una estimaci´on de R01 . . Los posibles resultados en esta l´ınea tendr´ıan la ventaja de reducir la complejidad y el tiempo de c´omputo asociados a la introducci´on de un m´odulo de interpretaci´on de im´agenes de v´ıdeo en el sistema. por lo que se desea estabilizar es una integral de la medida de los sensores. Conclusiones y desarrollos futuros 175 z1 elevación plataforma P z0 Rotacón: R01 Traslación T01 y1 acimut plataforma x1 x0 Sistema de referencia fijo en tierra Sistema de referencia del vehículo y0 Figura 7. Sin embargo. coordenadas del vector P 0 expresadas en el sistema de referencia fijo en tierra (0) independientemente de las perturbaciones y los movimientos realizados por el veh´ıculo que soporta la antena. es posible obtener una realimentaci´on peri´odica del error de seguimiento mediante un subsistema de visi´on externo. y el equilibrio a estabilizar ser´a y∞ = (ϕc . Este es el principio del sistema DORNA que se describir´a en el ap´endice de esta tesis. al menos de forma aproximada. La estabilizaci´on de la integral puede acumular errores en r´egimen permanente irrecuperables debido al efecto de perturbaciones. el conjunto de funciones de hamilton en bucle cerrado alcanzable en el caso de un problema de control subactuado. Ortega & Van der Schaft 2002). que establecen un marco para el c´omputo aproximado de la m´axima sobreoscilaci´on. debido a la introducci´on de t´erminos no cuadr´aticos de la velocidad. es decir. Esta l´ınea ha comenzado de la mano de los trabajos de (Blankenstein. etc. 3 que no involucren la resoluci´ on de un sistema de EDPs . debido al car´acter fuertemente no lineal del sistema de la bola en la viga. Concretamente en el caso del IDA-PBC. y resta proporcionar soluciones autom´aticas3 . la manera de compensar sus efectos en el caso de sistemas subactuados representa un terreno dif´ıcil e inexplorado. de una relaci´on siquiera aproximada entre kv y tiempo de establecimiento. • Extender las ecuaciones reducidas del m´etodo IDA-PBC al caso de sistemas con m´as de un grado de subactuaci´on2 . la sobreoscilaci´ on y el tiempo de establecimiento son dos par´ametros del control de notable importancia en el dise˜ no. Sin embargo. Dentro del contexto de la pasividad y de los desarrollos presentados en esta tesis basados en el m´etodo IDA-PBC. • Estudiar las posibles soluciones proporcionadas por el m´etodo del cap´ıtulo 5 en otros sistemas subactuados de inter´es en la comunidad investigadora: p´endulos rotatorios. • Como es sabido. • Introducci´on de restricciones no hol´onomas en el m´etodo IDA-PBC. Desarrollos futuros 7.2 Sistemas subactuados Esta l´ınea es una fuente continua de problemas abiertos y objeto de una intensa actividad investigadora por parte de matem´aticos e ingenieros de control. de momento. • Definir de una manera pr´actica el conjunto posible de hamiltonianos controlados. es una medida de lo r´apido que se perder´a energ´ıa y se converger´a al equilibrio. hallar un m´etodo exacto o num´erico aproximado para estimar el cotas superiores del tiempo de establecimiento del sistema. Paralelamente a los resultados relacionados con el an´alisis transitorio de sistemas controlados mediante pasividad presentados en el cap´ıtulo 4.5. se proponen las siguientes l´ıneas como trabajo futuro. sin embargo la complejidad que involucra requiere un tratamiento simplificador similar al presentado en el cap´ıtulo 5. Pendubot. se mantiene como un problema abierto para el que s´olo se han encontrado soluciones en el caso de sistemas 2 Nos referimos los grados de subactuaci´on como la diferencia entre el n´ umero de grados de libertad y de subactuadores. Pese a los recientes avances en modelado y compensaci´on de fricci´on (Canudas de Wit et al. 1995). El ´area del control de sistemas subactuados en toda su generalidad. Para ello debemos explotar el hecho intuitivo de que kv . Acrobot. ni siquiera podemos afirmar que en todo caso un crecimiento de kv implica un tiempo de establecimiento menor.5. El marco te´orico de esta l´ınea ha sido introducido en (Blankenstein 2002). un modelo simple de fricci´on viscosa romper´ıa la divisi´on energ´ıa potencial–cin´etica de las ecuaciones. Y de ning´ un modo disponemos.176 7. • Incorporaci´on de t´erminos de fricci´on realistas en los modelos en bucle de abierto del m´etodo IDA-PBC y Lagrangianos controlados. la tasa de disipaci´on. En nuestro caso.5. Los robots caminantes son sistemas h´ıbridos ya que su din´amica tiene una parte continua que admite la cl´asica descripci´on en variables de estado y una parte conmutada. En el caso de robots caminantes esto es un elemento esencial. con la l´ınea de Bullo por su evidente inter´es pr´actico. donde las se˜ nales de corriente alterna producida por circuitos eventualmente conmutados. u) sigue siendo uno de los objetivos m´as codiciados y al mismo tiempo inalcanzables dentro de la literatura del control. as´ı como la continuidad de dicha funci´on en el cambio de regi´on de fucionamiento. podr´ıa introducir al sistema en estados transitorios inestables y provocar una p´erdida de equilibrio del robot. En (Bullo 2002) se propone una o´rbita peri´odica de referencia para el sistema h´ıbrido que permita el avance del robot caminante. el imponer estructuras en bucle cerrado de tipo lagrangiano o hamiltoniano. • Aproximaci´on a las o´rbitas objetivo por la v´ıa m´as pr´oxima posible. La principal aportaci´on de la ley de control resultante est´a en el hecho de que no maneja se˜ nales dependientes del tiempo y en su car´acter h´ıbrido. y otra donde est´e realizando una trayectoria de avance en el aire. • Posibilitar un estudio de robustez basado en pasividad y ganancia L2 . fundamentalmente. una propuesta de desarrollo futuro consiste en extender los desarrollos a o´rbitas h´ıbridas. deben estabilizarse en una . por si misma.Cap´ıtulo 7. cada articulaci´on o robot caminante debe conmutar entre una din´amica donde el pie est´a apoyado en el suelo. En este caso habr´ıa que estudiar el m´etodo para garantizar un decrecimiento de la funci´on de energ´ıa a lo largo de las trayectorias en ausencia de conmutaci´on. El segundo campo de aplicaci´on en el que se abre una l´ınea de investigaci´on de sumo inter´es es el dise˜ no de sistemas electr´onicos de potencia. dado que la aproximaci´on a una o´rbita fija con se˜ nales dependientes del tiempo. Las ventajas de trasladar el enfoque hamiltoniano a estos contextos son. Una metodolog´ıa constructiva (m´as all´a de los importantes pero poco pr´acticos enunciados de existencia) de s´ıntesis para sistemas no lineales controlables de la forma x˙ = f (x. Con el fin de enlazar los procedimientos expuestos en esta tesis de estabilizaci´on de ´orbitas mediante consideraciones energ´eticas. 7. donde las variables pueden tomar un valor dentro de un conjunto discreto. admita discontinuidades cuando el estado conmute de una regi´on a otra. • Proporcionar un m´etodo de detecci´on de bifurcaciones en sistemas como robots caminantes. Conclusiones y desarrollos futuros 177 subactuados simples.3 Estabilizaci´on de oscilaciones Como se ha mencionado recientemente en (Bullo 2002) la estabilizaci´on de oscilaciones en sistemas no lineales tiene un enorme inter´es en el ´area de robots caminantes. Las distintas t´ecnicas de control presentadas en esta tesis allanan el camino hacia las soluciones de tipo GAS de cierto sistema pero al mismo tiempo. podr´ıan obstaculizar el descubrimiento de otras leyes m´as generales. donde la funci´on de energ´ıa. • Evitar la incomodidad en la fase de desarrollo software de trabajar con se˜ nales dependientes del tiempo como referencia de las trayectorias. De especial inter´es es el caso de los sistemas de alimentaci´on ininterrumpida (SAI).7) est´a dise˜ nada para ajustarse a la de los sistemas mec´anicos donde la primera ecuaci´on de estado es x˙ 1 = x2 relacionando posici´on y velocidad dado que las fuerzas s´olo tienen efecto en la derivada de la velocidad.2. De hecho la ecuaci´on (6.7). y el dise˜ no de una din´amica hamiltoniana para un subsistema de segundo orden. .178 7. puede presentar dificultades a la hora de encontrar una ley de ajuste tal que en bucle cerrado se obtenga la estructura disipativa oscilatoria (6.2.7 del cap´ıtulo 6. Si no se encuentra una ley de ajuste adecuada a partir del modelo en bucle abierto. El ajuste de un sistema no lineal sin estructura mec´anica. A continuaci´on se dar´an unas indicaciones b´asicas para el procedimiento de dise˜ no. y posiblemente sea necesario dise˜ nar estructuras hamiltonianas generalizadas ad hoc que cumplan la condici´on de disipatividad con respecto a la funci´on de energ´ıa oscilatoria presentada en el capitulo 6. se puede optar redise˜ nar tanto la funci´on de energ´ıa. como la din´amica objetivo oscilante. Desarrollos futuros ´orbita peri´odica correspondiente a un arm´onico puro y una serie de se˜ nales con desfase constante. lo cual puede ser objeto de una secuencia de ensayo y error. concretamente la formulaci´on hamiltoniana generalizada es s´olo de directa aplicaci´on en sistemas mec´anicos completamente actuados y una amplia clase de subactuados. El procedimiento en el caso m´as general implica un proceso iterativo de dise˜ no a dos niveles: la elecci´on de una funci´on de Hamilton Hd con un conjunto m´ınimo en una o´rbita peri´odica deseada.2. Los detalles de este procedimiento se ilustran en el diagrama de flujo de la figura 7. dependiendo del sistema que se trate. De hecho. posiblemente esta estructura puede no ser la ideal.5. como es el caso de los sistemas electr´onicos de potencia. con funci´on de Hamilton Hd . es de directa aplicaci´on la t´ecnica de s´ıntesis ilustrada en la secci´on 6. y que faciliten la b´ usqueda de leyes de control para el ajuste de las din´amicas en bucle abierto y cerrado. En el caso de que el modelo del sistema de potencia sea linealizable por realimentaci´on. Recordemos que los resultados presentados en esta tesis. 2: Procedimiento de dise˜ no de un controlador para estabilizaci´ on de oscilaciones basado en pasividad en sistemas sin estructura mec´anica.Cap´ıtulo 7. Conclusiones y desarrollos futuros 179 Inicio SI ¿Modelo linealizable por realimentación? NO Rediseño a Nivel 1 Elección de la función de energía Hd con un conjunto mínimo en la orbita periódica Rediseño a Nivel 2 Elección de la dinámica en bucle cerrado disipativa respecto a Hd considerando las peculiaridades del modelo NO SI ¿Agotada búsqueda? Emplear Hd y la estructura GHS del Capítulo 6 NO ¿Existe ley de ajuste para subsistema de orden 2? SI NO ¿Estuctura triangular? SI Inmersión e Invariancia u otras técnicas de ajuste Backstepping Cálculo de la ley de control (Cap. 6) Fin Figura 7. . Desarrollos futuros .180 7.5. 2 Arquitectura hardware La arquitectura hardware del controlador del posicionador est´a basada en bus VME. Sobre dicho bus se dispone de un sistema multiprocesador que cuenta con entradas y salidas de diversos tipos. Una plataforma consiste en un mecanismo de dos grados de libertad de tipo rotacional. El control de plataformas giroestabilizadas presenta un gran inter´es en el ´ambito de aplicaciones de tipo aeron´autico o de navegaci´on. Inicialmente se explicar´a lo que se entiende en este ap´endice por plataforma. dentro de los limites f´ısicos del mecanismo. en la que se usa una arquitectura distribuida mediante tres procesadores DSP. El objetivo de la aplicaci´on es controlar las velocidades de la plataforma medidas respecto a ejes inerciales independientemente de las perturbaciones a las que se ve sometida. Normalmente este tipo de plataformas se ubican en un m´ovil que posee una determinada orientaci´on variable respecto a tierra. Para el desarrollo de la aplicaci´on se ha implementado a su vez un simulador de la plataforma giroestabilizada con una interfaz hardware con el controlador. Estas variaciones de orientaci´on del m´ovil que soporta la plataforma son detectadas por sensores de tipo girosc´opico ubicados en el extremo de la plataforma. Dicha aplicaci´on se implementa en un hardware basado en bus VME. Rubio & Gordillo 2000). A. por lo que la transmisi´on de se˜ nales se realiza a trav´es de anillos colectores situados en la parte inferior. as´ı como interfases Ethernet para la comunicaci´on con otros 181 . un esquema completo de la plataforma se puede ver en la figura A. El sensor girosc´opico usado mide velocidades en dos de sus ejes.1 Introducci´on En este ap´endice se presenta una aplicaci´on para el control de una plataforma giroestabilizada inicialmente publicado en (G´omez-Estern.1. Normalmente el movimiento se limita u ´nicamente en elevaci´on. P´erez. La disposici´on f´ısica de los ejes permite al elemento terminal posicionarse con distintas orientaciones y elevaciones. Por lo que las medidas proporcionadas por el gir´oscopo dependen de la posici´on en la que se encuentren los dos grados de libertad de la plataforma.Ap´ endice A Proyecto DORNA A. tanto los de entrada como los de salida tienen una resoluci´on de 12 bits. Los m´odulos de E/S anal´ogicas no son accesibles desde el bus VME. θ x G y z . ϕ. • Una tarjeta de E/S digital para tener informaci´on de mecanismos de seguridad y activar y desactivar dispositivos auxiliares. • Dos tarjetas basadas en un DSP TMS320C40 que implementan lazos de control para los dos grados de libertad de la plataforma.182 A. Este m´odulo tambi´en dispone de salidas anal´ogicas para controlar el par aplicado a lo motores.2 son: • Una tarjeta basada en un procesador Motorola 68040 que se encarga de gestionar las interfases Ethernet. • Una tarjeta basada en un DSP TMS320C40 (Texas Instruments 1999) que interpreta los mensajes recibidos de por la red Ethernet.2.1: Esquema de la plataforma giroestabilizada. A su vez env´ıa respuestas a trav´es de la red y gestiona una m´aquina de estados que gobierna las distintas modalidades de comportamiento del pedestal. Los resolver usados son de doble precisi´on ×1 y ×16 usando convertidores RD de 14 bits. Arquitectura hardware . Esta tarjeta se gestiona desde el procesador de comunicaciones y m´aquina de estados. Cada tarjeta posee un m´odulo de entradas y salidas anal´ogicas que permite a cada eje la lectura de tac´ometro y gir´oscopo. sino desde el bus interno de las tarjetas DSP. Todos los canales anal´ogicos. ϕ x y z Figura A. En concreto las distintas tarjetas de las que dispone el sistema y que conforman la arquitectura de la figura A. equipos. El intercambio de informaci´on entre los distintos procesadores se realiza mediante memorias del tipo DPR (dual port RAM ) que incorporan las tarjetas DSP. . • Una tarjeta para permitir la lectura de los resolver que proporcionan la posici´on del pedestal. Para ellos se han implementado sem´aforos basados en el cl´asico algoritmo de Peterson (Tanenbaum 2001). con la particularidad de que no se debe esperar m´as de un . Act´ ua de manera similar al anterior salvo por tener los instantes de muestreo determinados por el controlador de orientaci´on. Gestión de Comunicaciones y Estado. En una secci´on posterior se describe su funcionamiento con mayor detalle. Tiene lugar en una de las tarjetas basada en el DSP TMS320C40 y su fin es coordinar la actividad de los controladores con las o´rdenes de protocolo recibidas en datagramas. gestionar los estados del sistema y detectar errores en los equipos. El acceso de tales procesos a zonas de memoria compartida para el intercambio de datos conlleva la necesidad de arbitrar mecanismos de sincronizaci´on que eviten condiciones de carrera. • Proceso de control del eje de elevaci´on. θ. Esta tarea tiene lugar en la tarjeta CPU basada en el procesador 68040. Intercambia informaci´on con el proceso de gesti´on y variables din´amicas con el controlador de orientaci´on para hacer posible el control multivariable. • Proceso de control del eje de orientaci´on Tiene lugar en una de las DSP con tarjeta de expansi´on conversora A/D-D/A. Las tramas recibidas se insertan en un buffer de memoria compartida para su acceso desde el proceso de gesti´on del sistema. responder a dichas ´ordenes. Este proceso no realiza ninguna interpretaci´on ni creaci´on de datagramas. Proyecto DORNA 183 Lazo elevación ˙ θ˙i θ.3 Arquitectura de la aplicaci´on En el soporte f´ısico descrito se ejecuta una aplicaci´on en tiempo real multitarea y multiprocesador dividida en cuatro procesos: • Proceso para el env´ıo y recepci´on de datagramas UDP del protocolo de comunicaciones con el sistema de operaci´on.2: Arquitectura hardware del sistema. •Ordenes •Datos Pedestal •Diagnósticos uθ Subsistema de Operación •Consignas •Modo de operación Registro de Datos uφ M68040 Gestión de Ethernet ˙ φ˙ i φ. Plataforma Giroestabilizada Lazo orientación Figura A. φ. Ambos procesos ser´an descritos con m´as detalle en los apartados subsiguientes. • Proceso de gesti´on del protocolo y la m´aquina de estados. A. Controla la din´amica del eje en el modo requerido por el sistema de operaci´on y la sincronizaci´on de los periodos de muestreo de ambos lazos. por lo que funciona como esclavo de ´este. s´olo sirve de puente de comunicaci´on hacia el interfaz Ethernet.Ap´endice A. En concreto se cuenta con entradas y salidas anal´ogicas y digitales. • Emular el movimiento de la base de la plataforma con se˜ nales conocidas. y realiza como funciones m´as importantes: • Integrar un modelo completo de la plataforma mediante el algoritmo Runge-Kutta de orden 4 con un periodo de 1 ms. Si se supera dicho plazo. plazo determinado a la espera del desbloqueo de una regi´on cr´ıtica por parte de otro proceso.4 Simulador de la plataforma giroestabilizada Para el desarrollo del sistema de control de la plataforma se ha contado con la importante ayuda de un simulador de una plataforma. • Un ordenador PC en el que se ejecuta el programa simulador de la plataforma. El software del simulador se ha realizado en lenguaje C++ orientado a objetos. adem´as de tarjetas para la emulaci´on de los resolvers. La arquitectura software descrita aparece reflejada en el diagrama de la figura A. . Simulador de la plataforma giroestabilizada PAR_ELEVACION GIROSCOPO_ELEVACION HABILITACION_PEDESTAL SINCRONIZACION PETICION_TSO ORDENES_VELOCIDAD_INERCIAL SELECCION_MODO ORDENES_VEL_INERCIAL_EM_GYRO REFERENCIA_ELEV ORDENES_VELOCIDAD_CUBIERTA VARIABLES_ELEVACION LAZO_CONTROL_ ELEVACION TACOMETRO_ELEVACION RESOLVER_ELEVACION ORDENES_POSICION GESTION DE COMUNICACIONES ORDENES_DIAGNOSTICO VARIABLES_ ELEVACION DATOS_PLATAFORMA VARIABLES_ ORIENTACION GIROSCOPO_ORIENTACION TABLA_SITUACION_OPERATIVA SINCRONIZACION SELECCION_MODO DATOS_PEDESTAL REFERENCIA_ELEV TACOMETRO_ORIENTACION LAZO_CONTROL_ ORIENTACION RESOLVER_ORIENTACION RESULTADOS_DIAGNOSTICO VARIABLES_ORIENTACION TOPES_PEDESTAL PAR_ORIENTACION BOCINA_PEDESTAL FRENOS_PEDESTAL Figura A. se enviar´a un mensaje notificando la inactividad del proceso bloqueante. Dicho simulador se encuentra dotado de una interfaz el´ectrica conectable al controlador. El hardware del simulador consta de dos partes: • Un rack con bus VME en el que se alojan tarjetas E/S para emular la presencia de todos los sensores de la plataforma.3 A.3: Arquitectura software del sistema.4.184 A. La interfase entre el ordenador y el bus VME se realiza mediante una tarjeta adaptadora de bus VME a PCI. A.5 Procesador de comunicaciones Una tarjeta DSP se destina a gestionar la comunicaci´on con el sistema de operaci´on del buque mediante un protocolo basado en datagramas UDP. km constantes de par de los motores. • Realizar registros de las variables del sistema para su posterior an´alisis.1) (A. En el simulador tambi´en se incorpora un modelo de la holgura que se presenta en los engranajes que conectan el eje motor con el eje de la carga. η relaciones de las cajas de engranajes. El modelo a usar en cada simulaci´on es seleccionable por el usuario de entre los existentes en la base de datos.2) (A. Proyecto DORNA 185 • Mantener una base de datos de juegos de par´ametros y opciones de simulaci´on de la plataforma.Ap´endice A. Se han incluido distintos modelos de fricci´on como son los modelos est´aticos y de LuGre (Canudas de Wit et al. Las funciones de esta tarjeta . Im inercias de los actuadores y los elementos Iij las componentes de los tensores de inercia de las partes m´oviles. Tambi´en se incluyen herramientas para la visualizaci´on y an´alisis de los datos generados por la simulaci´on.4. Las funciones τf se corresponden con los pares de fricci´on.4. en el caso de que ´este venga dado por el modelo LuGre.4. tal y como se ve en la figura A. se usan las expresiones: τf = σ0 z + σ1 z˙ abs(v) z˙ = v + z f (v) 1 ( f (v) = τC1 + τV 1 abs(v)+ σ0  −B1 abs(v) sgn1 (v)− + (τS1 − τC1 ) e  − τC2 + τV 2 abs(v)+  ) + (τS2 − τC2 ) e−B2 abs(v) sgn2 (v) ! 1 si(·) > 0 sgn1 (·) = 0 si(·) ≤ 0 ! 0 si(·) > 0 sgn2 (·) = −1 si(·) ≤ 0 (A. El conjunto de ecuaciones que se integran en cada periodo de muestreo es:   ηo kmo iao = ψ¨ Izz + s2 Ixx + c2 Izz + η 2 Imo + 1 ηe kme iae θ 2 θ 2 o ˙ 2θ (Ixx − Izz ) + τf o (ψ) ˙ + η 2 bmo + ψ˙ θs 2 2 o   2 ¨ = θ Iyy2 + ηe Ime − 1 ˙ + η 2 bme − ψ˙ 2 s2θ (Ixx − Izz ) + τf e (θ) 2 2 2 e donde i son las corrientes de los est´ator de los motores. 1995).3) El simulador incorpora un m´odulo para la visualizaci´on en tiempo real del movimiento de la plataforma. El modelo de la plataforma usado en el simulador ha tratado de recoger las no linealidades m´as importantes que se presentan en este tipo de sistemas.4. estados. • Construcci´on de mensajes de protocolo que ser´an enviados mediante UDP/Ethernet al sistema de operaci´on del buque. • Implementaci´on de una m´aquina de estados s´ıncrona para la coordinaci´on de modos. • Habilitaci´on de temporizadores y disparo de eventos para la gesti´on de la actividad s´ıncrona de la m´aquina. • Monitorizaci´on del funcionamiento de las DSP de los lazos de control. activable a distintas frecuencias. procesadores y memorias). • Realizaci´on de todos los chequeos de inicializaci´on y rutinarios de los elementos hardware del sistema.5. Si las o´rdenes solicitadas son viables seg´ un el estado de la m´aquina. Dichos mensajes se almacenar´an en una zona de memoria compartida con la CPU Motorola. • Recepci´on de las referencias de control y modo de seguimiento desde el sistema de operaci´on mediante el mismo protocolo. se notificar´a debidamente a los lazos de control. . arbitr´andose los mecanismos oportunos para el acceso concurrente y la notificaci´on de llegada de nuevos mensajes. (Tarjetas de entrada/salida. Se hace uso de un mecanismo de tipo watchdog para detectar si alguno de los controladores interrumpi´o su actividad al cabo de un periodo determinado.4: Modelo 3D del simulador de la plataforma. Para ello se establece una zona de memoria compartida con los procesadores de lazos de control y sus correspondientes sem´aforos de acceso concurrente.186 A. El env´ıo de las tramas por red es tarea de la CPU de acceso a la red. Entre los procesos que se ejecutan de forma s´ıncrona se encuentra el env´ıo de datos peri´odicos para los equipos de registro de datos del buque. Procesador de comunicaciones Figura A. son diversas: • Captura de informaci´on relativa a la din´amica de los lazos de orientaci´on y elevaci´on. La m´aquina de estados se describe de forma somera en el siguiente apartado. entradas y salidas digitales como frenos y alarmas. hombre arriba (para evitar el movimiento en presencia de operarios).5: Diagrama de estados del sistema. La DSP de comunicaciones ejecuta un bucle infinito con la estructura de aut´omata l´ogico programable para coordinar las entradas. En funci´on de este resultado y del modo de funcionamiento se decidir´a si se debe operar de forma degradada o deshabilitar el control. Lectura de las coordenadas medidas por los lazos de control. Realizaci´on de chequeos internos peri´odicos. 2.Ap´endice A. 4. Lectura de mensajes de protocolo provenientes del sistema de operaci´on. eventos del temporizaci´on y se˜ nales digitales). determinaci´on de las salidas correspondientes al estado y aplicaci´on de dichas salidas. Lectura a trav´es de la tarjeta I/O paralelo VME de las se˜ nales binarias que dan cuenta del estado de operaci´on de los sistemas f´ısicos de la m´aquina: topes superior e inferior. determinaci´on del estado y modo de seguimiento futuros. lazos. se determina si estos bloquean la operatividad de la m´aquina o si por el contrario admiten un funcionamiento degradado. A. Proyecto DORNA 187 Fallo gyro AND modo=velocidad_in ercial OR FALLO_BITE ENCENDIDO _1 BITE OK OR IGNORA_BIT ENCENDIDO _2 FIN TEMPORIZADOR BOCINA AND PROTECCIONES_ OFF Petición TSO HABILITA_ PEDESTAL AND EMERGENCIA Fallo gyro AND modo=velocidad_inercial OR Fallo BITE OR DESHABILITA_ PEDESTAL ARRAN QUE Pérdida COMUNICACION ENCENDIDO _3 FIN TEMPORIZADOR BOCINA Fallo gyro AND modo=velocidad_inercial OR Fallo BITE EMERGE NCIA OPERACION Pérdida COMUNICACION Figura A. . El algoritmo de la m´aquina de estados se descompone en adquisici´on de las entradas (provenientes del sistema de operaci´on. En el caso de existencia de fallos en el Hardware. 3. El bucle principal de operaci´on queda especificado en el pseudoc´odigo a continuaci´on: 1.6 M´aquina de estados Menci´on aparte merece la funci´on de coordinaci´on del sistema o m´aquina de estados. chequeos rutinarios. estado del gir´oscopo y p´erdida de la referencia del resolver. estados y salidas del sistema. Lectura entradas digitales. 6. La actualizaci´on de dichas variables se realiza en virtud del tiempo transcurrido desde la u ´ltima iteraci´on. 9. bocina de emergencia y habilitaci´on de los servoamplificadores de los motores. Aplicaci´on de los nuevos valores de las salidas digitales a trav´es de la tarjeta I/O paralelo VME. La figura (A. en este modo auxiliar se tiene utilidad en caso de fallo del gir´oscopo. en cada modo la variable a controlar es distinta. en el que se controla la velocidad inercial proporcionada por el gir´oscopo. 11. el controlador calcula las se˜ nales de control apropiadas. • Modo de velocidad inercial. • Modo de velocidad. en el que se controla la posici´on de los dos servomotores le´ıda por los resolver. Los lazos de control pueden funcionar en distintos modos. en el que se controla la velocidad de los dos servomotores. Actualizaci´on de los temporizadores. 8. El operario habilitar´a las protecciones al aproximarse al pedestal para su manipulaci´on en condiciones de seguridad.7.5) se refleja el diagrama de estados del controlador del pedestal de sensores: A. El programa en cada periodo de muestreo obtiene muestras de todos los sensores y si la plataforma se encuentra en estado de operaci´on. Dichos modos son: • Modo de posici´on. Los eventos s´ıncronos generados por este procesador funcionan mediante la cuenta atr´as de una serie de variables. Escritura en la memoria compartida de una tabla indicando el estado interno del sistema y las modificaciones que se hayan producido para ser enviada hacia el sistema de operaci´on. 10. alimentaci´on del gir´oscopo.7 Procesadores de lazos de control Cada DSP que controla un lazo de control ejecuta un algoritmo de control en tiempo real (Benett 1988). Determinaci´on de salidas digitales correspondientes al estado actual. Cuando una de ellas llega a cero se dispara el evento correspondiente que ser´a posteriormente procesado por la m´aquina de estados. Obtenci´on del estado y modo seguimiento futuros en funci´on de la informaci´on recogida en los apartados anteriores. Procesadores de lazos de control 5. El modo de seguimiento depender´ıa de la orden recibida desde el sistema de operaci´on y la posibilidad de llevarla a cabo seg´ un el estado y los errores que se hayan detectado en los pasos anteriores. Comprobaci´on de protecciones activas.188 A. Env´ıo de referencias y modos de seguimiento nuevos a las DSP de los lazos de control. • Modo de velocidad de emulaci´on girosc´opica. 7. El conjunto de salidas digitales activables son: frenos en cada eje. Externamente por medio de la conexi´on Ethernet a otros sistemas se le puede proporcionar al los controladores la posici´on en la que se . Asimismo se enviar´an los mensajes peri´odicos pendientes al equipo de registro de datos y las tramas de respuesta del protocolo que sean oportunas. • Comprobaci´on de la respuesta al escal´on de velocidad. • Ajuste manual y/o autom´atico de derivas. . Proyecto DORNA 189 encuentra la base que soporta la plataforma. A. La filosof´ıa de la aplicaci´on inform´atica obedece a la estructura de programaci´on de aut´omatas programables al existir en la literatura m´etodos compactos de especificaci´on y modelado de m´aquinas de estados para estos sistemas. Los procesadores de lazo de control disponen de mecanismos de autodiagn´ostico por medio de los cuales se puede comunicar fallos hardware o desajustes de los controladores.8 Conclusiones En este ap´endice se ha presentado un sistema en tiempo real para el control de una plataforma con dos grados de libertad acoplados.Ap´endice A. de este modo se pueden estimar las velocidades inerciales. Las principales funciones del modo de diagn´osticos son: • Comprobaci´on de la respuesta al escal´on de posici´on. El procedimiento de dise˜ no y documentaci´on de la aplicaci´on obedece a normas de calidad en ingenier´ıa del software. El sistema mec´anico es una plataforma de sensores de navegaci´on mar´ıtima de grandes dimensiones y estrictas especificaciones de funcionamiento. Los resultados de estos test se transmiten al procesador de comunicaciones. El texto pone de relieve aquellos aspectos de la implementaci´on que por su complejidad y originalidad resultan de inter´es en campos te´oricos como el modelado y control de sistemas din´amicos no lineales y en a´reas m´as t´ecnicas como el desarrollo de aplicaciones con restricciones de tiempo real en sistemas multiprocesadores con elementos de sincronizaci´on y memoria compartida basados en DSPs. 190 A.8. Conclusiones . .vectk.Ap´ endice B C´ odigo Maple para la ecuaci´ on (6. En primer lugar se crean los vectores cuyos elementos son los ki .P. u0:=-x1-k0*P*x2. f[m. lo cual ha motivado el desarrollo de unas rutinas Maple para el c´alculo autom´atico simb´olico de la ley de control para un orden arbitrario. gam := [evaln(gamma || (1 . Por tanto si escribimos init(5). for i from 2 to m do f[m+1-i. evalm(f) end proc.8.. y se muestra en pantalla f 3 dando como resultado   −x4 − k3 x5      −x3 − k2 x4       −P x2 − k1 x3    0 191 . Esta funci´on ha de invocarse con un argumento indicando el orden del sistema linealizado.1]:=-x[i+1]-vectk[i]*x[i+2] od. (5 en el u ´ltimo ejemplo). Para ello se definir´a el siguiente procedimiento Maple init := proc (n) local m. m:=n-2.8.1.1) puede ser tarea ardua. vectk := [evaln(k || (1 .x. γi xi y fi de la secci´on 6. todos los vectores son inicializados para n = 5. x := [evaln(x || (1 .8. m))]. m = 3. m))].u0. global gam.1) El c´omputo de cada t´ermino de la ecuaci´on (6. n))]. f := matrix(m+1.0).f.1] := -P*x2-k1*x3. m := n-2.. i. end if.1) El segundo paso consiste en calcular la matriz Γk para cualquier valor de k. m[k. evalm(m).1. for i from 1 to k-1 do m[i. m[i.l) local m.k.192 Ap´endice B. Con este prop´osito emplearemos el siguiente procedimiento Maple: mat:=proc(k) local m.i.[gam[1].k]:=gam(1).2).8. od. que dar´a como resultado la matriz 5 × 4     m1 :=     γ4 1 0 0 0 γ3 1 0 0 0 γ2 1 0 0 0 γ1 0 0 0 1         Ahora bien.1]) else m:=matrix(k+1. end. if (k = 1) then m:=matrix(2. m:=matgamma(l). end. od. m[k+1. para obtener series de multiplicaciones del tipo Γ4 Γ3 Γ2 definiremos un sencillo procedimiento matprod:=proc(k. para el cual una t´ıpica llamada ser´ıa m1:=mat(4).k]:=1. for i from l+1 to k do m:=evalm(matgamma(i)&*m).0). La llamada a esta funci´on para calcular en particular Γ4 Γ3 Γ2 ser´ıa m2:=matprod(4. evalm(m).i+1]:=1. C´odigo Maple para la ecuaci´ on (6.i]:=gam(k-i+1). lo cual da como resultado el vector  γ4 (γ3 (γ2 γ1 + 1) + γ1 ) + γ2 γ1 + 1   γ3 (γ2 γ1 + 1) + γ1    γ2 γ1 + 1     γ1  1            .i. que en el anterior ejemplo tomar´an la forma u4:=derproc(u4..h+1) &*submatrix(f.1].v). v.’h’=1. end.w. dando como resultado la ley de control en el dominio de Laplace. Se invocar´a esta funci´on con el resultado de la u ´ltima llamada a control1 y el orden del sistema n.v). Para su uso.6).n) local i.m-1) +f. m:=n-2.8.m+1.8. for i from 1 to n do v:=subs(x[i]=x[i](t). w:=coeff(v.u). El siguiente procedimiento Maple toma los coeficientes del polinomio en s y toma sus derivadas temporales derproc2:=proc(u.Ap´endice B. od. en el caso hipot´etico en que n = 6. global u0. C´odigo Maple para la ecuaci´ on (6.m.s. para lo cual definiremos la funci´on control1:=proc(n) local m..0).1.i. para dar lugar a u4 := (−x1 − k0 P x2 )(γ4 (γ3 (γ2 γ1 + 1) + γ1 ) + γ2 γ1 + 1) + γ4 γ3 γ2 (−P x2 − k1 x3 ) + γ4 γ3 (x3 − k2 x4 ) + (γ4 + γ2 )(−P x2 − k1 x3 ) + γ4 (x4 − k3 x5 ) + x3 − k2 x4 + x5 − k4 x6 A fin de transformar todos los γi en los correspondientes operadores derivativos definiremos el siguiente procedimiento: derproc:=proc(u. v:=subs(P=x1^2+x2^2-mu. od.n) local i.v.m+1-h. u:=matprod(m. m:=n-2.1))’.. m = 4 escribir´ıamos u4:=control1(6). .1)*u0+sum(’evalm(matprod(m.1) 193 El siguiente paso es obtener la formula (6. for i from 1 to n-2 do v:=subs(gam[i]=vectk[i]+s. donde s representa la derivada temporal: u4 := + + + (−x1 − k0 P x2 )((k4 + s)((k3 + s)((k2 + s) · (k1 + s) + 1) + k1 + s) (k2 + s)(k1 + s) + 1) + (k4 + s)(k3 + s)(k2 + s)(−P x2 − k1 x3 ) (k4 + s)(k3 + s)(x3 − k2 x4 ) + (k4 + 2 s + k2 )(−P x2 − k1 x3 ) (k4 + s)(x4 − k3 x5 ) + x3 − k2 x4 + x5 − k4 x6 A continuaci´on necesitamos convertir esta expresi´on en una funci´on del estado. evalm(u)[1.vectk. v:=u. end.u.v. init(n).1) por medio de los procedimientos previos. Para obtener la ley u3 para un sistema de quinto orden como se realiz´o en la secci´on 6. C´odigo Maple para la ecuaci´ on (6. v. v:=u. od.v). end: Como puede observarse. end.t$i)=x[h+i](t). v:=derproc3(v.ord). mientras que su salida a su vez es pasada a una funci´on que realiza la sustituci´on general x˙ i = xi+1 : derproc3:=proc(u. fullproc:=proc(ord) local m.v).h. od. w. simplemente escribiremos u3:=fullproc(5).v. m:=n-2. for h from 1 to n do v:=subs(x[h](t)=x[h]. como sucede en el siguiente m´etodo que aglutina los pasos anteriores.m. La salida de derproc deber´ıa pasarse como argumento de derproc2. v:=derproc(v.s. para obtener la ley de control completa s´olo hay que proporcionar el orden del sistema n. od.n) local i.i).194 Ap´endice B.v.ord).v).i. v:=derproc2(v.t$i). m:=ord-2. for i from 1 to ord do v:=subs(x[i](t)=x[i]. end.8. for h from 1 to n-1 do for i from n-h by -1 to 1 do v:=subs(diff(x[h](t).8 anterior. v.ord).1) for i from 1 to m do w:=w+diff(coeff(v. od. De hecho. con la implementaci´on de esta funci´on el c´alculo completo queda automatizado. . v:=control1(ord). v:=subs(x1(t)^2+x2(t)^2-mu=P. esta funci´on tambi´en realiza tareas de “limpieza”.v) od. Besancon. USA. F. (2002). in ‘Proceedings of the 37th IEEE Conference on Decision and Control’. L. in ‘Proc. 161–162. 9. Ortega. J. A. F.. (2001). On output feedback tracking control with disturbance attenuation for euler-lagrange systems. & White.. Kelkar. (2002). Int. (2002). (1996). G. pp. & White. in ‘Lagrangian and Hamiltonian methods in nonlinear control 2003 (pendiente de aceptaci´on)’. R. 354–369. Russia. S. Aracil. in ‘Preprint’. ‘The matching conditions of controlled lagrangians and interconnection assigment passivity based control’.. August 12-16. A family of hamiltonian oscillating systems. Journal of Control (en revisi´on) .. & Battiloti. Immersion and invariance: a new tool for stabilization and adaptive control of nonlinear systems. 195 . (2001). Barcelona. L. 37–42. ‘Control of nonlinear underactuated systems’. FL. NOLCOS’01’... D. (2000). G. Kapitanski. Sevilla. Espa˜ na. XV IFAC World Congress’. & Gordillo. 1st IFAC Workshop on Lagrangian and Hamiltonian Methods for nonlinear control’. (1988). L. St Petersburg. San Francisco. & G´omez-Estern. Swinging up a pendulum by energy control. Real-time Computer Control: An Introduction. K. Matching control laws for a ball and beam system. Pure Appl. A. of Control 75. G. in ‘Proc. Math. F. in ‘15th International Symposium on Mathematical Theory of Networks and Systems. Kapitanski.Bibliograf´ıa Andreev. (2002). Blankenstein. Princeton. G´omez-Estern. Academic Press. Auckly. Gosavi.. (1998). & Kapitanski. Nonlinear Control Systems. Gordillo. (2002). Astolfi. W. J. F. R.. Aracil. University of Notre Dame. D. ‘Generation of stable oscillations in cascade nonlinear systems and the hopf bifurcation’. Auckly. Blankenstein. & Van der Schaft. NJ. J. Int J. ˚ Astr¨om. K. Gordillo. Comm. W. J. A.. S. No. 3139–3143. & Ortega. Prentice Hall International. S. & Furuta. F. Espa˜ na. 5th IFAC Symp. Aracil. (2001). pp.. & Acosta. USA. Benett. Stabilization of oscillations in the inverted pendulum. F. 3. D. Tampa. USA. in ‘Proc. On the λ–equations for matching control laws. pp. 645–665.MTNS’02’. Auckly. in ‘13th IFAC World Congress’. Matching and stabilization of constrained systems. M.. Bloch. E. (2001). K. G´omez-Estern. Lisbon. ‘Passivity. T. F. G´omez-Estern. 10th Mediterranean Conference on Control and Automation’. No. ‘A new model for control on systems with friction’. A. Isidori. (1995). Vienna. USA. Control of hybrid systems along limit cycles. & Marsden.196 BIBLIOGRAF´IA Blankenstein. 40th IEEE Conf on Decision and Control’. M. E. Introduction to Control of Oscillations and Chaos. Ortega. Leonard. Orlando. No. St Petersburg. Passivity-based control and disturbance rejection on a 2-dof platform. N. Cordones. & Rubio. Total energy shaping for underactuated mechanical systems. (2000). Superior Tecnico. ‘Stabilization of hamiltonian systems with nonholonomic contraints based on time–varying generalized canonical transformations’. NOLCOS’01’. in ‘Proc. on Automatic Control 45. & Aracil. F.. 4. F.. & Gordillo. Olsson. No. J. & Sugie. N. Marsden. AU. J. pp... . M. ‘Controlled lagrangians and the stabilization of mechanical systems’. (2002). Inst. J. M. Nonlinear Control Systems. & Van der Schaft. F.. in ‘15th Symposium on Mathematical Theory of Networks and Systems MTNS. J. ESAIM: Control.. A. R. IEEE Transactions of Automatic Control 40. Cambridge. A. & R´ıos-Bolivar. USA. Fujimoto. Byrnes. Espa˜ na. & Pogromsky. Leonard. J. Optimisation. & Lischinscky. F. A. in ‘Proc. FL. H. ‘The equivalence of controlled lagrangian and controlled hamiltonian systems’. Aracil. in ‘Proc. R.. H. Vol. J. and the global stabilization of minimum phase nonlinear systems’. Aracil. August 12-16. Chang. 309–320. F. Ortega.’. & Willems. R. G. Ortega. Russia. D. 4036–4041. Matching of euler-lagrange and hamiltonian systems. on Automatic Control 36. J.. C. Stabilization of a class of underactuated mechanical systems via total energy shaping. A. in ‘Proceedings of the 39th Conference on Decision and Control Systems’. feedback equivalence. 5th IFAC Symp. C. Bullo. (2002). IEEE Tr. Rubio. P. Barcelona. (2002). A. in ‘Proc. ˚ Astr¨om. G.. (2002). (1991). UK. F. in ‘European Control Conference 2003 (pendiente de aceptaci´on)’. F. Sira-Ram´ırez. E. World Scientific. C. IFAC Symposium on Robot Control’. 12.. G´omez-Estern. No. XV IFAC World Congress’. R. (1998). K. Practical implementation of a hamiltonian–based 2–DOF platform. (2001). IEEE Tr. & Spong. 1228–1240. Fradkov. (2001). and Calculus of Variations (en revisi´ on) . G´omez-Estern. F. Orlando. & Woolsey. FL. 11. Espinosa-P´erez. University of Notre Dame. (2000). F. The hopf bifurcation and controlled oscillations in electromechanical systems. Canudas de Wit.. in ‘Proc. 15. A... Bloch. Regulation of the ppr mobile robot with a flexible joint: a combined passivity and flatness approach. Portugal. Systems and Control Letters 44.. (2002). & Rubio. 3. (2000). G´omez-Estern. Berlin. Nonlinear Systems. & Lifchitz. Ortega.. 173–176. & Gordillo.. Sontag & J. Tomo I: Mec´ anica. Sydney. (1976). Springer-Verlag. (2002). H. General matching conditions in the theory of controlled lagrangians. L. F. M. Journal of Mathematics Analysis and Applications 182. pp. No. Marsden. Gordillo. (1998). & Ko¸cak. Proceedings of the CDC’02. L. Phoenix. Liu. Prentice Hall. ‘Criterion of Hopf bifurcations without using eigenvalues’. University of Notre Dame. Marino. in ‘Technical Report CCEC 95-0228’. Springer-Verlag. N. 1663–1671. Espa˜ na. F.. 250–256. IEEE Trans. R. Sevilla. R. (2002). Leonard. & Aracil. (1995). Springer-Verlag. A simple set point robot controller by using only position measurements. V. Mosc´ u.. Las Vegas. XXI Jornadas de Autom´atica’. W. & Praly. . 12th IFAC World Conf. pp. 9.. Vidyasagar. ‘Dynamics and control of underactuated mechanical systems’. P´erez. C. Gordillo. Blondel. F. IEEE Transactions on Automatic Control 44. I. 392–398. (1992). Ediciones MIR. Nonlinear Control Design.. (1995). USA. ‘Nonlinear control via approximate inputoutput linearization: The ball and beam example’. in ‘Proc. P. Nonlinear Control Systems.’. & G´omez-Estern. AZ. Hauser. Hale. J. A. Kelly. ‘Open Problems in Mathematical Systems and Control Theory’. in ‘Proc. A. P. Mechanical feedback control systems. J. F. (1964). G´omez-Estern. USA. No. H. Wiley. I. M. Krsti´c. (1996). M. & Kolmanovsky. (2000). in ‘Proc. University of California. J. E. of the 38th IEEE Conference on Decision and Control’. (1993). Springer-Verlag. 6. M. M. P. Sastry. Rubio.BIBLIOGRAF´IA 197 G´omez-Estern. Australia. in ‘15th International Symposium on Mathematical Theory of Networks and Systems.. Santa Barbara. Hamberg. (1995). Springer-Verlag.. & McCracken. (1994). R. A. (2001). 39–44. Kuznetsov. J. Curso de f´ısica te´ orica. N. Van der Schaft. Reyhanoglu. S.MTNS’02’. On the measure of global invariant manifold for fixed points. (1991). 3. on AC 37. Stabilization of autonomous oscillations and the Hopf bifurcation in the ball and beam. The Hopf Bifurcation and Its Applications. Aracil.. & Kokotovic. J. Y. Bloch. (1995). Aplicaci´on en tiempo real para el control de una plataforma giroestabilizada. Dynamics and Bifurcations. On the ball and beam problem: regulation with guaranteed transient performance and tracking periodic orbits. R. & Marsden. Landau. Sepulchre. Khalil.J. E. Kanellakopoulos. DE. J. & Tomei. Isidori. in M. (1999). J. Elements of Applied Bifurcation Theory. & Kokotovic. F. Willems. Krsti´c. F. Nonlinear and Adaptive Control Design. (1989). August 12-16. F. Prentice Hall. Vol. eds. 4. ‘On output feedback global stabilization of euler-lagrange systems’. Loria. ‘The Hopf bifurcation theorem and its applications to nonlinear oscillations in circuits and systems’. ‘Stabilization of underactuated mechanical systems via interconnection and damping assignment’. USA. Springer-Verlag. & Sussmann. Sepulchre. A. R. & Mawhin. IEEE Transactions on Automatic Control 46. A. USA. No. & Kokotovic.. M. P. of Robust and Nonlinear Cont. F. T. No. A. & Ortega. R. Passivity-based Control of Euler-Lagrange Systems. (2000). Alianza Universidad Textos.. Van der Schaft. IEEE Trans. Int. ‘Putting energy back in control’. Ortega. (2002).. L. No. of the 38th IEEE Conference on Decision and Control’. Foundations of Theoretical Mechanics I. Jankovic. .. (1997). Mareels. Shiriaev.. J. Springer-Verlag. (1980).4. P. J. H. R. M. London. (2002). pp. NJ. Int Journal of Robust and Nonlinear Control 10. R. Pitman Publ. USA. FL. on Automatic Control 47.. R. & Maschke. Interconnection and damping assignment control of electromechanical systems.. 283–300.. B. & Sira-Ram´ırez. Praly. R. H. Ortega. & Blankenstein. AZ. XV IFAC World Congress’. S. Ortega. Constructive Nonlinear Control. 8. (1999). PhD thesis: Nonlinear Control of Underactuated Mechanical Systems with Application to Robotics and Aerospace Vehicles. F. M. & Spong. Santilli. 313–324. R. Ortega.. & et al. (1990). Ortega. Shen. 637–644. Ra˜ nada. Ordinary Differential Equations: Vol II. 585–596. ‘Interconnection and damping assignment passivity-based control of port-controlled hamiltonian systems’. R. Barcelona. Special Issue on Mechanical Systems 5. Orlando. Madrid. K. Espa˜ na. in ‘Proc. (1998). L. (1978). 4. Magazine 9. Massachusetts Institute of Technology. Rampazzo. Niklasson. Maschke.198 BIBLIOGRAF´IA Mees. (1995).. 1218–1233. (2001). G. Spong. H. R. Princeton. Mei. & Chua.. A. (1979). I. L. Stabilization of underactuated mechanical systems via interconnection and damping assignment. Kelly. Loria. R. 235–254. Robust nonlinear excitation control with L2 -disturbance attenuation for power systems. Ortega. A. 4.. & Escobar. No. Automatica 38. (2002). IEEE Control Syst. (2001). A. G. B. Springer–Verlag.. Van der Schaft. (2000). Olfati-Saber. Q. Rodr´ıguez. Rouche. No. & Praly. Din´amica Cl´asica. in ‘Proceedings of the 40th IEEE Conference on Decision and Control’. 2613–2618. in ‘Proc. Ortega.. No. G´omez-Estern. Lu. (2001). (2001). Phoenix. No. R. R. A. in ‘Proceedings of the 1st IFAC Workshop on Lagrangian and Hamiltonian methods in nonlinear systems’. G. ‘Stabilization of nonlinear systems via forwarding mod{Lg V }’. M. on CAS 26. IEEE Tr. & Kaliora. PhD thesis. & Tamura.. Set-valued differentials and a nonsmooth version of chow’s theorem.9. N. ‘On global properties of passivity-based control of the inverted pendulum’. 10. 1845–1851. Springer-Verlag. (1987). Texas Instruments (1999). Prentice Hall. Van der Schaft. Wang. S. USA. C. Spong. (1993). 2613–2618. Applications of qualitative methods in the nonlinear control of superarticulated mechanical systems. M. M. Automatica 37. (1997). California. (2002). Weibel. . Prentice Hall. M. pp. W. Massachusetts.. John Wiley & Sons.. Robot Dynamics and Control. Inc. J. Cheng. PhD thesis. P. Spong. & Li. New York. A. Boston University. San Diego. Nonlinear system analysis (2nd edition). Spong. Vidyasagar. & Vidyasagar. L2 -Gain and Passivity Techniques in Nonlinear Control. Boston. J. Robotics Research 6. 49–59. Hyatt Regency. R. S. A. in ‘International Workshop on Control Problems in Robotics and Automation: Future Directions’. M. Modern Operating Systems. Preprint. USA.. (1997). Tanenbaum. Y. ‘Nonlinear control of the inertia wheel pendulum’. (2001). D. Y.BIBLIOGRAF´IA 199 Slotine. Texas Instruments TMS320C4x User Guide. (2000). Underactuated mechanical systems. Corke. Int. (1989).. & Lozano. M. ‘On the adaptive control of robot manipulators’. (2001). 2002 . UK. London. ‘Dissipative hamiltonian realization and energy-based L2 -disturbance attenuation control of multimachine power systems’. Li. & Ge.
Copyright © 2024 DOKUMEN.SITE Inc.