299018-Sistemas Avanzados de Control

March 29, 2018 | Author: eeredondop | Category: Fuzzy Logic, Science And Technology, Systems Theory, Cybernetics, Technology


Comments



Description

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNADESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS PROGRAMA DE INGENIERÍA ELECTRÓNICA 299018-SISTEMAS AVANZADOS DE CONTROL CARLOS ALBERTO VERA ROMERO (Director Nacional) JAIRO HERNAN LOPEZ B. Acreditador PAMPLONA Julio de 2009 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL MÓDULO SISTEMAS AVANZADOS DE CONTROL © Copyright Universidad Nacional Abierta y a Distancia ISBN 2009 Centro Nacional de Medios para el Aprendizaje UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL ASPECTOS DE PROPIEDAD INTELECTUAL Y VERSIONAMIENTO El presente módulo fue diseñado en el año 2009 por el Ingeniero Carlos Alberto Vera Romero, docente de la UNAD, y ubicado en el CEAD de Pamplona, el Ing. Vera nació en Gramalote, departamento Norte de Santander, el 6 de mayo de 1977. Estudio su bachillerato en el Colegio Sagrado Corazón de Jesús de la Comunidad de Hermanas Betlehemitas en el municipio de Gramalote, Departamento Norte de Santander COLOMBIA. Secretariado y Comercio en 1991 y Bachiller Académico en 1993. En el año 2000 se graduó de Ingeniero Electrónico de la Universidad de Pamplona, con el trabajo: Diseño de una Interfaz portátil para la obtención y monitoreo de la actividad cardiaca humana. En el siguiente año termino sus estudios Técnicos en Energía Solar. Además tiene dos especializaciones; una en Pedagogía Universitaria y otra en Gestión de Proyectos Informáticos. En marzo del año 2008, recibió su título de Magíster (Master of Science) en Controles Industriales de la Universidad de Pamplona, con el trabajo titulado: Obtención y análisis mediante un interfaz de los procesos transitorios en un motor de inducción tipo Jaula Ardilla. En año 2000 se desempeño como docente hora cátedra en la Universidad de Pamplona, En el año 2001 al 2008, trabajo para la misma Institución como docente Tiempo Completo de diversas áreas de la ingeniería como la electrónica, las telecomunicaciones y en su especialidad, el procesamiento digital de señales. A su vez también se desempeño en el año 2001 como director del Programa de Ingeniería Electrónica y en el año 2002 como Director de departamento del mismo programa. Además participo activamente como Coordinador en procesos de registro calificado y acreditación. Director y jurado calificador de diversos proyectos de investigación en los diferentes programas de la Facultad de Ingeniería. Docente Hora cátedra de la Corporación Tecnológica Centrosistemas sede Pamplona. En año 2004 y 2005. Fue asesor e Investigador de Procesos de Articulación en el Instituto Superior de Educación ISER- Pamplona- COLOMBIA. Trabajo en el año 2006 y 2007 como Reparador e Instalador de Tecnología XDSL y Redes de Banda Ancha para Telefónica - Telecom en Pamplona. Actualmente se encuentra laborando para la Universidad Nacional Abierta a Distancia UNAD en el Centro de Educación A Distancia de Pamplona, como Docente. Tiene a cargo la Dirección del Curso Académico; Organizaciones del Conocimiento en la Especialización en Dirección Prospectiva y Estratégica de las Organizaciones Universitarias. Además es tutor virtual del curso; Introducción a la Ingeniera de las Telecomunicaciones, del mismo programa que ofrece la UNAD y UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL es Coordinador del grupo GRINDES. Grupo de Investigación para el Desarrollo Económico y Social. A realizado diversos proyectos, ponencias y publicaciones a nivel nacional e internacional en las áreas de la electrónica, las telecomunicaciones y el control industrial. El presente módulo esta basado en un trabajo preliminar de 6 capítulos compilado por el ing. JOHN JAIRO CESPEDES MURILLO, Y actualmente actualizado por el ingeniero Carlos Alberto Vera Romero en donde ha extendido el contenido de capítulos a nueve, aplicando los lineamientos de los módulos de los cursos académicos virtuales. Actualmente el ing. JAIRO HERNAN LOPEZ B., tutor, apoya el proceso de revisión de estilo del módulo y dio aportes disciplinares, didácticos y pedagógicos en el proceso de acreditación de material didáctico desarrollado en el mes de JULIO de 2009. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL INTRODUCCIÓN Cuando se menciona “Sistemas de Control Avanzado” se quiere indicar la aplicación de estrategias de control automático que trascienden las que usualmente se aplican en control de procesos. Ejemplos de las técnicas de control más usuales de sistemas SISO (una entrada – una salida) son el control PID en sus diversas formas –ajuste manual o automático (“selftunning”)-, control de razón, sistemas de “Adelanto-Atraso” (“Lead-Lag”) por reasignación de polos y ceros, control digital discreto (usando PLC’s), etc., las mismas que pueden aplicarse sobre sistemas MIMO (multivariables), usando el concepto de desacople de lazos a partir del análisis de la matriz de ganancias relativas de Bristol, quedando limitado a sistemas con igual número de variables de entrada que de salida. En general, estas estrategias pueden denominarse de “parámetros óptimos” ya que, partiendo de una estructura algorítmica fija, se modifican sus parámetros con el objeto de lograr la respuesta del proceso que mejor se adecue a los requerimientos del mismo, conforme a un criterio de optimización fácil de entender y manejar por un operador de planta (Ver: ABC-Algoritmos de control PID). Esta forma de operar tiene –entre sus ventajas principales- que puede ser fácilmente implantada con circuitos electrónicos analógicos y/o digitales, pudiendo construirse controladores PID en gabinetes compactos y comercializarse individualmente como tal. Asimismo, la simpleza de la programación de un algoritmo PID digital ha posibilitado que la mayor parte de las empresas fabricantes de equipos del rubro de la automatización (PLC’s, sistemas de adquisición de datos (DAS), o sistemas de control distribuido (DCS)) incorporen módulos de control PID dentro de sus productos. Por lo general, este tipo de control presenta buenas condiciones de desempeño para la mayoría de los procesos industriales tradicionales, lo que prácticamente asegura su permanencia en el tiempo. Sin embargo, existen procesos que –por su grado de complejidad- no pueden ser operados usando técnicas de control convencional de forma eficiente, y requieren aplicar técnicas de control avanzado para alcanzar las prestaciones deseadas. En las próximas líneas se hará referencia a la visión del autor de estas formas “avanzadas” de control, las que –en parte- pueden ser contrastadas y ampliadas en: (Mark J.Willis y Ming T. Tham (1994) Advanced Process Control. Dept. of Chemical and Process Engineering. University of Newcastle. Disponible en http://lorien.ncl.ac.uk/ming/advcontrl/sect1.htm, consultado el 1 de julio 2009). Los sistemas de control avanzado. Existen diferentes formas de control automático que responden a este tipo de denominación. En general, todas se basan en un conocimiento más o menos acabado del sistema a controlar, tanto de su fenomenología como de sus condiciones de operación, a través de un modelo UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL matemático que lo describa en forma bastante aproximada, en todo su rango de operación y para cualquier instante de tiempo (situación relevante en procesos por lotes o “batch”). Este modelo se usa tanto como parte integrante del sistema de control como para evaluar el desempeño del sistema a través de técnicas de simulación. Por lo “parámetros optimizados” sino que responden mas bien a estrategias de “estructura optimizada”, ya que su estructura depende del sistema particular a controlar. El desarrollo de este tipo de algoritmos –por lo general- implica una fuerte plataforma computacional y, por tanto, difícilmente pueda pensarse en encontrar productos comerciales que los contenga (salvo excepciones de simple implantación como es el caso de control por lógica difusa (“fuzzy logic”), al que se hará referencia en un próximo párrafo). Esto hace que este tipo de control no pueda ofrecerse como “un producto particular”, disponible en un gabinete DIN o equivalente, sino que la estrategia de control se programa dentro de un computador, para cada caso. Por tanto, controladores con estrategias de control avanzado no pueden “comprarse en el mercado”, sino que requieren ser configuradas por un experto en control, quien deberá posteriormente capacitar al operador del proceso para hacer los ajustes que podrían requerirse durante la operación rutinaria del sistema que esté siendo controlado. Estrategias de control avanzado más conocidas. Sin duda, y siguiendo la definición dada de control avanzado, existen diversidad de estrategias de control que responden a esta clasificación, principalmente provenientes del mundo académico-científico. Sin embargo, la dificultad para poder ser operadas por personal con escaso nivel de formación profesional así como para generalizarlas a sistemas de diferente naturaleza, ha provocado que pocas sean las que han trascendido del ámbito académico al industrial. A continuación, se hace referencia a las más relevantes, partiendo de aquellas que han cruzado al umbral de la aplicación industrial. • Control Experto control Borroso, Difuso o por Lógica Difusa (“Fuzzy Logic Control”): Este tipo de control se basa en la recopilación de conocimiento de un sistema, a partir de operadores del mismo que pueden considerarse como “expertos” en su área de conocimiento. Este conocimiento se transforma en una serie de reglas del tipo “SI x1, x2,... xn, ENTONCES y1, y2,... ym,...” (“IF..., THEN...”), donde “x1, x2,... xn” representan los antecedentes o premisas e “y1, y2,... ym” las consecuencias o acciones. La forma de procesar estas reglas, contrastándolas con la información disponible del proceso controlado, da las características de cada tipo de control en particular. El mejor exponente de este tipo de control, por el grado de aceptación que ha tenido a nivel industrial es el control Borroso, Difuso o por Lógica Difusa (“Fuzzy Logic Control”). Esta es –quizás- el sistema de control avanzado que ha tenido mejor aceptación entre sus exponentes, principalmente por la industria japonesa, y se encuentran aplicaciones de estrategias de control basadas en lógica difusa en el ajuste automático del foco en cámaras fotográficas, resolución del sistema de UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL frenos ABS en la industria automotriz, lavadoras automáticas, etc. Inclusive, las principales empresas fabricantes de PLC’s incorporan módulos de control de lógica difusa, y las plataformas SCADA o DCS también los están incluyendo como herramientas de control. Este tipo de control se basa en la aplicación de un álgebra difusa planteada por Lofti Zadeh, al tratar de representar el pensamiento lógico humano. Para utilizar esta lógica, las variables controladas y observadas que provienen de los distintos sensores presentes en el proceso, cuya información será utilizada por el sistema de control, debe “pasarse” al mundo “difuso” a través de un procedimiento conocido como “emborronado” o “fusificación” (“fuzzification”), teniendo en cuenta el grado de pertenencia que tiene cada variable a los conjuntos difusos en que se subdivide el rango de aplicación de cada variable, a través de la definición de funciones de membresía asignadas a las mismas. Cuando las variables están ya definidas en forma difusa, se contrasta la información del sistema con la base de conocimiento disponible del proceso y, mediante aplicación de álgebra difusa, se determina la acción de control requerida para el sistema, pero con carácter “difuso”. Para entregar esta información al mundo real, la acción de control debe ser “desemborronada” o “defusificada” (defuzzification”), y entonces estará disponible para ser aplicada a los actuadores del proceso. Entre las principales ventajas de esta técnica puede destacarse la simpleza de su implantación, la extensión directa que tiene para aplicarse tanto a sistemas SISO como MIMO y, en este último caso, sin requerir un mismo número de entradas que de salidas. Además, como se basa en una estructura de información similar a la del pensamiento humano, la forma de proceder tiene muy buena aceptación por parte de los operadores del sistema. • Control Óptimo: Este control se basa en la definición de una función o funcional que –por lo general- incluye el error de control y la acción de control y/o sus desviaciones, con ponderaciones que permiten “pesar” en forma relativa cada una de ellas, y se establece un criterio de optimización sobre dicho funcional que se ajuste a los objetivos del control. Inclusive, pueden incluirse también las restricciones del misma (rangos de operación de variables, de las acciones de control y del sistema), produciendo una acción de control óptima según el criterio establecido, sujeta a las restricciones presentes en el proceso. Este último aspecto es su principal fortaleza frente a controladores convencionales como el PID. El mejor representante de este tipo de control, por la gran aceptación que ha tenido en el campo del control de procesos Control Predictivo por Modelo (“Model Predictive Control” o “MPC”). El sistema utiliza un modelo matemático del proceso para predecir el comportamiento del sistema en el futuro frente a posibles acciones de control a aplicar. Se define un “horizonte de predicción” (tiempo sobre el cual se evalúan las posibles respuestas del sistema) y un “horizonte de control” (tiempo sobre el que las acciones de control pueden variar y después del cual se mantienen constantes). Se determina la acción de control óptima a aplicar al sistema para lograr la respuesta deseada del sistema dentro del horizonte de predicción previsto, tanto para la acción de control en el instante presente como en los futuros instantes de muestreo. A pesar de definirse varias acciones de control (actual y futuras) solamente se aplica la actual, ya que en el próximo intervalo de UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL control se vuelve a repetir el mismo cálculo. El sistema más difundido es el que usa un modelo lineal para el sistema (LMPC), tanto por la facilidad de implantación como por la posibilidad de ajustar el modelo en distintos instantes del proceso usando cualquiera de los métodos de identificación de sistemas conocidos. Aplicaciones industriales de esta técnica de control pueden encontrarse en. • Control Robusto: Consiste en definir una estructura de control que tenga un desempeño acorde a las especificaciones del sistema, independientemente de las perturbaciones a las que esté expuesto. A nivel académico, los mayores desarrollos en torno a este tema tienen relación con el Control Óptimo. Sin embargo, otro buen ejemplo que sí ha sido aplicado a nivel industrial es el Control por Modelo Interno (“Internal Model Control o IMC”). Este sistema de control también ha tenido buena aceptación industrial, debido a que el controlador resultante puede asimilarse a un control PID. Tal como en MPC, este control incorpora un modelo matemático de la planta, pero en este caso se usa para compensar la dinámica modelable y no modelable de planta. Aunque las acciones de control que pueden lograrse con sistemas de control robusto son más cautelosas que las que resultan de otros sistemas, con un buen ajuste del controlador se pueden lograr sistemas que cumplan ambas prestaciones. • Control Adaptivo, Adaptativo o Adaptable (“Adaptive Control”): Este sistema de control es apropiado para sistemas que sean variantes en el tiempo. Aunque dentro de esta categoría podrían colocarse los “PID autoajustables”, el concepto es mucho más amplio, ya que suelen incorporar técnicas de identificación de parámetros por mínimos cuadrados u otras técnicas propias del sistema resultante. Una de las estrategias de control más conocidas dentro de este tipo de control es el “Control Adaptivo por Modelo de Referencia” (“Reference Model Adaptive Control” o “RMAC”). Se define un modelo con una dinámica como la que gustaría que tenga el sistema. El objetivo del sistema de control es disponer de un sistema de lazo cerrado cuyos parámetros puedan ajustarse para establecer el tipo deseado de respuesta del sistema (la que se tendría si el sistema fuese igual al modelo de referencia). • Control Neuronal: Las Redes Neuronales (“Neural Networks”) son estructuras matemáticas que procuran representar la información en forma similar a como se estructura en nuestro cerebro. El objetivo de usar redes neuronales es disponer de un sistema que se comporte como una “caja negra” que pueda emular el comportamiento de un sistema. Para ello, se requiere de una etapa de entrenamiento (donde se ingresa información disponible del sistema procurando que la red “aprenda” lo que se le quiere enseñar) y una de “validación” (donde se contrasta el aprendizaje de la red con otros datos disponibles del sistema que no se utilizan para el entrenamiento). Cuando la red “ha aprendido”, se la puede utilizar tal como si se operara con el sistema real. En el caso de Control Neuronal (“Neural Control”), se pueden generar datos que representen condiciones del proceso y acciones de control que lleven al sistema a los valores deseados. Incorporando esa información al aprendizaje de la red, podría lograrse que el UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL sistema emule tales condiciones. Este sistema requiere que el proceso de entrenamiento incluya todo el espectro posible de situaciones a las que podría estar expuesto el sistema, ya que si se llegase presentar una condición que no fue considerada durante la etapa de entrenamiento, no puede asegurarse que el sistema responda en la forma esperada. Por tanto, la parte más crítica es la selección de datos adecuados para el entrenamiento de la red. En esta etapa se puede encontrar combinado con otras técnicas, como es el caso de sistemas “neuro-fuzzy”, que emplean lógica difusa para poder establecer la selección de datos a utilizar en el entrenamiento. El presente texto pretende ser un abre bocas para las nuevas generaciones de ingenieros cuya pasión es el control avanzado de procesos, se pretende mostrar con referencias algunas de estas estrategias mencionadas. .. …. ¡ B i e n v e n i d @ s ! al curso sistemas avanzados de control. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL INDICE DE CONTENIDO ASPECTOS DE PROPIEDAD INTELECTUAL Y VERSIONAMIENTO.................................................... 3 INTRODUCCIÓN ......................................................................................................................... 5 UNIDAD 1. GENERALIDADES DEL CONTROL AVANZADO............................................................... 20 CAPITULO 1. EVOLUCIÓN EN LOS SISTEMAS DE CONTROL........................................................ 21 Introducción......................................................................................................................... 21 Lección 1. Automatización de plantas industriales ............................................................ 22 Lección 2. Controlador Lógico Programable...................................................................... 30 Lección 3. Sistema de control distribuido.......................................................................... 32 Lección 4. Aplicaciones de control por computador ......................................................... 35 Lección 5. Nuevas vías de comunicación........................................................................... 39 CAPITULO 2. DISEÑO MEDIANTE VARIABLES DE ESTADO.......................................................... 44 Introducción......................................................................................................................... 44 Lección 6. Observadores de estado................................................................................. 44 Lección 7. Observador de orden completo........................................................................ 45 Lección 8. Diseño de observadores de orden completo.................................................... 49 Lección 9. Observador de orden reducido......................................................................... 64 Lección 10. Observador para sistemas MIMO.................................................................. 73 CAPITULO 3. CONTROL ÓPTIMO............................................................................................. 80 Introducción......................................................................................................................... 80 Lección 11. Generalidades del control óptimo continuo y discreto.................................... 80 Lección 12. Control LQ de Horizonte Infinito.................................................................. 100 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Lección 13. Solución del problema de horizonte infinito............................................ 101 Lección 14. Principio máximo de Pontryaguin................................................................. 102 Lección 15. Estimación de Estado con el Filtro de Kalman............................................... 107 Fuentes Documentales de la Unidad 1............................................................................ 113 UNIDAD 2. TÉCNICAS AVANZADAS DE CONTROL I ...................................................................... 116 CAPITULO 1. TÉCNICAS AVANZADAS EN LOS SISTEMAS DE CONTROL ..................................... 117 Introducción....................................................................................................................... 117 Lección 1. Control en adelanto (feedforward)................................................................. 118 Lección 2. Control en cascada......................................................................................... 123 Lección 3. Control de relación (ratio control) .................................................................. 131 Lección 4. Mezcla de productos (Blending) ..................................................................... 135 Lección 5. Control selectivo............................................................................................ 139 CAPITULO 2. IDENTIFICACIÓN DE SISTEMAS DINÁMICOS........................................................ 146 Introducción....................................................................................................................... 146 Lección 7. Estructura y clasificación de los modelos........................................................ 148 Lección 8. Modelos para sistemas invariantes en el tiempo............................................ 150 Lección 9. Métodos de visión global ............................................................................... 155 Lección 10. Método de estimación por mínimos cuadra- dos generalizado (GLS) ........... 164 CAPITULO 3. CONTROL DIFUSO.................................................................................................. 166 Introducción....................................................................................................................... 166 Lección 11. Historia de la lógica borrosa. ........................................................................ 167 Lección 12. Conjunto borroso......................................................................................... 170 Lección 13. Operaciones con conjuntos borrosos............................................................ 172 Lección 14. El control borroso........................................................................................ 175 Lección 15. Aplicaciones de la lógica borrosa.................................................................. 182 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Fuentes Documentales de la Unidad 2............................................................................ 186 UNIDAD 3. TÉCNICAS AVANZADAS DE CONTROL II ..................................................................... 189 CAPITULO 1. CONTROL ADAPTATIVO..................................................................................... 190 Introducción....................................................................................................................... 190 Lección 1. Sistemas de control adaptativo ...................................................................... 190 Lección 2. Controladores adaptativos con modelo de referencia (MRAC)........................ 194 Lección 3. Método de Lyapunov ..................................................................................... 197 Lección 4. Método de hiperestabilidad........................................................................... 200 Lección 5. Estructura general de los sistemas adaptativos (MRAC).................................. 201 CAPITULO 2. REDES NEURONALES ARTIFICIALES..................................................................... 206 Introducción....................................................................................................................... 206 Lección 6. Funcionamiento de una neurona biológica. .................................................... 207 Lección 7. Características de una red neuronal artificial ................................................. 214 Lección 8. Principales tipos de redes neuronales ............................................................ 227 Lección 9. Backpropagation............................................................................................ 232 Lección 10. Aprendizaje asociativo................................................................................. 234 CAPITULO 3. CONTROL PREDICTIVO....................................................................................... 243 Introducción....................................................................................................................... 243 Lección 11. Fundamentos del control predictivo............................................................. 243 Lección 12. Ventajas e desventajas del Control Predictivo .............................................. 245 Lección 13. Elementos del Control Predictivo: ................................................................ 246 Lección 14. Algoritmos................................................................................................... 249 Lección 15. Restricciones y tendencias en Control Predictivo......................................... 251 Fuentes Documentales de la Unidad 3............................................................................ 253 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL LISTADO DE TABLAS Tabla 2 1 Tabla de reglas aplicadas............................................................................................. 177 Tabla 3 1 Funciones de Transferencia......................................................................................... 220 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL LISTADO DE GRÁFICOS Y FIGURAS Unidad 1. Figura 1. 1 Instrumentos instalados en campo ............................................................................. 22 Figura 1. 2 Paneles con instrumentos analógicos.......................................................................... 23 Figura 1. 3 SP modificado por el operador.................................................................................... 24 Figura 1. 4 SP modificado por el computador ............................................................................... 25 Figura 1. 5 Sustitución de un lazo de control analógico por otro tipo DDC.................................... 26 Figura 1. 6 Diagrama en bloques de configuración twin computer ............................................... 28 Figura 1. 7 Diagrama en bloques de Seguridad en el control por medio de back up...................... 29 Figura 1. 8 Elementos de un Sistema de Control Distribuido (SCD................................................. 33 Figura 1. 9 Consola de Operación................................................................................................. 34 Figura 1. 10 Controladores analógicos efectuando control independiente.................................... 36 Figura 1. 11 Cierre del lazo hecha por el operador........................................................................ 37 Figura 1. 12 Sistema de control ON LINE...................................................................................... 38 Figura 1. 13 Sistema de control ON LINE en LAZO CERRADO......................................................... 39 Figura 1. 14 Sistema de control utilizando fielbus......................................................................... 42 Figura 1. 15 Diagrama en bloques de un observador del orden completo..................................... 47 Figura 1. 16 Diagrama en bloques de un observador del orden reducido...................................... 64 Figura 1. 17 Posibles trayectorias de 1 al 8................................................................................... 82 Figura 1. 18 Péndulo invertido ..................................................................................................... 91 Figura 1. 19 Esquema del lazo del sistema del péndulo invertido ................................................. 92 Figura 1. 20 Respuesta ante una entrada escalón unitario con control LQR. ................................. 97 Figura 1. 21 Respuesta corregida ante una entrada escalón unitario con control LQR................... 99 Figura 1. 22 Respuesta Ganancia del estimador versus el tiempo............................................... 111 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Unidad 2. Figura 2. 1 Diagrama en bloques del control feedforward .......................................................... 119 Figura 2. 2 Diagrama de un intercambiado de calor.................................................................... 120 Figura 2. 3 Diagrama de un intercambiado de calor con compensación dinámica....................... 122 Figura 2. 4 Diagrama de un intercambiado de calor con compensación dinámica....................... 123 Figura 2. 5 Diagrama típico de nivel de un tanque para el ejemplo del control en cascada ......... 124 Figura 2. 6 Aplicando control en cascada.................................................................................... 125 Figura 2. 7 Diagrama en bloques aplicando el control en cascada en el nivel de un tanque ........ 126 Figura 2. 8 Diagrama de control entre nivel y caudal de salida del acumulador de una columna de destilación ................................................................................................................................. 127 Figura 2. 9 Diagrama de control entre nivel y caudal de salida del acumulador de una columna de destilación ................................................................................................................................. 127 Figura 2. 10 Diagrama de control de combustión de un horno ................................................... 129 Figura 2. 11 Diagrama de control de sistemas con tres controladores en cascada...................... 129 Figura 2. 12 Diagrama de control de sistemas con tres controladores en cascada...................... 130 Figura 2. 13 Diagrama de un absorbedor en el que se elimina SH 2 utilizando como absorbente Mono Etanol Amina (MEA)......................................................................................................... 132 Figura 2. 14 Sistema feedforward aplicado al absorbedor ......................................................... 133 Figura 2. 15 Sistema de relación caudal parcial a caudal total..................................................... 134 Figura 2. 16 Sistema de control para relación de mezcla............................................................ 135 Figura 2. 17 Sistema de control para blending........................................................................... 136 Figura 2. 18 Diferentes fases que componen el desarrollo.......................................................... 138 Figura 2. 19 Control selectivo Anti reset windup......................................................................... 141 Figura 2. 20 Control selectivo override...................................................................................... 141 Figura 2. 21 Control override para medida de caudal de LPG...................................................... 143 Figura 2. 22 Comportamiento del control override para la medida del caudal de LPG ................ 143 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 23 Sistema de control override entre presión nivel en los equipos situados en cabeza de una columna desetanizadora ..................................................................................................... 144 Figura 2. 24. Respuesta al escalón de un sistema de primer orden con retardo.......................... 156 Figura 2. 25 Respuesta al escalón de un integrador .................................................................... 158 Figura 2. 26 Respuesta de un sistema de 2do orden................................................................... 158 Figura 2. 27 Evaluación de la respuesta sinusoidal...................................................................... 161 Figura 2. 28 Análisis de la respuesta frecuencial con técnicas de correlación.............................. 162 Figura 2. 29 Jan Likasiewicz ........................................................................................................ 168 Figura 2. 30 Lofti A. Zadeh.......................................................................................................... 168 Figura 2. 31 E.H. Mamdani ......................................................................................................... 169 Figura 2. 32 Subconjunto borroso .............................................................................................. 171 Figura 2. 33 Forma gráfica del conjunto gente joven ................................................................. 172 Figura 2. 34 A Intervalo borroso entre 5 y 8............................................................................... 173 Figura 2. 35 B número borroso en torno a 4............................................................................... 173 Figura 2. 36 Operación AND....................................................................................................... 174 Figura 2. 37 Operación OR ......................................................................................................... 174 Figura 2. 38 Operación negación................................................................................................ 174 Figura 2. 39 Funciones pertenecientes al conjunto borroso velocidad....................................... 175 Figura 2. 40 Funciones pertenecientes al conjunto borroso ángulo ........................................... 176 Figura 2. 41Funciones pertenecientes al conjunto borroso velocidad angular ............................ 176 Figura 2. 42 Funciones pertenecientes al ángulo actual ............................................................. 177 Figura 2. 43 Funciones pertenecientes a velocidad angular actual ............................................. 178 Figura 2. 44 Conjunto cero, variable lingüística "ángulo" y ángulo actual ................................... 178 Figura 2. 45 Conjunto borroso “cero” –ángulo de 0.75.............................................................. 178 Figura 2. 46 Funciones pertenecientes a velocidad angular actual .............................................. 179 Figura 2. 47 Valor real pertenece al conjunto borroso "cero" en un grado de 0.4 ....................... 179 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 48 Operación lógica AND ............................................................................................ 180 Figura 2. 49 Resultado de la regla “negativa baja”...................................................................... 180 Figura 2. 50 Resultado de la regla “positiva baja”....................................................................... 181 Figura 2. 51Resultado de la regla “velocidad cero”..................................................................... 181 Figura 2. 52 Resultado de las reglas solapadas ........................................................................... 181 Figura 2. 53 Conjunto borroso de velocidad............................................................................... 182 Figura 2. 54 Herramienta EDIMED............................................................................................. 186 Unidad 3. Figura 3. 1 Sistema con control adaptativo................................................................................. 191 Figura 3. 2 Sistema con mecanismo de adaptación..................................................................... 194 Figura 3. 3 Sistema de primer orden.......................................................................................... 199 Figura 3. 4 Simulación proceso de primer orden γ1=0.1 ............................................................. 202 Figura 3. 5 Simulación proceso de primer orden γ1=0.5 ............................................................. 203 Figura 3. 6 Representación equivalente del modelo de error...................................................... 204 Figura 3. 7 Sistema adaptativo por modelo de referencia paralelo ............................................. 205 Figura 3. 8 Neuronas Biológicas.................................................................................................. 208 Figura 3. 9 Cambios asociativos de las fuerzas sinápticas durante el aprendizaje........................ 209 Figura 3. 10 Comunicación entre neuronas ................................................................................ 211 Figura 3. 11 Proceso químico de una sinápsis............................................................................. 213 Figura 3. 12 Neurona Artificial.................................................................................................... 214 Figura 3. 13 De la neurona biológica a la neurona artificial......................................................... 214 Figura 3. 14. Estructura de una red neuronal.............................................................................. 215 Figura 3. 15 Neurona de una sola entrada.................................................................................. 217 Figura 3. 16 Función de transferencia Hardlim........................................................................... 218 Figura 3. 17 Función de transferencia Hardlims.......................................................................... 218 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 18 Función de transferencia lineal ............................................................................... 219 Figura 3. 19 Función de transferencia sigmoidal ......................................................................... 219 Figura 3. 20 Neurona con múltiples entradas ............................................................................. 221 Figura 3. 21 Neurona con múltiples entradas, notación abreviada.............................................. 222 Figura 3. 22 Capa de S neuronas ................................................................................................ 223 Figura 3. 23 Capa de S neuronas con notación abreviada ........................................................... 223 Figura 3. 24 Red de tres capas.................................................................................................... 224 Figura 3. 25 Red de tres capas con notación abreviada............................................................... 224 Figura 3. 26 Redes Recurrentes.................................................................................................. 225 Figura 3. 27 Bloque de retardo................................................................................................... 226 Figura 3. 28 Bloque integrador................................................................................................... 226 Figura 3. 29 Clasificación de las Redes Neuronales ..................................................................... 227 Figura 3. 30 Modelo del Fotoperceptrón de Rosenblatt.............................................................. 228 Figura 3. 31Esquema de conexiones de un Perceptrón sencillo .................................................. 229 Figura 3. 32 Perceptrón según Minsky y Papert.......................................................................... 230 Figura 3. 33 Perceptrón.............................................................................................................. 231 Figura 3. 34 Circuito Eléctrico red Hopfield................................................................................. 241 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL UNIDAD 1 Nombre de la Unidad Generalidades del control avanzado Introducción El presente curso inicia con una explicación de la evolución que ha tenidos los de diversos sistemas de control. Seguido de los diferentes métodos utilizados en el diseño de sistemas de control mediante variables de estado. También se pretende profundizar la selección de las variables de control, tales que maximizan o minimizan un índice de optimización determinado, dentro de los enlaces, puesta sobre las variables de control que frecuentemente no son las variables independientes y dentro de las limitaciones propias del sistema. Justificación La necesidad actual de los futuros profesionales de la ingeniería, requiere ingenieros que conozcan y comprendan, además de las técnicas de control, a su vez los diversos procesos encaminados a una mayor eficiencia y calidad de los sistemas y de sus procesos de control. Intencionalidades Formativas Se pretende en la siguiente unidad que los estudiantes conozcan y comprendan cambios y evolución que ha tenido los sistemas de control hasta el fía de hoy. Conocer diferentes métodos de diseño de sistemas de control en el espacio de estados desarrollando competencias para el modelado de sistemas de control usando variable de estado. Obtener las bases necesarias para entender los conceptos generales de optimalidad, índice de desempeño y control óptimo, aprehendiendo a usar diversas técnicas de diseño de control óptimo con la finalidad de optimizar el desempeño de un sistema Denominación de capítulos • Capitulo 1.1 Evolución en los sistemas de control • Capitulo 1.2 Diseño mediante variables de estado • Capitulo 1.3 Control óptimo UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL UNIDAD 1. GENERALIDADES DEL CONTROL AVANZADO UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL CAPITULO 1. EVOLUCIÓN EN LOS SISTEMAS DE CONTROL Introducción En las primeras plantas de procesamiento de fluidos del siglo pasado, el control de procesos requería frecuentemente de muchos operadores, quienes circulaban continuamente alrededor de cada unidad de proceso observando los instrumentos locales y manipulando las válvulas. Las operaciones generales de la planta requerían que los operadores realizaran un tour a la planta registrando manualmente los parámetros de importancia. Posteriormente, y tras efectuar los cálculos matemáticos apropiados, el operador hacia un segundo tour, ajustando los controles. Con la transmisión de las señales neumáticas, nacieron las primeras salas de control, donde se trasladaron los indicadores a un lugar central, junto con los controladores que transmitían señales de vuelta hacia las válvulas. En ese entonces, las lecturas se realizaban en grandes indicadores locales y los operadores ajustaban los controles neumáticos en la sala de control. Luego de la Segunda Guerra Mundial, los controladores electrónicos empezaron a aplicarse industrialmente y aparecieron nuevos tipos de sensores para medir parámetros anteriormente no medibles. Asimismo, los computadores se volvieron más baratos y confiables, y los controladores se hicieron más pequeños, permitiendo su instalación en paneles. A su vez, las salas de control se tornaron más comunes y complejas. Las tecnologías de video y su habilidad para desplegar datos y permitir al operador iniciar acciones de control, hicieron posible las entradas del control distribuido. Entonces, la sala de control pudo proveer información centralizada sin tener que centralizar todo el procedimiento, disminuyendo así los riesgos asociados, al reducir costos y complejidad de cableado. De este modo, los tradicionales recorridos de los operadores dejaron de ser necesarios, ya que con sus dedos, podían acceder a las pantallas de un controlador (o de un grupo de ellos), hacer cambios de Set Point fácilmente desde UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL el teclado y si existían condiciones fuera de lo normal, responder a cualquier alarma. A continuación se presenta una descripción la evolución en los sistemas de control, desde la automatización de plantas industriales, el controlador lógico programable, los sistemas de control distribuido, las aplicaciones de control OFF LINE y nuevas vías de comunicación en plantas industriales. Lección 1. Automatización de plantas industriales Sección 1. Evolución en los elementos de control En los primeros tiempos de la industrialización las plantas eran supervisadas y controladas manualmente, basándose en las indicaciones de instrumentos instalados en campo, como se muestra en la Figura 1.1 La supervisión requería que el operador estuviera en la planta para llevar a cabo el control manual directo del proceso. Figura 1. 1 Instrumentos instalados en campo Desarrollos posteriores en la instrumentación, tal como sensores con posibilidad de transmitir las principales variables de proceso (temperatura, presión, nivel, caudal), así como controladores mecánicos, hidráulicos y neumáticos, contribuyen en loa años cuarenta a la automatización gradual de las plantas. La tendencia de UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL automatización continuó durante los años cincuenta al aparecer los instrumentos electrónicos. Todo ello condujo a la centralización en salas donde se ubicaron los elementos necesarios para llevar a cabo la supervisión y control. La Figura 1.2 muestra dos paneles con instrumentos analógicos de diferentes tamaños de acuerdo a ala evolución en al tecnología. Figura 1. 2 Paneles con instrumentos analógicos A mediados de los años veinte se utilizó en la industria el control todo-nada, y al final de los años veinte el control proporcional. Los controladores con acciones proporcional, integral y derivativa fueron de uso común en los años treinta. Los valores de referencia (puntos de ajuste o SP), podrían ser fijados por el operador de planta. La necesidad de comprender los problemas inherentes al ajuste o sintonía de los controladores PID, hizo que apareciera la simulación del lazo de control. Este fue el principio de la teoría sobre sistemas de control. Para el ajuste de los parámetros de control se empezaron a utilizar alas reglas de Ziegler Nichols, basadas en la sensibilidad del lazo de control. Sección 2. Automatización basado en computador (Controles SPC y DDC) La posibilidad de utilizar computadores digitales para el control de procesos apareció en la mitad de los años cincuenta, aunque fue realmente a finales de esa década cuando se desarrolló esta alternativa de control. Desde entonces el computador para control de procesos ha evolucionado a través de diferentes etapas de desarrollo que en <<Distributed Computer Control>> aparecen identificadas como: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • Etapa inicial 1958 a 1964 • Computador centralizado 1965 a 1970 • Minicomputador 1971 a 1975 • Control distribuido Desde 1975 Durante mucho tiempo los computadores eran demasiado grandes, lentos, caros e inseguros desde el punto de vista de funcionamiento. Debido a la falta de seguridad solamente podían utilizarse para realizar control supervisorio, es decir, cálculo de puntos de ajuste de controladores tradicionales con tecnología analógico, conectados directamente al proceso. Para llevar a cabo el control supervisorio se pueden utilizar dos procedimientos: • SP modificado por el operador. En este modo, el computador simplemente suministra el operador de planta los datos para fijar los puntos de ajuste de controladores analógicos, tal como aparece en la Figura 1.3. Figura 1. 3 SP modificado por el operador UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • SP modificado por el computador. En este modo, el computador fija automáticamente los valores de los puntos de ajuste (control SPC o Set Point Control) tal como aparece en la Figura 1.4. Al tratarse de modificar puntos de ajuste de controladores analógicos, el control supervisorio suele ejecutarse con una frecuencia comprendida entre uno y varios minutos. La siguiente fase consistió en la utilización de computadores para sustituir a los controladores tradicionales. Con esto empezó una nueva era en el control de procesos, aunque las funciones del sistema de control seguían siendo las mismas, basado en el comportamiento del lazo de control PID. Al sustituir al controlador analógico, computador tenía que mover directamente el elemento final de control, por lo que se utilizó el término DDC (Direct Digital Control), para poner énfasis en que el computador controla directamente el proceso. Figura 1. 4 SP modificado por el computador La técnica DDC consiste esencialmente en sustituir los controladores analógicos por un computador digital, el cual realiza las mismas funciones de control. La UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 5 muestra la sustitución de un lazo de control analógico por otro tipo DDC. La frecuencia de ejecución de los algoritmos es similar a las utilizadas por el control supervisorio. Figura 1. 5 Sustitución de un lazo de control analógico por otro tipo DDC El valor de proceso, medido por el sensor, se muestrea cíclicamente y, después de la conversión de señal analógica a digital, se introduce al algoritmo de control. El valor de salida calculado se envía al elemento final de control después de pasar el convertidor de señal digital a analógica. Si se compara con el control analógico convencional, el control DDC introdujo una serie de ventajas, entre las que se pueden citar: • Fácil configuración y reconfiguración de los lazos de control. • Introducción sencilla de nuevos lazos de control. • Posibilidad de realizar algoritmos de control avanzado. • Cálculos basados en modelos para obtener valores óptimos en los puntos de ajuste de los lazos existentes en el computador. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Por el contrario, las desventajas más importantes del control digital, utilizando un solo computador, se puede decir que son: • Baja seguridad del sistema. El fallo del computador provoca el fallo de todos los lazos de control. • Altos costes en inversión, mantenimiento y personal, incluyendo costes de programación. • Sobrecarga del procesador (Central Process Unit), cuando el computador tiene que manejar otros procesos de cálculo además del control DDC. Las dificultades técnicas para llevar a cabo la programación ocasionaron serios problemas, por lo que el número de instalaciones aumentaba relativamente despacio. Estas dificultades fueron reducidas utilizando herramientas tipo fill in the blanks (rellenar espacios en blanco) y block oriented programming (programación por bloques). El usuario de estas herramientas no necesita tener conocimientos de programación, simplemente introduce datos de entrada, salidas, tipos de regulador, escalas, etc., en espacios previamente formateados. Sin embargo la relativamente poca seguridad de los computadores retrasó su progreso en el área de control DDC durante muchos años, hasta que los avances en la tecnología de semiconductores consiguieron hacer más baratos, pequeños y rápidos y seguros los computadores. Apareció el término minicomputador para designar este tipo de computador, el cual hizo posible el incremento de sistemas basados en control DDC. Sección 3. Seguridad en el control por medio de back up Posteriores innovaciones en la tecnología de computadores solucionaron muchas de las desventajas mencionada anteriormente. Una gran innovación fue el twin computer concept (computador gemelo), en el que un computador de reserva (back up), realiza las mismas funciones que le principal y en caso de fallo de éste asume sus tareas. La Figura 1.6 representa un diagrama de bloques con la configuración de este tipo. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 1. 6 Diagrama en bloques de configuración twin computer El concepto de computadores en paralelo convenció a los escépticos para utilizar control digital como equivalente del control analógico. Posteriormente una variedad de conceptos de seguridad adicional, como el de la Figura 1.7, hicieron que los computadores para control DDC fueran ampliamente aceptados, antes de llegar los sistemas de control distribuido. En la Figura 1.7 aparece un lazo de control en el que se muestre el concepto de seguridad con un controlador analógico de back up para sustituir el computador ante fallo de éste. Este concepto incluye tres posibles modos de operación. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 1. 7 Diagrama en bloques de Seguridad en el control por medio de back up • Computador (C). También denominado DDC. En este modo el ordenador realiza las funciones de control. • Automático (A). El control analógico de back up lleva a cabo todas las funciones de control. • Manual (M). El operador actúa directamente sobre el elemento final. El sistema de control actúa en lazo abierto. Tanto el valor de la variable de proceso, medida por el sensor, como el punto de ajuste fijado por el operador, son transferidos simultáneamente al ordenador y al controlador back up. Para un valor de punto de ajuste dado, el computador calcula la salida hacia el elemento final de control. En caso de fallo del computador, el controlador pasa instantáneamente al modo automático. El controlador de reserva continúa con el control a partir del último valor de salida calculado por el computador, porque el controlador estaba realizando seguimiento del valor de salida para que el cambio se realice sin salto (bumpless) en la salida. De igual manera, el computador está leyendo el valor de salida cuando el modo de control es manual o automático. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Por último, en caso de fallo del computador, si el operador prefiere cambiar el modo de operación a manual, sólo tiene que pasar el selector de modos al correspondiente a éste y situar el elemento final en la posición deseada. Después de solucionar el fallo, el ordenador toma automáticamente el valor de salida para realizar el cambio sin saltos. Lección 2. Controlador Lógico Programable Sección 1. El controlador lógico programable La aplicación de minicomputadores no fue una solución económicamente rentable para muchos problemas de control, sobre todo si se utilizaban para realizar secuencias lógicas que tradicionalmente se implementaban con sistemas de relés. En los años sesenta, General Motors realizó la especificación apara el diseño de un nuevo controlador programable que redujera los costes de instrumentación y eliminase una serie de problemas relacionados con los relés. El nuevo controlador especificado debía estar basado en tecnología de computador, ser programable y reprogramable, así como fácil de mantener y reparar. Además debía ser robusto, seguro en su funcionamiento y más pequeño y barato que los sistemas equivalentes de relés. Esta especificación se refería solamente a problemas de control secuencial utilizado en procesos discontinuos. En base a las razones expuestas en la especificación, el controlador se denominó Programable Logic Controller (PLC). El primer PLC apareció al final de los años sesenta con unas prestaciones limitadas, puesto que sólo se trataba de sustituir a los sistemas de relés. Con la introducción de los microprocesadores, a principios de los años setenta, cambió radicalmente la tecnología, desarrollándose los controladores con tal rapidez que pronto pudieron manejar un gran número de instrucciones. La comunicación o interfase con el operador también evolucionó, apareciendo los terminales gráficos de pantalla con tubos de rayos catódicos (CRT). En la siguiente década de evolución, todos los aspectos de diseñó se modificaron, fundamentalmente por el desarrollo en la tecnología de comunicaciones. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Utilizando uniones (links), para comunicación de datos los controladores programables se pudieron integrar formando sistemas automáticos complejos. Sección 2. Computador para control distribuido A mediados de los setenta, los microprocesadores fueron incorporados a un gran número de equipos de control. En muchas plantas industriales estos equipos sustituyeron a controladores basados en hardware analógico. Como consecuencia aparecieron los sistemas DDC basados en microprocesador, más pequeños que los anteriores minicomputadores y equipados con pantallas gráficas (displays). Si a esto se suma el progreso en la tecnología de comunicaciones, se llega a la estructura de control distribuido. El primer sistema de control distribuido fue anunciado por Honeywell en 1975, un sistema de control jerárquico con un gran número de microprocesadores con tareas específicas asignadas a cada uno de ellos. Durante este tiempo, especialmente a principios de los ochenta, las normas internacionales tendieron a la compatibilidad e intercambiabilidad del hardware y software. Los sistemas de interfase para computadores fue un elemento fundamental de este desarrollo. Estructuras para soporte de tarjetas y buses para corta y larga distancia (incluyendo la red de área local), fueron normalizados y aceptados como una solución para el diseño de sistemas complejos de control distribuido. Además, el concepto de modularidad tanto en hardware como en software disminuyó los costes de desarrollo. La normalización de aplicaciones de software para control de plantas y acondicionamiento de señales creó algunos paquetes fáciles de aplicar, tales como: • Acondicionamiento de señales de entrada. • Linealización y filtrado de señales. • Asignación de límites y alarmas. Estas funciones fueron incorporándose en los equipos como <<librería de funciones>>. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Lección 3. Sistema de control distribuido Sección 1 Descripción general De forma simplificada, un Sistema de Control Distribuido (SCD), consta de tres elementos fundamentales, tal como aparece en la Figura 8, y que son: • Interfase al Proceso. • Interfaz al Operador. • Vía de datos. Interfase al Proceso Suele haber dos tipos de equipos para realizar la interfase con el Proceso. Uno de ellos, denominado habitualmente controlador, se dedica al procesamiento de lazos de control con entrada, procedente de elementos de medidas, y salida hacia elementos finales, mientras que otro módulo se dedica al procesamiento de entradas que no necesariamente realizar funciones de control, tal como indicaciones. Entre los últimos suele haber equipos especializados en determinados tipos de entradas siendo el más habitual el que procesa temperaturas, conocido como multiplexor. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 1. 8 Elementos de un Sistema de Control Distribuido (SCD Algunos módulos del sistema tienen la posibilidad de programación adicional en lenguajes de alto nivel (Basic, Fortran o lenguajes especializados), con posibilidad de acceso directo a los parámetros de bloques de control. Esta particularidad da una potencia considerable a los equipos, sobre todo si se va a realizar Control Avanzado. Interfaz al Operador El sistema proporciona un medio de supervisar y manipular las Unidades de Proceso desde la Sala de Control, a través de una Consola de Operación similar a la que aparece en la Figura 1.9. Esta consola hace la función de interfaz entre el operador y las Unidades. Todas las pantallas se encuentran unidas con los armarios de control a través de la vía de datos o vía de comunicación. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 1. 9 Consola de Operación Vía de datos El sistema dispone de una vía principal para comunicación de datos y otra de reserva. Cada vía está compuesta por un cable coaxial y toda la electrónica asociada, por donde fluye la comunicación a lo largo de todos los elementos del sistema de control. Ante un fallo en la vía principal, automáticamente entra la de reserva, sin afectar al control de la planta. Sección 2. Seguridad del sistema La medida básica de fiabilidad de un sistema se mide por el tiempo medio entre fallos (MTBF). Para aumentar este tiempo medio entre fallos se utilizan las técnicas de redundancia. Se considera que un sistema es redundante cuando, ante un fallo en una parte del mismo sigue funcionando correctamente, ya que el elemento que falla es sustituido por otro de reserva. Antes de continuar conviene decir que existen dos tipos de diseño para asegurar el control: • Conexión en paralelo redundante. • Conexión de un sistema y otro de reserva. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Con el primer procedimiento existen dos sistemas que procesan simultáneamente las entradas y salidas, comparando continuamente los resultados. La salida la proporciona uno solo de ellos, como se vio en la Figura 6. El segundo procedimiento se comporta de forma que sólo el controlador principal está procesando las entradas y salidas. Si falla este controlador considerado principal, automáticamente asume sus funciones otro controlador considerado como reserva, encargándose este último de procesar las entradas y salidas a partir del momento del fallo. Lección 4. Aplicaciones de control por computador De la misma manera que se produjo la evolución en la automatización de plantas industriales, lo hizo el diseño y utilización de aplicaciones de control por computador. Los primeros computadores se utilizaban sólo apara adquisición de datos de planta, evolucionando hasta llevar a acabo el control del proceso. Sección 1. Aplicaciones de control OFF LINE En los principios de la automatización basada en computador, el operador de planta tenía que tomar lectura de las indicaciones e introducir los datos obtenido en el computador. El computador se utilizaba para adquisición y procesamiento de datos con objeto de realizar balances de materia y energía, control de producción, etc. No se calculaban puntos de ajuste para controladores analógicos ni salidas a elementos finales. Los controladores analógicos seguían efectuando el control independientemente de las tareas que realizara el computador, tal como aparece en la Figura 1.10. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 1. 10 Controladores analógicos efectuando control independiente Este tipo de aplicación se utilizaba para tareas como gestión de la producción, conociéndose con el nombre de OFF LINE en LAZO ABIERTO, puesto que ningún valor calculado retornaba al proceso. En la siguiente etapa de automatización de procesos, la función del computador fue extendida al cálculo de puntos de ajuste de controladores analógicos, así como cálculo de valores de salida a actuadores o elementos finales de control. Sin embargo, en esta etapa de desarrollo los valores calculados de puntos de ajuste o salidas eran introducidos a mano por el operador, por lo que el cierre del lazo lo realizaba el operador, tal como se muestra en la Figura 1.11. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 1. 11 Cierre del lazo hecha por el operador Este tipo de control se utilizaba para tareas tales como planificación de la producción conociéndose como OFF LINE en LAZO CERRADO, puesto que los datos calculados se enviaban como realimentación al proceso, modificando el operador los puntos de consigna necesarios en función de los datos suministrados por el computador. Las aplicaciones OFF LINE introducen un gran retraso e el control debido a la intervención humana, tanto para la toma de datos como apara la distribución de valores calculados a sus destinos, por lo que su utilizaciones muy limitada. Sección 2. Aplicaciones de control ON LINE Al final de los años cincuenta, los computadores fueron provistos de sistemas de interface para captar los datos directamente de los instrumentos conectados al proceso. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Por consiguiente no era necesaria la intervención del operador de planta para transferir los datos al computador. Sin embargo, el computador no enviaba los datos calculados a los puntos de ajuste ni a los elementos finales de control, como puede verse en la figura 1.12. Esta aplicación todavía se utiliza para automatizar recogida de datos, control de calidad, optimización, et., conociéndose con el nombre de ON LINE en LAZO ABIERTO. Figura 1. 12 Sistema de control ON LINE El computador toma automáticamente los datos, realiza los cálculos previstos encaminados a control u optimización y envía los resultados a una pantalla u otro tipo de interface para el operador si lo considera oportuno, tome la acción de modificar los puntos de ajuste o salidas a elementos finales de acuerdo a los datos suministrados por el computador. El primer ensayo para conectar directamente los elementos finales de control con el ordenador se realizó a finales de los años cincuenta. Aquí la transferencia automática de datos se realiza en ambas direcciones, por lo que el operador sólo necesita supervisar el funcionamiento del proceso. Este modo en la Figura 1.13 y se conoce como control ON LINE en LAZO CERRADO. Éste es el nivel más alto de control por ordenador de forma automática, es decir, sin intervención del operador. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 1. 13 Sistema de control ON LINE en LAZO CERRADO Las aplicaciones ON LINE también llevan asociado un tiempo de retardo importante, puesto que la elaboración de los cálculos puede tardar varias horas, sobre todo si se trata de aplicaciones de optimización en línea con funciones objetivo que han de converger antes de suministrar los resultados. Lección 5. Nuevas vías de comunicación Hasta no hace mucho tiempo, las únicas vías de datos residían fundamentalmente en las salas de control, para efectuar la comunicación digital a partir de los convertidores analógicos – digitales existentes en las tarjetas de entrada a los sistemas de control distribuido. Sección 1. Estándar de comunicación digital UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL La lógica evolución del mundo digital ha llegado hasta elementos de campo como transmisores y posicionadores de válvulas automáticas, apareciendo la generación como elementos smart o inteligentes, la cual va sustituyendo progresivamente a la comunicación analógica de 4 a 20 mA. Para comunicación de los nuevos elementos con tecnología digital aparecen las vías de datos campo (fielbus), con diversos protocolos diseñados por los fabricantes de instrumentos y equipos de control, algunos de cuyos protocolos han desaparecido del mercado. Con el objeto de unificar criterios y poder llegar a la intercambiabilidad de elementos, a mediado de los años ochenta se inicia el desarrollo de un estándar de comunicación digital entre elementos de campo y sistemas de control, emitiéndose en 1993 el estándar IEC-1158 (internacional Electrotechnical Commision), que define el nivel físico de transmisión – recepción de datos en términos de velocidad de comunicación, codificación de la señal, número de unidades en el bus, alimentación, etc. Los protocolos basados en el estándar IEC- 1158 reciben el nombre genérico de Fielbus. Sección 2. FOUNDATION TM Fielbus Es el nombre del protocolo creado por la organización de los principales proveedores de todo el mundo implicados en el desarrollo del nuevo estándar fielbus. Sin entrar en demasiado detalles, a continuación se describen los aspectos básicos acerca de la composición y funcionamiento del protocolo. Nivel físico FOUNDATION TM Fielbus es una red de área local (Local Area Network), para comunicación digital, que interconecta elementos de campo tales como transmisores finales, teniendo la posibilidad de distribuir el control a través de la red. La red puede ser de cable de cobre, fibra óptica o incluso de comunicación por radio. La longitud del cable (bus) depende de la calidad o características del mismo, por ejemplo, un par de cobre trenzado y apantallado puede alcanzar hasta 1.900 metros, mientras que el mismo par no apantallado alcanza 400 metros, dependiendo además de la velocidad de transmisión. La señal utilizada para comunicación a través del bus se codifica con la técnica Manchester Biphase-L. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL El estándar permite conectar hasta un máximo de 32 elementos en un bus, apareciendo una serie de restricciones en función de características tales como tipo de alimentación, tipo de seguridad intrínseca de la instalación, etc. Por tal motivo es necesario realizar un diseño de la topología de la red con el objeto de conocer el número de elementos que es posible conectar. Sistema de comunicación Su función es la de controlar las transmisión de mensajes desde y hacia el fielbus a través del nivel físico. Se realiza por medio de un programador determinista y centralizado denominado Link Active Schedule (LAS). Cuando un elemento tiene que proporcionar datos, el LAS manda que los emita hacia el bus para ser utilizados por cualquier de los dispositivos conectados al mismo. Este sistema también es responsable de mantener la hora en el bus, para que todos los dispositivos utilicen la misma. Nivel de aplicación del usuario Este nivel están definido a su vez por varios bloques para llevar a cabo las diferentes tareas encomendas al fielbus. • AI Entrada analógica (Analog Input) • AO Salida analógica (Analog Output) • DI Entrada digital (Digital Input) • D0 Salida Digital (Digital Output) • PID Controlador (Proportional, Integral, Derivate) • RA Relación (RAtio) • ML Estación manual (Manual Loader) • CS Selección de control (Control Selector) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Los bloques pueden ser definidos para obtener la funcionalidad deseada. Por ejemplo, una válvula automática puede contener un bloque PID y la salida analógica (AO) correspondiente. Un transmisor puede contener una entrada analógica (AI), de forma que el lazo de control se puede cerrar utilizando un transmisor y una válvula conectada al fieldbus, tal como se muestra la figura 1.14. Figura 1. 14 Sistema de control utilizando fielbus Ventajas e inconvenientes En la actualidad no existen datos para avalorar exactamente el comportamiento de estas vías de datos, por lo que se mencionan solamente los beneficios potenciales, que por otra parte quedan desfasados rápidamente por la evolución tecnológica. De acuerdo a estos criterios se enumeran beneficios tales como: • Reducción de costes de instalación. • Menor coste de mantenimiento. • Ahorros operativos al gestionar mejor la instalación. Por el contrario existen una serie de inconveniente, entre los que se pueden citar: • No existe una tecnología unificada entre los diversos buses de campo. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • Incertidumbre sobre el futuro. • Al no existir elementos prefabricados, tales como armarios cableados, etc., no se pueden realizar comprobaciones del sistema hasta no esta instalado en campo. • Intereses comerciales entre fabricantes de elementos de campo y sistemas de control distribuido. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL CAPITULO 2. DISEÑO MEDIANTE VARIABLES DE ESTADO Introducción El método de asignación de polos es algo análogo al método del lugar de las raíces ya que se colocan los polos en lazo cerrado en posiciones deseadas. La diferencia básica es que en el diseño en lugar de las raíces se sitúan sólo los polos en lazo cerrado dominantes, mientras que el diseño por asignación de polos se colocan todos los polos en lazo cerrado en las posiciones que se deseen. En este capítulo se analiza los diferentes métodos de diseño mediante variables de estado. A continuación se presenta se analiza el diseños de observadores de estado tanto definiciones como diseños de observadores de orden completo, observadores de orden reducido y observadores para sistemas MIMO. Lección 6. Observadores de estado Un dispositivo (o un programa de computadora) que estima u observa las variables de estado se llama observador de estado, o, simplemente, observador. Si el observador de estado capta todas las variables de estado del sistema, sin importar si algunas están disponibles para una medición directa, se denomina observador de estado de orden completo. Hay ocasiones en las que un observador tal no es necesario, en las que se requiere de la observación de las variables de estado que no se miden, pero no de aquellas que también se miden directamente. Por ejemplo, dado que las variables de salida son observables y se relacionan en forma lineal con las variables de estado, no necesitamos observar todas las variables de estado, sino las n − m variables de estado en las que n es la dimensión del vector de estado y m es la dimensión del vector de salida. Un observador que estima menos de n variables de estado, en donde n es la dimensión del vector de estado, se denomina observador de estado de orden reducido o, simplemente, observador de orden reducido. Si el observador de estado de orden reducido tiene el orden mínimo posible, se denomina observador de estado de orden mínimo, u observador de orden mínimo. En este capitulo analizaremos el observador de estado de orden completo y el observador de estado de orden reducido y observadores para sistemas MIMO (multiple input, multiple output). UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Los observadores de estado, son herramientas virtuales, que permiten estimar las variables o estados de un sistema en base a mediciones de las señales de salida y señales de control. Estos observadores permiten enviar información estimada acerca del valor que toman dichos estados, permitiendo conocer un aproximado del valor real, además cuentan con muy poco margen de diferencia o error. Se le considera una herramienta virtual, puesto que se desarrolla como software o programa dentro de una computadora. Sección 1. Clasificación Existen 2 tipos de observadores: observadores de orden completo, y observadores de orden reducido u orden mínimo. • Los observadores de orden Completo, son aquellos utilizados para observar o estimar todos los estados de un sistema. • Los observadores de orden Reducido, son aquellos utilizados para observar o estimar solo algunos estados de un sistema. Lección 7. Observador de orden completo Dado el sistema: Dx Cx y Bu Ax x + = + = & (1.1) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL donde: x Vector de estado (n x 1) u Señal de control (escalar) y Señal de salida (escalar) A Matriz (n x n) B Matriz (n x 1) C Matriz (1 x n) D Matriz (escalar) Se puede estimar sus estados mediante la siguiente expresión: ) ( y y L Bu x A x − + + = & donde: L Vector de ganancias que permiten la observación de estados (1 x n) x Vector de estados estimados y Salida estimada UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 1. 15 Diagrama en bloques de un observador del orden completo Debe notarse que las matrices A, B, C, D son las mismas tanto para un sistema real como para el sistema estimado. Para los cálculos siguientes se asume que el valor de D es cero. La diferencia existente entre x y x se denomina error de observación, y el término ) ( y y L − se denomina factor de corrección. Para determinar el error de observación restamos x x & & − , así se obtiene: ) )( ( ) ( ) ( ) ( ) ( ) ( )) ( ( ) ( x x LC A x x x x LC x x A x x x C Cx L x x A x x y y L x A Ax x x y y L Bu x A Bu Ax x x − − = − − − − = − − − − = − − − − = − − + + − + = − & & & & & & & & & & UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Si se sabe que el error esta definido como la diferencia entre el estado real y el estado estimado, entonces se tendrá: e LC A e x x e x x e ⋅ − = − = − = ) ( & & & & A partir de esta expresión se puede conocer el comportamiento dinámico y la estabilidad del sistema, si la matriz |A-LC| es estable, entonces el observador hará bien su trabajo, y dada cualquier condición inicial, el sistema tenderá a un error cero. La elección de correctos valores para el vector de observabilidad L, permitirá que el comportamiento dinámico del vector de error sea asintóticamente estable y lo suficientemente rápido para tender a un valor de cero. La estabilidad asintótica y la velocidad de respuesta de la dinámica del error se determina mediante los autovalores de la matriz |A-LC|, dados por el polinomio característico |sI-A+LC|. Existe una condición necesaria, la cual consiste en que el sistema obtenido sea estable y completamente controlable y observable. Sección 1. Ejemplo de observador de orden completo • Determinar la ecuación característica del sistema siguiente, si se le agrega un observador de estados L. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL | |x y u x x 1 0 1 0 4 1 2 0 = ( ¸ ( ¸ + ( ¸ ( ¸ − − = & Solución Si el sistema es de orden 2, es de suponer que el observador también será de orden 2, y lo podemos definir como ( ¸ ( ¸ = 2 1 L L L Luego el polinomio característico estará dado por: | | | | | | ( ¸ ( ¸ + ( ¸ ( ¸ − − − ( ¸ ( ¸ = + − ( ¸ ( ¸ + ( ¸ ( ¸ − − − ( ¸ ( ¸ = + − 2 1 2 1 0 0 4 1 2 0 0 0 1 0 4 1 2 0 1 0 0 1 L L s s LC A sI L L s LC A sI | | | | | | ) 2 ( ) 4 ( ) 2 ( ) 4 ( 4 1 2 1 2 2 1 2 2 1 L s L s LC A sI L L s s LC A sI L s L s LC A sI + + + + = + − + + + + = + − ( ¸ ( ¸ + + − + = + − Lección 8. Diseño de observadores de orden completo Sección 1. Método de diseño abreviado Analizando la respuesta del ejemplo anterior nos podemos dar cuenta que los valores que toman L 1 y L 2 están condicionadas por las raíces del polinomio, las cuales a su vez están condicionadas por las características con que se desea que UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL cuente el sistema, por tanto se puede elegir raíces de tal modo de poder controlar la respuesta del sistema en lazo cerrado. Por lo tanto se puede asumir valores para dichas raíces, a los que llamaremos µ 1 y µ 2 de modo tal que el polinomio tenga una respuesta estable. Luego por simple equivalencia de términos podemos hallar el valor de las incógnitas. Ejemplo de diseño de observador de estado usando el Método de diseño abreviado • Dado el polinomio característico del ejemplo anterior: s 2 +(4+L 2 )s+(2+L 1 ), encontrar el valor de L 1 y L 2 si se quiere que los polos deseados del sistema se ubiquen en -4 y -3. Solución Las raíces del polinomio son µ 1 = -4 y µ 2 = -3 12 7 ) 3 )( 4 ( ) )( ( 2 2 1 + + = + + = − − s s s s s s µ µ Luego por equivalencia |sI – A + LC| = s 2 + 7s + 12 Es decir, s 2 + (4 + L 2 )s + (2 + L 1 ) = s 2 + 7s + 12 s 2 = s 2 donde (4 + L 2 )s = 7s L 2 = 3 (2 + L 1 ) = 12 L 1 = 10 ¦ ¹ ¦ ´ ¦ UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Se puede generalizar la metodología seguida anteriormente, de la siguiente manera: Si tenemos que [µ 1 µ 2 µ 3 … µ n ] son los autovalores deseados para la matriz del observador |A-LC|, estos conforman el polinomio característico: (s-µ 1 ) (s-µ 2 ) (s-µ 3 ) … (s-µ n ) Este polinomio se iguala al polinomio característico original |sI-A+LC|, creándose una equivalencia entre términos: |sI-A+LC| = (s-µ 1 ) (s-µ 2 ) (s-µ 3 ) … (s-µ n ) Resolviendo la equivalencia se podrá encontrar el valor del vector L. NOTA: Este método esta restringido a sistemas de hasta 3 er orden, además el sistema debe estar en la forma canónica observable. Es aconsejable que los polos del observador sean de 3 a 5 veces mayores (más negativos) que los polos del controlador por realimentación de estados, pero sin salirse de la región de estabilidad dada por el lugar geométrico de las raíces. La elección de los polos deseados van a determinar las características de la respuesta obtenida, por lo que puede existir un conjunto infinito de vectores L como solución, de las cuales solo un limitado número de soluciones cumplen con las necesidades requeridas para el sistema (como por ejemplo: sobreimpulso, velocidad de respuesta, etc. del sistema estimado), por lo que se aconseja probar, mediante simulación, la respuesta del sistema a diferentes valores de polos escogidos. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Sección 2. Método de diseño por la formula de Ackerman La formula de Ackerman aplicada al diseño de observadores de estado, esta dada por: ( ( ( ( ¸ ( ¸ ( ( ( ( ¸ ( ¸ Φ = − − 1 0 0 ) ( 1 1 M M n CA CA C A L En donde ) ( A Φ es equivalente a ) (s Φ , que es el polinomio característico deseado, pero en vez de la “s” se coloca la matriz “A”. Ejemplo aplicando el método de diseño por la formula de Ackerman • Para el siguiente sistema, determinar el vector de observadores de estados L, si se quiere que los polos deseados se ubiquen en -3+j y -3-j | |x y u x x 1 0 1 0 2 1 1 0 = ( ¸ ( ¸ + ( ¸ ( ¸ − − = & Solución Si φ(s) = (s-µ 1 ) (s-µ 2 ) = (s+3-j) (s+3+j) = s 2 + 6s + 10 por lo tanto φ(A) = A 2 + 6A + 10I UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL ( ¸ ( ¸ = ( ¸ ( ¸ × ( ¸ ( ¸ − = | | ¹ | \ | ( ¸ ( ¸ × ( ¸ ( ¸ × | | ¹ | \ | ( ¸ ( ¸ + ( ¸ ( ¸ − − + ( ¸ ( ¸ − − = ( ¸ ( ¸ ( ¸ ( ¸ − + + = − 4 9 0 1 1 4 4 9 1 0 0 1 1 2 10 0 0 10 12 6 6 0 3 2 2 1 1 0 2 1 1 0 ) 10 6 ( 1 2 L L L I A A L Sección 3. Método de diseño completo 1°) Determinar la controlabilidad del sistema y la observabilidad Controlabilidad: | | B A AB B Wc n 1 − = K Observabilidad: ( ( ( ( ¸ ( ¸ = −1 n CA CA C Wo M 2°) Calcular el polinomio característico original |sI-A|, el cual será: |sI-A| = s n + a 1 s n-1 + a 2 s n-2 + … + a n-1 s + a n = 0 3°) Es conveniente trabajar con las ecuaciones de estado en su forma canónica observable, si no se encuentra en esta forma, se debe determinar una matriz de transformación para llevarla a esta forma, la cual se define como: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Q = (W x Wo) -1 En donde Wo es la matriz de observabilidad, y W se define como: ( ( ( ( ( ( ¸ ( ¸ = − − − − 0 0 0 1 0 0 1 0 1 1 1 3 2 1 2 1 L L M M N M M K K a a a a a a W n n n n En donde a 1 , a 2 , … a n-2 , a n-3 , son los coeficientes del polinomio característico original |sI-A|. 4°) Se determina el polinomio característico deseado a partir de (s-µ 1 ) (s-µ 2 ) (s-µ 3 ) … (s-µ n ), donde µ i es un polo deseado, obteniéndose: s n + b 1 s n-1 + b 2 s n-2 + … + b n-1 s + b n 5°) Finalmente el vector L se encuentra a partir de la siguiente expresión: (*) ( ( ( ( ( ( ¸ ( ¸ − − − − × = − − − − 1 1 2 2 1 1 a b a b a b a b Q L n n n n n n M (*) La deducción de esta expresión puede encontrarse en el libro “Ingeniería de Control Moderna”, Katsuhiro Ogata, 3 ra Edición, Cáp.12, Pág. 817-820. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Ejemplo del método de diseño completo: Para el siguiente sistema, determinar el vector de observadores de estados L, si se quiere que los polos deseados se ubiquen en -5, -2+j y -2-j | |x y u x x 0 0 1 1 0 0 2 1 2 1 0 0 0 1 0 = ( ( ( ¸ ( ¸ + ( ( ( ¸ ( ¸ − − − = & Solución. 1°) Controlabilidad Observabilidad ( ( ( ¸ ( ¸ − − = 3 2 1 2 1 0 1 0 0 Wc rank(Wc) = 3 det(Wc) = -1 ∴ El sistema es controlable ( ( ( ¸ ( ¸ = 1 0 0 0 1 0 0 0 1 Wo rank(Wo) = 3 det(Wo) = 1 ∴ El sistema es observable 2°) | | ( ( ( ¸ ( ¸ − − − − ( ( ( ¸ ( ¸ = − 2 1 2 1 0 0 0 1 0 0 0 0 0 0 0 s s s A sI UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL | | | | | | 2 1 2 2 2 2 ) 1 2 ( 2 1 2 1 0 0 1 3 2 1 3 2 2 1 3 2 3 2 = = = ⇒ + + + ≡ + + + = − + + + = − ( ( ( ¸ ( ¸ + − − = − a a a a s a s a s s s s A sI s s s A sI s s s A sI 3°) Q = ( W x Wo ) -1 ( ( ( ¸ ( ¸ − − = ( ( ( ¸ ( ¸ = ( ( ( ¸ ( ¸ × ( ( ( ¸ ( ¸ = × ( ( ( ¸ ( ¸ = ( ( ( ¸ ( ¸ = 3 2 1 2 1 0 1 0 0 0 0 1 0 1 2 1 2 1 1 0 0 0 1 0 0 0 1 0 0 1 0 1 2 1 2 1 0 0 1 0 1 2 1 2 1 0 0 1 0 1 1 1 1 2 Q Wo W a a a W 4°) (s - µ 1 ) (s - µ 2 ) (s - µ 3 ) = (s + 5) (s + 2 + j) (s + 2 - j) = (s + 5) (s 2 + 4s + 5) = s 3 + 9s 2 + 25s + 25 ≡ s 3 + b 1 s 2 + b 2 s + b 3 25 25 9 3 2 1 = = = ⇒ b b b 5°) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL ( ( ( ¸ ( ¸ × ( ( ( ¸ ( ¸ − − = ( ( ( ¸ ( ¸ − − − × = 7 24 23 3 2 1 2 1 0 1 0 0 1 1 2 2 3 3 a b a b a b Q L ( ( ( ¸ ( ¸ − = ( ( ( ¸ ( ¸ = 4 10 7 3 2 1 L L L L Sección 4. Diseño mediante el software Matlab Se puede hacer uso del software Matlab, para lo cual se emplea el comando acker o el comando place. Dado el sistema Dx Cx y Bu Ax x + = + = & , y un vector de polos deseados: | | n P µ µ µ L 2 1 = Se puede obtener un observador de estados utilizando: L = place (A’,B’,P)’ o también L = acker (A’,B’,P)’ Ejemplo_1. De diseño utilizando el software Matlab • Para el siguiente sistema, determinar el vector de observadores de estados L, si se quiere que los polos deseados se ubiquen en -2, -1+j y -1-j UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL | |x y u x x 0 0 2 1 0 0 1 2 3 1 0 0 0 1 0 = ( ( ( ¸ ( ¸ + ( ( ( ¸ ( ¸ − − − = & Solución. >> A = [0 1 0; 0 0 1; -3 -2 -1]; >> C = [2 0 0]; >> P = [-2 -1+j -1-j]; >> L = acker(A',C',P)' L = 1.5000 0.5000 -3.0000 >> L = place(A',C',P)' L = 1.5000 0.5000 -3.0000 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Ejemplo_2. De diseño utilizando todos los métodos. • Para el siguiente sistema, determinar el vector de observadores de estados L aplicando los 4 métodos antes descritos, si se quiere que los polos deseados se ubiquen en -2, -3+0.5j y -3-0.5j | |x y u x x 1 0 0 1 0 0 2 1 0 1 0 1 4 0 0 = ( ( ( ¸ ( ¸ + ( ( ( ¸ ( ¸ − − − = & Solución 1°) Método completo Controlabilidad Observabilidad ( ( ( ¸ ( ¸ − − − − = 3 2 1 2 1 0 8 4 0 Wc rank(Wc) = 3 det(Wc) = 16 ∴ El sistema es controlable ( ( ( ¸ ( ¸ − − = 3 2 1 2 1 0 1 0 0 Wo rank(Wo) = 3 det(Wo) = -1 ∴ El sistema es observable Polinomio característico original UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL | | | | | | | | 4 1 2 4 2 4 ) 1 2 ( 2 1 0 1 1 4 0 2 1 0 1 0 1 4 0 0 0 0 0 0 0 0 3 2 1 3 2 2 1 3 2 3 2 = = = ⇒ + + + ≡ + + + = − + + + = − ( ( ( ¸ ( ¸ + − − = − ( ( ( ¸ ( ¸ − − − − ( ( ( ¸ ( ¸ = − a a a a s a s a s s s s A sI s s s A sI s s s A sI s s s A sI Q = ( W x Wo ) -1 ( ( ( ¸ ( ¸ = ( ( ( ¸ ( ¸ = 0 0 1 0 1 2 1 2 1 0 0 1 0 1 1 1 1 2 a a a W ( ( ( ¸ ( ¸ = ( ( ( ¸ ( ¸ − − × ( ( ( ¸ ( ¸ = × 1 0 0 0 1 0 0 0 1 3 2 1 2 1 0 1 0 0 0 0 1 0 1 2 1 2 1 Wo W ( ( ( ¸ ( ¸ = 1 0 0 0 1 0 0 0 1 Q Polinomio característico deseado (s - µ 1 ) (s - µ 2 ) (s - µ 3 ) = (s + 2) (s + 3 + 0.5j) (s + 3 – 0.5j) = (s + 2) (s 2 + 6s + 9.25) = s 3 + 8s 2 + 21.25s + 18.5 ≡ s 3 + b 1 s 2 + b 2 s + b 3 5 . 18 25 . 21 8 3 2 1 = = = ⇒ b b b UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Vector Observador ( ( ( ¸ ( ¸ × ( ( ( ¸ ( ¸ = ( ( ( ¸ ( ¸ − − − × = 6 25 . 20 5 . 14 1 0 0 0 1 0 0 0 1 1 1 2 2 3 3 a b a b a b Q L ( ( ( ¸ ( ¸ = ( ( ( ¸ ( ¸ = 6 25 . 20 5 . 14 3 2 1 L L L L 2°) Método abreviado | | ) )( )( ( 3 2 1 µ µ µ − − − = + − s s s LC A sI | | | | | | ( ( ( ¸ ( ¸ + ( ( ( ¸ ( ¸ + − − = + − ( ( ( ¸ ( ¸ + ( ( ( ¸ ( ¸ − − − − ( ( ( ¸ ( ¸ = + − 3 2 1 3 2 1 0 0 0 0 0 0 2 1 0 1 1 4 0 1 0 0 2 1 0 1 0 1 4 0 0 0 0 0 0 0 0 L L L s s s LC A sI L L L s s s LC A sI | | ( ( ( ¸ ( ¸ + + − + − + = + − 3 2 1 2 1 0 1 1 4 0 L s L s L s LC A sI | | | | ) 4 ( ) 1 ( ) 2 ( ) 4 ( ) 1 2 ( 1 2 2 3 3 1 2 3 2 L s L s L s LC A sI L L s sL s s LC A sI + + + + + + = + − + + + + + + = + − UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Polinomio deseado 5 . 18 25 . 21 8 ) 5 . 0 3 )( 5 . 0 3 )( 2 ( ) )( )( ( 2 3 3 2 1 + + + = − + + + + = − − − s s s j s j s s s s s µ µ µ Luego por equivalencia s 3 + (L 3 )s2 + (1 + L 2 )s + (4 + L 1 ) = s 3 + 8s 2 + 21.25s + 18.5 (2+L 3 )s2 = 8s 2 L 3 = 6 donde (1 + L 2 )s = 21.25s L 2 = 20.25 (4 + L 1 ) = 18.5 L 1 = 14.5 3°) Método por formula de Ackerman Si φ(s) = (s-µ 1 ) (s-µ 2 ) (s - µ 3 ) = s 3 + 8s 2 + 21.25s + 18.5 por lo tanto φ(A) = A 3 + 8A 2 + 21.25A + 18.5I | | | ¹ | \ | ( ( ( ¸ ( ¸ ( ( ( ¸ ( ¸ × | | | | ¹ | \ | ( ( ( ¸ ( ¸ + ( ( ( ¸ ( ¸ − − − + ( ( ( ¸ ( ¸ − − − + ( ( ( ¸ ( ¸ − − − = ( ( ( ¸ ( ¸ ( ( ( ¸ ( ¸ − − + + + = − 1 0 0 0 0 1 0 1 2 1 2 1 1 0 0 0 1 0 0 0 1 51 . 18 2 1 0 1 0 1 4 0 0 25 . 21 2 1 0 1 0 1 4 0 0 8 2 1 0 1 0 1 4 0 0 1 0 0 3 2 1 2 1 0 1 0 0 ) 5 . 18 25 . 21 8 ( 2 3 1 2 3 L I A A A L ( ( ( ¸ ( ¸ × ( ( ( ¸ ( ¸ − − − = 0 0 1 8 25 . 8 6 25 . 32 5 . 8 25 . 20 33 24 5 . 14 L ¦ ¹ ¦ ´ ¦ UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL ( ( ( ¸ ( ¸ = ( ( ( ¸ ( ¸ = 6 25 . 20 5 . 14 3 2 1 L L L L 4°) Usando matlab >> A = [0 0 -4; 1 0 -1; 0 1 -2]; >> C = [0 0 1]; >> P = [-2 -3+0.5j -3-0.5j]; >> L = acker(A',C',P)' L = 14.5000 20.2500 6.0000 >> L = place(A',C',P)' L = 14.5000 20.2500 6.0000 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Lección 9. Observador de orden reducido En la práctica no todas las variables necesitan ser observadas, habrá algunas que se podrán medir directamente y con buena precisión, por tanto no será necesario un observador que estime todos los estados, sino más bien solo algunos de ellos. Si se cuenta con un vector de estados X de dimensión (n x 1) del cual m estados pueden ser medibles, se tendrá que el orden del observador será (n-m x 1). Figura 1. 16 Diagrama en bloques de un observador del orden reducido El vector X puede ser dividido en 2 vectores: Xa que corresponde a los estados medidos, de orden (m x 1) Xb que corresponde a los estados observados, de orden (n-m x 1) X 1 … X m Estados conocidos o medibles X m+1 … X n Estados no conocidos que requieren ser observados 1 2 1 2 1 × + + ( ( ( ( ( ( ( ( ( ( ( ¸ ( ¸ = n n m m m X X X X X X X M M UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Obteniéndose: | | ( ¸ ( ¸ = ( ¸ ( ¸ + ( ¸ ( ¸ ( ¸ ( ¸ = ( ¸ ( ¸ Xb Xa Cb Ca Y u Bb Ba Xb Xa Abb Aba Aab Aaa b X a X & & Las dimensiones de las submatrices son: Aaa m x m Aab m x n-m Aba n-m x m Abb n-m x n-m Ba m x 1 Bb n-m x 1 Ca 1 x m Cb 1 x n-m El sistema queda reducido a la siguiente expresión: u Bb Xb Abb Xa Aba b X u Ba Xb Aab Xa Aaa a X ⋅ + ⋅ + ⋅ = ⋅ + ⋅ + ⋅ = & & Sección 1. Diseño de observadores de orden reducido UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL En el diseño de observadores de orden completo, el sistema era descrito por Dx Cx y Bu Ax x + = + = & En cambio para el diseño de observadores de orden reducido el sistema es descrito por la ecuación de estado: u Bb Xb Abb Xa Aba b X ⋅ + ⋅ + ⋅ = & y por la ecuación de salida: Xb Aab u Ba Xa Aaa a X ⋅ = ⋅ − ⋅ − & De estos 2 sistemas se pueden establecer una serie de equivalencias: Observador Orden Completo Observador Orden Reducido X b X A Aab u B⋅ u Bb Xa Aba ⋅ + ⋅ Y u Ba Xa Aaa a X ⋅ − ⋅ − & Y b X Aab ⋅ C Aab Cabe mencionar que se busca encontrar un vector de observadores L, de orden (n-m x 1) En el diseño de observadores de orden completo se determino la siguiente ecuación: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL ) ( y y L Bu x A x − + + = & La cual puede llevarse a su correspondiente equivalencia para el caso de observadores de orden reducido, obteniéndose la siguiente representación: (*) ) ( ) ( u Ba Xa Aaa a X L u Bb Xa Aba b X Aab L Abb b X ⋅ − ⋅ − ⋅ + ⋅ + ⋅ + ⋅ ⋅ − = & & y la Ecuación del Error es: e Aab L Abb e ⋅ ⋅ − = ) ( & La Ecuación Característica para el observador es la siguiente: |sI – Abb + L.Aab| = s i + a 1 s i-1 + a 2 s i-2 + … + a i-1 s + a i = 0 donde i equivale al orden de L, es decir (n-m) Sección 2. Metodología de diseño para el observador de orden reducido Se pueden aplicar los mismos métodos usados para hallar los observadores de orden completo, pero tenemos que hacer una variación la cual consiste en reemplazar los índices: en vez de considerar el índice “n”, se debe considerar el índice “i”. Por ejemplo si un sistema es de orden 4 y tiene un estado medible, entonces m=1, y por tanto el sistema observado será de orden 3 (n – m = 4 – 1 = 3 = i). (*) La deducción de esta expresión puede encontrarse en el libro “Ingeniería de Control Moderna”, Katsuhiro Ogata, 3 ra Edición, Cáp.12, Pág. 832-833. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL El otro cambio que hay que hacer es realizar una equivalencia entre las matrices, dada de la siguiente manera: Aaa D Aab C Aba B Abb A Lo que resta por hacer, es aplicar la misma metodología que para los observadores de orden completo, considerando el nuevo orden del sistema (i) y las nuevas matrices del sistema (Abb, Aba, Aab, Aaa). Ejemplo utilizando la metodología de diseño para el observador de orden reducido • Para el siguiente sistema, suponga que el estado X1 se puede medir con precisión, diseñe el observador de orden reducido L aplicando los 4 métodos antes descritos, si se quiere que los polos deseados se ubiquen en -3+0.5j y -3-0.5j | |x y u x x 0 0 1 1 0 0 6 11 6 1 0 1 0 1 0 = ( ( ( ¸ ( ¸ + ( ( ( ¸ ( ¸ − − − = & Solución Nuevo orden para el sistema observado: 3 – 1 i = 2 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Nuevas matrices del sistema: D Aaa C Aab B Aba A Abb | | | | ( ¸ ( ¸ − − = ( ¸ ( ¸ − = = = 6 11 1 0 6 0 0 1 0 Abb Aba Aab Aaa 1°) Método completo Controlabilidad Observabilidad | | ( ¸ ( ¸ − − − = ⋅ = 6 6 6 0 Aba Abb Aba Wcr rank(Wc) = 2 det(Wc) = -36 ∴ El sistema es controlable ( ¸ ( ¸ = ( ¸ ( ¸ ⋅ = 1 0 0 1 Abb Aab Aab Wor rank(Wo) = 2 det(Wo) = 1 ∴ El sistema es observable Polinomio característico original | | | | ( ¸ ( ¸ + − = ( ¸ ( ¸ − − − ( ¸ ( ¸ = − ≡ − 6 11 1 6 11 1 0 0 0 s s s s Abb sI A sI UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL | | 11 6 11 6 2 1 2 1 2 2 = = ⇒ + + ≡ + + = − a a a s a s s s Abb sI Q = ( W x Wo ) -1 ( ¸ ( ¸ = ( ¸ ( ¸ = 0 1 1 6 0 1 1 1 a W ( ¸ ( ¸ = ( ¸ ( ¸ × ( ¸ ( ¸ = × 0 1 1 6 1 0 0 1 0 1 1 6 Wor W ( ¸ ( ¸ − = 6 1 1 0 Q Polinomio característico deseado (s - µ 1 ) (s - µ 2 ) = (s + 2 + 3.4641j) (s + 2 – 3.4641j) = s 2 + 4s + 16 ≡ s 2 + b 1 s + b 2 16 4 2 1 = = ⇒ b b Vector Observador ( ¸ ( ¸ − × ( ¸ ( ¸ − = ( ¸ ( ¸ − − × = 2 5 6 1 1 0 1 1 2 2 a b a b Q L ( ¸ ( ¸ − = ( ¸ ( ¸ = 17 2 2 1 L L L UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL 2°) Método abreviado | | ) )( ( ] [ 2 1 µ µ − − = ⋅ + − ≡ + − s s Aab L Abb sI LC A sI ¨ | | | | | | | | ( ¸ ( ¸ + + − + = ⋅ + − ( ¸ ( ¸ + ( ¸ ( ¸ + − = ⋅ + − ( ¸ ( ¸ + ( ¸ ( ¸ − − − ( ¸ ( ¸ = ⋅ + − 6 11 1 0 0 6 11 1 0 1 6 11 1 0 1 0 0 1 2 1 2 1 2 1 s L L s Aab L Abb sI L L s s Aab L Abb sI L L s Aab L Abb sI | | | | ) 11 ( ) 6 ( ) 11 ( ) 6 )( ( 2 1 2 2 1 L s L s Aab L Abb sI L s L s Aab L Abb sI + + + + = ⋅ + − + + + + = ⋅ + − Polinomio deseado 16 4 ) )( ( 2 2 1 + + = − − s s s s µ µ Luego por equivalencia 6 + L 1 = 4 L 1 = -2 6 L 1 + 11 + L 2 = 16 L 2 = 17 3°) Método por formula de Ackerman UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Si φ(s) = 16 4 ) )( ( 2 2 1 + + = − − s s s s µ µ por lo tanto φ(A) ≡ φ(Abb)= Abb 2 + 4Abb + 16I | | ( ¸ ( ¸ × ( ¸ ( ¸ × | | ¹ | \ | ( ¸ ( ¸ + ( ¸ ( ¸ − − + ( ¸ ( ¸ − − = ( ¸ ( ¸ ⋅ ⋅ + + = − − 1 0 1 0 0 1 1 0 0 1 16 6 11 1 0 4 6 11 1 0 1 0 ) 16 4 ( 1 2 1 2 L Wor I Abb Abb L ( ¸ ( ¸ − = ( ¸ ( ¸ = ( ¸ ( ¸ × ( ¸ ( ¸ − = 17 2 1 0 17 22 2 5 2 1 L L L L 4°) Usando MATLAB >> Aaa = [0]; >> Aab = [1 0]; >> Aba = [0; -6]; >> Abb = [0 1; -11 -6]; >> P = [-2 + 3.4641j -2-3.4641j]; >> L = acker(Abb', Aab',P)' L = -2 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL 17 >> L = place(Abb', Aab',P)' L = -2 17 Lección 10. Observador para sistemas MIMO Hasta el momento se ha mostrado el diseño de observadores para sistemas SISO (single input, single output), es decir, sistemas que tienen una entrada y una salida. A continuación vamos a estudiar el diseño de observadores para el caso de sistemas con varias entradas y varias salidas, llamados sistemas MIMO (multiple input, multiple output). Un sistema MIMO puede ser descrito de la siguiente manera: | | | | | | r q n q r u D C y u B Ax x × × × + = + = 1 & donde: x Vector de estado (n x 1) u Señal de control (1 x r) y Señal de salida (escalar) A Matriz (n x n) B Matriz (n x r) C Matriz (q x n) D Matriz (q x r) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL n Es el orden del sistema (numero de estados) r Es el número de entradas q Es el número de salidas En el diseño de observadores, se sabe que el número de entradas que tenga el sistema, no afectará el diseño del observador, puesto que estos datos no intervienen en los cálculos. En cambio, el número de salidas con que cuente el sistema si afecta el diseño del observador. En este caso se aplica el “Principio de Separabilidad Lineal”, el cual consiste en separar las salidas y trabajarlas como si fueran provenientes de sistemas distintos. Por ejemplo; si se tiene la siguiente matriz C (matriz de salidas) ( ¸ ( ¸ = 6 5 4 3 2 1 C Esta se podrá descomponer bajo el Principio de Separabilidad Lineal, en dos submatrices: | | | | 6 5 4 3 2 1 2 1 = = C y C Para cada una de estas nuevas matrices se requerirá un observador independiente: L 1 y L 2 , cuyo orden será de (n x 1), en este caso será de (3 x 1) c/u. Así mismo cada observador requiere de “polos deseados”, los cuales pueden ser independientes o también comunes, siempre que cumplan con dar estabilidad al sistema y dependiendo de las condiciones de respuesta que se desee obtener al estimar cada salida. Ejemplo de observador de estado para sistemas MIMO UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • Para el siguiente sistema, determinar la matriz de observadores de estados L, si se quiere que los polos deseados se ubiquen en -1 y -2 para la primera salida, y -1-j, y -1+j para la segunda salida. x y u x x ( ¸ ( ¸ = ( ¸ ( ¸ + ( ¸ ( ¸ − − = 1 0 0 1 1 0 5 5 1 0 & Solución C 1 = [1 0] C 2 = [0 1] | | ( ¸ ( ¸ = = ( ¸ ( ¸ = ( ¸ ( ¸ = 22 21 12 11 2 1 22 21 2 12 11 1 L L L L L L L L L L L L L Método completo Controlabilidad Observabilidad | | ( ¸ ( ¸ − = ⋅ = 5 1 1 0 B A B Wc rank(Wc) = 2 det(Wc) = -1 ∴ El sistema es controlable ( ¸ ( ¸ = ( ¸ ( ¸ ⋅ = 1 0 0 1 1 1 1 A C C Wo rank(Wo) = 2 det(Wo) = 1 ∴ El sistema es observable UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL ( ¸ ( ¸ − − = ( ¸ ( ¸ ⋅ = 5 5 1 0 2 2 2 A C C Wo rank(Wo) = 2 det(Wo) = 5 ∴ El sistema es observable Polinomio característico original | | ( ¸ ( ¸ + − = ( ¸ ( ¸ − − − ( ¸ ( ¸ = − 5 5 1 5 5 1 0 0 0 s s s s A sI | | 5 5 5 5 2 1 2 1 2 2 = = ⇒ + + ≡ + + = − a a a s a s s s A sI Diseño del primer observador (l 1 ) Q = ( W x Wo 1 ) -1 ( ¸ ( ¸ = ( ¸ ( ¸ = 0 1 1 5 0 1 1 1 a W ( ¸ ( ¸ = ( ¸ ( ¸ × ( ¸ ( ¸ = × 0 1 1 5 1 0 0 1 0 1 1 5 1 Wo W ( ¸ ( ¸ − = 5 1 1 0 Q Polinomio característico deseado (s - µ 1 ) (s - µ 2 ) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL = (s + 1) (s + 2) = s 2 + 3s + 2 ≡ s 2 + b 1 s + b 2 2 3 2 1 = = ⇒ b b Vector Observador ( ¸ ( ¸ − − × ( ¸ ( ¸ − = ( ¸ ( ¸ − − × = 2 3 5 1 1 0 1 1 2 2 1 a b a b Q L ( ¸ ( ¸ − = ( ¸ ( ¸ = 7 2 12 11 1 L L L Diseño del segundo observador (l 2 ) Q = ( W x Wo 2 ) -1 ( ¸ ( ¸ = ( ¸ ( ¸ = 0 1 1 5 0 1 1 1 a W ( ¸ ( ¸ − = ( ¸ ( ¸ − − × ( ¸ ( ¸ = × 1 0 0 5 5 5 1 0 0 1 1 5 2 Wo W ( ¸ ( ¸ − = 1 0 0 2 . 0 Q Polinomio característico deseado (s - µ 1 ) (s - µ 2 ) = (s + 1+j) (s + 1-j) = s 2 + 4s + 5 ≡ s 2 + b 1 s + b 2 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL 2 2 2 1 = = ⇒ b b Vector Observador ( ¸ ( ¸ − − × ( ¸ ( ¸ − = ( ¸ ( ¸ − − × = 3 3 1 0 0 2 . 0 1 1 2 2 2 a b a b Q L ( ¸ ( ¸ − = ( ¸ ( ¸ = 3 6 . 0 22 21 2 L L L | | ( ¸ ( ¸ − − = ( ¸ ( ¸ = = 3 6 . 0 7 2 22 21 12 11 2 1 L L L L L L L Se puede obtener los mismos resultados usando Matlab: >> A = [0 1; -5 -5]; >> B = [0; 1]; >> C = [1 0; 0 1]; >> C1 = C(1,:); >> C2 = C(2,:); >> P1 = [-1 -2] ; >> P2 = [-1+j -1-j] >> L1 = acker(A’,C1’,P1)’ UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL L1 = -2.0000 7.0000 >> L2 = acker(A’,C2’,P2)’ L2 = 0.6000 -3.0000 >> L = [L1 L2]; L = -2.0000 0.6000 7.0000 -3.0000 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL CAPITULO 3. CONTROL ÓPTIMO Introducción El problema de optimización consiste en la selección de las variables de control, tales que maximizan o minimizan un índice de optimización determinado, (por ejemplo, el costo de producción unitario) dentro de los enlaces, (por ejemplo las ecuaciones que describen el objeto de control) puesta sobre las variables de control que frecuentemente no son las variables independientes y dentro de las limitaciones (por ejemplo, dentro de los rangos invisibles de los campos). Lección 11. Generalidades del control óptimo continuo y discreto El método de diseño combinado de observador y realimentación de estados que se mostró en el capitulo pasado es una herramienta fundamental en el control de sistemas en variable de estados. Sin embargo, no es siempre el método más útil tres dificultades obvias: 1. La traducción de especificaciones de diseño a ubicación de polos no es directa, especialmente en sistemas complejos; ¿cuál es la mejor configuración de polos para especificaciones dadas? 2. Las ganancias de realimentación en sistemas MIMO no son únicas; ¿cuál es la mejor ganancia para una configuración de polos dada? 3. Los autovalores del observador deben elegirse más rápidos que los del controlador, pero, ¿se tiene algún criterio adicional para preferir una configuración a otra? UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Los métodos que introduciremos en este capitulo dan respuestas a estas preguntas. Notaremos que las ganancias de realimentación de estados y del observador pueden elegirse de forma que minimicen un criterio de optimización dado. El criterio particular que veremos es un funcional cuadrático del estado y la entrada de control, (3.1) El criterio particular que se muestra es un funcional cuadrático del estado y la entrada de control, donde Q y R son matrices constantes (aunque no necesariamente) semidefınida y defınida positivas respectivamente. El control que se obtiene de minimizar este criterio es lineal. Como el criterio se basa en funcionales cuadráticos, el método se conoce como lineal-cuadrático (LQ: linear- quadratic), del que se obtiene el regulador lineal cuadrático (LQR). Criterios similares de optimización se siguen para el diseño de observadores, solo que el funcional depende del error de estimación, y se basa en una caracterización estadística de este estimador óptimo lineal-cuadrático se conoce como el filtro de Kalman. Cuando se combinan la ganancia de realimentación de estados LQ con el filtro de Kalman, obtenemos lo que se conoce como un controlador lineal- cuadrático-gaussiano (LQG). (Lo de gaussiano viene de la caracterización estadística del ruido empleada.) Para entender la idea de criterio de optimización en variable de estados, la introduciremos con sistemas de tiempo discreto, que son más simples. El estado de un sistema discreto describe una trayectoria haciendo transiciones discretas de un estado a otro bajo el efecto de una entrada también aplicada en tiempo discreto. Cuando se asocia un criterio de optimización al sistema, cada transición de estado tiene asociado un costo o penalidad. Por ejemplo, pueden penalizarse las transiciones de estado que se alejan demasiado del estado final deseado, o las acciones de control de valores demasiado elevados. A medida que el sistema evoluciona de estado en estado, los costos se suman hasta acumular un costo total asociado a la trayectoria. Ilustramos el concepto con el grafo de la Figura (1.17), que representa 8 estados de un sistema discreto con sus transiciones posibles. El estado inicial es el ‘1, y el final el 8. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 1. 17 Posibles trayectorias de 1 al 8 El sistema pasa de un estado a otro en cada tiempo k determinado por la entrada u[k] y la ecuación: x[k + 1] = Ax[k] + Bu[k]. (3.2) Las transiciones posibles se representan por los arcos que conectan el estado inicial al final a través de los estados intermedios. El costo asociado a cada transición se representa con la letra J; por ejemplo, el costo de moverse del estado 3 al 5 es J 35 . Asumiendo que los costos se acumulan en forma aditiva, vemos que la trayectoria marcada en rojo, por ejemplo, tiene un costo total J 13 + J 35 + J 56 + J 68 . Como hay varias rutas alternativas del estado 1 al 8, el costo total dependerá de la trayectoria elegida. La señal de control u[k] que determina la trayectoria de menor costo es la estrategia óptima. Como ya veremos, en sistemas de tiempo continuo, la acumulación de costos se representa mediante integración, en vez de suma. La herramienta matemática que usaremos para determinar la estrategia óptima es el principio de optimalidad de Bellman. “En cualquier punto intermedio x i en una trayectoria optima entre x 0 y x f , la estrategia desde x i al punto final x f debe ser en sí una estrategia optima.”. Este obvio principio nos permitir resolver en forma cerrada nuestros problemas de control optimo. También se usa en el cómputo recursivo de las soluciones óptimas en un procedimiento llamado programación dinámica. Una ventaja de usar el esquema de control óptimo cuadrático es que el sistema diseñado será estable, excepto en el caso en el que el sistema no es controlable. Al diseñar sistemas de control con base en la minimización de los índices de desempeño cuadrático se necesita resolver las ecuaciones de Riccati. MATLAB tiene un comando Lqr que UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL proporciona la solución a la ecuación de Riccati en tiempo continuo y determina la matriz de ganancias de realimentación óptima. En este capitulo diseñaremos sistemas de control mediante los índices de desempeño cuadráticos tanto en la forma analítica como mediante el calculo con MATLAB. Sección 1. Control LQ en tiempo continuo La deducción del control optimo LQ para el sistema en tiempo continuo, (3.3) sigue los mismos pasos que el de tiempo discreto, solo que las transiciones se reducen a incrementos infinitesimales. El costo es ahora: (3. 4) Haciendo tender los incrementos a cero se obtienen los equivalentes de tiempo continuo (3.5) (3.6) (3.7) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Esta ecuación diferencial matricial es llamada: “ecuación diferencial matricial de Riccati”, debe resolverse hacia atrás en el tiempo, con condiciones iniciales P(t f ) = S. El control optimo LQ es una realimentación lineal de estados, aunque inestacionaria. Los transitorios en P(t) y K(t) ocurrirán sobre el final del intervalo [t 0 , t f ]. Pero, la ecuación diferencial de ricatti es en general de difícil solución. Aun, haciéndolo numéricamente, ¿cómo pueden guardarse los (infinitos) valores de P(t) calculados en tiempo invertido para ser aplicados luego al sistema? Esta dificultad lleva a buscar una solución óptima estacionaria, K (t) = K , que surge de considerar el caso de horizonte infinito t f → ∞ Sección 2. Control LQ en tiempo discreto Consideremos el sistema en tiempo discreto definido por: (3.8) El problema de control que se desea resolver es: Encontrar la secuencia de control u k que lleve al sistema expresado en la ecuación anterior de la condición inicial x i = x 0 al estado final x N = x f , minimizando el funcional cuadrático (3.9) Este funcional puede interpretarse como el costo total de la transición de x i a x N y, en particular, el termino x N Sx N penaliza el error en alcanzar el estado nal UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL deseado. Las matrices de peso S, Q y R pueden seleccionarse para penalizar ciertos estados/entrada más que otros. Como veremos, las matrices S y Q deben ser semi-definidas positivas, y la R definida positiva. Aclarando que se hace la representación de x[k] por x k Transición [N − 1] → [N] Para encontrar el control a aplicar al sistema de forma que se minimice la ecuación anterior, supongamos que estamos en el paso N − 1 de la trayectoria óptima. Así, el costo J i,N de la transición de N − 1 a N es (3.10) substituimos x N como una función de u N −1 , lo que da: (3.11) (3. 12) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Como J es cuadrático en u, podemos minimizarlo diferenciando: (3.13) (3.14) (3.15) De esta ultima ecuación obtenemos el ultimo elemento de la secuencia de control óptima: (3.16) que resulta ser un mínimo, ya que UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL (3.17) Como vemos, de u N −1 es un control lineal por realimentación de estados de la forma habitual: (3.18) donde (3.19) El valor del costo mínimo J* N −1 ,N obtenido con u N −1 es: (3. 20) (3.21) donde se define (3.22) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL La elección de la notación S N −1 en la ecuación anterior surge de que si estamos en el paso final N, no hay ninguna acción de control que tomar y (3.23) es decir (2.24) (3.25) (3.26) Transición [N − 2] → [N] Tomamos otro paso para atrás en el cómputo del control óptimo y consideremos ahora que estamos en el paso N − 2: (3.27) Por lo tanto, para calcular la estrategia óptima para ir del estado en N − 2 al estado final en N, usamos el principio de optimalidad para deducir que: (3.28) y así reducimos el problema al de calcular la estrategia óptima para ir de N − 2 a N − 1 (la de N − 1 a N ya la obtuvimos). Así, ahora el paso N − 1 es el final, UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL (3.29) Igual que antes, podemos minimizar J N −2,N −1 sobre todos los posibles u N −2 , y es fácil ver que las expresiones son las mismas pero con N − 1 en vez de N, y N − 2 en vez de N − 1, , (3.30) (3.31) Transición [k] → [N] Retrocediendo en los pasos N-2, N-3,...,k, se generan la siguientes expresiones recursivas para el control óptimo , (3.32) donde (3.33) (3.34) Notar que la ecuación en diferencias inmediatamente anterior de S k se resuelve para atrás, comenzando en UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL S N = S (3.35) El costo óptimo de k a N es: (3.36) El conjunto de ecuaciones anteriores de la transición [k] → [N] representa el controlador LQ completo para el sistema discreto, que resulta, en general, inestacionario. La ecuación en diferencias de S k se conoce como la ecuación matricial en diferencias de Riccati. El hecho de que se resuelva para atrás en el tiempo le da a K k la peculiaridad de que los transitorios aparecen al final del intervalo [k, T], en vez de al principio. Ejemplo: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 1. 18 Péndulo invertido Las ecuaciones en espacio de estados del sistema son: (3.37) (3.38) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Los criterios de diseño con para una referencia escalón de 0.2m en el carro son los siguientes: • Tiempo de establecimiento para x y θ de menos de 5 segundos. • Tiempo de subida para x de menos de 1 segundo. • Sobrevalor en theta menor que 20 grados (0.35 radianes). • Error en régimen permanente dentro del 2 por ciento. Este sistema tiene una entrada y dos salidas. Usando los métodos de estado estacionario es relativamente simple diseñar un controlador para conseguir seguimiento en ambas salidas, ángulo y posición del carro. El problema puede resolverse con realimentación de estados. El esquema del lazo de control es el siguiente: Figura 1. 19 Esquema del lazo del sistema del péndulo invertido En este problema R representa la entrada escalón al carro. Los 4 estados representan la posición y velocidad del carro y el ángulo y velocidad angular del péndulo. La salida y contiene la posición del carro y el ángulo del péndulo. Deseamos diseñar un controlador tal que cuando se le dé una entrada escalón al sistema, el péndulo se desplace (no hay otra posibilidad), pero que eventualmente UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL vuelva a la posición de equilibrio (la vertical), y que l carro se mueva a la nueva posición de referencia. Intuitivamente (o por experiencia práctica) sabemos que el sistema es inestable a lazo abierto. El primer paso en el diseñó de este tipo de controlador es determinar los polos lazo abierto: estos se pueden determinar a través del siguiente código de programa de matlab small >> M = 0.5; m = 0.2; b = 0.1; i = 0.006; g = 9.8; l = 0.3; p = i*(M+m)+M*m*l^2; % denominador A = [0 1 0 0; -(i+m*l^2)*b/p (m^2*g*l^2)/p 0; 0 0 1; 0 -(m*l*b)/p m*g*l*(M+m)/p 0]; B = [0; (i+m*l^2)/p; 0; m*l/p]; C = [1 0 0 0; 0 1 0]; D = [0;0]; p = eig(A) p = 0 5.5651 -0.1428 -5.6041 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Como se puede observar hay un polo inestable en 5.5651, lo que confirma la hipótesis inicial de que el sistema es inestable a lazo abierto. Por lo tanto se observa que el siguiente paso es asumir que se dispone del estado completo para la realimentación, y se calcula la ganancia K que determina la ley de control u = −K x. Esta ganancia puede calcularse de varias formas. Si uno ya sabe dónde desea colocar los polos a lazo cerrado puede usar la función “place“ o ”acker“ de matlab. Otra opción es usar la función lqr; ésta da un controlador óptimo (bajo ciertas condiciones que veremos en detalle más adelante). La función ”lqr“ permite elegir dos parámetros, R y Q, que balancean la importancia relativa de la entrada y el estado en el costo que se pretende optimizar. El caso más simple es asumir R = 1, y Q = C′ * C. Notar que se usa las dos salidas (el ángulo del péndulo y la posición del carro). El método “lqr“ permite manejar las dos salidas y en este caso es bastante fácil de hacerlo. El controlador puede ajustarse cambiando los elementos distintos de cero en la matriz Q hasta obtener una respuesta satisfactoria. Para encontrar la estructura de Q entrar la siguiente línea en la ventana comando de Matlab: >> Q=C’*C Q = 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 Los elementos en las posiciones (1,1) será usado para pesar la posición del carro, y el elemento (3,3) para pesar el ángulo del péndulo. Se deja el peso en el control R = 1. Ahora se sabe qué forma tiene Q, se puede experimentar hasta encontrar la matriz K que da un buen controlador. Se diseña un programa para que los cambios en Q se vean automáticamente en la respuesta del controlador obtenido para cada iteración hasta encontrar la Q y K que satisfacen los requerimientos de diseño. anexamos el programa completo: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL >> M = 0.5; m = 0.2; b = 0.1; i = 0.006; g = 9.8; l = 0.3; p = i*(M+m)+M*m*l^2; %denominador A = [0 1 0 0; 0 -(i+m*l^2)*b/p (m^2*g*l^2)/p 0; 0 0 0 1; 0 -(m*l*b)/p m*g*l*(M+m)/p 0]; B = [0; (i+m*l^2)/p; 0; m*l/p]; C = [1 0 0 0; 0 0 1 0]; D = [0;0] p = eig(A) Q=C’*C x=1; y=1; Q=[x 0 0 0; 0 0 0 0; 0 0 y 0; 0 0 0 0]; R = 1; K = lqr(A,B,Q,R) Ac = [(A-B*K)]; UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Bc = [B]; Cc = [C]; Dc = [D]; T=0:0.01:5; U=0.2*ones(size(T)); [Y,X]=lsim(Ac,Bc,Cc,Dc,U,T); plot(T,Y) grid legend(’Carro’,’’Pendulo invertido’) D = 0 0 p = 0 5.5651 -0.1428 -5.6041 Q = 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 K = -1.0000 -1.6567 18.6854 3.4594 >> La curva en verde representa el ángulo, en radianes, y la curva en azul la posición, en metros. Como se ve, la respuesta no es satisfactoria. El sobrevalor en el ángulo está bien, pero los tiempos de establecimiento necesitan ajuste. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Puede observarse también que el carro no está cerca de la posición deseada sino que se movió para el lado opuesto. Corregiremos este error en la sección siguiente; por ahora nos concentramos en los tiempos de subida y establecimiento. Volviendo al archivo-m, cambiamos las variables x e y para ver si se puede obtener una respuesta mejor. Vemos que aumentando x reducimos los tiempos de establecimiento y subida, y bajamos el ángulo que se mueve el péndulo. Usando x = 7000 e y = 200, se obtienen los siguientes valores de D Q Y K y la respuesta a lazo cerrado: Figura 1. 20 Respuesta ante una entrada escalón unitario con control LQR. D = 0 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL 0 p = 0 5.5651 -0.1428 -5.6041 Q = 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 K =[ -83.6660 -44.0051 119.7550 23.7239] UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 1. 21 Respuesta corregida ante una entrada escalón unitario con control LQR. Se puede observar que incrementando x e y aún mas se podría haber mejorado la respuesta más todavía. Se eligen estos valores porque satisfacen las especificaciones y mantienen x e y relativamente pequeños. Cuando mayores sean x e y, mayor será el esfuerzo de control usado, y mayor el ancho de banda del sistema al lazo cerrado. El sistema tiene ahora un tiempo de establecimiento menor de 2 segundos que cumple el requisito inicial de ser menor de 5 segundos. Ver gráfica(1.21). UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Lección 12. Control LQ de Horizonte Infinito Ecuación Algebraica de riccati para sistemas continuos PA + A T P + Q − PBR −1 B T P = 0, (3.39) con el correspondiente control optimo LQ (ahora estacionario) u(t) = −K x(t) = −R 1 B T P x(t) (3.40) En el caso discreto tenemos S k = S S = A T SA − A T SB(R + B T SB) 1 B T SA + Q (3.41) ecuación algebraica discreta de Riccati. K = (R + B T SB) 1 B T SA. (3.42) En rigor, sin embargo, no sabemos aun si estas soluciones constantes de régimen permanente resuelven los correspondientes problemas óptimos de horizonte infinito. Analizamos este punto a continuación. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Lección 13. Solución del problema de horizonte infinito Se desea controlar el sistema: (3.43) con una realimentación estática de estados u(t) = K x(t) tal que se minimice el funcional de costo (3.44) Con la realimentación, el sistema a lazo cerrado queda x(t) = (A − BK )x(t) (3.45) incurriendo en un costo (3.46) Como sabemos que la solución de la ecuación anterior es x(t) = e (ABK )t x 0 se reemplaza en la expresión del costo, y se obtiene: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL (3.47) (3.48) (3.49) Lección 14. Principio máximo de Pontryaguin Supóngase que un sistema tiene una variable de estado única x 1 con x 1 = 0 en equilibrio si u 1 es el control una ecuación de estado que tipifica un comportamiento inestable es: (3.50) sin un control x 1 se incrementaría en forma exponencial desde un valor inicial X 0 . El objetivo principal es alcanzar el estado de equilibrio en un tiempo t 1 .por lo tanto las condiciones inicial y final son: se selecciona como función costo que penaliza el uso de un control con una gran magnitud como: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL (3.51) el control u 1 es una función continua de, t que no fija limites a su magnitud, el problema esta ahora completamente definido es unidimensional autónomo y lineal con un control variable sin limites y con un objetivo fijo en un tiempo t 1 . Ahora se aplica el principio máximo de pontryaguin: el primer paso es reemplazar la integral de costo introduciendo una nueva variable de estado x0 que satisface la ecuación (3.52) Con condiciones de frontera El segundo paso es introducir dos variables de “co-estado” z 0 y z 1 y una cantidad de la forma H (x 0 , x 1 , z 0 , z 1 ) y definida como sigue: (3.53) Expresión llamada como el hamiltoniano (H) del sistema. De esta expresión la rata de cambio de las variables son prescritas en la ecuación de hamilton así que de una manera similar se establece que z 0 y z 1 satisfacen la ecuación de hamilton y se definen: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL el otro par de hamilton son las ecuaciones: El tercer paso es resolver las ecuaciones de “co-estado” el cual introduciría algunas constantes cuyos valores se deben determinar, la ecuación de de z 0 muestra que z 0 = constante y el principio máximo de pontryaguin requiere que esta constante debe ser de tipo negativo sin perder generalidad se puede seleccionar a z 0 = −1 por la tanto la ecuación de z 1 tiene como solución: donde A es una constante que en este estado no podemos determinar. El cuarto paso es aplicar el principio máximo de pontryaguin se selecciona el control u 1 (t) para dar un posible valor del hamiltoniano H, considerado como una función de u. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL se puede observar que: ahora se procede a determinar la función de control que hemos usado aparte de la constante A. pero se debe estar seguros que x 1 desde su valor inicial hasta su valor final bajo la aplicación de este control, inicialmente se procede a resolver la ecuación de estado: la ecuación que satisface la condición inicial es: El objetivo es x 2 = 0 que es alcanzado en un tiempo t 1 así que: De donde: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Con este resultado procederemos a determinar el control óptimo y la trayectoria óptima Esta solución completa proporciona una solución óptima y única del problema. Se simula el siguiente sistema: (3.54) (3.55) con el controlador LQ optimo que minimiza el costo : (3.56) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Ejercicio propuesto: Realizar un programa de código MATLAB que compute K k y x k en lazo cerrado Lección 15. Estimación de Estado con el Filtro de Kalman Se muestra la solución óptima a la estimación de estado conocida desde hace unos cuarenta años como el filtro de Kalman, que consiste de un filtro variante en el tiempo, tanto para el caso de sistemas en tiempo continuo como el caso discreto en tiempo para sistemas aleatorios. Considere una planta discreta x(k + 1) = A(k)x(k) + B(k)u(k) + G(k)w(k) (3.57) donde x es el vector de estado a estimar, u es el vector de control y con mediciones: y(k) = C(k)x(k) + v(k) (3.58) donde el ruido del proceso w(k) y el ruido de medición v(k) son secuencias aleatorias de media cero, esto es: {w(k) = {v(k)} = 0 (3.59) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL ni presentan correlación en el tiempo, es decir son ruido blanco, ello es: {w(i)w T (j)} = {v(i)v T (j)} = 0 (3.60) si i ≠ j y tienen covariancias o niveles de ruido iguales a {w(k)w T (k)} = Q(k){v(k)v T (k)} = R(k) (2.61) donde las matrices de covariancia Q y R son simétricas y positivas semidefinidas. Las matrices A, B, G, C, Q y R son conocidas en todo momento. Así mismo, el vector u de control es conocido. Se va a suponer por el momento que sin usar la medición actual y(k), ya se tiene un estimado del estado al momento de la medición, al cual se denota mediante x p (k), El problema que resuelve el filtro de Kalman es cómo actualizar dicho estimado basados en las mediciones actuales. Se demuestra que la solución viene dada en forma recursiva mediante la fórmula: x e (k) = x p (k) + L(k)[y(k) − C(k)x p (k)] (3.62) donde la matriz L(k) es conocida como la ganancia de Kalman y varía en cada periodo de muestreo mediante la siguiente fórmula: L(k) = P(k)C T (k)R −1 (3.63) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL donde P(k) es la matriz de covariancia del error del estimado tras las mediciones, es decir del error de x e (k). Viene dada por la fórmula: P(k) = M(k) − M(k)C T (k)[C(k) M(k)C T (k) + R] −1 C(k)M(k) (3.64) Donde la matriz M(k) es la matriz de covarianza del error del vector x p (k) y se calcula de manera recurrente mediante: M(k + 1) = A(k)P(k)A T (k) + G(k)Q(k)G T (k) (3.65) El vector x p también se calcula de manera recurrente mediante la fórmula: x p (k + 1) = A(k)x e (k) + B(k)u(k) (3.66) De tal modo que el filtro de Kalman se calcula para cada periodo de muestreo evaluando las fórmulas anteriores, donde se deben asumir valores iniciales para x p (0) y para M(0). Las fórmulas que constituyen el filtro minimizan el error de estimación y se obtienen haciendo una optimización por cuadrados mínimos del criterio siguiente: J = [x(k) − x e (k)]P -1 (k)[x(k) − x e (k)] T + [C(k)x(k) − y(k)]R -1 [C(k)x(k) − y(k)] T (3.67) Las fórmulas anteriores constituyen lo que se denomina como actualización en tiempo o la propagación en el tiempo y se pueden calcular antes del muestreo siguiente. Las fórmulas previas se conocen como la actualización por la medición y se realiza inmediatamente después de tomar las observaciones y(k). se debe notar que no es condición necesaria que las matrices del sistema y del ruido sean UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL constantes pues lo único que se requiere es que sean de valor conocido y que la ganancia de Kalman se puede calcular de antemano pues no depende del valor que tomen las variables ni sus estimados, evaluando recursivamente todas las ecuaciones anteriores. Ejercicio realizado. Consideremos que el modelo del sistema viene dado por: Donde (3.68) con Q = 0.2 , R = 0.1 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL (3.69) Es decir, tenemos un sistema invariante en el tiempo sujeto a ruido gaussiano estacionario. Al resolver recursivamente encontramos la evolución de la matriz L en el tiempo, misma que se muestra en la figura (2.6) Figura 1. 22 Respuesta Ganancia del estimador versus el tiempo El valor de estado permanente de la matriz L calculado de manera recursiva, mediante las ecuaciones planteadas para el estimador de kalman, y también usando el comando kalman de MATLAB resulta ser: (2.70) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Los primeros valores para L son: L 1 = (0.4444 1.7778) T (3.71) L 2 = (0.41861 1.783) T (3.72) Etcetera. . . L2 = 0.41861.1783 (3.72) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Fuentes Documentales de la Unidad 1 • Análisis de sistemas dinámicos, Curso virtual. Universidad Nacional de Colombia. http://www.virtual.unal.edu.co/cursos/ingenieria/2001619/, página web consultada el 1 de Julio de 2009 • Acedo S, de José, Sánchez A. Instrumentación y control avanzado de procesos. Ediciones Díaz Santos 2006. • B. Anderson and J. Moore Optimal Control: Linear Quadratic Methods, , Prentice-Hall, 1989. • Chi – Tsong Chen, “Linear System. Theory and Design” Oxford University Press. 3 ra Edición. USA. 1998. • David Bardey y Héle Bonnet, Donal E. Kira Teoría del control óptimo ¡Una guía para principiantes! - Universidad del Rosario http://www.urosario.edu.co/economia/documentos/pdf/bi87.pdf, pagina web consultada el 15 de julio de 2009. • Desineni Subbaram Naidu., Optimal Control Systems. Desineni Subbaram Naidu CRC PRESS. Optimal Control Theory an introduction • Donald M. Wiberg, “Espacio de Estado y Sistemas Lineales”, Mc.Graw-Hill. México. 1971. • Dover, Donald Kirk Optimal Control Theory: An Introduction, , 2004. • Frank l. Lewis and Vassilis L. Syrmos, Optimal Control. Second Edition • Feedback control modes. Lewis M. Gordon. Chemical Engineering, Septiembre 19, 1983. • H. Kwakernaak and R. Sivan Linear Optimal Control Systems, , 1969. • Instrumentación y Control de Plantas Químicas. Facultad de Ingenierías. Universidad de Buenos Aires. Argentibna . http://materias.fi.uba.ar/7609/- Pagina web consultada el 3 de Julio de 2009. • Katsuhiko Ogata, “Ingeniería de Control Moderna”.Prentice Hall. 3 ra Edición. México. 1998. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • MathWorks Inc. MATLAB User´s Guide, Toolbox de Control. Versión 5.3. USA. 1998. • Michael O’Flynn., “Linear Systems. Time Domain and Transform Analysis” Wiley. Singapore. 1987. • Michael O’Flynn. “Linear Systems. Time Domain and Transform Analysis”. Wiley. Singapore. 1987. • Modelos expresados en variables de estado. http://materias.fi.uba.ar/7609/material/Clase%2002/02%2003%20Modelo%2 0en%20Variables%20de%20Estado.pdf. Pagina web consultada el 3 de julio de 2009. • Process control in practice. Tore H. Agglund. Chartwell/Bratt, 1991 • Stochastic Optimal Control: The Discrete-Time Case, Dimitir P. Bertsekas and Steven E. Shreve, Athena Scientific, 1996. • Vera. R, C. A. Apuntes de clases de Tópicos Avanzados de Control. Maestría en Control Industriales. Universidad de Pamplona – COLOMBIA, 2007 • Vera. R, C. A. Apuntes de clases de Instrumentación Industrial. Maestría en Control Industriales. Universidad de Pamplona – COLOMBIA, 2007 • Video (Controlador lógico programable), Tomado de: http://www.youtube.com/watch?v=fKfKLzMYvtk.Página consultada el 1 de julio de 2009 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL UNIDAD 2 Nombre de la Unidad Técnicas avanzadas de control I. Introducción La siguiente unidad trata de las diferentes técnicas de control avanzando utilizados actualmente en la industria y de los cuáles aún se siguen investigando. Se profundiza en algunas estrategias de control avanzado, e identificación paramétricas de los sistemas, que a partir de data se obtiene una función que modela el sistema, o se construir modelos a partir de la observación. La lógica borrosa o difusa juega también un papel importante en los procesos de control, la lógica difusa permite plantear el problema en los mismos términos en los que lo haría un experto humano. Justificación El futuro profesional de la ingeniería debe comprender que además de las técnicas avanzadas de control e identificación de sistemas, desde las primeras ideas formalizadas de la lógica difusa en los años 60, se han venido intentando cada vez con más éxito la aplicación de esta rama de la lógica al control automático , incluyendo el de procesos , es ésta la razón por la que se incluyen el control difuso, dentro de la presente unidad para hacer más amplio los conceptos de sistemas avanzados de control. La presente unidad es en realidad introductoria, tratan de explicar sus fundamentos y principios de aplicación de forma simple sentando las bases para que aquellos estudiantes que deseen seguir profundizando en los temas cuenten ya con un primer paso hecho. Intencionalidades Formativas Conocer diferentes técnicas avanzadas de control y métodos de identificación de sistemas. Además de obtener las bases necesarias para entender la lógica difusa aplicada al control de procesos. Denominación de capítulos • Capitulo 2.1 Técnicas avanzadas en los sistemas de control • Capitulo 2.2 Identificación de sistemas dinámicos • Capitulo 2.3 Control borroso UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL UNIDAD 2. TÉCNICAS AVANZADAS DE CONTROL I UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL CAPITULO 1. TÉCNICAS AVANZADAS EN LOS SISTEMAS DE CONTROL Introducción La importancia del control de realimentación (feedback), tiene una serie de ventajas como: • No es necesario tener conocimiento a priori de la dinámica del proceso. • Se produce acción correctora ante cualquier perturbación que afecte a la variable controlada. • El control PID es un sistema muy robusto. Para que aparezcan inestabilidades han de producirse cambios importantes en la dinámica del proceso. El control feedback también tiene una serie de desventajas, entre las que se pueden citar: • Sólo se produce cuando la variable controlada se ha desviado de su punto de ajuste. Por tanto, es imposible evitar el error en la variable controlada. • El controlador no puede adelantarse a las perturbaciones aunque éstas puedan ser conocidas y medidas. • El comportamiento no suele ser aceptable en proceso con grandes retardos puros. Por todo ello, existen una serie de técnicas de control avanzado que mejoran el comportamiento del control básico. En realidad, el término control avanzado no tiene una demarcación clara. Se puede definir como un conjunto de técnicas y herramientas que permiten adaptarse a las condiciones cambiantes del proceso. Entre las técnicas para realizar control avanzado se pueden encontrar las siguientes: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • Control feedforward. • Control en cascada. • Control de relación. • Control selectivo. Cada una de estas técnicas puede apoyarse en diversos cálculos matemáticos para complementar el efecto sobre el elemento final de control, siempre con el objetivo de producir estabilidad en la operación. En necesario hacer hincapié en que el objeto principal del control avanzado es producir estabilidad en la operación. Como consecuencia de la estabilidad de las unidades de proceso, obteniendo: • Mejora de rendimiento en productos de mayor valor añadido. • Ahorro de energía. • Incremento de la capacidad de producción. Lección 1. Control en adelanto (feedforward) Los controladores con realimentación del proceso no tienen en cuenta la influencia de las perturbaciones que se producen y que afectan al lazo de control. Debe existir un error para que se inicie la acción correctiva. Un medio para corregir el efecto de las perturbaciones es el control feedforward, el cual compensa el efecto de las mismas antes que produzcan error en la variable controlada. Este sistema está limitado por la exactitud de las medidas, los cálculos efectuados y las perturbaciones no medidas. Sección 1. Teoría del control feedforward Cualquier proceso se puede describir en función de las relaciones existentes entre las salidas y dos grupos de entradas: la salida del proceso que es la variable controlada (Vc) o dependiente, y la entrada, conocida a su vez como variable UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL manipulada (Vm) o independiente. Las variables asociadas a la carga son el otro tipo de independientes, conocidas como variables de perturbación (Vp). La figura 2.1 muestra un diagrama de bloques como variables en el que aparecen las tres variables descritas. Como puede verse, cada una de las entradas llega al proceso pon un lugar diferente, por lo que afectan de distinta forma a la variable controlada. La ecuación que describe al proceso es: Vc=Vm*Gm-Vp*Gp Donde Gm y Gp son las funciones de transferencia. Figura 2. 1 Diagrama en bloques del control feedforward El objeto del sistema de control feedforward es mantener la variable controlada en un valor de referencia <<R>> que debe ser igual al valor deseado para la variable controlada. Con estos datos se puede obtener el valor de la variable manipulada a partir de la ecuación anterior. Vm=(R+Vp*Gp)/Gm UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Si el cálculo de la variable manipulada es correcto, para cualquier valor de la variable de perturbación se mantendrá constante el valor de referencia, es decir, el valor de la variable controlada. Sección 2 Aplicación a un intercambiado de calor En el cambiador de la Figura 2.2, la temperatura de salida es la variable controlada, el caudal de producto y su temperatura de entrada son variable de perturbación, mientras que el caudal de vapor es la variable manipulada. Figura 2. 2 Diagrama de un intercambiado de calor Aplicando un balance de energía se obtiene el modelo en estado estacionario del proceso de intercambio de calor. Hs*Fs=Fp*Cp*(Ts-Te) Donde: Hs = Entalpía del vapor (kcal/kg) Fs = Caudal de vapor (kg/h) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Fp = Caudal de producto (Kg/h) Cp = Calor específico del producto (kcal/kg ºC) Ts = Temperatura de salida (ºC) Te = Temperatura de entrada (ºC) En este ejemplo la regencia es la temperatura de salida deseada. Si no existieran otras perturbaciones se podría fijar el caudal de vapor necesario para mantener esta temperatura. Fs=Fp*(Cp/Hs)*(R - Te) El cálculo anterior se basa en el modelo en estado estacionario, en el cual no se contemplan las diferentes dinámicas que afectan a las variables en función de su propia naturaleza y el lugar donde se encuentran situadas en el proceso. Para llevar a cabo la compensación dinámica es necesario introducir una función de tiempo lead/lag en las variables de perturbación, de forma que el sistema de control pasa a ser el de la Figura 2.3. La compensación dinámica hace coincidir en el tiempo las variables para que nos e produzca desviación entre el valor real de la variable controlada y el valor deseado como referencia. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 3 Diagrama de un intercambiado de calor con compensación dinámica Sección 3. Reajuste por medio de feedback Existen influencias externas que producen errores en el cálculo. Como consecuencia la temperatura de salida puede sufrir deriva, produciendo un error permanente. Entre las influencias externas se pueden citar: • Cambio en la presión del vapor, haciendo que se modifique su entalpía. • Cambio en las condiciones ambientales noche y día invierno y verano, etc. • Ensuciamiento en los tubos del cambiador. Todo esto hace que sea necesario recurrir a un procedimiento que sea capaz de mantener la variable controlada en su valor de referencia. Este procedimiento es el control feedback. La Figura 2.4, muestra el sistema de control anterior incluyendo un controlador temperatura en la línea de salida de producto, el cual actúa como reajuste o feedback. Este controlador mantendrá la temperatura en el valor de referencia UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL deseado, corrigiendo los desequilibrios producido por la perturbaciones no medidas y lo errores de cálculo. Figura 2. 4 Diagrama de un intercambiado de calor con compensación dinámica Lección 2. Control en cascada En la práctica existe gran cantidad de proceso con lazos simples de control feedback entre los que se produce interacción. Para eliminarla es necesario medirla y controlarla por medio de un sistema de control denominado cascada. La figura 2.5 muestra un ejemplo típico a partir del cual se va a contemplar el funcionamiento del sistema. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 5 Diagrama típico de nivel de un tanque para el ejemplo del control en cascada Para controlar el nivel en el fondo de un recipiente se utiliza, en principio, un controlador que actúa directamente sobre la válvula. Mientras aguas debajo de la válvula automática no se produzca ninguna perturbación se efectuará un control de nivel aceptable. Si por alguna causa disminuye la presión aguas abajo, la válvula dejará pasar más caudal para la misma apertura al haber aumentado la diferencia de presión a través de ella. La posición de válvula se corregirá cuando disminuya el nivel y su controlador disminuya la salida en cantidad suficiente para buscar un nuevo equilibrio. Tomando la válvula como un orificio de restricción en el que antes y después existen las presiones 1 P y 2 P respectivamente, se puede aplicar la ecuación de cálculo de caudal, la cual de forma simplificada es la siguiente: 2 1 * P P K Q − = Esto hace que al disminuir 2 P aumente el caudal de paso para la misma apertura de válvula. Se puede observar, por tanto, que un cambio en la diferencia de presión ocasiona un cambio en el paso por la válvula, que a su vez modifica el nivel en el recipiente. En otra palabras, existe interacción entre caudal y nivel, la cual se puede de amortiguar efectuando control en cascada, tal como aparece en la Figura 2.6. Con esta técnica, tan pronto se modifique el caudal se llevará a cabo UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL la corrección necesaria sobre la válvula antes que se vea afectado el nivel del recipiente. Figura 2. 6 Aplicando control en cascada Llegados a este punto se puede ver que un sistema de control en cascada utiliza dos controladores feedback. Solamente uno de ellos, denominado esclavo o secundario, tiene salida al proceso, en este ejemplo el controlador de caudal. El controlador de nivel, denominado máster o primario, se utiliza para fijar el punto de ajuste del secundario. La variable a controlar es la medida del controlador primario, mientras que la medida de caudal del secundario es una variable intermedia. En un sistema de control en cascada, la dinámica del lazo secundario deber ser siempre más rápida que la del primario. En caso contrario no es posible que funcione correctamente. La Figura 2.7, muestra un diagrama de bloques del ejemplo mostrado en al Figura 2. 6, a partir del cual se pueden deducir dos comportamientos. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 7 Diagrama en bloques aplicando el control en cascada en el nivel de un tanque • Si la perturbación ocurre en el lazo de control interior (caudal), el controlador secundario inicia la acción correctiva antes que se traslade al lazo de control exterior (nivel). • Si la perturbación ocurre en el lazo exterior (nivel), el comportamiento de la cascada hace que se modifique el punto de ajuste del lazo interior. En este caso el conjunto se comporta prácticamente como si fuera un solo control feedback. Sección 1. Algunos ejemplos de control en cascada. Además del ejemplo mostrado en la Figura 2.6, se muestran a continuación otros ejemplos típicos de control en cascada. La figura 2.8, muestra el control entre nivel y caudal de salida del acumulador de una columna de destilación. Este sistemas se utiliza parra cerrar el balance de materia en cabeza de la columna. También aparece el control en cascada entre temperatura y caudal de reflujo. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 8 Diagrama de control entre nivel y caudal de salida del acumulador de una columna de destilación En este ejemplo se trata de una columna de destilación a condensación total, es decir, todo el producto que sale por cabeza se condensa y llega al acumulador en fase líquida, de donde se reparte en dos corrientes, una de ellas retorna como reflujo y la otra abandona el proceso como destilado. Al mantener el reflujo constante, este sistema hace que las variaciones de nivel ocasionada por la mayor o menor acumulación de producto hagan que la salida de destilado sea variable para cerrar el balance de materia. La Figura 2.9, muestra el caso de un intercambiador de calor en el que se debe controlar la temperatura de salida de uno de los productos manipulando el caudal de entrada del otro producto. Figura 2. 9 Diagrama de control entre nivel y caudal de salida del acumulador de una columna de destilación UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Este caso se puede hacer extensivo a todos los intercambios de calor utilizados en proceso unitarios. Por ejemplo, en una columna de destilación se pueden presentar dos casos típicos, como son: • Control temperatura de fondo. La temperatura de producto puede estar situada en el plato sensible de fondo de la columna, mientras el caudal corresponde al fluido calefactor del reboiler, representado por el cambiador de calor, como muestra la Figura 2.11. • Control temperatura de cabeza. La temperatura de producto corresponde al plato sensible situado en la pare superior de la columna, mientras que el caudal corresponde al reflujo como muestra la Figura 2.8. Tanto en el caso de fondo como en el de cabeza, las temperaturas podrían ser sustituidas por cromatógrafos para controlar la composición de los productos de ambos extremos de la columna. Otro caso típico es el correspondiente al control de combustión de un horno, representado en la Figura 2.10. El control en cascada controla la temperatura de salida del producto manipulando la presión del combustible. En lugar de la presión se podría utilizar como secundario el caudal, en cuyo caso la válvula automática debería estar situada después de la medida e caudal, para evitar la perturbación que se produce al variar la presión posterior a la válvula. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 10 Diagrama de control de combustión de un horno Queda, por último, comentar que a veces se utilizan sistemas con tres controladores en cascada, como queda representado en la Figura 2.11. Figura 2. 11 Diagrama de control de sistemas con tres controladores en cascada En realidad estos casos suelen ser más teóricos que prácticos, por la dificultad que existe para sintonizar tres lazos de control en serie. En cualquier caso, si se UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL utiliza este sistema de control, los parámetros de ajuste del lazo de composición del producto deben ser lo suficientemente relajados para no producir oscilación en el conjunto. Con alternativa a los tres controladores en serie se puede utilizar alguno de los sistemas siguientes: • Control incremental de composición. Dado que la composición del producto cambia de manera lenta, en lugar del AC se puede utilizar un controlador incremental que modifique el punto de ajuste del controlador de temperatura periódicamente, no de forma continua como lo hace un controlador PID normal. En realidad es un controlador integral con incrementos constantes. • Control de composición alternativo al control de temperatura. Con el fin de eliminar uno de los controladores, puesto que tanto la temperatura como la composición están asociados a la calidad del producto, se puede configura el sistema que aparee en la Figura 2.12. Figura 2. 12 Diagrama de control de sistemas con tres controladores en cascada Con este sistema se puede utilizar, por ejemplo, como controlador primario principal el correspondiente a la composición, y sólo en caso de fallo de éste, o a UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL voluntad de operador, pasar a controlar con el correspondiente a al temperatura, accionando el conmutador manual HS. En este caso el TC será un controlador primario de reserva. Lección 3. Control de relación (ratio control) Sección 1. Relación de caudales Es un sistema en donde se va a controlar una variable secundaria en relación directa a otra variable denominada primaria. Un ejemplo típico es la relación líquido/vapor en un proceso de absorción.- En este proceso se capturan o condensan ciertos componentes de una corriente de gas por medio de un absorbente líquido. La figura 2.13, muestra un absorbedor en el que se elimina 2 SH utilizando como absorbente Mono Etanol Amina (MEA). El caudal de alimentación contiene el gas a absorber. La variable a manipular es el caudal de absorbente. Sin intentar realizar aquí un balance de materia exhaustivo entre las cuatro corrientes que intervienen en el absorbedor, es importante resaltar que la variable a manipular es la relación L/V, sujeta a reajustes debidos a variaciones en la composición de la alimentación Para mantener la relación L/V es necesario utilizar un sistema feedforward como el que aparece en la Figura 2.14. Por medio de este sistema, para mantener constante la relación L/V se modifica el caudal de absorbente en función del caudal de alimentación. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 13 Diagrama de un absorbedor en el que se elimina SH 2 utilizando como absorbente Mono Etanol Amina (MEA) Esta relación mantiene a su vez la concentración de la corriente de fondo, o bien de cabeza, dependiendo de la calidad del producto que se desea controlar. La relación se puede ajustar manualmente o de forma automática. Un ejemplo típico de ajuste automático es el control de relación aire combustible en el proceso de combustión de una caldera. En este caso la relación se puede ajustar manualmente o de forma automática. Un ejemplo típico de ajuste automático es el control de relación aire combustible en el proceso de combustión de una caldera. En este caso la relación se reajusta por medio de un analizador de oxígeno situado en la salida de gases efluentes de la combustión. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 14 Sistema feedforward aplicado al absorbedor Sección 2.Relación caudal parcial a caudal total Este sistema se representa en la Figura 2.15, y es una variante del anterior. Se utiliza fundamentalmente por las siguientes razones: • Donde es imposible medir el caudal (A) o no controlado antes de realizar la mezcla, bien por estar inaccesible, por su alta viscosidad, o cualquier otra causa. (después de la dilución disminuye la viscosidad y puede ser medido.) • Donde se desea añadir el líquido en relación al total y saber que este total contiene un porcentaje del componente deseado (B). se utiliza para mezclar las componentes, como se verá en el sistema de blending. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 15 Sistema de relación caudal parcial a caudal total Sección 3.Relación de cantidades En este sistema se controla la cantidad total de la variable secundaria en relación directa a ala cantidad total (acumulada) de la variable primaria no controlada. Se obtiene una dosificación más precisa que cuando se controlan caudales instantáneos, sobre todo cuento se trata de cantidades pequeñas. Al comparar caudales totalizados este sistema mantiene el porcentaje de los componentes de la mezcla de forma más precisa. La ventaja de este control es que permite que existan desviaciones temporales de una de las variables, ya que el sistema es que permite que existan desviaciones temporales de una de las variables, ya que el sistema las compensa automáticamente con posterioridad. Este sistema tiene gran utilidad en mezcla de grandes cantidades de producto, en la cual es necesario añadir componente de forma exacta como ocurre en el blendig de gasolina o gasóleo. La figura 2.16 muestra un sistema de control de este tipo en el que el sumador va acumulando el valor de la ejecución anterior más el de la actual, dando como resultado un caudal acumulado que es el que se utiliza para llevar a acabo el control de relación. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 16 Sistema de control para relación de mezcla Lección 4. Mezcla de productos (Blending) El blending, o mezcla de productos, es una aplicación de control que utiliza las técnicas de control de relación de forma múltiple para realizar una mezcla con varios componentes, tal como muestra de forma simplificada la Figura 2.17, dos casos típicos de blending son los correspondientes a la formulación de gasolina y gasóleo a partir de varios componentes. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 17 Sistema de control para blending Solo se va a mencionar el comportamiento del sistema tratado como control de relación. Por tanto, lo puntos de ajuste de cada componente se fijan en función de valores obtenidos por simulación u optimización OFF LINE. Existen sistemas en los que se puede realizar optimización ON LINE, en cuyo caso los puntos de ajuste se van adaptando a valores calculados en función de las composiciones deseadas por ejemplo Presión de Vapor Reid, índice de Octano, etc. Dada la problemática asociada ala factor de servicio de los analizadores en línea, este sistema tiene una utilización limitada. De forma simple, factor de servicio es el tanto por ciento del tiempo que el analizador se encuentra funcionando y disponible para efectuar control automático. Sin entrar en detalle sobre la forma de realizar el control del blending, a continuaciones relacionan algunas de sus particularidades: • Velocidad de mezcla. Corresponde al punto de ajuste fijado en el controlador máster de caudal situado en línea común (Blender), donde se UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL unen todos los componentes. Se fija en unidades de caudal, por ejemplo, 500 h m / 3 . A veces se conoce como demanda máster. • Volumen de mezcla. Es la cantidad total de producto que se desea obtener en la mezcla. Se fija en unidades de volumen, por ejemplo, 10.000 3 m . • Relaciones parciales de componentes. La suma de puntos de ajuste de las relaciones correspondiente a todos lo componentes ha de ser igual al 100%. • Volúmenes parciales. Se deben calcular dos volúmenes, correspondientes a los puntos de ajuste de cada componente (teórico), y a las medidas de caudal de paso (real). Cuando se produce desviación entre ellos se deben corregir los caudales correspondientes por medio del bías asociado a cada lazo. Realmente la salida del controlador de relación corresponde al valor teórico de punto de ajuste que corresponde a cada componente, mientras que el pinto de ajuste real de de controlador de caudal es la suma del teórico más del bías añadido, si se produce desviación el volumen de paso real con respecto al teórico. Si no existe desviación, el valor del bías será cero. • Arranque y para de bombas. Se realiza automática la puesta en marcha de las bombas situadas en las líneas de producto al mismo tiempo que se inicia la mezcla. Asimismo se efectúa la parada automática al final de la mezcla. • Capacidad de los tanques. La mezcla se inicia sólo si el volumen existente en los tanques origen es suficiente para suministrar el correspondiente a la demanda de cada componente. Asimismo el tanque destino debe tener capacidad suficiente para el volumen de mezcla fijado. Sección 1.Funcionamiento del sistema de mezcla En la figura 2.18, aparecen las diferentes fases que componen el desarrollo de una mezcla de productos. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 18 Diferentes fases que componen el desarrollo • Inicio. La velocidad de mezcla se inicia en cero y va aumentando hasta alcanzar su valor de referencia fijado en el punto de ajuste del controlador máster de caudal el tiempo hasta alcanzar el punto de ajuste está destinado ala sistema de rampa ascendente de caudal. • Funcionamiento normal. Una vez alcanzada la velocidad de mezcla, o demanda del máster, el caudal permanece en ese valor mientras no ocurra ninguna incidencia. • Pacing. Durante el tiempo que permanece la velocidad de mezcla en su valor de referencia se puede presentar una condición de pacing. Generalmente esta condición se asocia a la posición de válvula de los diferentes componentes, de forma que si alguna de ellas alcanza un valor próximo al 100% es necesario reducir la velocidad de mezcla. Si no se realiza la reducción nos e alcanzará la mezcla deseada porque el componente cuya válvula ha alcanzado el 100% está fuera de control y el caudal de paso no corresponderá al fijado en su punto de ajuste. Cuando desaparece la condición de pacing se puede volver el valor anterior de velocidad de mezcla bien de forma manual o automática. El pacing se trata en realidad de acompañar la velocidad de mezcla a las restricciones producidas por la apertura de válvula de los componentes. • Pre-parada. A un cierto valor de volumen de mezcla, por ejemplo 95%, se llega a la condición conocida como pre-parada. En este momento se inicia un sistema de rampa descendente hasta alcanzar una velocidad de mezcla denominada valor de retención, en el cual permanecen todos los componentes hasta finalizar la mezcla. Realmente se trata de frenar la UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL velocidad para poder realizar el ajuste final de cada uno de los componentes de la mezcla. • Parada. La parada de la mezcla se realiza cuando todos los componentes han alcanzado su volumen prefijado. Dado que se conoce el volumen total de mezcla y la relación de cada componente también se conocen los volúmenes parciales, de forma que cuando cada componente alcanza su volumen prefijado se cierra automáticamente la válvula automática. De esta forma el volumen total corresponde exactamente con el prefijado. Lógicamente todas las válvulas no se cierran al mismo tiempo, sino que lo hacen en función de cuando se alcance el volumen de cada componente. Lección 5. Control selectivo Existen muchas ocasiones en las que entre varias medidas o salida de controladores se debe seleccionar una de ellas, bien por razones de seguridad, eficacia, etc. En el caso de medidas, el sistema sólo realiza la función de selector puro, puesto que se trata de variables cuyo valor es fijo. Como ejemplo típico se tiene la selección de la temperatura más alta en un reactor, la cual va a ser utilizada como variable de proceso para un controlador. Se trata de seleccionar entre los milivoltios generados por cada uno de los termopares implicados. Cuando se trata de seleccionar entre los milivoltios generados por cada uno de los termopares implicados. Cuando se trata de seleccionar una salida entren la de varios controladores, la variable a seleccionar no es fija, sino flotante. Las salidas de los controlador son seleccionados tienden a desplazar de hacia un externo u otro del rango. Estro se debe a que las salidas son el resultado de aplicar la ecuación del controlador PID que, como se sabe, tiene una componente debida a la acción integral que lleva a saturar su salida en alguno de los extremos cuando existe error entre medida y punto de ajuste. El fenómeno de saturación debida a la acción integral se conoce como reset windup, y el tipo de control selectivo se conoce como override. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Sección 1. Antisaturación (Anti reset windup) En el control selectivo override siempre existe uno o más controladores cuya salidas no está seleccionada, dada la propia naturaleza a de este tipo de control. Con objeto de simplificar, a partir de aquí se supone que sólo existen dos controladores cuya salda reenvía a un selector. El controlador no seleccionado tendrá un error permanente entre la variable proceso (PV) y punto de ajuste (SP), por lo que su salida (OP) será inferior a la seleccionada dependiendo si el selector es de máxima o mínima respectivamente. Si los controladores sólo disponen de acción proporcional, la salida no seleccionada tendrá un valor fijo proporcional al error. Si además disponen de acción integral, la salida no seleccionada llegará a saturarse con el tiempo debido a la integración del error, por lo que si no existe ningún sistema que evite esta saturación la salida se irá a un valor por encima del máximo o por debajo del mínimo, aunque el indicador de salida éste en 100 o 0% respectivamente. Esta particularidad hace que el cambio de variable controlada no se haga justo en el momento en que la no seleccionada cambie el signo del error, sino que hace falta además que elimine la saturación debida a ala acción integral (reset windup), para que pase a se la variable controlada principal. Para evitar la saturación, los sistemas de control distribuido disponen de limitadores de acción integral, de forma que se evite la saturación del controlador no seleccionado. A modo de ejemplo se describen a continuación dos sistemas para evitar la saturación. • Limitar la acción integral de los controladores en un valor de salida determinado, Por ejemplo, 90 y 10%. A partir de estos valores de salida del controlador se elimina el efecto de la acción integral, reduciendo la saturación E la Figura 2.19, las salidas no seleccionadas permanecería en el 90%. Para llevar a cabo el cambio de variable, el controlador nos seleccionado tuene que aproximar su salida desde 90 a 60%. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 19 Control selectivo Anti reset windup • Algunos sistemas de control distribuido disponen de ajuste de banda de seguimiento de la salida no seleccionada con respecto a la seleccionada, por ejemplo, 5%. En la Figura 19, la salida no seleccionada estaría en el 65%. De esta forma el cambio entre variables controladas se hace rápidamente (65 a 60%) evitando perturbaciones en le proceso. • Algunos sistemas disponen de controladores con external feedback. A esta entrada se conecta la salida del selector, de forma que la salida del controlador no seleccionado se encontrará muy cerca de la salida del selector, evitando la saturación del controlador. Sección 2. Control override en estación de bombeo Existen ocasiones en las que es necesario limitar una variable de proceso en un valor determinado, alto o bajo, para evitar daños en equipos o al proceso. Un ejemplo típico lo constituyen las estaciones de bombeo en las que existen dos variables controladas y una sola manipulada, tal como se muestra la Figura 2.20. Figura 2. 20 Control selectivo override UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Las variables controladas son las presiones de aspiración e impulsión o descarga, mientras que la manipulada es la válvula automática situada en la línea de impulsión. En condiciones normales deber ser controlada la presión de impulsión. Solamente se limitará este control si la presión de aspiración disminuye de u cierto valor, en cuyo caso pasará a ser la variable controlada. La salida de los controladores se conecta a un selector override de mínima señal. El punto de ajuste del controlador de presión de aspiración está situado por debajo de la presión normal de operación. Debido al error entre PV y SP, su salida se encontrará al máximo debido a la componente integral y tener configura acción inversa. El controlador de impulsión también tiene acción inversa y mantiene la presión en el punto de ajuste deseado. Por tanto, su salida será menor que la del consolador de presión de aspiración. En condiciones normales de operación, el selector de mínima señal tendrá seleccionada la del controlador de impulsión para enviarla a al válvula automática. Cunado, por haber aumentado el caudal de paso, la presión de aspiración disminuya por debajo de su punto de ajuste la salida del controlador disminuirá, haciéndose menor que la correspondiente al controlador de impulsión. Como consecuencia el selector dejará pasar la salid del controlador de aspiración hacia la válvula automática, protegiendo de esta forma la bomba. E este momento se producirá un error permanente en el controlador de descarga, siendo su PV menor que el SP, por lo que la salida de este controlador aumentará dejando de ser seleccionada. Sección 3. Control override para medida de caudal de LPG Como su nombre indica, el Gas Licuado de Petróleo (Liquefied Petroleum Gas), se encuentra en fase gas a presión atmosférica y temperatura ambiente. Con objeto de mantenerlo en fase líquida debe estar sometido a una cierta presión por encima de la presión de vapor del butano, propano y etano contenidos en la mezcla. En la Figura 2.21, la salida de los controladores de caudal y presión se envían a un selector de máxima señal. En condiciones normales la salida del controlador de UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL presión estará por encima de la correspondiente al controlador de caudal, estando por tanto controlando el caudal da su valor deseado. Si por alguna circunstancia disminuye la presión, disminuirá también la salida de su controlador, pasando éste a controlar al alcanzar la medida el punto de ajuste, el cual estará fijado a la mínima presión para que el GLP permanezca en fase líquida. Figura 2. 21 Control override para medida de caudal de LPG El comportamiento aparece en la Figura 2.22, mientras la presión está situada por encima de su punto de ajuste, el caudal se mantendrá en el valor deseado. Cuando la presión alcanza su punto de ajuste, el controlador hace que éste se mantenga constante, disminuyendo el paso de caudal para evitar que se gasifique el GLP, lo cual produciría errores en la medida. Figura 2. 22 Comportamiento del control override para la medida del caudal de LPG UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Sección 4. Control override en un intercambiado tipo Kettle Por último se describe el funcionamiento de un control override entre presión nivel en los equipos situados en cabeza de una columna desetanizadora, como aparece en la Figura 2.23. Figura 2. 23 Sistema de control override entre presión nivel en los equipos situados en cabeza de una columna desetanizadora La refrigeración se realiza con fracción C3 que entra al condensador en fase líquida y lo abandona en fase gas. En el condensador se realiza el cambio de fase, en el cual el calor latente de vaporización hace que se condense el vapor procedente de cabeza de la columna. La presión se controla en el acumulador, de forma que si ésta aumenta abrirá la válvula automática inundando tubos con líquido refrigerante. El gas producido en el cambio de fase se acumula en la parte superior del condensador tipo Kettle, de donde pasa a la aspiración de un compresor para volver a condensarlo y repetir el ciclo al tratarse de un circuito cerrado. Al abrir la válvula automática aumentará el nivel en el condensador, hasta el extremo de inundar totalmente los tubos. En este momento se tiene la máxima UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL capacidad de refrigeración posible, por lo que no es necesario dejar pasar más líquido por la válvula. Pa evitar que siga aumentando la apertura de válvula, pasará a controlar el nivel a través del selector override de mínima señal. El controlador de presión tiene configurada acción directa, por lo que al aumentar la presión aumenta la salida, mientras que el controlador de nivel tiene configurada acción inversa, de forma que al aumentar el nivel disminuye su salida. Como consecuencia de este comportamiento, el selector override deber ser de mínima señal. Este sistema de control protege el circuito de aspiración del compresor de la posible entrada de líquido con los consiguientes daños que esto producirá en la máquina. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL CAPITULO 2. IDENTIFICACIÓN DE SISTEMAS DINÁMICOS Introducción El avance alcanzado por los sistemas computacionales, tanto en Hardware como en Software, ha permitido el desarrollo de sistemas de control de procesos muy eficientes. La implementación de algoritmos fácilmente manejables por computadores o procesadores dedicados al control ha dejado atrás a los controladores tradicionales. La continua aparición de nuevos controladores algebraicos y formulaciones de algoritmos de control han impulsado el estudio y la teorización sobre múltiples tópicos y herramientas matemáticas relacionadas. Esta ciencia trata de inferir modelos a partir de observaciones y estudiar sus propiedades. Los modelos (hipótesis, leyes de la naturaleza, paradigmas, etc.) pueden tener un carácter más o menos formal, pero con la característica básica de enlazar observaciones bajo algunos patrones. La identificación de sistemas trata el problema de construir modelos matemáticos de sistemas dinámicos a partir de datos obtenidos del propio sistema. La lección se basa en metodologías teóricamente bien sustentadas y, debidas a la abundancia de sistemas dinámicos que existen a nuestro alrededor, las técnicas de identificación de sistemas encuentran un extenso campo de aplicación. En términos generales, un sistema es un objeto en el cual variables de diferente tipo interactúan y producen señales observables. Las señales observables que nos interesan son llamadas salidas. El sistema es afectado por estímulos externos; algunos de los cuales son manipulables por el observador, las entradas y por otras, las perturbaciones. Estas perturbaciones pueden ser de dos tipos: las medibles directamente y aquellas de las cuales sólo pueden observarse sus efectos en la salida. Para el modelado de sistemas no es muy importante la distinción entre perturbaciones y entradas. La noción de sistema es, obviamente, muy amplia, por cuanto este concepto representa un papel muy importante en la ciencia moderna. Muchos problemas de diferente índole son solucionados con estructuras orientadas a sistemas. En términos muy generales, hablar de sistemas dinámicos implica que el valor presente en la salida de un sistema en un instante depende no solamente de los valores de las entradas en ese instante sino también de sus valores previos. La identificación pretende estudiar modelos inferidos a partir de observaciones. Obtener las relaciones matemáticas que ligan las variables de un proceso físico no siempre es posible de forma directa. La identificación permite, mediante un conjunto de experiencias sobre el sistema, la determinación indirecta de estas ecuaciones. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Lección 6. Generalidades El funcionamiento de los procesos industriales ha cambiado drásticamente en las últimas décadas. Este cambio es debido principalmente a la evolución de la tecnología del computador. La automatización de los procesos ha comportado un aumento de la productividad de algunos sectores industriales, obligando a la industria a adaptarse a las demandas de mercado y aumentar su competitividad [Backx, 1993]. Para aumentar la competitividad ha sido necesario desarrollar nuevas técnicas: métodos y herramientas que permitan maximizar la eficiencia de los procesos, desarrollando controladores de gran calidad, y maximizar la flexibilidad de los procesos con el menor ajuste de la maquina. Para ello es imprescindible conocer el comportamiento dinámico del proceso, principalmente de las partes críticas. En la actualidad, cada vez más, el trabajo de un ingeniero consiste en la realización de modelos matemáticos de los procesos estudiados [Ljung 1994]. Los modelos son utilizados en áreas tan distintas como: bioingeniería, construcción, economía, meteorología, procesos químicos,. . . .,etc. El campo de utilización de dichos modelos es muy amplio, destacar aplicaciones como: control, supervisión, predicción, simulación, optimización,.... A continuación se comenta un poco más las dos primeras ya que las técnicas de identificación y el diseño de controladores han seguido un camino paralelo Según [Seborg, 1994], las estrategias actuales de diseño de controladores pueden clasificarse en dos grupos: control convencional y control avanzado. El control convencional consistente en el control: manual, PID, de relación, en cascada, en avance o retardo de fase. Según dicho autor el 90 por ciento de los controladores de procesos industriales son actualmente controladores convencionales. Las estrategias de control avanzado se subdividen en tres grupos: técnicas de control convencionales (control desacoplado, control selectivo, control con compensación de retardo puro), técnicas de control basadas en modelos numéricos (control predictivo, control adaptativo, control robusto, control con modelo interno) y técnicas de control basadas en conocimiento (sistemas expertos, control neuronal, control fuzzy). Tanto para la utilización de técnicas de diseño convencionales como técnicas avanzadas y especialmente las basadas en modelos, es necesario un modelo numérico preciso del proceso UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL estudiado. Comentar también que los procesos industriales están sujetos a severos requerimientos de eficacia, disponibilidad y seguridad. La complejidad de los mismos crece constantemente y esto hace necesario el desarrollo de herramientas automáticas de ayuda al operador humano: los sistemas de supervisión. Entre las tareas de este tipo es necesario destacar las tareas destinadas a la detección y diagnostico de fallos. Con una rápida detección de los fallos se puede evitar desde una pérdida de prestaciones hasta un deterioro del sistema con consecuencias que pueden ser catastróficas para el propio sistema e incluso para el personal de la planta. Los sistemas de detección de fallos se basan en la obtención de síntomas, de señales indicadoras de fallos, y su análisis para indicar la posible existencia y localización de dicho fallo. Uno de los métodos utilizados para ello es la comparación del proceso con un modelo de simulación, son los métodos denominados diagnostico basado en modelos como en [Iserman84], [Gertler98]. Principalmente, por las dos razones expuestas anteriormente diseño de controladores y métodos de detección de fallos, es necesario disponer de un modelo matemático que se ajuste al comportamiento del sistema estudiado. El desarrollo de las técnicas de diseño de controladores utilizando métodos numéricos y las técnicas de identificación, se originaron simultáneamente [Backx93]. El inició de las técnicas de identificación, aplicadas a procesos con una entrada y una salida, tienen su origen a principios de los años 70 [strm70]. No sería hasta finales de la década de los 90 que empiezan aplicarse a procesos industriales [Ljung87; Sderstrm89], algunas de ellas útiles para el estudio de sistemas múltiple entrada múltiple (MIMO). Lección 7. Estructura y clasificación de los modelos Se denomina identificación a la técnica de construir un modelo a partir de las variables medidas del proceso: entradas o variables de control, salidas o variables controladas y, posiblemente, perturbaciones. En principio y con el objetivo UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL de modelizar se pueden proponer tres formas distintas de utilizar los métodos de identificación: 1. Hacer distintas aproximaciones para estructurar el problema: seleccionar las señales de interés, observar la dependencia entre ellas, estudiar el grado de linealidad del proceso, 2. Construir un modelo que describa el comportamiento entre las entradas y las salidas, prescindiendo del comportamiento físico. Hay distintas formas de abordar el problema, según se consideren modelos no paramétricos o modelos paramétricos. 3. Utilizar los datos para determinar los parámetros no conocidos del modelo físico obtenido a base del estudio de propiedades y leyes físicas del proceso estudiado. En este caso se habla de modelos “tailor-made” de los cuales se debe estimar solamente los valores de los parámetros no conocidos. Para ello se recurre a ensayos de comportamiento o pruebas físicas y/o a la utilización de técnicas de optimización. . El curso propuesto se centra en las dos primeras. Otro aspecto a tener en cuenta será el tipo de modelo matemático que se pretende identificar. Hay varias formas de catalogar los modelos matemáticos [Ljung94]: deterministas o estocásticos, dinámicos o estáticos, de parámetros distribuidos o concentrados, lineales o no lineales, y de tiempo continuo o tiempo discreto. Los tipos de modelos que se pretende analizar en este curso serán: * Deterministas, ya que se quiere estudiar la relación entre la entrada y la salida con una parte no modelizable o no conocida (estocástica); * Dinámicos, porqué el objetivo es conocer el comportamiento dinámico de un proceso; UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL * De parámetros concentrados, no se considera la variación en función del espacio; * Lineales o no lineales, se haría mayor énfasis a las técnicas de identificación de modelos lineales, comentado algunas técnicas para ser utilizadas en el caso de sistemas no lineales; * Tiempo continuo o tiempo discreto, se propone describir técnicas para la identificación de modelos en tiempo discreto y continuo. Se debe dejar claros varios aspectos en cuanto a la construcción de un modelo: Un modelo se desarrolla siempre a partir de una serie de aproximaciones e hipótesis y, por lo tanto, es una representación parcial de la realidad; Un modelo se construye para una finalidad especifica y debe ser formulado para que sea útil a dicho fin; Un modelo tiene que ser por necesidad un compromiso entre la simplicidad y la necesidad de recoger los aspectos esenciales del sistema en estudio Lección 8. Modelos para sistemas invariantes en el tiempo Un modelo completo para un sistema invariante en el tiempo es: y(k) = G(q −1 )u(k) + H (q −1 )e(k) (2.1) El método más fácil para parámetrizar G(q −1 ) y H (q −1 ) es tomar funciones racionales en las cuales el numerador y el denominador son polinomios y los coeficientes de estos polinomios son los parámetros. Estos parámetros son los que se van a identificar. Si se asigna a estos parámetros como Θ entonces la descripción del sistema es la siguiente: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL y(k) = G(q, Θ)u(k) + H (q, Θ)e(k) (2.2) Sección 1. Ecuación de error modelo ARX (Autoregresive eXogenous) La relación entrada-salida esta descrita por una ecuación diferencial de la forma siguiente: y(k) + a 1 y(k − 1) + • • • + a n − (y − n) = b 1 u(k) + • • • + b m u(k − m) + e(k) (2.3) el termino e(k) es llamado RUIDO BLANCO y es un error directo en la ecuación diferencial. El vector de parámetros Θ en este caso es: Θ = (a1 a2 . . . an b1 b2 . . . bm) T (2.4) Considerando la notación siguiente: A(q −1 ) = 1 + a q −1 + a q −2 + • • • + a n q −n (2.5) B(q −1 ) = b 1 + b 2 q −1 + • • • + b m q −m+1 (2.6) Entonces la relación de entrada-salida es: A(q −1 )y(k) = B(q −1 )u(k) + e(k) (2.7) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL o también (2.8) y entonces (2.9) (2.10) Estos modelos también se llaman modelos ARX “AR“ porque de refiere a la parte autoregresiva y A(q −1 )y(k) y ”X” es la entrada B(q −1 )u(k). Físicamente no son los mas sencillos por su evidencia en el procedimiento debido a que la entrada de ruido blanco esta filtrada por la dinámica de A(q −1 ). Este modelo es la elección inicial en todo proceso de identificación sin embargo tiene una gran desventaja frente a otros modelos que consiste en una descripción defectuosa de las influencias de las perturbaciones Sección 2. Ecuación de error modelo ARMAX y(k) + a 1 y(k − 1) + • • • + a n a(y − n a ) = b 1 u(k) + • • • + b n bu(k − n b) (2.11) +1 + e(k) + c 1 e(k − 1) + • • • + cn c e(k − n c ) (2.12) Para el vector de parámetros Θ en este caso tenemos Θ = (a 1 . . . an a b 1 . . . bn b c1 . . . cn c ) T (2.13) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Con C (q −1 ) = 1 + c 1 q −1 + c 2 q −2 + • • • + c n q −n (2.14) La relación de entrada-salida es: A(q −1 )y(k) = B(q −1 )u(k) + C (q −1 )e(k) (2.15) o también (2.16) y entonces (2.17) (2.18) Sección 3. Ecuación de error modelo output (OE) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Los modelos de ecuación de error descritos tiene una función de transferencia que contienen un polinomio en común A(q −1 ) desde el punto de vista físico es mas razonable realizar la parametrización de H(q −1 ) y G(q −1 ) de manera diferente, por ejemplo la relación entre entrada y salida sin perturbación puede ser dada por una ecuación diferencial lineal y(k), la perturbación existe de un ruido blanco aditivo a la salida y se encuentra el siguiente modelo: (2.19) Este es un modelo armax con A(q −1 = C (q −1 ) = F(q −1 ) Modelo Box Jenkins: Una generalización evidente del modelo output error se puede obtener modelando más el error. Como descripción ARMA para estos se tiene la siguiente: (2.20) Sección 4. Modelo General PEM todos los modelos anteriores se obtienen como caso especial de el modelo general cuya estructura es la siguiente: (2.21) En la mayoría de los casos la búsqueda del modelo adecuado se limita a un proceso de tipo iterativo, donde el conocimiento del sistema anterior es fundamental para hallar el modelo nuevo, una vez se hayan encontrado un UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL conjunto de modelos útiles se debe elegir el modelo óptimo que consiga aproximarse al conjunto de datos. Lección 9. Métodos de visión global Son aquellos métodos con los cuales se obtienen modelos a partir de mediciones. Estos modelos son generalmente gráficas (modelos no paramétricos) pero que a partir de estas curvas se pueden encontrar algunos parámetros que determinan las dinámicas del proceso .por ejemplo: el tiempo muerto τ d , la constante de tiempo τ ,coeficiente de amortiguación ζ y las diferentes frecuencias tales como la de corte, resonancia, etc. Sección 1. Respuesta paso Una forma de obtener empíricamente las características dinámicas de un proceso es a través de una respuesta paso, al enviar una señal de paso u(t) como entrada a un proceso se obtiene como salida paso y(t). En cuanto al modelo en sí se puede decir que la mayoría de los procesos industriales responden a los siguientes casos: sistema de primer orden con un retardo puro ver figura (2.1) (3.22) sistema de primer orden con integradores ver figura (2.2) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL (2.23) sistema de 2do orden ver figura (2.3) Figura 2. 24. Respuesta al escalón de un sistema de primer orden con retardo (3.24) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Esta representación, como se muestra, responde a ecuaciones diferenciales que vinculan entrada y salida. Si se desea usar la representación equivalente en ecuaciones en diferencias, como se mostró anteriormente, se obtendría: sistema de primer orden con un retardo puro (3.25) sistema de primer orden con integrador (3.26) sistema de 2do orden UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 25 Respuesta al escalón de un integrador Figura 2. 26 Respuesta de un sistema de 2do orden (3.27) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Esta forma es más conveniente para representar un proceso cuando usamos un computador como elemento de cálculo. Con otra percepción también podemos utilizar la expresión heredada del método de smith que es totalmente equivalente. (3.28) La ganancia en estado estacionario K p se puede obtener facilmente de la razón del valor final en estado estacionario ∆y sobre la amplitud de la entrada ∆u, el tiempo muerto τ d puede ser leído de la curva y(t). La constante de tiempo τ puede ser estimada del tiempo que toma la salida y(t) en alcanzar el 63.2 por ciento del valor final del estado estacionario Sección 2. Técnicas frecuenciales Los sistemas lineales pueden también definirse a partir de la respuesta frecuencial G(j). Mientras que las respuestas transitorias y el análisis de correlación tienen por objetivo estimar la respuesta impulsional, las técnicas frecuenciales tienen por objetivo la estimación directa de la respuesta frecuencial, el cambio a partir de ella se estiman los parámetros de la función de transferencia se abordará en otro tema. Las técnicas que se presentan en este apartado son el análisis de Fourier y el análisis espectral. Análisis de la respuesta frecuencial El análisis de la respuesta frecuencial es un método simple para obtener información acerca de un sistema lineal. Consiste simplemente en describir como se comporta el sistema cuando esta sometido a una entrada senoidal. Al aplicar una señal de entrada definida por: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL u(t) = αsen(ωt) (3.29) la respuesta del sistema puede describirse como: y(t) = |G(jω)|αsen(ωt + φω) + v(t) + transitorio (3.30) Donde φ(ω) = argG(jω) Asumiendo que se puede ignorar el transitorio y considerar solo la respuesta estacionaria, la salida del sistema puede utilizarse directa- mente para determinar G(jω). Observando simplemente la señal de entrada y de salida, se puede calcular la ganancia y el desfase entre ambas señales. La figura (3.4) muestra como evaluar la respuesta a una entrada senoidal. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 27 Evaluación de la respuesta sinusoidal. La ganancia y la fase se obtienen: G(jω) = Cuando el experimento se repite con distintas frecuencias pertenecientes al ancho de banda del sistema, el resultado puede dibujarse en forma de diagrama de Bode. Las ventajas de este método son: Es fácil de utilizar y no se requiere un procesado difícil de los datos. No es necesario hacer ninguna suposición sobre la estructura del modelo, solo considerar que se trata de un modelo lineal. Es fácil concentrar el estudio del proceso en un rango de frecuencias determinado. Los inconvenientes que presenta este método son: Dan como resultado una tabla de datos o un gráfico que no puede ser utilizado directamente en simulación. Son necesario largos periodos de pruebas si se quiere evaluar el valor de G(j) para un gran número de frecuencias. Es muy sensible al ruido presente en el sistema y no da ningún valor medio estadístico. En la mayoría de las veces resulta difícil determinar el valor de desfase entre las señales. Para evitar el problema de las perturbaciones, se puede utilizar el denominado método de correlación para el análisis de la respuesta frecuencial. Tal como se muestra en la figura 2.28, consiste en multiplicar la salida del sistema por una señal seno y una señal coseno de la misma frecuencia que la entrada del sistema y a continuación integrar las señales obtenidas considerando un intervalo especifico de medida T m : (2.31) (2.32) La estimación de la amplitud y de la fase se calcula mediante: (2.33) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL (2.34) Figura 2. 28 Análisis de la respuesta frecuencial con técnicas de correlación Para minimizar el efecto de las perturbaciones, la duración de las medidas T m debe ser siempre un múltiplo del periodo de la señal de test. En el mercado hay equipos que utilizan este método para realizar el análisis frecuencial. El principal inconveniente de este método radica en el hecho de que en la mayoría de procesos industriales no es posible aplicar una señal senos como entrada en operación normal y, al igual que el método anterior, requiere repetir los experimentos para muchas frecuencias, hecho que en muchos casos lo hace inviable. Sección 3. Análisis de Fourier Se dice que una señal, u(t), es de energía finita sí: Caso continuo (2.35) (2.36) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Si la entrada tiene energía finita, es posible determinar la función de transferencia frecuencial utilizando la transformada de Fourier de las señales de entrada y salida: (2.37) En el caso de tener acceso a datos en un intervalo de tiempo finito 0 < t < s , la transformada de Fourier de las señales se determina mediante: (2.38) (2.39) por lo tanto, la estimación de la función de transferencia empírica (ETFE) se determina con la ecuación: (2.40) n el caso en que se disponga de datos muestreados: u(kT ), y(kT ) para k =1 . . . , N se puede utilizar para el cálculo de la transformada de Fourier discreta: (2.41) (2.42) siendo T el periodo de muestreo y N=s/T. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Cuando la frecuencia tiende por valor , para r = 0, . . . N − 1, y N se ajusta a una potencia de dos, es posible utilizar la FFT para estimar los valores de Ys(ω) yUs(ω) . Lección 10. Método de estimación por mínimos cuadrados generalizado (GLS) El método de mínimos cuadrados presenta como principal inconveniente la no- convergencia del algoritmo cuando el ruido presente en el proceso no es blanco. Una posible forma de solucionar el problema es utilizando el método de mínimos cuadrados generalizado el cual es una extensión del método LS [strm 71], [Zhu93]. Al considerar un modelo de tipo: A(q −1 )y(t) = B(q −1 )u(t − nk) + H (q −1 )e(t) (2.43) Sí la función de transferencia discreta del ruido, H(q −1 ), es conocida, el modelo puede transformarse de la forma: (2.44) donde: (2.45) (2.46) Con estas nuevas señales filtradas de la entrada y la salida, el problema podría ser resuelto aplicando el método clásico de LS. Por lo tanto el método GLS puede interpretarse como un problema de estimación de LS aplicando como criterio la generalización del error. El problema que se plantea en la utilización de este método es que la función de transferencia H (q−1) no es UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL conocida. Para solucionar este problema se requiere un proceso iterativo en cuatro etapas el cual consiste en que con el método LS, hacer una primera estimación de los polinomios A(q−1 ) y B(q−1): A(q −1 )y(t) = B(q −1 )u(tnk) + v(t) (2.47) y después analizar el residuo, ε(t), y determinar por ejemplo un modelo AR para aproximar H(q −1 ). En este caso se tiene un modelo denominado ARARX ( ) ( ) 1 1 1 − − = q D q G (2.48) (2.49) La estimación de D(q −1 )requiere otra vez la utilización del método LS Filtrar(blanquear) la entrada y la salida usando el modelo obtenido en la etapa anterior (2.50) (2.51) Hacer una nueva estimación por mínimos cuadrados utilizando las señales filtradas. Este proceso debe repetirse, a partir de la segunda etapa, tantas veces como sea necesario hasta conseguir la convergencia. La convergencia del método se evalúa comprobando que los residuos definidos obtenidos sean blancos. Para ello puede utilizarse el test de auto correlación. Para utilizarse este método deben definirse tanto el orden de la parte determinista como el orden de la parte estocástica. Para simplificar el problema, la mayoría de las veces se considera que son del mismo orden. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL CAPITULO 3. CONTROL DIFUSO Introducción La lógica borrosa es una rama de la inteligencia artificial que se funda en el concepto "Todo es cuestión de grado", lo cual permite manejar información vaga o de difícil especificación si quisiéramos hacer cambiar con esta información el funcionamiento o el estado de un sistema especifico. Es entonces posible con la lógica borrosa gobernar un sistema por medio de reglas de 'sentido común' las cuales se refieren a cantidades indefinidas. Las reglas involucradas en un sistema borroso, pueden ser aprendidas con sistemas adaptativos que aprenden al ' observar ' como operan las personas los dispositivos reales, o estas reglas pueden también ser formuladas por un experto humano. En general la lógica borrosa se aplica tanto a sistemas de control como para modelar cualquier sistema continuo de ingeniería, física, biología o economía La lógica borrosa es entonces definida como un sistema matemático que modela funciones no lineales, que convierte unas entradas en salidas acordes con los planteamientos lógicos que usan el razonamiento aproximado. Se fundamenta en los denominados conjuntos borrosos y un sistema de inferencia borroso basado en reglas de la forma " SI....... ENTONCES...... ", donde los valores lingüísticos de la premisa y el consecuente están definidos por conjuntos borrosos, es así como las reglas siempre convierten un conjunto borroso en otro. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Lección 11. Historia de la lógica borrosa. La lógica borrosa (Fuzzy Logic) ha surgido como una herramienta lucrativa para el control de subsistemas y procesos industriales complejos, así como también para la electrónica de entretenimiento y hogar, sistemas de diagnóstico y otros sistemas expertos. Aunque la lógica borrosa se inventó en Estados Unidos el crecimiento rápido de esta tecnología ha comenzado desde Japón y ahora nuevamente ha alcanzado USA y también Europa. La lógica borrosa es todavía un boom en Japón, el número de cartas patentando aplicaciones aumenta exponencialmente. Principalmente se trata de aplicaciones más bien simples de lógica borrosa. Lo borroso ha llegado a ser una palabra clave para vender. Los artículos electrónicos sin componentes borrosos se están quedando gradualmente desfasados. Como una mordaza, que muestra la popularidad de la lógica borrosa, cada vez es más frecuente un sello con "fuzzy logic" impreso sobre el producto. En Japón la investigación sobre lógica borrosa es apoyada ampliamente con un presupuesto enorme. En Europa y USA se están realizando esfuerzos para alcanzar al tremendo éxito japonés. Por ejemplo, la NASA emplea lógica borrosa para el complejo proceso de maniobras de acoplamiento. La lógica borrosa es básicamente una lógica multievaluada que permite valores intermedios para poder definir evaluaciones convencionales como sí/no, verdadero/falso, negro/blanco, etc. Las nociones como "más bien caliente" o "poco frío" pueden formularse matemáticamente y ser procesados por computadoras. De esta forma se ha realizado un intento de aplicar una forma más humana de pensar en la programación de computadoras. La lógica borrosa se inició en 1965 por Lotfi A. Zadeh, profesor de ciencia de computadoras en la Universidad de California en Berkeley. Parece que la Lógica Borrosa es algo reciente y en lo que se lleva trabajando poco tiempo pero sus orígenes se remontan a los tiempos de los filósofos Aristóteles y Platón. Ellos son los primeros en considerar que las cosas no tienen porqué ser de un cierto tipo o dejar de serlo, sino que hay una escala intermedia enre los dos extremos. Es más son los pioneros en considerar que existían diferentes grados de verdad y falsedad. Por ejemplo, en el caso de los colores, entre el blanco y el negro hay una escala de tonalidades grises. Después de éstos, en el siglo XVIII, David Hume e Immanuel Kant continuaron pensando estas ideas. Ambos concluyeron en que el razonamiento se adquiere gracias a las vivencias a lo largo de nuestra vida. Hume creía en la lógica del sentido común y Kant pensaba que sólo los matemáticos podían proveer UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL definiciones claras y que por lo tanto había principios contradictorios que no tenían solución. Uno de los ejemplos dados por Kant es que, la materia podía ser dividida infinitamente, pero al mismo tiempo no podía ser dividida infinitamente. En conclusión, ambos detectaron algunos principios contradictorios en la Lógica Clásica. A principios del siglo XX, el filósofo y matemático británico Bertrand Russell divulgó la idea de que la lógica produce contradicciones. Realizó un estudio sobre las vaguedades del lenguaje, concluyendo con precisión que la vaguedad es un grado. También en este tiempo Ludwing Wittgenstein, estudió las diferentes acepciones que tiene una misma palabra. Éste llegó a la conclusión de que en el lenguaje una misma palabra expresa modos y maneras diferentes. Figura 2. 29 Jan Likasiewicz En 1920 Jan Lukasiewicz, figura 2.29, desarrolló la primera lógica de vaguedades. Para él los conjuntos tienen un posible grado de pertenencia con valores que oscilan entre 0 y 1, y en este intervalo existen un número infinito de valores. El padre del término "borroso" fue Lofti Asier Zadeh, figura 2.30 cuando en 1965 publicó "Fuzzy Sets" (Conjuntos Difusos). Figura 2. 30 Lofti A. Zadeh Las tesis que propone surgen del estudio de pensadores de distintas disciplinas que como él, tenían una visión de los problemas diferente de la lógica tradicional. La paradoja del conjunto de Bertrand Russell, el principio de incertidumbre de la física cuántica de Werner Heisenberg, la teoría de los conjuntos vagos de Max Black y la aportación de Jan Lukasiewiz, influyeron para que Zadeh publicase el UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL ensayo "Fuzzy Sets" en la revista "Information and Control" y tres años después en 1968, "Fuzzy Algorithm". Al comienzo las ideas publicadas por Zadeh no fueron seguidas por la comunidad científica del momento, pero con el tiempo comenzó a tener seguidores lo que produjo que sus teorías fuesen ampliadas y se asentaran sus conocimientos. La intención de Zadeh era la creación de un formalismo para manejar de forma más eficiente la imprecisión del razonamiento humano. Es en 1971, cuando realiza la publicación de "Quantitative Fuzzy Semantics" en donde aparecen los elementos formales que dan lugar a la metodología de la Lógica Borrosa y de sus aplicaciones tal y como se conocen en la actualidad. A partir de 1973, con la teoría básica de los controladores borrosos de Zadeh, otros investigadores comenzaron a aplicar la Lógica Borrosa a diversos procesos. Se establecen varios grupos de investigación en lógica difusa en algunas pequeñas universidades japonesas; los profesores Terano y Shibata en Tokio y los profesores Tanaka y Asai en Osaka hacen grandes aportaciones tanto al desarrollo de la teoría de la Lógica Borrosa como al estudio de sus aplicaciones. Figura 2. 31 E.H. Mamdani En 1974 Assilian y Mamdani en el Reino Unido desarrollaron el primer controlador difuso diseñado para la máquina de vapor. La implantación real de un controlador de este tipo no fue realizada hasta 1980 por F.L. Smidth & Co. en una planta cementera en Dinamarca. En 1987 Hitachi usa un controlador fuzzy para el control del tren de Sendai, el cual usa uno de los sistemas más novedosos creados por el hombre. Desde entonces, el controlador ha realizado su trabajo correctamente con la consiguiente satisfacción por parte de los usuarios de dicho tren. Es también en este año cuando la empresa Omron desarrolla los primeros UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL controladores difusos comerciales y es que 1987 es considerado como el "fuzzy boom" debido a la gran cantidad de productos basados en Lógica Borrosa que se comercializan. En 1993, Fuji aplica la Lógica Borrosa para el control de inyección química en plantas depuradoras de agua por primera vez en Japón. Ha sido precisamente aquí, en donde más apogeo ha tenido la Lógica Borrosa, creándose estrechas colaboraciones entre el gobierno, las universidades y las industrias, estableciendo proyectos llevados a cabo por el Ministerio de Industria y Comercio (MITI) y la Agencia de Ciencia y Tecnología (STA) en consorcio con el Laboratory for International Fuzzy Engineering Research (LIFE). De forma paralela al desarrollo de las aplicaciones de la lógica difusa, Takagi y Sugeno desarrollan la primera aproximación para construir reglas fuzzy a partir de datos de entrenamiento. Otro factor decisivo para continuar con la investigación de este campo es el interés en las redes neuronales y su semejanza con los sistemas fuzzy. Se buscan relaciones entre las dos técnicas obteniéndose como resultado los sistemas neuro-fuzzy, que usan métodos de aprendizaje basados en redes neuronales para identificar y optimizar sus parámetros. Para finalizar, aparecen los algoritmos genéticos que sumados a las redes neuronales y los sistemas fuzzy son herramientas de trabajo muy potentes en el campo de los sistemas de control. Lección 12. Conjunto borroso La noción más básica de sistemas borrosos es un subconjunto borroso. Ejemplo: En primer lugar consideramos un conjunto X con todos los números reales entre 0 y 10 que nosotros llamado el universo de discurso. Ahora, definimos un subconjunto A de X con todos números reales en el rango entre 5 y 8. A = [5,8] Ahora mostramos el conjunto A por su función característica, es decir esta función asigna un número 1 o 0 al elemento en X, dependiendo de si el elemento está en el subconjunto A o no. Esto conlleva a la figura 2.31. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 32 Subconjunto borroso Se puede interpretar los elementos que han asignado el número 1 como los elementos que están en el conjunto A y los elementos que han asignado el número 0 como los elementos que no están en el conjunto A. Este concepto es suficiente para muchas áreas de aplicación. Pero nosotros podemos encontrar fácilmente situaciones donde carece de flexibilidad. Para comprender este concepto veamos un ejemplo: Se desea describir el conjunto de gente joven. Más formalmente se puede denotar: B = {conjunto de gente joven} Como - en general - la edad comienza en 0, el rango más inferior de este conjunto está claro. El rango superior, por otra parte, es más bien complicado de definir. Como un primer intento colocamos el rango superiora en, digamos, 20 años. Por lo tanto nosotros definimos B como un intervalo denominado: B = [0,20] Ahora la pregunta es: ¿ por qué alguien es en su 20 cumpleaños joven y al día siguiente no? Obviamente, este es un problema estructural, porque si movemos el límite superior del rango desde 20 a un punto arbitrario podemos plantear la misma pregunta. Una manera más natural de construir el conjunto B estaría en suavizar la separación estricta entre el joven y el no joven. Nosotros haremos esto para permitir no solamente la (crispada) decisión "él/ella SI está en el conjunto de gente joven" o "él/ella NO está en el conjunto de gente joven", sino también las frases más flexibles como "él/ella SI pertenece un poquito más al conjunto de gente joven" o "él/ella NO pertenece aproximadamente al conjunto de gente joven". UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Pasamos a continuación a mostrar como un conjunto borroso nos permite definir una noción como "él/ella es un poco joven". Tal y como constatamos en la introducción podemos usar conjuntos borrosos para hacer computadoras más sabias, y ahora tenemos que codificar la idea más formalmente. En nuestro ejemplo primero codificamos todos los elementos del Universo de Discurso con 0 o 1. Una manera de generalizar este concepto está en permitir más valores entre 0 y 1. De hecho, nosotros permitimos infinitas alternativas entre 0 y 1, denominando el intervalo de unidad Yo = [0, 1]. La interpretación de los números ahora asignados a todos los elementos del Universo de Discurso es algo más difícil. Por supuesto, el número 1 asignado a un elemento significa que el elemento está en el conjunto B y 0 significa que el elemento no está definitivamente en el conjunto el B. El resto de valores significan una pertenencia gradual al conjunto B. Para ser más concretos mostramos ahora gráficamente el conjunto de gente joven de forma similar a nuestro primer ejemplo por su función característica. Figura 2. 33 Forma gráfica del conjunto gente joven De esta forma unos 25 años de edad todavía sería joven al grado de 50 por ciento. Ahora sabemos qué es un conjunto borroso. ¿Pero qué se puede hacer con él?. Lección 13. Operaciones con conjuntos borrosos Ahora que se tiene una idea de lo que son conjuntos borrosos, se puede introducir las operaciones básicas sobre conjuntos borrosos. Parecido a las operaciones sobre conjuntos booleanos nosotros también se puede interseccionar, unificar y negar conjuntos borrosos. En su primerísimo artículo sobre conjuntos borrosos, L. A. Zadeh sugirió el operador mínimo para la intersección y el operador máximo para la unión de dos conjuntos borrosos. Es fácil ver que estos operadores UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL coinciden con la unificación booleana, e intersección si únicamente se consideran los grados miembros 0 y 1. A fin de aclarar esto, se muestra varios ejemplos. Sea A un intervalo borroso entre 5 y 8, y B un número borroso entorno a 4. Las figuras correspondientes se muestran a continuación: Figura 2. 34 A Intervalo borroso entre 5 y 8 Figura 2. 35 B número borroso en torno a 4 La figura 2.36 siguiente muestra la operación AND (Y) del conjunto borroso A y el número borroso B (el resultado es la línea azul). UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 36 Operación AND La operación OR (O) del conjunto borroso A con el número borroso B se muestra en la figura 2.37 (nuevamente, es la línea azul). Figura 2. 37 Operación OR La figura 2.38 da un ejemplo para una negación. La línea azul es la NEGACIÓN del conjunto borroso A. Figura 2. 38 Operación negación UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Lección 14. El control borroso Los controladores borrosos son las aplicaciones más importantes de la teoría borrosa. Ellos trabajan de una forma bastante diferente a los controladores convencionales; el conocimiento experto se usa en vez de ecuaciones diferenciales para describir un sistema. Este conocimiento puede expresarse de una manera muy natural, empleando las variables lingüísticas que son descritas mediante conjuntos borrosos. Sección 1. El péndulo invertido El problema está en equilibrar una pértiga sobre una plataforma móvil que puede moverse en dos únicas direcciones, a la izquierda o a la derecha. Ante todo, nosotros tenemos que definir (subjetivamente) cual es la velocidad del anden: alta, baja, etc. Esto se hace para especificar las funciones pertenecientes al conjunto borroso: • negativo alto (celeste) • negativo bajo (verde) • cero (rojo) • positivo bajo (azul) • positivo alto (morado) Figura 2. 39 Funciones pertenecientes al conjunto borroso velocidad Lo mismo se hace para el ángulo entre la plataforma y la pértiga, además de para la velocidad angular de este ángulo: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 40 Funciones pertenecientes al conjunto borroso ángulo Figura 2. 41Funciones pertenecientes al conjunto borroso velocidad angular Apréciese que, para hacerlo más fácil, suponemos que al principio la pértiga está en una posición cercana a la central para que un ángulo mayor de, digamos, 45 grados en cualquier dirección no pueda - por definición - ocurrir. Ahora se da varias reglas que dicen qué hacer en situaciones concretas: Considere por ejemplo que la pértiga está en la posición central (el ángulo es cero) y no se mueve (la velocidad angular es cero). Obviamente esta es la situación deseada, y por lo tanto no tenemos que hacer nada (la velocidad es cero). Consideremos otro caso: el polo está en la posición central como antes, pero está en movimiento a baja velocidad en la dirección positiva. Naturalmente nosotros tendríamos que compensar el movimiento de la pértiga moviendo la plataforma en la misma dirección a baja velocidad. De esta forma hemos constituido dos reglas que pueden ponerse en una forma más formalizada como esta: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Si el ángulo es cero y la velocidad angular es cero entonces la velocidad será cero. Si el ángulo es cero y la velocidad angular es positiva baja entonces la velocidad será positiva baja. Podemos resumir todas las reglas aplicables en una tabla: ángulo velocidad NA NB C PB PA NA NA NB NB C C NA NB C PB PA PB C PB velocidad angular PA PA Tabla 2 1 Tabla de reglas aplicadas donde NA es una (usual) abreviatura para negativa alta, NB para negativa baja, etc. A continuación mostraremos como estas reglas pueden aplicarse con valores concretos para el ángulo y velocidad angular. Para ello vamos a definir dos valores explícitos para el ángulo y la velocidad angular para operar con ellos. Considérese la situación siguiente: Un valor actual para el ángulo: Figura 2. 42 Funciones pertenecientes al ángulo actual Un valor actual para la velocidad angular: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 43 Funciones pertenecientes a velocidad angular actual Ahora se muestra como aplicar nuestras reglas a esta situación real. Observe como aplicar la regla Si el ángulo es cero y la velocidad angular es cero entonces la velocidad será cero a los valores que hemos definido. Esta es la variable lingüística "ángulo" donde nos centramos en el conjunto "cero" y el ángulo actual: Figura 2. 44 Conjunto cero, variable lingüística "ángulo" y ángulo actual Nos damos cuenta que nuestro valor real pertenece al conjunto borroso "cero" en un grado de 0.75: Figura 2. 45 Conjunto borroso “cero” –ángulo de 0.75 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Ahora mostramos la variable lingüística "velocidad angular" donde nos centramos en el conjunto borroso "cero" y el valor actual de velocidad angular: Figura 2. 46 Funciones pertenecientes a velocidad angular actual Nos damos cuenta que nuestro valor real pertenece al conjunto borroso "cero" en un grado de 0.4: Figura 2. 47 Valor real pertenece al conjunto borroso "cero" en un grado de 0.4 Como las dos partes de la condición de nuestra regla están unidas por una Y (operación lógica AND) calculamos el mín(0.75,0.4)=0.4 y cortamos el conjunto borroso "cero" de la variable "velocidad" a este nivel (según nuestra regla): UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 48 Operación lógica AND Por su parte, el resultado de la regla. Si el ángulo es cero y la velocidad angular es negativa baja entonces la velocidad será negativa baja es: Figura 2. 49 Resultado de la regla “negativa baja” El resultado de la regla. Si el ángulo es cero y la velocidad angular es positiva baja entonces la velocidad será positiva baja es: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 50 Resultado de la regla “positiva baja” El resultado de la regla. Si el ángulo es positivo bajo y la velocidad angular es negativa baja entonces la velocidad será cero es: Figura 2. 51Resultado de la regla “velocidad cero” Estas cuatro reglas solapadas desembocan en un resultado único: Figura 2. 52 Resultado de las reglas solapadas UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL El resultado del controlador borroso es un conjunto borroso (de velocidad), así que tenemos que escoger un valor representativo como salida final. Hay varios métodos heurísticos (métodos de claridad o defuzzification), uno de ellos es tomar el centro de gravedad del conjunto borroso: Figura 2. 53 Conjunto borroso de velocidad El procedimiento completo se denomina controlador de Mamdani. Lección 15. Aplicaciones de la lógica borrosa Principalmente, se observará la aptitud del control borroso en términos generales. El empleo del control borroso es recomendable: • Para procesos muy complejos, cuando no hay un modelo matemático simple. • Para procesos altamente no lineales. • Si el procesamiento del (lingüísticamente formulado) conocimiento experto puede ser desempeñado. El empleo del control borroso no es una buena idea si: • El control convencional teóricamente rinde un resultado satisfactorio. • Existe un modelo matemático fácilmente soluble y adecuado. • El problema no es soluble. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Sección 1. Definiciones Intersección de conjuntos Nosotros llamamos un nuevo conjunto generado desde dos conjuntos determinados A y B, intersección de A y B, si el nuevo conjunto contiene exactamente esos elementos que están contenidos en A y en B. Unificación de conjuntos Nosotros llamamos un nuevo conjunto generado desde dos conjuntos determinados A y B, unificación de A y B, si el nuevo conjunto contiene todos los elementos que se contienen en A o en B o en ambos. Negación de conjuntos Nosotros denominamos al nuevo conjunto que conteniendo todos los elementos que están en el universo de discurso pero no en el conjunto A la negación de A. Variables lingüísticas Un variable lingüística es un quíntuple (X,T(X),U,G,M,), donde X es el nombre de la variable, T(X) es el término conjunto (es decir, el conjunto de nombres de valores lingüísticos de X), U es el universo de discurso, G es la gramática para generar los nombres y M es un conjunto de reglas semánticas para asociar cada X con su significado. Sección 2. Otras aplicaciones de la Lógica Borrosa La Lógica Borrosa tiene gran utilidad ya que ella nos permite tratar problemas demasiado complejos, mal definidos o para los cuales no existen modelos matemáticos precisos. Gracias a este tipo de lógica se ha permitido modelizar y resolver situaciones consideradas intratables desde el punto de vista de la Lógica Clásica. En los últimos años la Lógica Borrosa se ha utilizado en distintos tipos de instrumentos, máquinas y en diversos ámbitos de la vida cotidiana. Algunos casos por ejemplo son los estabilizadores de imágenes en grabadoras de vídeo, controladores de ascensores e ingeniería de terremotos. También se ha usado esta técnica en la industria, obteniéndose excelentes resultados como en el caso del metro de Sendai en Japón, ya que permitía que el metro arrancara y frenara con gran suavidad, sin producir alteraciones entre los pasajeros. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Realizando una división de los ejemplos en tres grandes grupos tenemos: • Productos creados para el consumidor: Lavadoras difusas (Matsuhita Electronic Industrial), hornos microondas, sistemas térmicos, traductores lingüísticos, cámaras de vídeo, televisores, estabilizadores de imágenes digitales (Matsuhita) y sistemas de foco automático en cámaras fotográficas. • Sistemas: Elevadores, trenes, automóviles (caso de los sistemas de transmisiones, de frenos y mejora de la eficiencia del uso de combustible en motores), controles de tráfico, sistemas de control de acondicionadores de aire que evitan las oscilaciones de temperatura y sistemas de reconocimiento de escritura. • Software: Diagnóstico médico, seguridad, comprensión de datos, tecnología informática y bases de datos difusas para almacenar y consultar información imprecisa (uso del lenguaje FSQL). A continuación se muestran aplicaciones en las que se pueden consultar a través de la página web algunas de las características, uso y una información más detallada: 1. Gestión de recursos humanos mediante Lógica Borrosa. http://www.uv.es/asepuma/recta/ordinarios/6/6-2.pdf 2. Módulo hardware mediante lógica difusa. http://www.tq.com/product/cart/pdfs_spanish/CE124%20Spanish.PDF 3. Algoritmo de control borroso usando el dispositivo MSP430x14x. http://focus.ti.com/lit/an/slaa235/slaa235.pdf 4. Sistema experto para evaluar daños postsísmicos en edificios. http://dspace.uniandes.edu.co:5050/dspace/bitstream/1992/413/1/mi_798.p df 5. Determinación de las IBNR mediante lógica difusa. http://www.actuarios.org/espa/anales/2003/De%20Andres%202003.pdf 6. Evaluación de lógica difusa en el control de máquinas eléctricas. http://dei-s1.dei.uminho.pt/pessoas/jaime/Documentos/CIT.pdf 7. Control de un generador de inducción como un freno eléctrico. http://www.ijesp.com/Vol2No1/IJESP2-8Hosseinzadeh.pdf 8. Modelización de magulladuras por disparos en armaduras con un sistema adaptativo de sistema difuso. http://sipi.usc.edu/~kosko/SMCFinal.D05.pdf 9. Razonamiento para el estudio de la probabilidad de eventos borrosos http://delivery.acm.org 10. Diseño de bases de datos difusa modelada con UML. http://www.inf.udec.cl/~mvaras/papers/2003/fuzzy-IDEAS-2003.pdf 11. Xfuzzy 3.0, entorno de desarrollo para sistemas de Lógica Borrosa. http://www.imse.cnm.es/Xfuzzy/Xfuzzy_3.0/index.html UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL 12. Software para diagnóstico médico. http://espejos.unesco.org.uy/simplac2002/Ponencias/Inforedu Sección 3. Ejemplo A continuación se muestra una interfaz que está en desarrollo realizada mediante Lógica Borrosa, EDIMED. EDIMED es una herramienta software para la realización de diagnósticos médicos, el cual puede formar parte del aprendizaje y evaluación de los estudiantes de Medicina. El estudiante selecciona el tipo de enfermedad y dependiendo de los síntomas que el sistema tenga registrados más los síntomas que el paciente de dicho alumno le exponga, el sistema debería dar un diagnóstico apropiado según el tipo de enfermedad del paciente. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 2. 54 Herramienta EDIMED Fuentes Documentales de la Unidad 2 • Sánchez Instrumentación y control avanzado de procesos Ediciones Díaz Santos 2006. • D.C. Evans, D. Rees, D.L. Jones. Design of test signals for identification of linear systems with nonlinear distortion. IEEE Trans. on Instrumentation and Measurement, 16, 6, p. 768-774, 1992. • Édgar Manuel Robayo Espinel. Control difuso. Fundamentos y aplicaciones. Universidad del Norte (Ediciones Uninorte). 2007. • Freeman James, David M Skapura , Redes Neuronales - Algoritmos, aplicaciones y Técnicas Addison -Wesley 1993 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • Golberg David Genetic Algorithms in search, optimization and machine learning.Addison-Wesley 1989 • H.Rake. Step response and frequency response methods, Academic Press, 1994. • Haupt Randy and Haupt Sue , Practical Genetic Algorithms John Wiley and Son 1998. • Haykin Simon, , Neural Networks a Comprehensive Foundation. Prentice Hall 1999 • Hilera J, Martínez V. , Redes Neuronales. Fundamentos, Modelos y Aplicaciones. Addison-Wesley 1995 • Jang R, Sun C, Mizutani E. , Neuro-Fuzzu and Soft Computing. Prentice Hall 1997 • K.J. Åström and P. Eykhoff. System Identification – A Survey. Automatica, Vol. 7 pp. 123-162. Pergamon Press, 1971. Great Britain. • Kosko, Bart , Neural Networks and Fuzzy Systems. Prentice-Hall International Editions, 1992. • K.H. Fasol, H.P. Jorgl. Principles of models building and identification, Automatica, 16, p.501-518, 1980 • K.R. Godfrey. Correlation methods. Automatic, 16, p. 527-534, 1980 • K. Ogata. Discrete-time Control Systems. Prentice-Hall International Editions, United States. • I.D. Landau. System identification and control design, Prentice Hall, 1990. • L.Ljung. System identification – Theory for the user, Prentice Hall, 1987. • L.Ljung and T.Glad. Modelling of dynamic system, Prentice Hall, 1994. • Lewis M. Gordon., Feedback control modes. Chemical Engineering, Septiembre 19, 1983 • Máquinas con rostro humano Los hombres están enseñando a los robots a pensar. ¿Cómo? Con la lógica borrosa. http://www.elpais.com/articulo/sociedad/Maquinas/rostro/humano/elpepusoc /20080921elpepisoc_1/Tes Página Web consultada el 15 de julio de 2009 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • Norgard M., Ravn O., Pulsen N., Hansen L. , Neural Networks for Modelling and Control of Dynamic Systems Springer 2000. • R. Iserman. Practical aspects of process identification, Automatica, 16, p.575-587, 1980 • R. Johansson. System modeling and identification. Prentice Hall, 1993 • Passino Kevin , Fuzzy control. Addison-Wesley 1998. • T. Söderström, P. Stoica. System identification, Prentice Hall, 1989. • Tore H. Agglund. Process control in practice Chartwell/Bratt, 1991 • Tutorial de lógica borrosa. Universidad Politécnica de Madrid. http://www.dma.fi.upm.es/java/fuzzy/tutfuzzy/, Página Web consultada el 13 de julio de 2009. • Y. Zhu, T. Backx. Identification of multivariable industrial processes – for simulation, diagnosis and control, Springer-Verlag, 1993. UNIDAD 3 Nombre de la Unidad Técnicas avanzadas de control II Introducción Se finaliza el curso con algunas técnicas consideras avanzadas como el control adaptativo, las redes neuronales ratifícales y el control predictivo, comprendiendo que es un abre bocas para los futuros ingenieros que desean profundizar en el campo del control inteligente, creando expectativas futuras inmediatas para incursionar en este campo del control inteligente. Relacionar los métodos de aprendizaje conexionista con la teoría existente es muy importante para aquellos UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Justificación interesados en elementos de control con aprendizaje y adaptivos, ya que la teoría de control es un campo ampliamente desarrollado con mucha literatura, donde muchos de los métodos de aprendizaje están muy relacionados con métodos clásicos bien estructurados por los teóricos del control adaptivo y predictivo. Por otro lado, dada la tendencia que los futuros profesionales de la ingeniería están tomando para el desarrollo ya aplicación de estos métodos de control avanzado por lo que se desarrollarán estas líneas con un enfoque basado en el estudio de un caso, junto con el cual se presentarán la mayoría de las funciones de los temas, evitando toda vez que sea posible la rigurosidad de planteos de la lógica formal en su concepción genérica. Intencionalidades Formativas Se busca que los estudiantes comprendan algunas técnicas avanzados de control inteligente, como el control basado en redes neuronales ratifícales, entre otras. Denominación de capítulos • Capitulo 3.1 Control adaptivo • Capitulo 3.2 Redes neuronales artificiales • Capitulo 3.3 Control predictivo UNIDAD 3. TÉCNICAS AVANZADAS DE CONTROL II UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL CAPITULO 1. CONTROL ADAPTATIVO Introducción Las primeras aproximaciones al control adaptivo llegaron a mediados del siglo pasado sin embargo el grado de complejidad y el nivel de organización interno requeridos no se podrían conseguir con las herramientas del momento y fue necesario esperar al desarrollo computacional para poder realizar modelos y formular teorías acerca del mismo. Fundamentalmente el control adaptivo se entiende como un sistema que pretende obtener las características deseadas de un sistema de referencia dado. También se puede visualizar como un regulador no-lineal de naturaleza autosintonizable. Lección 1. Sistemas de control adaptativo Un sistema de control adaptivo es aquel que continua y automáticamente mide las características dinámicas de la planta, las compara con las características deseadas y usa la diferencia para variar parámetros ajustables del sistema o para generar una señal de accionamiento de modo que se pueda mantener el funcionamiento óptimo con independencia de las variaciones ambientales; alternativamente este sistema puede medir su propio funcionamiento de acuerdo con un índice de comportamiento dado y modificar de ser necesario sus propios parámetros para mantener el funcionamiento óptimo con independencia de los cambios ambientales. El comportamiento óptimo de un sistema se logra encontrando la condición para la cual un sistema determinado funciona de la mejor forma posible, en control adaptivo esto se define por medio del índice de comportamiento que justamente es el que da al sistema, el comportamiento óptimo. El índice de comportamiento indica el máximo o el mínimo del comportamiento óptimo del sistema por lo que sí su valor es cero se puede utilizar como una señal de error del adaptivo. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL La reducción de costos de funcionamiento es un parámetro muy utilizado a la hora de la determinación del índice de comportamiento, sin embargo también se toman en cuenta otras condiciones como la confiabilidad, la aplicabilidad y la selectividad. Como ya se ha mencionado el control adaptivo pretende dar un funcionamiento óptimo a la planta, sin embargo, en muchas ocasiones el conocimiento que se tiene de las características de la misma es muy escaso, por lo que realizar solamente una identificación inicial puede no ser suficiente. En estos casos la determinación del máximo o mínimo del índice de comportamiento se debe realizar periódicamente con un intervalo de tiempo que tome en cuenta la velocidad con que se modifican los parámetros del sistema. Figura 3. 1 Sistema con control adaptativo En la figura 3.1 se puede identificar la planta y se observa como el índice de comportamiento es medido varias veces y su valor es comparado con el que se obtiene del controlador para finalmente tomar la decisión de cambiar o no la señal accionadora. Con fines explicativos, el proceso de un controlador adaptativo puede verse separando dos escalas de tiempo que evolucionan a diferente velocidad. Los cambios en los parámetros del controlador ocurren según la escala lenta. A su vez, la dinámica del lazo ordinario de realimentación transcurre según la escala rápida. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Existen dos grandes grupos de controladores adaptivos, los Controladores Adaptivos con Modelo de Referencia (MRAC) y los Reguladores Autoajustables (STR). Estos últimos son sistemas de lazo abierto y modifican los parámetros del sistema a partir de una tabla previamente calculada para distintos puntos de funcionamiento, en función de una variable auxiliar. Los MRAC por su parte, logran un comportamiento de lazo cerrado dado por un modelo de referencia ante una entrada dada. Son tres las partes principales que se distinguen en sistema de control adaptivo: Sección 1. Identificación de las características dinámicas de la planta La identificación de las características dinámicas de la planta se debe realizar sin afectar el funcionamiento normal de la planta, en forma periódica y con el fin de analizar en cada resultado la respuesta del sistema. Una forma de realizar esta identificación es aplicando una señal a la planta, la cual puede ser sus entradas normales ya que estas no pueden producir salidas no deseadas o resultados confusos, pero hay que tener en cuenta que esta señal debe contar con características adecuadas de ancho de banda, amplitud, etc., para obtener una correcta identificación. El tiempo en que tarda la identificación no debe ser muy grande ya que pueden cambiar los parámetros de la planta en el transcurso de una identificación por lo que se hace imposible conocer totalmente el comportamiento de la planta. Si ya son conocidos los parámetros de la planta, solamente es necesario obtener el índice de comportamiento, que indica que parámetros deben ser variados, para tener la identificación completa. Existen sistemas en los que la adaptividad depende únicamente del índice de comportamiento a estos sistemas se les conoce como optimizantes. Sección 2. Toma de decisión basada en la identificación de la planta Luego de haber realizado la identificación completa de la planta se debe comparar los resultados obtenidos con los óptimos, que indican el comportamiento que debe UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL seguir la planta, para tomar la decisión de cuales parámetros deben modificarse y la forma en que se deben cambiar. Sección 3. Modificación basada en la decisión hecha Con la toma de la decisión se deben cambiar algunos parámetros para modificar el funcionamiento de la planta entre ellos se encuentra la señal de entrada que puede ser cambiada ajustando los parámetros del controlador para así compensar las variaciones de la planta (modificación de parámetro del control), o bien, sintetizando la señal de control óptima que se basa en la función de transferencia, el índice de comportamiento y la respuesta transitoria deseada (síntesis de la señal de control) Dada la complejidad en el desarrollo matemático de este tipo de controladores es indispensable analizar cada proceso detalladamente antes de decidir si es necesario implementar un controlador adaptativo. Debe aplicarse el control adaptivo solamente cuando resulta ineficiente un controlador fijo. Este caso generalmente se presenta cuando se trabaja con sistemas no lineales en los que es necesario ajustar varios parámetros. Cuando se tratan sistemas lineales que tienen parámetros constantes, es comúnmente cuando resulta eficiente un controlador convencional. Se tienen un buen control cuando se regulan procesos en un punto fijo de operación y con perturbaciones pequeñas. Por lo tanto, si se quiere regular un sistema con un punto de funcionamiento cambiante, resulta práctica la aplicación de un controlador adaptativo. No es inmediato que se logra ver cuál es el tipo de controlador que se requiere, comúnmente, esta decisión se toma estudiando cada aplicación específica. La ventaja que se tiene esta técnica es que, a pesar de que es bastante compleja, un mismo diseño puede ser utilizado en diferentes aplicaciones. Entonces el costo en el desarrollo del controlador se divide entre las bastas aplicaciones que puede llegar a tener. Un ejemplo en el que resulta útil la aplicación del controlador adaptivo es cuando se trabaja con actuadores no lineales que generalmente se linealizan en torno a un punto de operación estacionario. En estos casos se observa mediante simulaciones que el sistema funciona bien solo en un punto de funcionamiento y que opera pobremente en los demás. Una vez tomada la decisión de que debe usarse un controlador adaptativo se decide entre utilizar, el controlador ajustable UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL por tabla o el controlador auto-ajustable. El primero se emplea si la variación de los parámetros es conocida, el auto-ajustable se aplica en sistemas que presentan partes con variaciones que no se conocen o que no se pueden medir. Lección 2. Controladores adaptativos con modelo de referencia (MRAC) Los sistemas adaptativos con modelo de referencia fueron diseñados primeramente para sistemas continuos por minimización de un índice de actuación, siendo dicho índice la integral del error al cuadrado (Hang 1973). Esta regla de diseño fue propuesta por Whitaker del MIT (1958), Instrumentation Laboratory, denominándose por ello como la regla del MIT. En cuanto a las configuraciones posibles con modelo de referencia, la más usual es utilizar un modelo paralelo ver figura aunque son posibles otras configuraciones (Landau 1974, 1981), como modelo serie, serie-paralelo, etc. Figura 3. 2 Sistema con mecanismo de adaptación UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL En la figura 3.2 puede verse un controlador primario que se utiliza para obtener el comportamiento en bucle cerrado (como en cualquier esquema de control convencional). Por otro lado como los parámetros del proceso pueden ser desconocidos y variables, es difícil encontrar un controlador que responda en todas las situaciones. En la técnica (MRAC), la respuesta deseada a una señal de entrada del proceso se especifica como un modelo de referencia. El mecanismo de adaptación mira la salida y p del proceso y la salida y m del modelo de referencia y calcula los parámetros adecuados de forma que la diferencia tienda a cero. El mecanismo de adaptación puede utilizar, si están disponibles, además de las señales de salida del proceso y del modelo de referencia (y p , y m ), las señales de entrada, de referencia y las variables de estado del proceso. Una de las partes más importantes en control adaptativo es el diseño de la ley de control. La primera ley de control adaptativo hace a uso de los modelos de sensibilidad y más tarde de la teoría de estabilidad de Lyapunov y de la teoría de hiperestabilidad de Popov. Estas últimas garantizan la estabilidad del conjunto del sistema, lo que las hace particularmente interesantes, convirtiéndose en métodos de diseño estándar. Diseño de controladores adaptativos: Como se ha visto en la sección anterior, un sistema de control adaptativo básicamente esta formado por tres partes: un controlador primario, un modelo de referencia y la ley de adaptación. Por lo tanto para el diseño de un sistema de control adaptativo, será necesario definir las tres partes. Dado que la parte que caracteriza al control adaptativo es la ley de adaptación, en lo que sigue, nos centraremos fundamentalmente en esta parte. -Controlador Primario: El controlador primario puede tener en principio cualquiera de las configuraciones conocidas para el diseño de controladores lineales. Sin embargo, debe cumplir la condición de que sea posible que el conjunto del proceso y el controlador puedan reproducir al modelo de referencia. Este requisito, supone restricciones sobre el orden y la estructura del controlador. Por otro lado para que pueda aplicarse una adaptación directa, la señal de control debe ser una función lineal de los parámetros. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL -Modelo de referencia: El modelo de referencia, que especifica el comportamiento deseado en lazo cerrado, se da usualmente en forma paramétrica. La condición mencionada anteriormente para el seguimiento del modelo de referencia, también condiciona en ciertos aspectos el modelo de referencia posible, en cuanto al orden relativo del proceso (exceso de polos). Por otro lado el modelo elegido debe ser sensible a la dinámica del proceso, ya que si por ejemplo se elige un modelo con una dinámica muy rápida, la señal de control será muy grande causando saturaciones y no pudiendo el sistema responder a dicha dinámica. Por ello la elección del modelo de referencia no es fácil, eligiéndose normalmente un modelo conservador. Enfoque de sensibilidad: Este método esta basado en el uso de los modelos de sensibilidad para adaptar los parámetros en la dirección correcta. La deducción de este método comienza con el planteamiento de un índice de actuación, normalmente cuadrático: (1.1) En esta ecuación e 1 = y p − y m y el índice J se evalúa sobre el periodo T fijo, en el cual los parámetros permanecen constantes. En el instante (t+T) los parámetros son ajustados en la dirección decreciente de J. (1.2) Γ debe ser una matriz cuadrada definida positiva, que representa la ganancia de adaptaci´on. Usualmente es diagonal. Teniendo en cuenta que: (1.3) Sustituyendo tenemos: (1.4) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Que en el límite para T → 0 da la ley de adaptación: (1.5) El factor ∂y p /∂θ representa la sensibilidad de la salida del proceso a las variaciones en, y puede ser generado por un modelo de sensibilidad. Como puede observarse esta ley de adaptación es denominada como la regla del MIT. El modelo de sensibilidad anterior se sustituye por la sensibilidad del modelo de referencia, dado que normalmente el modelo del proceso se desconoce. Esta suposición se hace en base a que pasado un tiempo la respuesta del sistema converge a la respuesta del modelo de referencia. La principal desventaja de este método, es la ausencia de un criterio que garantice la estabilidad del sistema de control. El sistema puede hacerse inestable si el modelo de referencia no se escoge adecuadamente o si la ganancia de adaptación se elige demasiado grande. Lección 3. Método de Lyapunov Dado el carácter no lineal y variable en el tiempo de los sistemas adaptativos por modelo de referencia MRAC, no son validos los criterios de estabilidad de sistemas lineales. Un método bien conocido es el método directo de Lyapunov. Este método establece que un sistema tiene un equilibrio x = 0, asintóticamente estable, si existe una función, llamada de Lyapunov, V (x) que satisface: V (x) > 0 para x ≠ 0 definida positiva V (x) < 0 para x ≠ 0 definida negativa V (x) → ∞ para ║║x ║║→ ∞ V (0) = 0 Como la función de Lyapunov es similar a una función de energía, esta debe decrecer con el tiempo. Utilizando este método en el diseño de sistemas adaptativos, se trasladan las especificaciones de estabilidad directamente en la ley de adaptación, siguiendo los pasos: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL 1. El primer paso es encontrar la ecuación de error, bien en la salida (yp − ym) o en las variables de estado (x p − x m ). 2. Encontrar una función de Lyapunov como una función del error entre las señales y del error en los parámetros . En su forma mas simple esta función toma la forma: (1.6) Donde las matrices P y Γ−1 deben ser definidas positivas. 3. Calcular la derivada de la función de Lyapunov. La derivada debe ser definida negativa. Generalmente toma la forma: (1.7) El primer término garantiza que la derivada es definida negativa, por lo que, haciendo el resto igual a cero se tiene una posible solución. La matriz Q es definida positiva. Las matrices P y Q, para un sistema gobernado por una matriz A, están relacionadas por la ecuación de Lyapunov: −Q = A T P + P A (1.8) 4. Haciendo el termino extra igual a cero se obtiene la ley de adaptación. Normalmente tiene la forma: (1.9) ε esta directamente relacionado con el error e y ξ es una versión modificada del vector de señales (referencia, salida, etc). Ejemplo realizado de un sistema de primer orden UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 3 Sistema de primer orden Considerando el sistema de la figura 3.3, donde la señal de control esta dada por: u = Kr (1.10) siendo K, la ganancia ajustable que hay que calcular, la deducción de la ley de adaptación es como sigue: (1.11) (5.12) (1.13) Teniendo en cuenta que el término (bK −1) es proporcional al error en el parámetro, a función de Lyapunov en este caso puede elegirse como: (1.14) Su derivada resulta ser: (1.15) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL (1.16) (1.17) El primer término es negativo. Así que haciendo el resto igual a cero se obtiene la ley de adaptación: (1.18) (1.19) En esta ley de adaptación el parámetro libre es , siendo necesario conocer el signo de b para fijar el de . En las figuras (1.4) y (1.5) se representa una simulación del ejemplo descrito cuando el parámetro b vale inicialmente 4 y en el instante 20 pasa a valer 2. Puede observarse como la adaptación es buena en ambos casos, siendo más rápida en el caso de la figura (1.4), dado que la ganancia de adaptación es superior. En línea a trazos se representa la salida del modelo de referencia y en línea continua la salida del modelo ajustable. La principal desventaja del método de Lyapunov es que no es un método sistemático, dado que hay que encontrar la función de Lyapunov V adecuada en cada caso. Lección 4. Método de hiperestabilidad UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Con este método también se consigue una ley de adaptación estable. Como en el método de Lyapunov, en primer lugar se formulan las ecuaciones de error. Estas ecuaciones se dividen en una parte lineal invariable con el tiempo y otra no lineal y variable con el tiempo. La primera parte contiene usualmente al modelo de referencia y su salida es la señal de error que es utilizada para la ley de adaptación. La segunda parte contiene la ley de adaptación y su salida negada es la entrada a la parte lineal. La teoría de hiperestabilidad garantiza la estabilidad asintótica si ambas partes (lineal y no lineal), satisfacen las condiciones de pasividad (Landau 1979): 1. La parte lineal (llámese G(s)), debe ser estrictamente positiva. Ello significa que: (a) G(s) debe ser real si s es real. (b) los polos de G(s) deben tener parte real negativa, y (c) la parte real de G(jω) de ser mayor que cero para 1 < ω < 1. 2. La parte no lineal debe cumplir la desigualdad de Popov. (1.20) Siendo v el vector de entrada y ω el vector de salida de la parte no lineal, y una constante finita positiva que no depende de t. Lección 5. Estructura general de los sistemas adaptativos (MRAC) Considerando de nuevo el esquema paralelo , pueden considerarse dos posibles formas de descripción: mediante variables de estado o bien UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL entrada-salida. Considerando la primera de ellas, puede escogerse el modelo de referencia como el conjunto de ecuaciones lineales: (1.21) donde x es el vector de estado y u es el vector de entrada. Este modelo se supone estable y completamente controlable. En cuanto al modelo ajustable (planta más controlador), puede utilizarse la siguiente representación: Figura 3. 4 Simulación proceso de primer orden γ1=0.1 (1.22) El vector de error generalizado viene dado por: e = x − y (1.23) El objetivo de diseño, en el caso parámetrico, es encontrar la ley de adaptación UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL tal que las matrices de parámetros A S (e, t) y B S (e, t) sean modificadas de forma que el error tienda a cero para cualquier entrada u. La derivada del error puede obtenerse restando las ecuaciones anteriores, donde además se suma y resta el termino A My : (1.24) pudiéndose expresar como: Figura 3. 5 Simulación proceso de primer orden γ1=0.5 (1.25) Si se desea que el mecanismo de adaptación tenga memoria (lo cual es lo más habitual), debe considerarse la inclusión de un integrador en el mecanismo de adaptación. Esto tendrá el efecto de que los parámetros ajustables dependerán no solo del error en un instante sino también de los valores pasados. Por ello la ley de adaptación se define como: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL (1.26) (1.27) Las ecuaciones anteriores pueden representarse según la figura 3.4, sistema que se puede descomponer en un sistema lineal y otro no lineal, al cual se le pueden aplicar el criterio de Popov de estabilidad (o criterio de hiperestabilidad). Figura 3. 6 Representación equivalente del modelo de error Para conseguir cumplir dicho criterio, por un lado la parte lineal se modifica añadiéndole un termino D en serie. En cuanto a las funciones F y G, caben muchas posibilidades de elección, pero teniendo en cuenta que deseamos que el error en régimen permanente sea cero, pueden elegirse de la forma: (1.28) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL (1.29) La estructura final del sistema ser a la representada en la figura (3.6) donde los parámetros de diseño serían las funciones D,Φ1 ,Φ2 ,Ψ1 y Ψ2. La resolución se realiza para cada caso concreto y no de forma general, ya que el caso general resulta bastante complicado. Figura 3. 7 Sistema adaptativo por modelo de referencia paralelo UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL CAPITULO 2. REDES NEURONALES ARTIFICIALES Introducción Resulta irónico pensar que máquinas de cómputo capaces de realizar 100 millones de operaciones en coma flotante por segundo, no sean capaces de entender el significado de las formas visuales o de distinguir entre distintas clases de objetos. Los sistemas de computación secuencial, son exitosos en la resolución de problemas matemáticos o científicos, en la creación, manipulación y mantenimiento de bases de datos, en comunicaciones electrónicas, en el procesamiento de textos, gráficos y auto edición, incluso en funciones de control de electrodomésticos, haciéndolos más eficientes y fáciles de usar, pero definitivamente tienen una gran incapacidad para interpretar el mundo. Esta dificultad de los sistemas de computo que trabajan bajo la filosofía de los sistemas secuenciales, desarrollados por Von Neuman, ha hecho que un gran número de investigadores centre su atención en el desarrollo de nuevos sistemas de tratamiento de la información, que permitan solucionar problemas cotidianos, tal como lo hace el cerebro humano; este órgano biológico cuenta con varias características deseables para cualquier sistema de procesamiento digital, tales como: 1. Es robusto y tolerante a fallas, diariamente mueren neuronas sin afectar su desempeño. 2. Es flexible, se ajusta a nuevos ambientes por aprendizaje, no hay que programarlo. 3. Puede manejar información difusa, con ruido o inconsistente. 4. Es altamente paralelo 5. Es pequeño, compacto y consume poca energía. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Lección 6. Funcionamiento de una neurona biológica. El cerebro humano constituye una computadora muy notable, es capaz de interpretar información imprecisa suministrada por los sentidos a un ritmo increíblemente veloz. Logra discernir un susurro en una sala ruidosa, un rostro en un callejon mal iluminado y leer entre líneas un discurso; lo más impresionante de todo, es que el cerebro aprende sin instrucciones explícitas de ninguna clase, a crear las representaciones internas que hacen posibles estas habilidades. Basados en la eficiencia de los procesos llevados a cabo por el cerebro, e inspirados en su funcionamiento, varios investigadores han desarrollado desde hace más de 30 años la teoría de las Redes Neuronales Artificiales (RNA), las cuales emulan las redes neuronales biológicas, y que se han utilizado para aprender estrategias de solución basadas en ejemplos de comportamiento típico de patrones; estos sistemas no requieren que la tarea a ejecutar se programe, ellos generalizan y aprenden de la experiencia. Sección 1. Teoría de las RNAs La teoría de las RNA ha brindado una alternativa a la computación clásica, para aquellos problemas, en los cuales los métodos tradicionales no han entregado resultados muy convincentes, o poco convenientes. Las aplicaciones más exitosas de las RNA son: • Procesamiento de imágenes y de voz • Reconocimiento de patrones • Planeamiento • Interfaces adaptivas para sistemas Hombre/máquina • Predicción • Control y optimización • Filtrado de señales Los sistemas de computo tradicional procesan la información en forma secuencial; un computador serial consiste por lo general de un solo procesador que puede manipular instrucciones y datos que se localizan en la memoria, el procesador lee, y ejecuta una a una las instrucciones en la memoria; este sistema serial es secuencial, todo sucede en una sola secuencia determinística de operaciones. Las RNA no ejecutan instrucciones, responden en paralelo a las entradas que se les presenta. El resultado no se almacena en una posición de memoria, este es el estado de la red para el cual se logra equilibrio. El conocimiento de una red neuronal no se almacena en instrucciones, el poder de la red está en su topología y en los valores de las conexiones (pesos) entre neuronas. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Las RNA son una teoría que aún esta en proceso de desarrollo, su verdadera potencialidad no se ha alcanzado todavía; aunque los investigadores han desarrollado potentes algoritmos de aprendizaje de gran valor práctico, las representaciones y procedimientos de que se sirve el cerebro, son aún desconocidas. Tarde o temprano los estudios computacionales del aprendizaje con RNA acabarán por converger a los métodos descubiertos por evolución, cuando eso suceda, muchos datos empíricos concernientes al cerebro comenzarán súbitamente a adquirir sentido y se tornarán factibles muchas aplicaciones desconocidas de las redes neuronales. Sección 2. Neurona biológica El cerebro consta de un gran número (aproximadamente 10 11 ) de elementos altamente interconectados (aproximadamente 10 4 conexiones por elemento), llamados neuronas. Estas neuronas tienen tres componentes principales, las dendritas, el cuerpo de la célula o soma, y el axón. Las dendritas, son el árbol receptor de la red, son como fibras nerviosas que cargan de señales eléctricas el cuerpo de la célula. El cuerpo de la célula, realiza la suma de esas señales de entrada. El axón es una fibra larga que lleva la señal desde el cuerpo de la célula hacia otras neuronas. El punto de contacto entre un axón de una célula y una dendrita de otra célula es llamado sinápsis, la longitud de la sinápsis es determinada por la complejidad del proceso químico que estabiliza la función de la red neuronal. Un esquema simplificado de la interconexión de dos neuronas biológicas se observa en la figura 3.7 Figura 3. 8 Neuronas Biológicas UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Algunas de las estructuras neuronales son determinadas en el nacimiento, otra parte es desarrollada a través del aprendizaje, proceso en que nuevas conexiones neuronales son realizadas y otras se pierden por completo. El desarrollo neurológico se hace crítico durante los primeros años de vida, por ejemplo está demostrado que si a un cachorro de gato, se le impide usar uno de sus ojos durante un periodo corto de tiempo, el nunca desarrollara una visión normal en ese ojo. Las estructuras neuronales continúan cambiando durante toda la vida, estos cambios consisten en el refuerzo o debilitamiento de las uniones sinápticas; por ejemplo se cree que nuevas memorias son formadas por la modificación de esta intensidad entre sinápsis, así el proceso de recordar el rostro de un nuevo amigo, consiste en alterar varias sinápsis. Como consecuencia de los primeros estudios sobre la base neural de los sistemas mnémicos (relacionados con la memoria), se creía que el almacenamiento de la memoria asociativa, tanto implícita como explícita, requerían de un circuito neuronal muy complejo. Entre quienes comenzaron a oponerse a este enfoque se hallaba Donald O. Hebb, profesor de la universidad de Milner; Hebb sugirió que el aprendizaje asociativo podría ser producido por un mecanismo celular sencillo y propuso que las asociaciones podrían formarse por una actividad neuronal coincidente: "Cuando un axón de la célula A excita la célula B y participa en su activación, se produce algún proceso de desarrollo o cambio metabólico en una o en ambas células, de suerte que la eficacia de A, como célula excitadora de B, se intensifica". Según la regla Hebbiana de aprendizaje, el que coincida la actividad de las neuronas presinápticas (suministran el impulso de entrada) con la de las postsinápticas (reciben el impulso) es muy importante para que se refuerce la conexión entre ellas, este mecanismo es llamado pre-postasociativo, del cual puede observarse un ejemplo en la figura 3.8. Figura 3. 9 Cambios asociativos de las fuerzas sinápticas durante el aprendizaje UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Todas las neuronas conducen la información de forma similar, esta viaja a lo largo de axones en breves impulsos eléctricos, denominados potenciales de acción; los potenciales de acción que alcanzan una amplitud máxima de unos 100 mV y duran 1 ms, son resultado del desplazamiento a través de la membrana celular de iones de sodio dotados de carga positiva, que pasan desde el fluido extracelular hasta el citoplasma intracelular; la concentración extracelular de sodio supera enormemente la concentración intracelular. La membrana en reposo mantiene un gradiente de potencial eléctrico de -70mv, el signo negativo se debe a que el citoplasma intracelular está cargado negativamente con respecto al exterior; los iones de sodio no atraviesan con facilidad la membrana en reposo, los estímulos físicos o químicos que reducen el gradiente de potencial, o que despolaricen la membrana, aumentan su permeabilidad al sodio y el flujo de este ion hacia el exterior acentúa la despolarización de la membrana, con lo que la permeabilidad al sodio se incrementa más aún. Alcanzado un potencial crítico denominado "umbral", la realimentación positiva produce un efecto regenerativo que obliga al potencial de membrana a cambiar de signo. Es decir, el interior de la célula se torna positivo con respecto al exterior, al cabo de 1 ms, la permeabilidad del sodio decae y el potencial de membrana retorna a -70mv, su valor de reposo. Tras cada explosión de actividad iónica, el mecanismo de permeabilidad del sodio se mantiene refractario durante algunos milisegundos; la tasa de generación de potenciales de acción queda así limitada a unos 200 impulsos por segundo, o menos. Aunque los axones puedan parecer hilos conductores aislados, no conducen los impulsos eléctricos de igual forma, como hilos eléctricos no serían muy valiosos, pues su resistencia a lo largo del eje es demasiado grande y a resistencia de la membrana demasiado baja; la carga positiva inyectada en el axón durante el potencial de acción queda disipada uno o dos milímetros más adelante, para que la señal recorra varios centímetros es preciso regenerar frecuentemente el potencial de acción a lo largo del camino la necesidad de reforzar repetidamente esta corriente eléctrica limita a unos 100 metros por segundo la velocidad máxima de viaje de los impulsos, tal velocidad es inferior a la millonésima de la velocidad de una señal eléctrica por un hilo de cobre. Los potenciales de acción, son señales de baja frecuencia conducidas en forma muy lenta, estos no pueden saltar de una célula a otra, la comunicación entre neuronas viene siempre mediada por transmisores químicos que son liberados en las sinápsis. Un ejemplo de comunicación entre neuronas y del proceso químico de la liberación de neurotransmisores se ilustra en la figura 3.9 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 10 Comunicación entre neuronas Cuando un potencial de acción llega al terminal de un axón son liberados transmisores alojados en diminutas vesículas, que después son vertidos en una hendidura de unos 20 nanómetros de anchura que separa la membrana presináptica de la postsináptica; durante el apogeo del potencial de acción, penetran iones de calcio en el terminal nervioso, su movimiento constituye la señal determinante de la exocitosis sincronizada, esto es la liberación coordinada de moléculas neurotransmisoras. En cuanto son liberados, los neurotransmisores se enlazan con receptores postsinápticos, instando el cambio de la permeabilidad de la membrana. Cuando el desplazamiento de carga hace que la membrana se aproxime al umbral de generación de potenciales de acción, se produce un efecto excitador y cuando la membrana resulta estabilizada en la vecindad el valor de reposo se produce un efecto inhibidor. Cada sinápsis produce sólo un pequeño efecto, para determinar la intensidad (frecuencia de los potenciales de acción) de la respuesta cada UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL neurona ha de integrar continuamente hasta unas 1000 señales sinápticas, que se suman en el soma o cuerpo de la célula. En algunas neuronas los impulsos se inician en la unión entre el axón y el soma, y luego se transmiten a lo largo del axón a otras células nerviosas. Cuando el axón está cerca de sus células destino, se divide en muchas ramificaciones que forman sinápsis con el soma o axones de otras células. Las sinápsis pueden ser excitatorias o inhibitorias según el neurotransmisor que se libere, cada neurona recibe de 10.000 a 100.000 sinápsis y su axón realiza una cantidad similar de sinápsis. Las sinápsis se clasifican según su posición en la superficie de la neurona receptora en tres tipos: axo-somática, axo-dendrítica, axo-axónica. Los fenómenos que ocurren en la sinápsis son de naturaleza química, pero tienen efectos eléctricos laterales que se pueden medir. En la figura 3.11 se visualiza el proceso químico de una sinápsis y los diferentes elementos que hacen parte del proceso tanto en la neurona presináptica, como en la postsináptica. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 11 Proceso químico de una sinápsis Las RNA no alcanzan la complejidad del cerebro, sin embargo hay dos aspectos similares entre redes biológicas y artificiales, primero los bloques de construcción de ambas redes son sencillos elementos computacionales (aunque las RNA son mucho más simples que las biológicas) altamente interconectados; segundo, las conexiones entre neuronas determinan la función de la red. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Lección 7. Características de una red neuronal artificial El modelo de una neurona artificial es una imitación del proceso de una neurona biológica, puede también asemejarse a un sumador hecho con un amplificador operacional tal como se ve en la figura 3.12. Figura 3. 12 Neurona Artificial Existen varias formas de nombrar una neurona artificial, es conocida como nodo, neuronodo, celda, unidad o elemento de procesamiento (PE); En la figura 3.11 se observa un PE en forma general y su similitud con una neurona biológica Figura 3. 13 De la neurona biológica a la neurona artificial De la observación detallada del proceso biológico se han hallado los siguientes análogos con el sistema artificial: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • Las entradas X i representan las señales que provienen de otras neuronas y que son capturadas por las dendritas. • Los pesos W i son la intensidad de la sinápsis que conecta dos neuronas; tanto X i como W i son valores reales. • es la función umbral que la neurona debe sobrepasar para activarse; este proceso ocurre biológicamente en el cuerpo de la célula. Las señales de entrada a una neurona artificial X 1 , X 2 ,.., X n son variables continuas en lugar de pulsos discretos, como se presentan en una neurona biológica. Cada señal de entrada pasa a través de una ganancia o peso, llamado peso sináptico o fortaleza de la conexión cuya función es análoga a la de la función sináptica de la neurona biológica. Los pesos pueden ser positivos (excitatorios), o negativos (inhibitorios), el nodo sumatorio acumula todas las señales de entradas multiplicadas por los pesos o ponderadas y las pasa a la salida a través de una función umbral o función de transferencia. La entrada neta a cada unidad puede escribirse de la siguiente manera (2.1) Una idea clara de este proceso se muestra en la figura 3.13, en donde puede observarse el recorrido de un conjunto de señales que entran a la red. Figura 3. 14. Estructura de una red neuronal Una vez que se ha calculado la activación del nodo, el valor de salida equivale a UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL (2.2) Donde representa la función de activación para esa unidad, que corresponde a la función escogida para transformar la entrada neta i en el valor de salida y que depende de las características específicas de cada red. Sección 1. Notación matemática estándar Una notación matemática estándar no ha sido aún establecida para las redes neuronales, ya que sus aplicaciones son útiles en muchos campos, Ingeniería, Física, Psicología y Matemáticas. En este trabajo se adoptó la siguiente convención para identificar las variables, de manera que fuera compatibles con las diferentes áreas, siendo lo más sencilla posible: • Valores escalares: se representarán por medio de letra minúscula itálica • Vectores: se representarán con letra itálica minúscula en negrilla. • Matrices: se representarán con letra mayúscula itálica en negrilla. Para redes multicapa, los parámetros adoptaran la siguiente forma: Donde c, es el número de la capa a la que corresponde dicho peso, y s representa las neuronas que participan en proceso. Así representa el peso de la segunda capa que comunica la primera neurona de dicha capa con la primera neurona de la primera capa. De igual manera el peso que representa la conexión desde la última neurona de la capa dos a la última neurona de la capa uno estará representado por: Esta convención es adoptada para todos los parámetros de la red. Sección 2. Funciones de Transferencia Un modelo más académico que facilita el estudio de una neurona, puede visualizarse en la figura 3.15 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 15 Neurona de una sola entrada Las entradas a la red serán ahora presentadas en el vector p, que para el caso de una sola neurona contiene solo un elemento, w sigue representando los pesos y la nueva entrada b es una ganancia que refuerza la salida del sumador n, la cual es la salida neta de la red; la salida total está determinada por la función de transferencia , la cual puede ser una función lineal o no lineal de n, y que es escogida dependiendo de las especificaciones del problema que la neurona tenga que resolver; aunque las RNA se inspiren en modelos biológicos no existe ninguna limitación para realizar modificaciones en las funciones de salida, así que se encontrarán modelos artificiales que nada tienen que ver con las características del sistema biológico. Limitador fuerte (Hardlim): La figura 3.16, muestra como esta función de transferencia acerca la salida de la red a cero, si el argumento de la función es menor que cero y la lleva a uno si este argumento es mayor que uno. Esta función crea neuronas que clasifican las entradas en dos categorías diferentes, característica que le permite ser empleada en la red tipo Perceptrón (2.3) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 16 Función de transferencia Hardlim El icono para la función Hardlim reemplazara a la letra f en la expresión general, cuando se utilice la función Hardlim. Una modificación de esta función puede verse en la figura 3.16, la que representa la función de transferencia Hardlims que restringe el espacio de salida a valores entre 1 y –1. (2.4) Figura 3. 17 Función de transferencia Hardlims Función de transferencia lineal (purelin): La salida de una función de transferencia lineal es igual a su entrada, (2.5) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 18 Función de transferencia lineal En la gráfica del lado derecho de la figura 3.18, puede verse la característica de la salida a de la red, comparada con la entrada p, más un valor de ganancia b, neuronas que emplean esta función de transferencia son utilizadas en la red tipo Adaline. Función de transferencia sigmoidal (logsig): Esta función toma los valores de entrada, los cuales pueden oscilar entre mas y menos infinito, y restringe la salida a valores entre cero y uno, de acuerdo a la expresión (2.6) Esta función es comúnmente usada en redes multicapa, como la Backpropagation, en parte porque la función logsig es diferenciable. Figura 3. 19 Función de transferencia sigmoidal UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL La tabla 3.1 hace una relación de las principales funciones de transferencia empleadas en el entrenamiento de redes neuronales. Nombre Relación Entrada /Salida Icono Función Limitador Fuerte hardlim Limitador Fuerte Simétrico hardlims Lineal Positiva poslin Lineal purelin Lineal Saturado satlin Lineal Saturado Simétrico satlins Sigmoidal Logarítmico logsig Tangente Sigmoidal Hiperbólica tansig Competitiva compet Tabla 3 1 Funciones de Transferencia Sección 3. Topología de una Red Típicamente una neurona tiene más de una entrada; en la figura 3.19 se observa una neurona con R entradas; las entradas individuales p 1 ,p 2 ,...,p R son multiplicadas por los pesos correspondientes w 1,1 , w 1,2 ,...w 1,R pertenecientes a la matriz de pesos W. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 20 Neurona con múltiples entradas La neurona tiene una ganancia b, la cual llega al mismo sumador al que llegan las entradas multiplicadas por los pesos, para formar la salida n, (2.7) Esta expresión puede ser escrita en forma matricial (2.8) Los subíndices de la matriz de pesos representan los términos involucrados en la conexión, el primer subíndice representa la neurona destino y el segundo, representa la fuente de la señal que alimenta a la neurona. Por ejemplo, los índices de w 1,2 indican que este peso es la conexión desde la segunda entrada a la primera neurona. Esta convención se hace más útil cuando hay más de una neurona, o cuando se tiene una neurona con demasiados parámetros; en este caso la notación de la figura 3.20, puede resultar inapropiada y se prefiere emplear la notación abreviada representada en la figura 3.21 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 21 Neurona con múltiples entradas, notación abreviada El vector de entrada p es representado por la barra sólida vertical a la izquierda. Las dimensiones de p son mostradas en la parte inferior de la variable como Rx1, indicando que el vector de entrada es un vector fila de R elementos. Las entradas van a la matriz de pesos W, la cual tiene R columnas y solo una fila para el caso de una sola neurona. Una constante 1 entra a la neurona multiplicada por la ganancia escalar b. La salida de la red a, es en este caso un escalar, si la red tuviera más de una neurona a sería un vector. Dentro de una red neuronal, los elementos de procesamiento se encuentran agrupados por capas, una capa es una colección de neuronas; de acuerdo a la ubicación de la capa en la RNA, esta recibe diferentes nombres Capa de entrada: Recibe las señales de la entrada de la red, algunos autores no consideran el vector de entrada como una capa pues allí no se lleva a cabo ningún proceso. Capas ocultas: Estas capas son aquellas que no tienen contacto con el medio exterior, sus elementos pueden tener diferentes conexiones y son estas las que determinan las diferentes topologías de la red. Capa de salida: Recibe la información de la capa oculta y transmite la respuesta al medio externo. Una red de una sola capa con un número S de neuronas, se observa en la figura 3.21 en la cual, cada una de las R entradas es conectada a cada una de las neuronas, la matriz de pesos tiene ahora S filas. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 22 Capa de S neuronas La capa incluye la matriz de pesos, los sumadores, el vector de ganancias, la función de transferencia y el vector de salida. Esta misma capa se observa en notación abreviada en la figura 3.23. Figura 3. 23 Capa de S neuronas con notación abreviada En la figura 3.23 se han dispuesto los símbolos de las variables de tal manera que describan las características de cada una de ellas, por ejemplo la entrada a la red es el vector p cuya longitud R aparece en su parte inferior, W es la matriz de pesos con dimensiones SxR expresadas debajo del símbolo que la representa dentro de la red, a y b son vectores de longitud S el cual, como se ha dicho anteriormente representa el número de neuronas de la red. Ahora, si se considera una red con varias capas, o red multicapa, cada capa tendrá su propia matriz de peso W, su propio vector de ganancias b, un vector de entradas netas n, y un vector de salida a. La versión completa y la versión en notación abreviada de una red de tres capas, pueden ser visualizadas en las figuras 3.23 y 3.24, respectivamente. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 24 Red de tres capas Para esta red se tienen R entradas, S 1 neuronas en la primera capa, S 2 neuronas en la segunda capa, las cuales pueden ser diferentes; las salidas de las capas 1 y 2 son las entradas a las capas 2 y 3 respectivamente, así la capa 2 puede ser vista como una red de una capa con R=S 1 entradas, S 1 =S 2 neuronas y una matriz de pesos W 2 de dimensiones S 1 xS 2 Figura 3. 25 Red de tres capas con notación abreviada Las redes multicapa son más poderosas que las redes de una sola capa, por ejemplo, una red de dos capas que tenga una función sigmoidal en la primera capa y una función lineal en la segunda, puede ser entrenada para aproximar UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL muchas funciones de forma aceptable, una red de una sola capa no podría hacer esto como se verá en capítulos posteriores. Un tipo de redes, un poco diferente a las que se han estudiado hasta el momento, son las redes recurrentes, estas contienen una realimentación hacia atrás o retroalimentación, es decir algunas de sus salidas son conectadas a sus entradas. Un tipo de red recurrente de tiempo discreto es mostrado en la figura 3.25. Figura 3. 26 Redes Recurrentes Para este tipo particular de red el vector p suple las condiciones iniciales (a(0)= p), y la salida está determinada por: (2.9) Donde a(1) y a(2), corresponden a la salida de la red para el primer y segundo intervalo de tiempo, respectivamente. La red alcanzará su estado estable cuando la salida para un instante de tiempo sea la misma salida del instante de tiempo anterior. Las redes recurrentes son potencialmente más poderosas que las redes con realimentación hacia delante. En este tipo de redes se introducen también dos nuevos conceptos, el bloque de retardo de la figura 3.27 y el bloque integrador de la figura 3.28 • Retardo UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 27 Bloque de retardo (2.10) La salida del bloque de retardo es el valor de entrada retrasado en un paso de tiempo, este bloque requiere que la salida sea inicializada con el valor a(0) para el tiempo t=0; a(0) se convierte en la salida de la red para el instante de tiempo inicial. • Integrador Figura 3. 28 Bloque integrador La salida del integrador es calculada de acuerdo a la expresión (2.11) Una red recurrente cuya implementación necesita un bloque integrador se ilustra en la figura 3.28. En general las redes neuronales se pueden clasificar de diversas maneras, según su topología, forma de aprendizaje (supervisado o no supervisado), tipos de funciones de activación, valores de entrada (binarios o continuos); un resumen de esta clasificación se observa en la figura 3.29 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 29 Clasificación de las Redes Neuronales Lección 8. Principales tipos de redes neuronales Sección 1. Antecedentes La primera red neuronal conocida, fue desarrollada en 1943 por Warren McCulloch y Walter Pitts; esta consistía en una suma de las señales de entrada, multiplicadas por unos valores de pesos escogidos aleatoriamente. La entrada es comparada con un patrón preestablecido para determinar la salida de la red. Si en la comparación, la suma de las entradas multiplicadas por los pesos es mayor o igual que el patrón preestablecido la salida de la red es uno (1), en caso contrario la salida es cero (0). Al inicio del desarrollo de los sistemas de inteligencia artificial, se encontró gran similitud entre su comportamiento y el de los sistemas biológicos y en principio se creyó que este modelo podía computar cualquier función aritmética o lógica. La red tipo Perceptrón fue inventada por el psicólogo Frank Rosenblatt en el año 1957. Su intención era ilustrar algunas propiedades fundamentales de los sistemas inteligentes en general, sin entrar en mayores detalles con respecto a condiciones específicas y desconocidas para organismos biológicos concretos. Rosenblatt creía que la conectividad existente en las redes biológicas tiene un elevado porcentaje de aleatoriedad, por lo que se oponía al análisis de McCulloch Pitts en el cual se empleaba lógica simbólica para analizar estructuras bastante idealizadas. Rosenblatt opinaba que la herramienta de análisis más apropiada era la teoría de probabilidades, y esto lo llevó a una teoría de separabilidad estadística que utilizaba para caracterizar las propiedades más visibles de estas redes de interconexión ligeramente aleatorias. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL El primer modelo de Perceptrón fue desarrollado en un ambiente biológico imitando el funcionamiento del ojo humano, el fotoperceptrón como se le llamo era un dispositivo que respondía a señales ópticas; como se muestra en el figura 3.29 la luz incide en los puntos sensibles (S) de la estructura de la retina, cada punto S responde en forma todo-nada a la luz entrante, los impulsos generados por los puntos S se transmiten a las unidades de asociación (A) de la capa de asociación; cada unidad A está conectada a un conjunto aleatorio de puntos S, denominados conjunto fuente de la unidad A, y las conexiones pueden ser tanto excitatorias como inhibitorias. Las conexiones tienen los valores posibles +1, -1 y 0, cuando aparece un conjunto de estímulos en la retina, una unidad A se activa si la suma de sus entradas sobrepasa algún valor umbral; si la unidad esta activada, A produce una salida que se envía a la siguiente capa de unidades. Figura 3. 30 Modelo del Fotoperceptrón de Rosenblatt De forma similar, las unidades A están conectadas a unidades de respuesta (R) dentro de la capa de respuesta y la conectividad vuelve a ser aleatorio entre capas, pero se añaden conexiones inhibitorias de realimentación procedentes de la capa de respuesta y que llegan a la capa de asociación, también hay conexiones inhibitorias entre las unidades R. Todo el esquema de conexiones se describe en forma general en un diagrama de Venn, para un Perceptrón sencillo con dos unidades de respuesta como el de la figura 3.30 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 31Esquema de conexiones de un Perceptrón sencillo El Perceptrón era inicialmente un dispositivo de aprendizaje, en su configuración inicial no estaba en capacidad de distinguir patrones de entrada muy complejos, sin embargo mediante un proceso de aprendizaje era capaz de adquirir esta capacidad. En esencia, el entrenamiento implicaba un proceso de refuerzo mediante el cual la salida de las unidades A se incrementaba o se decrementaba dependiendo de si las unidades A contribuían o no a las respuestas correctas del Perceptrón para una entrada dada. Se aplicaba una entrada a la retina, y el estímulo se propagaba a través de las capas hasta que se activase una unidad de respuesta. Si se había activado la unidad de respuesta correcta, se incrementaba la salida de las unidades A que hubieran contribuido. Si se activaba una unidad R incorrecta, se hacía disminuir la salida de las unidades A que hubiesen contribuido. Mediante estas investigaciones se pudo demostrar que el Perceptrón era capaz de clasificar patrones correctamente, en lo que Rosenblatt denominaba un entorno diferenciado, en el cual cada clase estaba formada por patrones similares. El Perceptrón también era capaz de responder de manera congruente frente a patrones aleatorios, pero su precisión iba disminuyendo a medida que aumentaba el número de patrones que intentaba aprender. En 1969 Marvin Minsky y Seymour Papert publicaron su libro: "Perceptrons: An introduction to Computational Geometry"[], el cual para muchos significó el final de las redes neuronales. En el se presentaba un análisis detallado del Perceptrón, en términos de sus capacidades y limitaciones, en especial en cuanto a las restricciones que existen para los problemas que una red tipo Perceptrón puede resolver; la mayor desventaja de este tipo de redes es su incapacidad para solucionar problemas que no sean linealmente separables. Minsky y Papert se apartaban de la aproximación probabilística de Rosenblatt y volvían a las ideas de cálculo de predicados en el análisis del Perceptrón. Su idea de Perceptrón aparece en la figura 2.32 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 32 Perceptrón según Minsky y Papert La estructura de un Perceptrón sencillo es similar a la del elemento general de procesamiento que se muestra en la figura 3.32; en la que se observa la adición de una condición umbral en la salida. Si la entrada neta, a esta condición es mayor que el valor umbral, la salida de la red es 1, en caso contrario es 0. La función de salida de la red en la figura 3.32 es llamada función umbral o función de transferencia (2.13) A pesar de esta limitación, el Perceptrón es aún hoy una red de gran importancia, pues con base en su estructura se han desarrollado otros modelos de red neuronal como la red Adaline y las redes multicapa. Sección 2. Estructura de la red: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Figura 3. 33 Perceptrón La única neurona de salida del Perceptrón realiza la suma ponderada de las entradas, resta el umbral y pasa el resultado a una función de transferencia de tipo escalón. La regla e decisión es responder +1 si el patrón presentado pertenece a la clase A, o –1 si el patrón pertenece a la clase B (figura 3.32), la salida depende de la entrada neta (n = suma de las entradas p i ponderadas). La red tipo Perceptrón emplea principalmente dos funciones de transferencia, hardlim con salidas 1, 0 o hardlims con salidas 1, -1; su uso depende del valor de salida que se espera para la red, es decir si la salida de la red es unipolar o bipolar; sin embargo la función hardlims es preferida sobre la hardlim, ya que el tener un cero multiplicando algunas de los valores resultantes del producto de las entradas por el vector de pesos, ocasiona que estos no se actualicen y que el aprendizaje sea más lento. Una técnica utilizada para analizar el comportamiento de redes como el Perceptrón es presentar en un mapa las regiones de decisión creadas en el espacio multidimensional de entradas de la red, en estas regiones se visualiza qué patrones pertenecen a una clase y cuáles a otra, el Perceptrón separa las regiones por un hiperplano cuya ecuación queda determinada por los pesos de las conexiones y el valor umbral de la función de activación de la neurona, en este caso los valores de los pesos pueden fijarse o adaptarse empleando diferentes algoritmos de entrenamiento. Para ilustrar el proceso computacional del Perceptrón consideremos la matriz de pesos en forma general. (2.14) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Los pesos para una neurona están representados por un vector compuesto de los elementos de la i-ésima fila de W (2.15) De esta forma y empleando la función de transferencia hardlim la salida de la neurona i de la capa de salida (2.16) El Perceptrón, al constar de una sola capa de entrada y otra de salida con una única neurona, tiene una capacidad de representación bastante limitada, este modelo sólo es capaz de discriminar patrones muy sencillos, patrones linealmente separables (concepto que se estudiará en la sección 2.1.4), el caso más conocido es la imposibilidad del Perceptrón de representar la función OR EXCLUSIVA. Lección 9. Backpropagation Sección 1. Antecedentes La regla de aprendizaje del Perceptrón de Rosenblatt y el algoritmo LMS de Widrow y Hoff fueron diseñados para entrenar redes de una sola capa. Como se discutió anteriormente, estas redes tienen la desventaja que solo pueden resolver problemas linealmente separables, fue esto lo que llevo al surgimiento de las redes multicapa para sobrepasar esta dificultad en las redes hasta entonces conocidas. El primer algoritmo de entrenamiento para redes multicapa fue desarrollado por Paul Werbos en 1974, este se desarrolló en un contexto general, para cualquier tipo de redes, siendo las redes neuronales una aplicación especial, razón por la cual el algoritmo no fue aceptado dentro de la comunidad de desarrolladores de redes neuronales. Fue solo hasta mediados de los años 80 cuando el algoritmo Backpropagation o algoritmo de propagación inversa fue redescubierto al mismo tiempo por varios investigadores, David Rumelhart, Geoffrey Hinton y Ronal Williams, David Parker y Yann Le Cun. El algoritmo se popularizó cuando fue incluido en el libro "Parallel Distributed Processing Group" por los sicólogos David Rumelhart y James McClelland. La publicación de este libro trajo consigo un auge en las investigaciones con redes neuronales, siendo la Backpropagation una de las redes más ampliamente empleadas, aun en nuestros días. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Uno de los grandes avances logrados con la Backpropagation es que esta red aprovecha la naturaleza paralela de las redes neuronales para reducir el tiempo requerido por un procesador secuencial para determinar la correspondencia entre unos patrones dados. Además el tiempo de desarrollo de cualquier sistema que se este tratando de analizar se puede reducir como consecuencia de que la red puede aprender el algoritmo correcto sin que alguien tenga que deducir por anticipado el algoritmo en cuestión. La mayoría de los sistemas actuales de computo se han diseñado para llevar a cabo funciones matemáticas y lógicas a una velocidad que resulta asombrosamente alta para el ser humano. Sin embargo la destreza matemática no es lo que se necesita para solucionar problemas de reconocimiento de patrones en entornos ruidosos, característica que incluso dentro de un espacio de entrada relativamente pequeño, puede llegar a consumir mucho tiempo. El problema es la naturaleza secuencial del propio computador; el ciclo tomar – ejecutar de la naturaleza Von Neumann solo permite que la máquina realice una operación a la vez. En la mayoría de los casos, el tiempo que necesita la máquina para llevar a cabo cada instrucción es tan breve (típicamente una millonésima de segundo) que el tiempo necesario para un programa, así sea muy grande, es insignificante para los usuarios. Sin embargo, para aquellas aplicaciones que deban explorar un gran espacio de entrada o que intentan correlacionar todas las permutaciones posibles de un conjunto de patrones muy complejo, el tiempo de computación necesario se hace bastante grande. Lo que se necesita es un nuevo sistema de procesamiento que sea capaz de examinar todos los patrones en paralelo. Idealmente ese sistema no tendría que ser programado explícitamente, lo que haría es adaptarse a sí mismo para aprender la relación entre un conjunto de patrones dado como ejemplo y ser capaz de aplicar la misma relación a nuevos patrones de entrada. Este sistema debe estar en capacidad de concentrarse en las características de una entrada arbitraria que se asemeje a otros patrones vistos previamente, sin que ninguna señal de ruido lo afecte. Este sistema fue el gran aporte de la red de propagación inversa, Backpropagation. La Backpropagation es un tipo de red de aprendizaje supervisado, que emplea un ciclo propagación – adaptación de dos fases. Una vez que se ha aplicado un patrón a la entrada de la red como estímulo, este se propaga desde la primera capa a través de las capas superiores de la red, hasta generar una salida. La señal de salida se compara con la salida deseada y se calcula una señal de error para cada una de las salidas. Las salidas de error se propagan hacia atrás, partiendo de la capa de salida, hacia todas las neuronas de la capa oculta que contribuyen directamente a la salida. Sin embargo las neuronas de la capa oculta solo reciben una fracción de la señal total del error, basándose aproximadamente en la contribución relativa que haya aportado cada neurona a la salida original. Este proceso se repite, capa por capa, UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL hasta que todas las neuronas de la red hayan recibido una señal de error que describa su contribución relativa al error total. Basándose en la señal de error percibida, se actualizan los pesos de conexión de cada neurona, para hacer que la red converja hacia un estado que permita clasificar correctamente todos los patrones de entrenamiento. La importancia de este proceso consiste en que, a medida que se entrena la red, las neuronas de las capas intermedias se organizan a sí mismas de tal modo que las distintas neuronas aprenden a reconocer distintas características del espacio total de entrada. Después del entrenamiento, cuando se les presente un patrón arbitrario de entrada que contenga ruido o que esté incompleto, las neuronas de la capa oculta de la red responderán con una salida activa si la nueva entrada contiene un patrón que se asemeje a aquella característica que las neuronas individuales hayan aprendido a reconocer durante su entrenamiento. Y a la inversa, las unidades de las capas ocultas tienen una tendencia a inhibir su salida si el patrón de entrada no contiene la característica para reconocer, para la cual han sido entrenadas. Varias investigaciones han demostrado que, durante el proceso de entrenamiento, la red Backpropagation tiende a desarrollar relaciones internas entre neuronas con el fin de organizar los datos de entrenamiento en clases. Esta tendencia se puede extrapolar, para llegar a la hipótesis consistente en que todas las unidades de la capa oculta de una Backpropagation son asociadas de alguna manera a características específicas del patrón de entrada como consecuencia del entrenamiento. Lo que sea o no exactamente la asociación puede no resultar evidente para el observador humano, lo importante es que la red ha encontrado una representación interna que le permite generar las salidas deseadas cuando se le dan las entradas, en el proceso de entrenamiento. Esta misma representación interna se puede aplicar a entradas que la red no haya visto antes, y la red clasificará estas entradas según las características que compartan con los ejemplos de entrenamiento. Lección 10. Aprendizaje asociativo Las redes con aprendizaje no supervisado (también conocido como auto- supervisado) no requieren influencia externa para ajustar los pesos de las conexiones entre sus neuronas, la red no recibe ninguna información por parte del entorno que le indique si la salida generada en respuesta a una determinada entrada es o no correcta, por ello suele decirse que estas redes son capaces de autoorganizarse. Estas redes deben encontrar las características, regularidades, correlaciones o categorías que se puedan establecer entre los datos que se presenten en su entrada; puesto que no hay supervisor que indique a la red la respuesta que debe generar ante una entrada concreta, cabría preguntarse precisamente por lo que la red genera en estos casos, existen varias posibilidades en cuanto a la UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL interpretación de la salida de estas redes que dependen de su estructura y del algoritmo de aprendizaje empleado. En algunos casos, la salida representa el grado de familiaridad o similitud entre la información que se le está presentando en la entrada de la red y las informaciones que se le han mostrado hasta entonces, en otro caso la red podría realizar una clusterización (clustering) o establecimiento de categorías, indicando la salida de la red a que categoría pertenece la información presentada a la entrada, siendo la propia red quien deba encontrar las categorías apropiadas a partir de correlaciones entre las informaciones presentadas. Una variación de esta categorización es el prototipado, en este caso la red obtiene ejemplares o prototipos representantes de las clases a las que pertenecen las informaciones de entrada. El aprendizaje sin supervisión permite también realizar una codificación de los datos de entrada, generando a la salida una versión codificada de la entrada con menos bits, pero manteniendo la información relevante de los datos. Algunas redes con aprendizaje no supervisado generan un mapeo de características (featuring mapping), obteniéndose en las neuronas de salida una disposición geométrica que representa un mapa fotográfico de las características de los datos de entrada, de tal forma que si se presentan a la red informaciones similares siempre sean afectadas neuronas de salida próximas entre sí, en la misma zona del mapa. En cuanto a los algoritmos de aprendizaje no supervisado, en general se consideran dos tipos, que dan lugar a los siguientes aprendizajes: 1. Aprendizaje asociativo 2. Aprendizaje competitivo En el primer caso normalmente se pretende medir la familiaridad o extraer características de los datos de entrada, mientras que el segundo suele orientarse hacia la clusterización o clasificación de dichos datos. En esta sección se profundizará en el estudio del primero de estos algoritmos, el correspondiente al aprendizaje asociativo. Una asociación es cualquier vínculo entre la entrada de un sistema y su correspondiente salida. Cuando dos patrones son vinculados por una asociación, el patrón de entrada es a menudo referido como el estímulo, y la salida es referida como la respuesta. El aprendizaje asociativo fue inicialmente estudiado por escuelas de Sicología, las cuales se dedicaron a estudiar las relaciones entre el comportamiento humano y el comportamiento animal. Una de las primeras influencias en este campo fue el experimento clásico de Pavlov, en el cual se entrenó a un perro para salivar al UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL escuchar el sonido de una campana si le era presentado un plato de comida, este es un ejemplo del llamado Condicionamiento Clásico. Otro de los principales exponentes de esta escuela fue B.F. Skinner, su experimento involucró el entrenamiento de ratas, las cuales debían presionar un botón para obtener comida, a este tipo de entrenamiento se le llamo Condicionamiento Instrumental. Basado en este tipo de comportamiento, Donald Hebb postuló el siguiente principio conocido como la regla de Hebb: " Cuando un axón de una celda A está lo suficientemente cerca de otra celda B como para excitarla y repetidamente ocasiona su activación, un cambio metabólico se presenta en una o ambas celdas, tal que la eficiencia de A, como celda excitadora de B, se incrementa". Con el término celda, Hebb se refería a un conjunto de neuronas fuertemente conexionadas a través de una estructura compleja, la eficiencia podría identificarse con la intensidad o magnitud de la conexión, es decir el peso. Este postulado aplicado a redes asociativas, marcó el inicio del aprendizaje no supervisado. Un gran número de investigadores ha contribuido al aprendizaje asociativo, en particular Tuevo Kohonen, James Anderson y Stephen Grossberg. Anderson y Kohonen desarrollaron independientemente el asociador lineal a finales de los años 60's y Grossberg introdujo la red asociativa no lineal durante este mismo periodo. Según la regla de aprendizaje de Hebb, la actividad coincidente en las neuronas présináptica y postsináptica es crítica para fortalecer la conexión entre ellas, a esto se denomina mecanismo asociativo pre-post. Sección 1.Redes competitivas En las redes con aprendizaje competitivo (y cooperativo), suele decirse que las neuronas compiten (y cooperan) unas con otras con el fin de llevar a cabo una tarea dada. Con este tipo de aprendizaje se pretende que cuando se presente a la red cierta información de entrada, sólo una de las neuronas de salida de la red, o una por cierto grupo de neuronas, se active (alcance su valor de respuesta máximo). Por tanto las neuronas compiten para activarse quedando finalmente una, o una por grupo, como neurona vencedora y el resto quedan anuladas y siendo forzadas a sus valores de respuesta mínimos. La competición entre neuronas se realiza en todas las capas de la red, existiendo en estas redes neuronas con conexiones de autoexitación (signo positivo) y conexiones de inhibición (signo negativo) por parte de neuronas vecinas. El objetivo de este aprendizaje es categorizar (clusterizar) los datos que se introducen en la red, de esta forma las informaciones similares son clasificadas formando parte de la misma categoría y por tanto deben activar la misma neurona UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL de salida. Las clases o categorías deben ser creadas por la propia red, puesto que se trata de un aprendizaje no supervisado a través de las correlaciones entre los datos de entrada. A principios de 1959, Frank Rosenblatt creó su simple clasificador espontáneo, una red de aprendizaje no supervisado basado en el Perceptrón, el cual aprendía a clasificar vectores de entrada en dos clases con igual número de términos. A finales de los años 60’s y principios de los 70’s, Stephen Grossberg introdujo muchas redes competitivas que usaban inhibición lateral obteniendo buenos resultados. Algunos de los comportamientos útiles obtenidos por él, fueron la supresión del ruido, aumento del contraste y normalización de vectores. En 1973, Christoph Von Der Malsburg introduce la regla del mapa de organización propia, que permitía a la red clasificar entradas en las cuales las neuronas que estuviesen en un vecindario cercano a la neurona ganadora, respondieran a entradas similares. La topología de esta red imitaba de alguna forma las estructuras encontradas en la corteza visual de los gatos, estudiada por David Hubel y Torten Wiesel. Su regla de aprendizaje generó gran interés, pero esta utilizaba un cálculo no local para garantizar que los pesos fueran normalizados, este hecho hacía este modelo biológicamente poco posible. Grossberg extendió el trabajo de Von Der Malsburg, redescubriendo la regla Instar. Grossberg mostró que la regla Instar removió la necesidad de renormalizar los pesos, porque los vectores de pesos que aprendían a reconocer vectores de entrada normalizados, automáticamente se normalizarán ellos mismos. El trabajo de Grossberg y Von Der Malsburg enfatizó la posibilidad biológica de sus redes. Otro exitoso investigador, Tuevo Kohonen ha sido también un fuerte proponente de las redes competitivas; sin embargo, su énfasis ha sido en aplicaciones para ingeniería y en descripciones de eficiencia matemática de las redes. Durante la década de los 70 Kohonen desarrolló una versión simplificada de la regla Instar, inspirada también en la red de Von Der Malsburg y Grossberg, de esta forma encontró una manera muy eficiente de incorporar topología a una red competitiva. Otra forma de aplicar este tipo de aprendizaje fue propuesta por Rumelhart y Zisper [32] en 1985, quienes utilizaban redes multicapa dividiendo cada capa en grupos de neuronas, de tal forma que éstas disponían de conexiones inhibitorias con otras neuronas de su mismo grupo y conexiones excitadoras con las neuronas de la siguiente capa; en una red de este tipo, después de recibir diferentes informaciones de entrada, cada neurona en cada grupo se especializa en la respuesta a determinadas características de los datos de entrada. En este tipo de redes cada neurona tiene asignado un peso total (suma de todos los pesos de las conexiones que tiene a su entrada), el aprendizaje afecta sólo a UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL las neuronas ganadoras (activas), en las que se redistribuye el peso total entre sus conexiones y se sustrae una porción de los pesos de todas las conexiones que llegan a la neurona vencedora, repartiendo esta cantidad por igual entre todas las conexiones procedentes de unidades activas, por tanto la variación del peso de una conexión entre una unidad i y otra j será nula si la neurona j no recibe excitación por parte de la neurona i (no vence en presencia de un estímulo por parte de i) y se modificará (se reforzará) si es excitada por dicha neurona. Una variación del aprendizaje supervisado aplicado a redes multicapa consiste en imponer una inhibición mutua entre neuronas únicamente cuando están a cierta distancia unas de otras (suponiendo que las neuronas se han dispuesto geométricamente, por ejemplo formando capas bidimendisionales), existe entonces un área o región de vecindad alrededor de las neuronas que constituye un grupo local. Fukushima empleó esta idea en 1975 para una red multicapa llamada Cognitron, fuertemente inspirada en la anatomía y fisiología del sistema visual humano y en 1980 el mismo Fukushima en una versión mejorada de la anterior a la que llamó Necognitron, presentó una variación de esta red utilizando aprendizaje supervisado. El Necognitrron disponía de un gran número de capas con arquitectura muy específica de interconexiones entre ellas y era capaz de aprender a diferenciar caracteres, aunque estos se presentasen a diferente escala, en diferente posición o distorsionados. El aspecto geométrico de la disposición de neuronas de una red, es la base de un caso particular de aprendizaje competitivo introducido por Kohonen en 1982 conocido como feature mapping (mapas de características), aplicado en redes con una disposición bidimensional de las neuronas de salida, que permiten obtener mapas topológicos o topográficos (topology preserving maps, topographics maps, self organization maps) en los que de algún modo estarían representadas las características principales de las informaciones presentadas a la red. De esta forma, si la red recibe informaciones con características similares, se generarían mapas parecidos, puesto que serían afectadas neuronas de salidas próximas entre sí. Red de Kohonen Existen evidencias que demuestran que en el cerebro hay neuronas que se organizan en muchas zonas, de forma que las informaciones captadas del entorno a través de los órganos sensoriales se representan internamente en forma de mapas bidimensionales. Por ejemplo, en el sistema visual se han detectado mapas del espacio visual en zonas del córtex (capa externa del cerebro), también en el sistema auditivo se detecta una organización según la frecuencia a la que cada neurona alcanza mayor repuesta (organización tonotópica). UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Aunque en gran medida esta organización neuronal está predeterminada genéticamente, es probable que parte de ella se origine mediante el aprendizaje, esto sugiere que el cerebro podría poseer la capacidad inherente de formar mapas topológicos de las informaciones recibidas del exterior, de hecho esta teoría podría explicar su poder de operar con elementos semánticos: algunas áreas del cerebro simplemente podrían crear y ordenar neuronas especializadas o grupos con características de alto nivel y sus combinaciones, en definitiva se construirían mapas especiales para atributos y características. A partir de estas ideas Tuevo Kohonen presentó en 1982 un sistema con un comportamiento semejante, se trataba de un modelo de red neuronal con capacidad para formar mapas de características de manera similar a como ocurre en el cerebro; el objetivo de Kohonen era demostrar que un estímulo externo (información de entrada) por sí solo, suponiendo una estructura propia y una descripción funcional del comportamiento de la red, era suficiente para forzar la formación de los mapas. Este modelo tiene dos variantes denominadas LVQ (Learning Vector Quantization) y TPM (Topology Preserving Map) o SOM (Self Organizing Map), ambas se basan en el principio de formación de mapas topológicos para establecer características comunes entre las informaciones (vectores) de entrada a la red, aunque difieren en las dimensiones de éstos, siendo de una sola dimensión en el caso de LVQ y bidimensional o tridimensional en la red SOM. Estas redes se tratarán con mayor profundidad en secciones posteriores. El aprendizaje en el modelo de Kohonen es de tipo Off-line, por lo que se distingue una etapa de aprendizaje y otra de funcionamiento. En la etapa de aprendizaje se fijan los valores de las conexiones (feedforward) entre la capa de entrada y la salida. Esta red utiliza un aprendizaje no supervisado de tipo competitivo, las neuronas de la capa de salida compiten por activarse y sólo una de ellas permanece activa ante una determinada información de entrada a la red, los pesos de las conexiones se ajustan en función de la neurona que haya resultado vencedora. Durante la etapa de entrenamiento, se presenta a la red un conjunto de informaciones de entrada (vectores de entrenamiento) para que ésta establezca en función de la semejanza entre los datos las diferentes categorías (una por neurona de salida), que servirían durante la fase de funcionamiento para realizar clasificaciones de nuevos datos que se presenten a la red. Los valores finales de los pesos de las conexiones entre cada neurona de la capa de salida con las de entrada se corresponderán con los valores de los componentes del vector de aprendizaje que consigue activar la neurona correspondiente. En el caso de existir más patrones de entrenamiento que neuronas de salida, más de uno deberá asociarse con la misma neurona, es decir pertenecerán a la misma clase. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL En este modelo el aprendizaje no concluye después de presentarle una vez todos los patrones de entrada, sino que habrá que repetir el proceso varías veces para refinar el mapa topológico de salida, de tal forma que cuantas más veces se presenten los datos, tanto más se reducirán las zonas de neuronas que se deben activar ante entradas parecidas, consiguiendo que la red pueda realizar una clasificación mas selectiva. Red de Hamming La red de Hamming ilustrada es uno de los ejemplos más simples de aprendizaje competitivo, a pesar de ello su estructura es un poco compleja ya que emplea el concepto de capas recurrentes en su segunda capa y aunque hoy en día en redes de aprendizaje competitivo se ha simplificado este concepto con el uso de funciones de activación más sencillas, la red de Hamming representa uno de los primeros avances en este tipo de aprendizaje, convirtiéndola en un modelo obligado de referencia dentro de las redes de aprendizaje competitivo. Las neuronas en la capa de salida de esta red compiten unas con otras para determinar la ganadora, la cual índica el patrón prototipo más representativo en la entrada de la red, la competición es implementada por inhibición lateral (un conjunto de conexiones negativas entre las neuronas en la capa de salida). Esta red consiste en dos capas; la primera capa, la cual es una red Instar, realiza la correlación entre el vector de entrada y los vectores prototipo, la segunda capa realiza la competición para determinar cual de los vectores prototipo está más cercano al vector de entrada. Sección 2. Redes recurrentes En el contexto de las redes recurrentes existen redes dinámicas por naturaleza como lo son la red de Hopfield, la red de Jordan y la red de Elman y redes dinámicas que siendo de naturaleza estática como lo son las redes multicapa logran el comportamiento dinámico realimentando sus entradas con muestras anteriores de las salidas, el comportamiento dinámico de las redes recurrentes hace que sean una poderosa herramienta para simular e identificar sistemas dinámicos no lineales. Red de Hopfield En la década de los 80´s con el fin de estudiar procesos que involucran sistemas gobernados por ecuaciones diferenciales no lineales surge la teoría clásica de UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL control geométrico basada en la geometría diferencial; simultáneamente renace el estudio de las Redes Neuronales debido al redescubrimiento del algoritmo Backpropagation, este hecho sumado al fracaso de las metodologías tradicionales aplicadas a la inteligencia artificial y a la disponibilidad de herramientas computacionales de bajo costo permitieron el desarrollo las redes neuronales recurrentes cuya principal aplicación es el control e identificación de sistemas no lineales. Este desarrollo es posible debido a que las propiedades matemáticas de las redes recurrentes están enmarcadas en las mismas propiedades que fundamentan el control geométrico, la primera red neuronal recurrente de naturaleza dinámica fue propuesta por Hopfield en 1984 bajo el contexto de las memorias asociativas. En búsqueda de una implementación practica, Hopfield presentó su modelo básico como un circuito eléctrico, el cual se muestra en la figura 2.6.1, donde cada neurona se representa por un amplificador operacional y una red asociada formada por una capacitancia y una resistencia, la entrada a cada amplificador es la suma de las corrientes I i mas las realimentaciones provenientes de otros amplificadores, por ejemplo el segundo amplificador realimenta al amplificador S a través de la resistencia R S2 , en caso de necesitarse realimentaciones con signo negativo, estas se hacen por medio de la salida inversora de cada amplificador; la ecuación para el modelo de Hopfield basado en las leyes de Kirchhoff se muestra en la ecuación (2.12). Figura 3. 34 Circuito Eléctrico red Hopfield (2.12) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Donde n i es el voltaje de entrada a cada amplificador y a i =f(n i ) su salida, con característica de amplificación f la cual es generalmente de tipo sigmoidal, . Sección 3. Redes Multicapa Las redes multicapa son de naturaleza estática, o sea su salida no evoluciona con el tiempo (para un patrón de entrada existe una salida asociada), pero pueden adquirir un comportamiento dinámico (para un patrón entrada la salida posee un estado transitorio y converge a un valor en el estado estacionario) realimentando sus entradas con estados anteriores de sus salidas. La red esta compuesta de una capa estática la cual generalmente posee un número de neuronas superior al número de variables de estado del sistema a identificar, la salida de la capa estática va a un sumador donde se le resta el valor anterior de la variable de estado Z i identificada por el sistema, de esta operación se genera la derivada de cada una de las i variables de estado identificadas por el sistema. Red de Elman La red de Elman típicamente posee dos capas, cada una compuesta de una red tipo Backpropagation, con la adición de una conexión de realimentación desde la salida de la capa oculta hacia la entrada de la misma capa oculta, esta realimentación permite a la red de Elman aprender a reconocer y generar patrones temporales o variantes con el tiempo. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL CAPITULO 3. CONTROL PREDICTIVO Introducción El control predictivo tiene como objetivo resolver de forma efectiva, problemas de control y automatización de procesos industriales que se caractericen por presentar un comportamiento dinámico complicado, multivariable, y/o inestable. La estrategia de control en que se basa este tipo de control, utiliza el modelo matemático del proceso a controlar para predecir el comportamiento futuro de dicho sistema, y en base a este comportamiento futuro puede predecir la señal de control futura. El control predictivo integra disciplinas como el control óptimo, control estocástico, control de procesos con retardo de tiempo, control multivariable, control con restricciones. Lección 11. Fundamentos del control predictivo El Control Predictivo Basado en Modelo (CPBM), conocido también como Model Based Predictive Control (MBPC) o simplemente Model Predictive Control (MPC). Esta estrategia también se conoce como control por horizonte deslizante, por ser ésta la forma en la que se aplican las señales de actuación. Existen muchos algoritmos de control predictivo que han sido aplicados con éxito: GPC, IDCOM, DMC, APC, PFC, EPSAC, RCA, MUSMAR, NPC, UPC, SCAP, HPC, etc. El control predictivo basado en modelo se puede definir como una estrategia de control que se basa en la utilización de forma explícita de un modelo matemático interno del proceso a controlar (modelo de predicción), el cual se utiliza para predecir la evolución de las variables a controlar a lo largo de un horizonte temporal de predicción especificado por el operador, de este modo se puede calcular las variables manipuladas futuras (señal de control futura) para lograr que en dicho horizonte, las variables controladas converjan en sus respectivos valores de referencia. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL El MPC se enmarca dentro de los controladores óptimos, es decir, aquellos en los que las actuaciones responden a la optimización de un criterio. El criterio a optimizar, o función de coste, está relacionado con el comportamiento futuro del sistema, que se predice gracias a un modelo dinámico del mismo, denominado modelo de predicción. El intervalo de tiempo futuro que se considera en la optimización se denomina horizonte de predicción. Dado que el comportamiento futuro del sistema depende de las actuaciones que se aplican a lo largo del horizonte de predicción, son éstas las variables de decisión respecto a las que se optimiza el sistema. La aplicación de estas actuaciones sobre el sistema conduce a un control en bucle abierto. La posible discrepancia entre el comportamiento predictivo y el comportamiento real del sistema crean la necesidad de imponer cierta robustez al sistema incorporando realimentación del mismo. Esta realimentación se consigue gracias a la técnica del horizonte deslizante que consiste en aplicar las actuaciones obtenidas durante un periodo de tiempo, tras el cual se muestrea el estado del sistema y se resuelve un nuevo problema de optimización. De esta manera, el horizonte de predicción se va deslizando a lo largo del tiempo. Una de las propiedades más atractivas del MPC es su formulación abierta, que permite la incorporación de distintos tipos de modelos de predicción, sean lineales o no lineales, monovariables o multivariables, y la consideración de restricciones sobre las señales del sistema. Esto hace que sea una estrategia muy utilizada en diversas áreas del control. El CPBM es una de las pocas técnicas que permiten controlar sistemas con restricciones incorporando éstas en el propio diseño del controlador. Estas características han hecho del control predictivo una de las escasas estrategias de control avanzado con un impacto importante en problemas de ámbito industrial Por tal motivo es importante resaltar que el control predictivo se ha desarrollado en el mundo de la industria, y ha sido la comunidad investigadora la que se ha esforzado en dar un soporte teórico a los resultados prácticos obtenidos. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Merece la pena destacar que el control predictivo es una técnica muy potente que permite formular controladores para sistemas complejos y con restricciones. Esta potencia tiene un precio asociado: el coste computacional y la sintonización del controlador. Recientes avances en el campo del MPC proveen un conocimiento más profundo de estos controladores, obteniéndose resultados que permiten relajar estos requerimientos. Así por ejemplo, se han establecido condiciones generales para garantizar la estabilidad (Mayne 2001), condiciones bajo las cuales se puede relajar el carácter optimal del controlador garantizando su estabilidad (Scokaert & Mayne 1998). Lección 12. Ventajas e desventajas del Control Predictivo Entre las ventajas se pueden citar: Formulación en el dominio del tiempo, lo cual le permite ser una técnica flexible, abierta e intuitiva. Permite tratar con sistemas lineales y no lineales, monovariables y multivariables utilizando la misma formulación para los algoritmos del controlador. La ley de control responde a criterios de optimización. Permite la incorporación de restricciones en la síntesis o implementación del controlador. Brinda la posibilidad de incorporar restricciones en el cálculo de las actuaciones. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Entre las desventajas se pueden citar: Requiere el conocimiento de un modelo dinámico del sistema suficientemente preciso. Requiere un algoritmo de optimización, por lo que solo se podría implementarse por medio de una computadora. Requiere un alto coste computacional, lo que hace difícil su aplicación a sistemas rápidos. Hasta hace relativamente poco, no se podía garantizar la estabilidad de los controladores, especialmente en el caso con restricciones. Esto hacía que el ajuste de estos controladores fuese heurístico y sin un conocimiento de cómo podían influir los parámetros en la estabilidad del sistema. Lección 13. Elementos del Control Predictivo: Hay una serie de elementos comunes a todos los controladores predictivos: El uso de un modelo matemático del proceso que se utiliza para predecir la evolución futura de las variables controladas sobre un horizonte de predicción. La imposición de una estructura en las variables manipuladas futuras. El establecimiento de una trayectoria deseada futura, o referencia, para las variables controladas. El cálculo de las variables manipuladas optimizando una cierta función de costo. La aplicación del control siguiendo una política de horizonte móvil. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Los modelos internos que se usan para predecir el comportamiento del sistema pueden ser de diversos tipos: Función de transferencia, Respuesta al impulso, Respuesta al escalón, Espacio Estado. Sección 1. Modelo de predicción Esta representado por el modelo matemático que describe el comportamiento dinámico del sistema. Las ecuaciones físicas del sistema conjuntamente con las incertidumbres del mismo pueden ser expresadas en el mismo modelo. Este modelo puede ser lineal, no lineal, en tiempo continuo, en tiempo discreto, puede estar expresado en función de transferencia o en ecuaciones de estado, puede ser multivariable o monovariable. Una consideración que deben tener, consiste en que el origen debe ser el punto de equilibrio en el que se quiere regular el sistema, lo cual se puede conseguir con un cambio de variables. Debido a que el controlador predictivo es generalmente implementado por un computador, esto requiere que el modelo del sistema se encuentre expresado en tiempo discreto, de la forma: x k+1 =f(x k ,u k ) Donde X k+1 son los estados en el tiempo (k+1), X k , son los estados en el tiempo (k), U k el la señal de control. Como la predicción depende además de la secuencia de actuaciones aplicadas desde el instante (k) hasta el instante (k + j), y por lo tanto futuras. A lo largo de esta tesis, se denota x(k + j|k) al estado del sistema predicho en el instante (k + j) a partir del estado conocido en el instante (k). Por lo tanto: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL x(k + j + 1|k) = f( x(k + j|k), u(k + j|k) ) Donde x(k|k) = X k . son los estados del sistema Sección 2. Función de coste Es aquella función definida positiva, que expresa el criterio a optimizar, es decir el coste asociado a un determinado comportamiento del sistema a lo largo del horizonte de predicción. Tiene la siguiente estructura: Donde L(x,u) es la función de coste de etapa, V(x) es la función de coste terminal. Ambas funciones son definidas positivas. La señal de control que se aplicaría durante el horizonte de predicción N, esta dado por: Sección 3. Restricciones Las restricciones indican los límites dentro de los cuales debe transcurrir la evolución de las señales que rigen el comportamiento del sistema. Estas fronteras se rigen por límites físicos, por razones de seguridad, por conveniencias económicas, etc. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Las restricciones se expresan como conjuntos X y U, cerrados y acotados, y deben pertenecer al sistema para todo instante de tiempo de trabajo. Si se desea poner un límite en el extremo final del horizonte de predicción, se expresaría de la forma: Lección 14. Algoritmos En esta lección se muestra brevemente los dos algoritmos considerados más representativos de las metodologías existentes en Control Predictivo. Representan a las dos familias de controladores predictivos, una de origen claramente industrial y la otra más académica. Sección 1. Dynamic Matrix Control El método DMC se desarrolló a finales de los setenta by Cutler and Ramaker de Shell Oil Co. y ha sido aceptado ampliamente en el mundo industrial, principalmente por las industrias petroquímicas. Actualmente DMC es algo más que un algoritmo y parte de su éxito se debe al hecho de que el producto comercial resuelve otros temas como identificación u optimización n global de la planta. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL Pero a pesar de este éxito en la práctica, este método adolece quizás de la ausencia de un análisis teórico más completo que estudie la influencia de los parámetros de diseño o (horizontes, secuencias de ponderación) sobre la estabilidad del bucle cerrado así como de resultados de robustez. Predicción. El modelo de proceso que se emplea es el de respuesta temporal, considerando la perturbación n como constante a lo largo del horizonte Perturbaciones medibles. El efecto de las perturbaciones medibles se puede añadir fácilmente a las anteriores ecuaciones de predicción, ya que éstas se pueden tratar como entradas al sistema. Algoritmo de control. El éxito en la industria del DMC se ha debido principalmente a su aplicación n a sistemas multivariables de gran dimensión n con la consideración de restricciones. Sección 2. Control Predictivo Generalizado El Control Predictivo Generalizado GPC fue propuesto por Clarke et al. en 1987 y se ha convertido en uno de los métodos más populares en el ámbito del Control Predictivo tanto en el mundo industrial como en el académico. Se ha empleado con éxito en numerosas aplicaciones industriales, mostrando buenas prestaciones a la vez que un cierto grado de robustez respecto a sobre parametrización o retardos mal conocidos. Puede resolver muchos problemas de control diferentes para un amplio campo de procesos con un número razonable de variables de diseño, que son especificadas por el operario dependiendo del conocimiento previo del proceso y de los objetivos de control. La idea básica del GPC es calcular una secuencia de futuras acciones de control de tal forma que minimice una función de coste multipaso. El índice a minimizar es UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL una función cuadrática que mide por un lado la distancia entre la salida predicha del sistema y una cierta trayectoria de referencia hasta el horizonte de predicción, y por otro el esfuerzo de control necesario para obtener dicha salida. El Control Predictivo Generalizado tiene muchas ideas en común con otros controladores predictivos previamente mencionados ya que está basado en las mismas ideas pero posee a su vez algunas diferencias. Como se verá más adelante, es capaz de proporcionar una solución explícita (en ausencia de restricciones), puede trabajar con procesos inestables o de fase no mínima e incorpora el concepto de horizonte de control así como la consideración en la función de coste de ponderación de los incrementos en las acciones de control. Las diversas posibilidades disponibles para el GPC conducen a una gran variedad de objetivos de control comparado con otras realizaciones, algunas de las cuales pueden ser consideradas como subconjuntos o casos límites del GPC. Lección 15. Restricciones y tendencias en Control Predictivo En la práctica todos los procesos están n sujetos a restricciones. Los actuadores tienen un campo limitado de acción n impuesto por límites físicos (por ejemplo una válvula no puede abrir más de un 100 % o un calentador no puede aportar más de su potencia máxima. También n existen límites de seguridad (por ejemplo presiones o temperaturas máximas), requerimientos tecnológicos (por ejemplo mantener temperaturas en un rango dado), limitaciones de calidad del producto (no salirse de cierta zona) o normativa medioambiental. Sección 1. Tratamiento convencional de restricciones El tratamiento convencional de restricciones en control de procesos se basa en que las restricciones en la variable manipulada (entrada) se cumplen saturando la salida del controlador. Sin embargo, las restricciones en la variable controlada (salida) no pueden abordarse; se intenta evitar su violación n trabajando alejados de los límites (en zona segura), operando lejos de la restricción n. Por seguridad se trabaja con una consigna inferior, más lejos del punto de operación n óptimo, lo que normalmente equivale a una disminución n de la calidad y/o cantidad en la producción n, ya que normalmente el punto óptimo se encuentra en UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL la intersección n de las restricciones obligando a acercarse lo más posible a las éstas pero sin superarlas. Si el controlador fuera capaz de tener en cuenta las restricciones y evitar su violación n, el proceso podría operar más cerca de éstas y por tanto de forma más eficiente. Sección 2. Restricciones en Control Predictivo En la actualidad el MPC es la única metodología capaz de incorporar las restricciones de forma sistemática en la fase de diseño o del controlador, siendo esta característica una de las razones de su gran éxito en la industria. Parece lo´ gico que al disponer de un modelo dina´ mico del proceso se pueda conocer la evolucio´ n futura de su salida y por tanto se pueda saber si e´ sta va a violar o no las restricciones y actuar en consecuencia. Para formular el algoritmo MPC con restricciones hay que expresar estas en función n de la variable sobre la que se puede actuar, es decir, en funcionen de u. Las restricciones en la entrada están ya expresadas en función n de u y para las restricciones en la salida se hace uso de las ecuaciones de predicción n que expresan el valor futuro de las salidas en función n de las señales de control futuras y valores conocidos en el instante t. Las restricciones que aparecen serán básicamente amplitud y velocidad de cambio en la señal de control y amplitud en la salida y se pueden expresar como: Sección 3. Tendencias del control predictivo En la actualidad existen muchos campos abiertos en Control Predictivo, tanto en lo referente a aplicaciones prácticas como a líneas de investigación. Todavía queda UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL mucho por estudiar en campos como identificación de modelos, estimación del estado y de las perturbaciones no medibles o tratamiento sistemático de las incertidumbres. El estudio de estabilidad o robustez de la solución es complicado, sobre todo en el caso de inclusión de restricciones, ya que la ley de control es en general variable con el tiempo y no se puede representar el sistema de la forma clásica de bucle cerrado. Fuentes Documentales de la Unidad 3 • A.G. Kutnetsov y D.W. Clarke. Advances in Model-Based Predictive Control, capitulo Application of constrained GPC for improving performance of controlled plants. Oxford University Press, 1994. • Aplicación en Java de una Red Neuronal para aproximar distintas funciones http://neuron.eng.wayne.edu/bpFunctionApprox/bpFunctionApprox.html • BARAN M.E, WU F.F. "Network reconfiguration in distribution sistems for loss reduction and load balancing". IEEE. Transaction on power delivery, Vol 4, # 2, April 1989. • B.E. Ydstie. Extended Horizon Adaptive Control. En Proc. 9th IFACWorld Congress, Budapest, Hungary, 1984. • Control Predictivo / Predictive Control. Universidad de Valladolid. Departamento de Ingeniería de sistemas y Automatica. Seción Departamento de la Facultad de Ciencias. http://www.isa.cie.uva.es/php/lineas/Control_Predictivo.html Página Web consultada el 15 de julio de 2009 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • Control Predictivo: metodología, tecnología y nuevas perspectivas. Departamento de Ingeniería de sistemas y automática. Universidad de Sevilla. 2000 http://www.esi2.us.es/~bordons/apuntes_MPC.pdf Página Web consultada el 15 de julio de 2009 • Control de procesos mediante Redes Neuronales Presentado por Cristina Garrido de la Universidad de Concepción para optar al título de Ingeniero Civil Químico http://www.diq.udec.cl/~cgarrido/ http://melquiades.diq.udec.cl/~cgarrido/ • Introducción a las Redes Neuronales Artificiales. Desarrollado por Alfredo Catalina Gallego http://www.gui.uva.es/login/13/redesn.html • Difusa, Universidad del Valle, Colombia. http://maxwell.univalle.edu.co/proyectos/rna/neurofuzzy1/ http://maxwell.univalle.edu.co/proyectos/rna/neurofuzzy2/ • CHAPMAN Stephen J. "Máquinas Eléctricas". McGraw Hill. Santafé de Bogotá Colombia. 1997 • C.R. Cutler y B.C. Ramaker. Dynamic Matrix Control- A Computer Control Algorithm. En Automatic Control Conference, San Francisco, 1980. • C.E. Garc´ıa, D.M. Prett y M. Morari. Model Predictive Control: Theory and Practice-a Survey. Automatica, 25(3):335–348, 1989. • DELGADO Alberto. "Inteligencia Artificial y Minirobots". Bogota D.C. Colombia. Ecoe Ediciones. Julio 1998. • DELGADO Alberto. "Propiedades Matemáticas y Aplicaciones de las Redes Neuronales Dinámicas Recurrentes". Santafé de Bogotá Colombia. • D.W. Clarke y C. Mohtadi. Properties of Generalized Predictive Control. Automatica,25(6):859–875, 1989. • D.W. Clarke, C. Mohtadi y P.S. Tuffs. Generalized Predictive Control. Part I. The Basic Algorithm. Automatica, 23(2):137–148, 1987. • E.F. Camacho, M. Berenguel y F.R. Rubio. Advanced Control of Solar Power Plants. Springer-Verlag, London, 1997. • E.F. Camacho y C. Bordons. Model Predictive Control. Springer-Verlag, 1999. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • H. Chen y F. Allgower. A quasi-infinite horizon nonlinear predictive controls cheme with guaranteed stability. Automatica, 34(10):1205–1218, 1998. • E.S. Meadows, M.A. Henson, J.W. Eaton y J. Rawlings. Receding horizon control and discontinuous state feedback stabilization. Int. Journal Control, p´aginas 1217– 1229, 1995. • FISCHBACH Gerald D.. "Mente y cerebro". Investigación y Ciencia # 194, Noviembre de 1992 • FLOREZ Oscar y SALAZAR Harold. Proyecto de grado "Utilización de Redes Neuronales Artificiales en la Reconfiguración de Alimentadores Primarios". Pereira Colombia. Universidad Tecnológica. 1998. • FREEMAN James y SKAPURA David. "Redes Neuronales: Algoritmos, aplicaciones y técnicas de programación". Delaware E.U.A. Addison Wesley Iberoamericana S.A. 1993 • GALLEGO Ramón y Ruben. "Flujo de Carga". Pereira Colombia. Universidad Tecnológica de Pereira. 1999 • GIRALDO Didier, TABARES Ivan. "Programa que entrena neuronas para implementar funciones lógicas". Scientia et technica. Año II, #5, Junio de 1997. • HAGAN Martin, DEMUTH Howard y BEALE Mark. "Neural Network Design". PWS Publishing Company. Boston U.S.A. 1996. • HILERA José R., MARTINEZ Víctor J. "Redes Neuronales Artificiales. Fundamentos, modelos y aplicaciones ". Ra-ma Editorial. Madrid. 1995 • HINTON Geoffrey E. "Redes neuronales que aprenden de la experiencia". Investigación y ciencia. #194, Noviembre de 1992. • H. Michalska y D.Q. Mayne. Robust receding horizon control of constrained nonlinear systems. IEEE Trans. on Automatic Control, 38(11):1623–1633, 1993. • H. Takatsu, T. Itoh y M. Araki. Future needs for the control theory in industries. report and topics of the control technology survey in japanese indsutry. Journal of Process Control, 8:369–374, 1998. • J. Richalet. Practique de la commande predictive. Hermes, 1992. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • KANDEL Eric R., ROBERT Hawkins. "Bases biológicas del aprendizaje y de la individualidad". Investigación y ciencia #194, Noviembre de 1992. • K. Kr¨amer y H. Ubehauen. Predictive Adaptive Control. Comparison of Main Algorithms. En Proceedings 1st European Control Conference, Grenoble, p´aginas 327– 332, julio 1991. • KOHONEN Tuevo. "Associative memory. A system theoretical approach". Springer-Verlag, 1977 • KOHONEN Tuevo. "Self-organized formaion of topologically correct feature maps". Biological Cybernetics #43 , 1982. Reimpreso en el texto "Neurocomputing" (J.Anderson y E. Rosenfeld ed.), MIT press,1988. • KOHONEN Tuevo. "Learning Vector Quantization". Abstracts of the first annual INNS Meeting, #308, 1988. • KONONEN Tuevo. "Self-organization and associative memory (3ª ed.)". Springer-Verlag, 1989. • KOSKO. "Bidirectional Associative Memories". IEEE Transactions on system, Man & Cybernetics, #18, pags 42-60,1988 • LATHI B.P. "Introducción a la teoría y sistemas de comunicación". Limusa editores. Méjico. 1995 • M. Minsky y S. Papert. "Perceptrons". ED. MIT Press,1969 • M.L. Tyler yM. Morari. Propositional Logic in Control and Monitoring Problems. Technical Report AUT96-15, Institut fur Automatik, ETH- Swiss Federal Institute of Technology, Zurich, Switzerland, 1996. • MURILLO José Joaquín. "Sistemas de distribución de energía eléctrica". Pereira, Colombia. 1997. • N.M.C. Oliveira y L.T. Biegler. An extension of newton-type algorithms for nonlinear process control. Automatica, 31:281–286, 1995. • SIMPSON P.K. "Foundations of neural Networks". Artificial Neural Networks. IEEE PRESS. New York. 1992 • Pagina de la Universidad de Chile contiene manual sobre el Snns http://cipres.cec.uchile.cl/~em753/ UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • Red de Hopfield como reconocimiento de patrones http://www.eeng.dcu.ie/~annet/intro/demo.html • Redes Neuronales aplicadas al reconocimiento de voz. Proyecto desarrollado por José María García Jiménez en Madrid, España http://electronica.com.mx/neural/aplicaciones/index.html • S.S. Keerthi y E.G. Gilbert. Optimal infinite-horizon feedback laws for a general class of constrained discrete-time systems: Stability and moving- horizon approximations. J. Optim. Theory Appl., 57(2):265–293, 1988. • R. De Keyser. A Gentle Introduction to Model Based Predictive Control. En PADI2 International Conference on Control Engineering and Signal Processing, Piura, Peru, 1998. • R.M.C. De Keyser, Ph.G.A.Van deVelde y F.G.A. Dumortier. AComparative Study of Self-adaptive Long-range Predictive Control Methods. Automatica, 24(2):149– 163, 1988. • Redes de Resonancia Adaptiva (ART), arquitectura, entrenamiento y aplicaciones de esta red Proyectos finales curso Redes Neuronales, Universidad del Valle, Colombia http://maxwell.univalle.edu.co/proyectos/rna/ART1/ http://maxwell.univalle.edu.co/proyectos/rna/ART2/ http://maxwell.univalle.edu.co/proyectos/rna/ART4/ • SIMPSON P.K. "Foundations of neural Networks". Artificial Neural Networks. IEEE PRESS. New York. 1992. • S.J. Qin y T.A. Badgwell. An Overview of Industrial Model Predictive Control Technology. In Chemical Process Control: Assessment and New Directions for Research. En AIChE Symposium Series 316, 93. Jeffrey C. Kantor, Carlos E. Garcia and Brice Carnahan Eds. 232-256, 1997. • S.J. Qin y Thomas A. Badgwell. Anoverview of nonlinear model predictive control applications. En IFAC Workshop on Nonlinear Model Predictive Control. Assessment and Future Directions. Ascona (Switzerland), 1998. • Tutorial con teoría detallada http://www.paisvirtual.com/informatica/navegadores/toniomos/rn/temas- rn.htm • Tutorial Redes Neuronales contiene Teoria General http://www.gc.ssr.upm.es/inves/neural/ann2/anntutorial.html UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍAS E INGENIERÍAS CONTENIDO DIDÁCTICO DEL CUSO: 299018-SISTEMAS AVANZADOS DE CONTROL • Tutorial de Redes Neuronales desarrollado en la Universidad Politécnica de Madrid UPM (España), bajo la dirección del Dr. Diego Andina de la Fuente Contiene una explicación de los distintos tipos de redes según su forma de aprendizaje y permite descargar un simulador para entrenar una red tipo backpropagation http://www.gc.ssr.upm.es/inves/neural/ann2/anntutor.htm • Visión Artificial y Visión Humana, aplicación a la percepción Visual en Robótica Grupo de investigación dirigido por el profesor Luis Jañez Esacalada's http://sirio.psi.ucm.es/PROYECTOS/VISIONROBOT/vavh.html • WIDROW Bernard, LEHR Michael A. "30 years of adaptive neural networks: Perceptron, Madaline, and Backpropagation". Proceedings of the IEEE, vol 78 #9, September 1990, pp 1415-1442.
Copyright © 2024 DOKUMEN.SITE Inc.