Diseño en el espacio de estados

 

CAPITULO VIII: Diseño en el espacio de estados

Introducción, diseño de la ley de control con retroalimentación completa de los estados, ubicación de las raíces de la ley de control, construcción del observador, ubicación de los polos del observador,  observador de orden completo y de orden reducido, introducción de entrada de referencia, control integral.

Bibliografía

 

Introducción

A lo largo del curso, hemos desarrollados modelos y hecho análisis dinámico de los mismos, siendo los modelos no-lineales, variantes en el tiempo y de múltiples entradas y salidas. En la medida que profundizábamos en el análisis, también fuimos particularizando el mismo para los sistemas lineales, invariantes en el tiempo y que sean SISO: de una entrada y una salida.

Ahora solo nos concentraremos en resolver el problema de controlar una planta cuya dinámica es lineal, invariante en el tiempo, y que presente una sola entrada y una sola salida.

Si eventualmente nos encontráramos con tener que desarrollar un controlador para una planta no-lineal, deberíamos buscar el punto de equilibrio (punto de operación) en el cual queremos mantener la planta, y a partir del mismo linealizar el modelo, desarrollando luego el controlador a partir de esa planta linealizada.

Si la planta es variante en el tiempo (y si los parámetros variantes no cambian abruptamente y además tampoco cambian demasiado), buscaremos aquel valor del parámetro variante en la que la planta es más difícil de controlar y desarrollaremos el control para ese valor del parámetro, esperando que una vez realizado el controlador funcione correctamente también para todo el rango del parámetro variante.

Si el sistema tiene múltiples entradas y salidas, una primera verificación que debería hacerse al sistema es que la cantidad de entradas al sistema sea la misma cantidad de salidas. Luego se debería realizar un análisis si el sistema puede “desacoplarse”: ver si se puede identificar cada una de las salidas como afectada solo por una de las entradas (sin que haya repeticiones), y realizar un controlador para cada uno de los pares entrada-salida desacoplados. Este desacoplamiento no es siempre posible, y para el caso que no sea posible otra estrategia a utilizar es ir haciendo controladores “anidados”: realizar primero un controlador entre una salida y entrada determinada, considerando que las otras entradas son nulas; introducir este controlador como parte del sistema, y volver a elegir otro par entrada-salida para realizar otro controlador, y así sucesivamente hasta agotar todas las entradas con todas las salidas.

Una vez desarrollado el controlador, siempre se procederá a verificar el funcionamiento del mismo a través de simulaciones, y esta verificación se hace aún más necesaria cuando el sistema presenta algunas de las características mencionadas anteriormente.

 

Unos de las características atractivas del diseño de control utilizando el método del diseño de espacio de estados es que el mismo consiste en una secuencia independiente de pasos. Dichos pasos son los que describimos a continuación:

 

1) Diseño de la ley de control: Se supone que se cuenta en todo momento con el valor de cada uno de los estados de la planta a controlar, y se determina la acción de control u (entrada de control a la planta) como una combinación lineal de los estados. Los coeficientes de esa “retroalimentación de estados” lo agrupamos en el vector que denominamos –K (ver figura 1). La determinación de K, para los sistemas controlables –mencionamos algo en el capítulo 6-, está unívocamente ligada a los autovalores del sistema retroalimentado y el problema se reduce en asignar un conjunto de autovalores que correspondan con una performance temporal satisfactoria en términos de tiempo de crecimiento, tiempo de establecimiento, sobrepico, etc.

 

Figura 1. Ley de control por retroalimentación completa de los estados.

 

2) Construcción del observador: Es muy raro que uno cuente con “mediciones” de todos los estados de la planta, y por lo tanto es habitual no contar los valores de los estados de la planta para realizar la retroalimentación de estados que se mencionó en el paso anterior. Por lo tanto, es necesario construir un estimador o observador (los dos términos se refieren a exactamente a lo mismo), que en todo momento estime los estados de la planta a partir de la acción de control u que se ejerce sobre la planta y la medición y (salida de la planta). Veremos que siempre es posible realizar la construcción de dicho observador si el sistema es observable.

 

3) Combinación de la ley de control con el estimador: Una vez construído el observador, determinamos la acción de control u, alimentando la ley de control con los estados estimados de la planta: , envés de utilizar los estados x propiamente dichos (ver figura 2). Cabría preguntarse si la construcción del controlador de éste modo no cambia la posición de los polos del sistema retroalimentado. La respuesta a esta inquietud, es que así construído el controlador, el sistema retroalimentado conserva los polos definidos por la ley de control, con adición de los polos del estimador.

 

Figura 2. Combinación de la ley de control con el estimador.

 

4) Entrada de referencia: Con el controlador armado hasta el paso anterior, el sistema planta/controlador funciona correctamente como regulador: para volver al punto de equilibrio a partir de una condición inicial distinta a ese punto de equilibrio, o para el rechazo de perturbaciones. Distinto es el caso de pretender que la salida y del sistema, “siga” la evolución de una señal deseada de referencia r. El problema es cómo introducimos en el esquema anterior (figura 2), dicha señal. La manera más sencilla de realizarla es como se muestra en la figura 3, donde envés de introducir al estimador la señal medida y, se la alimenta con la diferencia entre la referencia y la medición (y-r). Esta forma de introducir la entrada a referencia es semejante a la que se utiliza en control clásico, pero como veremos no es la única manera de introducir la referencia en el sistema, y que hay maneras más convenientes que ésta. De la manera que el sistema ha sido retroalimentado, la posición de los polos de la función transferencia entre la referencia r y la salida y quedan completamente definidos. Veremos que según cómo introduzcamos esta señal de referencia r dentro del controlador, tendremos la capacidad de mover los ceros de la función de transferencia mencionada.

 

Figura 3. Ejemplo de entrada de referencia.

 

Ley de control

El primer paso en el método de diseño de control en variable de estado como se mencionó anteriormente es encontrar la ley de control de retroalimentación de una combinación lineal de las variables de estado.

Esta combinación lineal la podemos expresar como el siguiente producto de vectores:

 

                                                Ec. [1]

 

Para la retroalimentación estamos asumiendo que disponemos de todos los elementos del vector de estado. En la práctica esta suposición es completamente poco probable, puesto que si tenemos la capacidad de medir todos los estados (no siempre es el caso ya que pueden existir estados que no se pueden medir), económicamente no tiene sentido, puesto que los sensores son unas de las partes más caras del lazo de control y tener que comprar un sensor para cada una de las variables de estado sabiendo que el problema se puede solucionar con uno solo de los sensores es un encarecimiento innecesario del sistema de control.

Como vemos de la ecuación [1], si tenemos un sistema de orden n, el vector de incógnitas K es de n componentes. Por ser un sistema de orden n, también tenemos la capacidad de escoger la posición de n autovalores. Por lo tanto tenemos n grados de libertad (cada una de los componentes del vector K), para determinar las n posiciones de los autovalores del sistema.

Sustituyamos la ley de retroalimentación (ec. [1]) dentro de la ecuación de estado del sistema:

 

                                                      Ec. [2]

 

Y por lo tanto ahora con la retroalimentación de estados el sistema pasa a ser un sistema autónomo, cuya dinámica está regida por los autovalores de la matriz (A-B.K); o sea los lugares del plano s que cumple con siguiente la ecuación característica:

 

                                                                                    Ec. [3]

 

Esta ecuación origina un polinomio mónico de grado n. Escogiendo los nuevos autovalores del sistema en s1, s2, … sn, dá origen también a un polinomio mónico de grado n al cual llamamos ac(s):

 

                                                      Ec. [4]

 

Igualando coeficiente a coeficiente estos dos polinomios (ec. [3] y [4]) obtenemos n ecuaciones, dentro de las cuales están nuestras n incógnitas (los elementos del vector K). De esta manera, resolviendo el sistema de ecuaciones de nxn, podemos obtener el vector de ganancias K de retroalimentación.

El trabajo de ubicar las raíces de la ecuación característica lo veremos con mayor detenimiento en un próximo punto, pero generalmente esta tarea requiere de un proceso de iteración del diseñador.

 

Ejemplo:

Pretendemos controlar un oscilador no-amortiguado de frecuencia w0, cuya una de sus representaciones por variable de estado es la siguiente:

 

           

 

Los requerimientos de control exigen colocar los dos autovalores del sistema controlado en una posición amortiguada dos veces más rápida que la frecuencia de oscilación, o sea en la posición del plano s = -2.w0.

Veamos primero que efectivamente el sistema es un oscilador no-amortiguado. Para ello hallemos los autovalores de la matriz A que son las raíces de la siguiente ecuación característica:

 

             

 

Cuyas raíces son como esperábamos: s = ±j.w0. (oscilador no-amortiguado de frecuencia w0).

Por los requerimientos de control queremos que la ecuación característica sea:

 

           

 

La ecuación característica aplicando la retroalimentación de estado es la siguiente:

 

 

 

Igualando coeficiente a coeficiente de ambos polinomios, obtenemos las siguientes dos ecuaciones:

por el término en s:

           

 

por el término independiente:

           

 

Y por lo tanto, el vector K de retroalimentación queda definido como:

 

           

 

Ley de control para sistema de orden mayor

La determinación del vector K llega a ser una tarea sencilla en sistema de bajo orden, pero se vuelve una tarea más complicada cuanto mayor es el orden del sistema. Para facilitar esa tarea, resulta conveniente pasar la representación de variables de estado a su forma canónica de controlabilidad. De esta manera el vector de ganancias de retroalimentación K se determina muy fácilmente.

Veamos para eso, cómo es la representación de variables de estado en su forma canónica de controlabilidad:

 

                                                                     Ec. [5]

 

                                              

 

Con esta estructura especial que tiene la matriz A, el polinomio de su ecuación característica es:

 

                                                       Ec. [6]

 

Calculemos en esta forma canónica cómo es la matriz que representa la dinámica del sistema retroalimentado:

 

                                Ec. [7]

 

 

Que sigue teniendo la misma estructura que la matriz Ac original, y por lo tanto el polinomio de su ecuación característica será por consiguiente:

 

                                                                                                                                                                Ec. [8]

 

Y si el polinomio característico deseado de los autovalores es:

 

                                                     Ec. [9]

 

La determinación de los componentes del vector de ganancia K de retroalimentación de estados se hace fácilmente:

 

           

                                                                                                  Ec. [10]

                    :

           

 

Por lo tanto, el procedimiento para determinar el vector K en sistemas de alto orden consistiría en hallar la matriz de transformación de estados T que lleve el sistema original a su forma canónica de controlabilidad. Ya en su nueva representación determinar el vector de retroalimentación Kc en esa representación, y finalmente llevar éste vector a su representación original a través de la matriz de transformación T.

Observar que un sistema podemos siempre llevarlo a la forma canónica de controlabilidad si el sistema es controlable, y siempre podemos encontrar el vector de retroalimentación K si podemos llevarla a dicha representación. La inversa también se dá, no podemos hallar el vector de retroalimentación K si el sistema no es controlable (por ende no podemos llevarlo a su representación en la forma canónica de controlabilidad).

Éste método de hallar el vector de retroalimentación K se puede sistematizar y reducir a una simple fórmula, conocida como la fórmula de Ackermann, donde el vector de retroalimentación K (en la representación original del sistema) se determina como:

 

                                                                       Ec. [11]

 

donde C es la matriz de controlabilidad que es:  y ac(.) es el polinomio característico que define las raíces deseadas de la ley de control, que se evalúa en la matriz A del sistema (notar que para evaluar el polinomio en la matriz, todos los términos del polinomio deben ser matrices de nxn, y por lo tanto el término independiente debe multiplicarse por la matriz identidad de nxn).

Cabe también remarcar que esta fórmula siempre puede evaluarse, siempre y cuando la matriz de controlabilidad C  sea invertible, y esto será así siempre que el sistema sea controlable.

 

Ejemplo:

Apliquemos la fórmula de Ackermann al problema del último ejemplo. El polinomio característico deseado era:

 

           

 

por lo tanto su evaluación en la matriz A es:

 

 

La matriz de controlabilidad es:

 

           

 

Coincide que su inversa es justamente la misma matriz.

Y aplicando la fórmula de Ackermann volvemos a obtener nuevamente el vector K de retroalimentación de estados:

 

           

 

Que obviamente coincide con el resultado obtenido anteriormente.

 

Ejemplo:

Para el sistema cuya representación de estados es la siguiente:

 

                                   

 

 

                                          

 

Buscar el vector de retroalimentación de estados K que cumpla con la siguiente ecuación característica:

 

           

 

Primero, veamos que z0 es un cero del sistema. Para eso busquemos cuánto vale la función de transferencia de u a y:

 

 

Encontremos ahora cuánto vale la ecuación característica del sistema retroalimentado:

 

 

 

 

Por lo tanto debe cumplirse que:

 

           

 

           

 

Resolviendo este sistema de ecuaciones de 2x2, obtenemos cuánto deben valer cada una de las componentes del vector K de retroalimentación:

 

           

 

           

 

De este resultado podemos destacar dos cosas:

-         Sabemos que cuanto más cercano el cero de la planta (z0) esté de los polos de la misma (s = -3 ó -4), el sistema será más “difícil de controlar”; esto se traduce que las componentes del vector K se hacen cada vez más grande (requiriendo un mayor esfuerzo de la acción de control). En el límite, cuando el sistema no es controlable, las componentes del vector K se hacen infinito.

-         Si requerimos también que el sistema actúe con mayor velocidad (que el tiempo de crecimiento sea más chico y por lo tanto que el wn sea más grande), vemos que exigen también que las componentes del vector K sean más grande (en valor absoluto), y por lo tanto exigiendo también un mayor esfuerzo en la acción de control.

 

Elección de la ubicación de las raíces de la ley de control

Por lo que acabamos de ver, el esfuerzo de control está relacionado con lo lejos que se hayan movido los polos originales de la planta, y por lo tanto es una competencia entre una mejor performance de la respuesta dinámica del sistema y un menor esfuerzo de la acción de control requerida.

Además, también tenemos que los ceros originales de la planta atraen a los polos, y por lo tanto se hace difícil apartar un polo de un cero que se encuentre cercano. Pero por otro lado, el comportamiento dinámico debido a un par de polo/cero cercanos se anulan mutuamente. En este sentido, conviene dejar este polo en su ubicación original y tratar de satisfacer los requerimientos de la respuesta dinámica moviendo los polos restantes.

Entonces la filosofía de ubicar los polos de la ley de control consiste en reparar solo los defectos que tienen la respuesta de lazo abierto.

Veremos tres metodologías distintas para elegir la ubicación de los polos de la ley de control, que son:

-         Segundo orden dominante.

-         Diseño de prototipos.

-         Lugar geométrico de las raíces simétrico.

 

Segundo orden dominante

En este método, se eligen la posición de dos los polos de manera de satisfacer los requerimientos de la respuesta transitoria, como ser tiempo de crecimiento, tiempo de establecimiento, sobrepico, etc. El resto de los polos se eligen que se encuentren alejados de éstos en un factor 4 para que no influyan en la respuesta transitoria, tratando de no moverlos demasiado, y tratando además de amortiguarlos.

Si existen ceros en la planta original, como los mismos permancen una vez cerrado el lazo de control, debería buscarse que los polos dominantes sean lo suficientemente lentos como para no ver la influencia de los ceros. En el caso de no ser posible, podría ubicarse uno de los polos restantes en la cercanía de ese cero para acotar su influencia sobre la respuesta transitoria.

Un caso típico de sistemas a controlar, son algunos sistemas mecánicos que poseen modos de alta frecuencia poco amortiguados y un par de modos de cuerpo rígido, que son de baja frecuencia. Para estos tipos de sistemas se busca satisfacer los requerimientos de la respuesta transitoria con los modos de cuerpo rígido, y los modos vibratorios de alta frecuencia se los deja con la misma frecuencia (wn) pero trasladándolos al eje real para amortiguarlos.

 

Diseño de prototipo

En este tipo de método, se ubican las n raíces de la ecuación características en lugares predeterminados según un conjunto de polinomios que satisfacen algún tipo de criterio normalizado con alguna frecuencia típica que requerimos que el sistema tenga.

Por ejemplo, Graham y Lathrop (1953) propusieron para plantas de distinto órden, cuál era el polinomio característico que minimizaba un cierto índice conocido como la Integral del Valor Absoluto del Error multiplicado por el tiempo (índice I. T. A. E. – siglas en inglés: Intergral Time Absolute Error) ante la presencia de un escalón a la entrada.

En fórmulas, el índice I.T.A.E. se calcula como:

 

                                                                             Ec. [12]

 

Los polinomios que Graham y Lathrop obtuvieron, fueron los siguientes, donde w0 es la frecuencia de corte que habíamos mencionado:

 

n

Ubicación de los polos según el criterio ITAE

1

2

3

4

5

 

La respuesta de éstos polinomios dan en general con un sobrepico. Si por los requerimientos de control se necesita que la respuesta no posea sobrepico, entonces, se pueden utilizar los polinomios de Bessel de grado n:

 

n

Ubicación de los polos según polinomios de Bessel

1

2

3

4

 

Aunque con estos polinomios tenemos la ventaja de eliminar el sobrepico, tenemos la desventaja de que la respuesta se torna algo más lenta en comparación con los polinomios según el criterio ITAE.

Observaciones respecto a ésta metodología: la frecuencia que se utilice para definir los polinomios debe ser semejante a las frecuencias del sistema original (si se elige una frecuencia mucho mayor, esto provocará que el esfuerzo de control sea demasiado grande). Si el sistema original tiene polos muy alejados en frecuencia, es mejor dejarlos y aumentarles un poco la amortiguación.

 

Lugar geométrico de las raíces simétrico

Una técnica muy utilizada en la teoría de control óptimo, es la técnica del regulador cuadrático lineal óptimo (LQR en sus siglas en inglés). Una versión simplificada de dicha teoría que es de fácil aplicación es la siguiente:

Planteo del problema: Buscar la ubicación de las raíces del sistema retroalimentado por variable de estado que minimice el siguiente funcional:

 

                                                                          Ec. [13]

 

para el sistema:

 

                                                                                   Ec. [14]

           

 

donde r balancea el efecto del error z con la acción de control u.

Observar que z no necesariamente es y la salida del sistema. La variable z, debe escogerse como un error que se quiere minimizar en conjunto con la acción de control, y dicho error se puede calcular como una combinación lineal de los estados de la planta.

Kailath (1980) demostró que los polos de lazo cerrado que minimizan J son las raíces estables de la ecuación:

 

                                                                    Ec. [15]

 

donde G0(s) es la función de transferencia de la entrada u del sistema al error z, que está definida como:

 

                                                     Ec. [16]

 

La ecuación [15] es la que define el lugar de las raíces simétrico respecto al eje imaginario respecto del parámetro variable r.

 

Entonces, para un dado r se encuentran la ubicación deseada de las raíces que cumplan con los requerimientos de la respuesta transitoria, y luego, por ejemplo, con Ackermann se determina el vector de ganancias de retralimentación de estados K.

 

Ejemplo:

Se desea controlar una planta cuya ecuación de estado es la siguiente:

 

           

 

donde el error que se quiere minimizar (en contraposición de la acción de control) es la suma de ambas variables de estado, por lo tanto:

 

           

 

Hallemos entonces la función de transferencia de u a z:

 

           

 

Por lo tanto, el lugar geométrico de las raíces al variar el parámetro r está dada por la siguiente ecuación característica:

 

           

 

Y por lo tanto el lugar geométrico de las raíces simétrico se muestra en la figura 4.

 

Figura 4. Lugar geométrico de las raíces simétrico del ejemplo.

 

Supongamos que se desea además de la posición de las raíces cumpla un óptimo, también sea lo más rápido posible. Del lugar geométrico vemos que dicha posición es cuando ambas raíces se unen nuevamente en el eje real. Determinemos entonces ese punto, para eso veamos dónde la derivada con respecto a la variable compleaja s de la inversa de la función transferencia se hace nula:

 

           

 

 

           

 

Y por lo tanto esta derivada se hace cero en s = 0.0, , y . De ellas, la raíz doble que nos interesa es la posición s = .

Utilizando el criterio de magnitud, podemos determinar el valor de r (suponiendo que el valor de a es: ):

 

           

 

           

 

Ahora, el polinomio característico deseado será:

 

           

 

Que debe coincidir con la ecuación característica del sistema retroalimentado:

 

 

 

Igualando coeficiente con coeficiente:

 

           

 

Obteniendo así el vector de retroalimentación K:

 

           

 

Diseño del estimador

Normalmente en las plantas dinámicas que deseamos controlar no disponemos a cada instante de tiempo t con todas las variables de estados x para determinar la acción de control u = -K.x. Entonces, ¿cómo realizamos el control?

La solución de este problema es mediante la construcción de un estimador (u observador indistintamente).

Un observador se encarga en cada instante de tiempo t de “estimar” cuánto valen las variables de estado x en base de la salida de la planta y (medición) y la acción de control efectuada u. El resultado del observador lo llamaremos variable de estado estimada .

Según el estimador determine el vector de variables de estado completo o solo un subconjunto del mismo, el estimador recibe el nombre de observador de orden completo u observador de orden reducido.

Veamos a continuación la construcción de un observador de orden completo.

 

Estimador de orden completo

Un estimador consiste en realizar una “simulación” del sistema para determinar el valor de las variables de estado estimadas . Una opción para armar el mismo, utilizando únicamente la información de la acción de control u, es mediante la siguiente ecuación:

 

                       [Ec. 17]

 

ya que las matrices A y B son conocidas (ya que contamos con un modelo de la planta), y la acción de control u también puesto que es lo que nosotros determinamos y enviamos a la planta. El único problema con esto es que no conocemos la condición inicial de la que parte la planta real x(0), y así poner la misma a nuestra simulación.

Analicemos con mayor detalle esto. La ecuación de estado de la planta real es:

 

                       [Ec. 18]

 

con condición inicial x(0). Supongamos que nuestra simulación parta de otra condición inicial que llamamos . Veamos entonces cómo evoluciona el error , restando la ecuación 18, la ecuación 17, obtenemos que:

 

                    [Ec. 19]

 

con condición inicial . Esto es un sistema autónomo, cuya dinámica corresponde a la de los autovalores de la matriz A. Entonces, salvo que fortuitamente las condiciones iniciales del vector de variables de estado coincida con el estimado, el error evolucionará con un error que estará dado por los autovalores de A, o sea la dinámica de la planta a lazo abierto. Si la planta original es inestable, evidentemente esto no funcionará puesto que el error divergirá. Pero, además, siendo la planta original estable, este estimador tampoco tiene sentido, puesto que la ley de control la diseñamos generalmente para que el sistema responda más rápidamente que la planta original, y no podemos alimentar la ley de control con una estimación que tiene una dinámica igual a la de la planta.

Entonces, ¿cómo resolvemos el problema?

El problema lo resolvemos usando la regla habitual de control: “cuando tienes un problema, usa retroalimentación”. ¿y qué es lo que retroalimentamos? Disponemos de una información que no la hemos utilizado hasta el momento que es la información de la salida de la planta y, que comparándola con la salida que daría nuestra simulación lo utilizaremos para retroalimentar el estimador como muestra en línea punteada la siguiente figura:

 

Figura 5. Esquema del estimador con retroalimentación.

 

Entonces la ecuación del observador será en este caso:

 

          [Ec. 20]

 

donde L es un vector columna de n componentes de ganancias proporcionales a determinar. Este vector L se elegirá de manera tal que el error de estimación converja de manera conveniente.

Calculemos ahora como converge el error de estimación. Restando a la ecuación 18 de la planta, la ecuación 20, obtenemos:

 

           

 

                               [Ec. 21]

 

Por lo tanto, si no hay error de modelado, el error de estimación convergerá con una dinámica que estará dada por la ecuación característica:

 

                   [Ec. 22]

 

En la práctica, se puede comprobar que aún habiendo pequeños errores en el modelado, se pueden conseguir errores pequeños de estimación dada una adecuada elección del vector L.

Por lo tanto, eligiendo la posición de n polos que definirán la dinámica de convergencia del error de estimación, podemos determinar el valor de las n componentes del vector L (es un problema de nxn). El problema es similar al de determinación del vector K para la ley de control. Entonces teniendo la ecuación característica deseada del estimador:

 

                             [Ec. 23]

 

donde bi son las ubicaciones deseadas de los polos del estimador. Igualando coeficiente a coeficiente con la ecuación 22 determinamos los valores de los componentes del vector L.

En este problema, siempre podemos determinar todos los componentes de L, si el sistema es observable (capacidad que tiene del sistema de observar todos los modos del sistema basándose en la medición y).

Recordamos que la planta es observable, si y solo si, la matriz de observabilidad O:

 

                                  [Ec. 24]

 

es de rango completo.

También podemos aplicar la fórmula de Ackerman para resolver este problema, ya que los autovalores de una matriz son los mismos que los autovalores de la matriz traspuesta. Observando las matrices, en la fórmula de Ackerman hay que reemplazar la matriz A por su traspuesta, la matriz B por la matriz C traspuesta, y el vector K por el vector L traspuesto. Notar que de esta manera, la matriz que hay que invertir es la matriz de observabilidad traspuesta.

 

Ejemplo:

Sigamos con el ejemplo del oscilador no-amortiguado, cuya representación por variables de estado volvemos a describir:

 

           

 

           

 

Elijamos como polos del estimador un polo doble en s = -10.w0. Por lo tanto la ecuación característica deseada será:

 

           

 

Y sabemos que la ecuación característica del estimador deberá ser:

 

           

 

           

 

Igualando coeficiente a coeficiente, obtenemos el siguiente resultado:

 

           

           

 

Por lo tanto la ecuación del observador será:

 

           

 

Observar que para la ley de control habíamos ubicado sus polos en s = -2.w0, o sea que duplicamos la frecuencia natural de la planta y pasamos de tener un coeficiente de amortiguamiento igual a 0 (no existe amortiguamiento), a otro con lazo de retroalimentación de estados cuyo coeficiente de amortiguamiento es 1 (completamente amortiguado). Notar que los polos del estimador los ubicamos a una distancia 5 veces mayor que los polos de la ley de control (son polos 5 veces más rápidos). Veremos más adelante que ésta es una buena elección.

 

Estimador de orden reducido

Si la salida del sistema es ya una de las variables de estado (si no lo es, se podría realizar una transformación de estado para que esto sí ocurriera), y además esta medición no es ruidosa, es completamente innecesario realizar una estimación de dicha variable. Si la señal de medición es ruidosa el observador de orden completo actuaría como filtro de dicha variable.

Entonces, en el caso que la medición no es ruidosa es conveniente construir un estimador de dimensión menor que solo estime los estados no medidos. Para eso dividamos el vector de variables de estado en: xa los estados medidos; y xb los estados no-medidos (que son los que deseamos estimar):

 

           

 

Por lo tanto la representación por variables de estado podrá ser escrita como:

 

                           [Ec. 25a]

                                                         [Ec. 25b]

 

Entonces la dinámica de las variables de estado no medidas es:

 

                                 [Ec. 26]

 

y la dinámica de las variables de estado medidas (si hablamos de sistemas SISO es una sola variable):

 

           

 

                                                [Ec. 27]

 

Por lo tanto la ecuación 26 juega el papel de las ecuaciones de estado, y la ecuación 27 la ecuación de salida, permitiendo realizar el siguiente paralelismo con el observador de orden completo:

 

O. orden completo

O. orden reducido

x

xb

A

Abb

B.u

Aba.y+Bb.u

y

C

Aab

 

Con este paralelismo, armamos la ecuación del estimador:

 

                [Ec. 28]

 

Definiendo ahora el error de estimación de las variables de estado no-medidas como:

 

                            [Ec. 29]

 

Usando la ecuación 26, 27, 28 y 29, obtenemos cómo es la ecuación de la dinámica de éste error:

 

                                [Ec. 30]

 

Y por lo tanto la ecuación característica que define los polos del estimador será:

 

                         [Ec. 31]

 

Que igualando coeficiente a coeficiente con la ecuación característica deseada determinamos los componentes del vector L. Notar que ahora L será un vector columna de la misma dimensión de xb (llamemos nb), y que el determinante de la ecuación 31 es de una matriz de nbxnb; por lo tanto ahora debemos elegir solamente la posición de nb polos.

La ecuación 28 del estimador puede ser reescrita como:

 

            [Ec. 32]

 

La presencia de la derivada temporal de la medición representa una dificultad, puesto que a pesar que la señal como digimos previamente no es ruidosa, el poco ruido que tenga por el uso de su derivada se verá amplificado. Entonces, para la implementación de este observador es conveniente utilizar una variable auxiliar ; e integro numéricamente con la siguiente ecuación:

 

            [Ec. 33]

 

y determino la estimación como:

 

                                    [Ec. 34]

 

Las ecuaciones 33 y 34 son entonces en conjunto las ecuaciones del observador de orden reducido; donde la ecuación 33 juega el papel de la ecuación de estado (con dos entradas: u e y), y la ecuación 34 la ecuación de salida (notar que hay transmisión directa de y –una de las entradas– a la salida ).

 

Ejemplo:

Volviendo al ejemplo del oscilador no-amortiguado, analizando las matrices tenemos que:

 

                                  

 

La ecuación característica será entonces:

 

           

 

Elijo la ubicación del único polo del estimador en s = -10.w0, por lo tanto la ecuación característica deseada será:

 

           

 

Por lo tanto, de la comparación de ambas ecuaciones determinamos que L = 10.w0.

La ecuaciones del estimador serán entonces:

 

           

           

 

 

           

 

Selección de los polos del estimador

Las reglas son similares que las utilizadas para la selección de los polos de la ley de control. Generalmente los polos del estimador se eligen entre 2 a 6 veces más rápidos que los de la ley de control, así los polos de la ley de control quedan dominantes (polos más cercano al origen en el plano s).

En caso que la medición sea muy ruidosa, debemos tratar que el vector de ganancias L sea de magnitudes pequeñas (confiar más en el modelo que en la medición), y esto resultará en polos del estimador que son más lentos y por lo tanto influirán más significativamente en la respuesta transitoria del sistema retroalimentado. En este caso, habrá que tomar un compromiso entre la reducción del ruido de la medición y la respuesta transitoria más lenta.

Aunque en el estimador no exista el problema de “demasiado esfuerzo para el actuador” (en un principio, en el comienzo de los computadores el límite estaba en la precisión que éstos podían manejar, pero con la máquinas que existen hoy en día ese ya no es un límite), el hacerlo demasiado rápido trae como consecuencia una menor capacidad de filtrado de ruido.

El equilibrio entre filtrado de ruido y la rapidez de los polos del estimador se puede optimizar.

Supongamos tener un observador de orden completo, cuyas ecuaciones reiteramos acá:

 

          [Ec. 35]

 

con el cual tratamos de estimar los estados de una planta que posee tanto perturbaciones en el modelo (w), como en la medición (v):

 

                      [Ec. 36.a]

                                        [Ec. 36.b]

 

Como podemos observar de las ecuaciones, cuando tengo un L que es pequeño en magnitud, nos estamos apoyando más en el modelo y B1.w debería ser más pequeño que el ruido de medición v. Haciendo un razonamiento similar, cuando tengo un L grande, nos estamos apoyando más en la medición que en el modelo, y por lo tanto debería tener un ruido en la medición v que sea pequeño, sin importarme mucho cuan grande sea la perturbación en el modelo w.

La solución óptima a ésto es el lugar geométrico simétrico de las raíces dado por la ecuación:

 

                                 [Ec. 37]

 

donde q es el parámetro que varía en el lugar geométrico de las raíces y que es proporcional a la relación entre las varianzas (el cuadrado de la desviación standard) del ruido de medición v y de la perturbación del modelo w: .

Mientras que la función de transferencia Ge(s), es la función de transferencia desde la perturbación w al ruido de la medición:

 

                          [Ec. 38]

 

En función de cuanto valga la relación de las varianzas de ambas señales ruidosas, es que obtenemos la mejor opción para la ubicación de polos del estimador. Ellas serán las ubicaciones de las raíces estables del lugar geométrico simétrico de las raíces mencionado.

 

Diseño del regulador

Combinemos ahora los resultados de haber diseñado la ley de control y el estimador. Por simplificación vamos a suponer que el observador que fue diseñado sea un estimador de orden completo, pero resultados similares a los que llegaremos se obtienen utilizando un observador de orden reducido.

Como se podrá observar, en este caso si la planta original es de orden n, cuando realizamos la retroalimentación de estados con un observador de orden completo, el sistema retroalimentado es un sistema de orden 2.n. Por lo tanto debemos describir al sistema eligiendo ahora 2.n variables de estado. Elijamos como las n primeras variables de estado a las variables de estado de la planta original: x, y las restantes n variables los errores de estimación: .

Empecemos a determinar las ecuaciones de estado del sistema extendido. De las ecuaciones de estado de la planta tenemos:

 

           

                                      [Ec. 39]

 

Por otro lado, del estimador sabemos que el error de estimación responde a la siguiente dinámica:

 

                                           [Ec. 40]

 

Y por lo tanto ya tenemos la descripción completa:

 

                                   [Ec. 41]

 

Donde ahora este sistema descripto por la ecuación 41 es un sistema autónomo, cuya ecuación característica es:

 

                               [Ec. 42]

 

Y se puede demostrar matemáticamente que dicho determinante es:

 

                        [Ec. 43]

 

Por lo tanto concluímos con algo que esperábamos que sucediera: el sistema retroalimentado tiene como autovalores (como polos), los polos de la ley de control en conjunto con los polos del estimador.

Ahora bien, nunca nos preguntamos con la parte que armamos del compensador, cómo era su función de transferencia. Veamos como queda el sistema retroalimentado:

 

Figura 6. Esquema del sistema retroalimentado con el regulador.

 

Toda la parte recuadrada en línea punteada es lo que “armamos” para realizar el control, a la cual entra la señal y de medición, y sale determinado cuánto vale la acción de control. Las ecuaciones del compensador serán:

 

                                [Ec. 44]

 

Reacomodando los términos:

 

                               [Ec. 45]

 

Y por lo tanto la ecuación de transferencia del compensador será:

 

                       [Ec. 46]

 

Que tendrá por polos las raíces de la ecuación característica:

 

                                  [Ec. 47]

 

Cuyos valores nunca antes habían sido calculados. Notar que dichas raíces pueden ser inestables, y por lo tanto la función de transferencia del compensador será inestable y esto no puede ser posible porque originaría acciones de control divergentes (que no es deseado puesto que, o alcanzaríamos siempre alguna saturación en la acción de control, o quemaríamos el actuador: por ejemplo un motor). Entonces este cálculo es siempre una cosa a tener en cuenta para verificar el controlador contruído.

Queda como ejercicio para el lector el desarrollo de estas cuentas para el caso de un observador de orden reducido.

 

Ejemplo:

Sea la planta con la siguiente función de transferencia:

 

           

 

Que en su forma canónica de observabilidad queda representado por variable de estado de la siguiente manera:

 

 

Determinamos primeramente el vector K de retroalimentación de estados. Para eso utilizamos el criterio ITAE, polinomio de tercer orden, con una frecuencia w0 = 2 rad/seg.

Esto significa que los polos de la ley de control los ubicamos en = -1.42, y = ‑1.04±2.14j; y la ecuación característica deseada será:

 

           

 

Con el mismo llegamos a obtener el vector de retroalimentación de estados:

 

           

 

Realicemos un estimador de orden completo, y utilicemos también el criterio ITAE con un w0 = 6 rad/seg. Entonces los polos del estimador estarán en = -4.25, y = ‑3.13±6.41j; y la ecuación característica deseada será:

 

           

 

Y así llegamos al vector de ganancias para el estimador:

 

           

 

Determinemos ahora la función de transferencia del compensador, que resulta en:

 

 

Que como vemos tiene un polo inestable, y por lo tanto no es posible implementarlo puesto que generaría una acción de control divergente.

 

Seguimiento a referencia

Hasta ahora lo que hemos llegado a realizar del control nos sirve como regulador: mantener la planta en el punto de operación y no moverlo de ese punto. Este regulador también cumple la función de rechazar perturbaciones, esto es, ante el cambio de una entrada no controlada (una perturbación), lograr mantener el sistema en el punto de operación mencionado.

El seguimiento a referencia es un problema distinto al de regulación, ya que supone la existencia de una señal de referencia r. El problema de seguimiento de referencia (o de servomecanismo) consiste en que la señal de salida y siga (copie) la evolución temporal de esta señal de referencia r (señal deseada para y).

Entonces el problema consiste en ver cómo introducimos en el esquema de control diseñado hasta ahora, la señal de referencia r de modo que y trate de seguirla.

Las ecuaciones que hemos desarrollado hasta ahora son las siguientes:

 

Planta:

                                 [Ec. 48]

 

Regulador:

                   [Ec. 49]

 

Existen dos maneras evidentes de introducir en el esquema de control la entrada de referencia (que no son las únicas, veremos que existen más). Esas dos formas son las que muestran las siguientes figuras:

 

Figura 7. CASO A: Compensación en la retroalimentación.

 

Figura 8. CASO B: Compensación en el lazo directo.

 

Como se puede observar, ambos esquemas de control presentan los mismos polos de lazo cerrado (haciendo r = 0, ambos esquemas tienen los mismos polos que el regulador), pero no tienen los mismos ceros y por lo tanto la respuesta en el seguimiento de r serán distintos:

CASO A: Un escalón en la entrada de referencia en este esquema excita de igual modo el estimador como a la planta, y por lo tanto no habrá un cambio en el error de estimación por la presencia de este escalón en la referencia. Esto significa que la función de transferencia de r a y debe tener ceros que cancelen los polos del estimador, así la respuesta del sistema así retroalimentado y con esta entrada de referencia tendrá como polos solo los polos de la ley de control, o sea las raíces de la ecuación característica: .

CASO B: Un escalón en la entrada de referencia en este esquema excita al estimador (aparece un error de estimación) que se atenúa con la dinámica propia del estimador. Esto significa que las raíces tanto de la ley de control como las del estimador son excitadas en forma conjunta, o sea los polos serán las raíces de la ecuación característica: .

 

Es evidente después de este análisis que es más conveniente utilizar el esquema del caso A.

Veamos ahora, la forma más general de introducir la señal de referencia r(t) en el regulador es sumando términos proporcionales a las ecuaciones del regulador:

 

                               [Ec. 50]

 

donde M es un vector columna de n componentes (n = es el orden del estimador), y N es un escalar (considerando un sistema SISO).

De esta manera:

 

Existen varias posibilidades para elegir los valores de M y N:

1)      Que el error de estimación  sea independiente de r(t).

2)      Que el control esté basado directamente en la comparación entre r e y, o sea esté basado en e = ry.

3)      Máxima libertad para ajustar la respuesta transitoria y estacionaria del sistema retroalimentado.

 

Para el caso 1:

Analicemos cómo es la dinámica del error de estimación:

 

           

 

                           [Ec. 51]

 

Por lo tanto, para que los cambios en el error de estimación no sean afectados por la señal r, M deberá ser igual a: M = B.N.

De esta manera, la ecuación 50 queda:

 

             [Ec. 52]

 

Notar que este es el caso A mencionado anteriormente.

Observar que si el actuador de la planta posee una saturación, conviene indicar también dicha saturación al estimador, así la saturación no afectará tampoco al error de estamación .

Queda todavía cómo determinar el valor de N, pero esto lo dejamos para más adelante, después de haber visto todos los casos.

 

Para el caso 2:

Esto es la única alternativa que disponemos cuando no se dispone de las señales r e y por separado, sino que se dispone solamente de la diferencia entre ambos. Ejemplo de ésto es por ejemplo el termostato en el control de temperatura de un ambiente.

En este caso, eligiendo N = 0; y M = -L, conseguimos el objetivo:

 

            [Ec.53]

 

y como vemos las ecuaciones ahora solo dependen de e = yr. Notar que éste es el caso B mencionado previamente.

 

Para el caso 3:

Para este caso, analicemos previamente que sucede con los ceros de transmisión de r a y, para el caso de no tener estimador. En este caso la acción de control u toma el valor:

 

            u = -K . x + N . r                                 [Ec. 54]

 

y por lo tanto las ecuaciones que gobiernan el sistema retroalimentado serán:

 

                         [Ec. 55]

 

Los ceros de la transmisión de r a y están dados por aquellos lugares del plano s que cumplen la siguiente ecuación:

 

                         [Ec. 56]

 

Estas raíces son las mismas, si a una columna de la matriz la multiplicamos por una constante y se la sumamos a las otras columnas. Multipliquemos a la última columna por ki/N y sumemos a cada una de las i columnas (i de 1 a n). Entonces las raíces de la ecuación 56 son las mismas que las raíces de la siguiente ecuación:

 

                               [Ec. 57]

 

Por lo tanto los ceros de transmisión de r a y no dependen del valor de K. Además podemos observar que estos ceros son los mismos ceros originales de la planta (son los ceros de u a y).

Analicemos ahora el caso de tener un estimador. Los ceros que hay de r a y serán los ceros que hay entre r y u, más los ceros de u a y. Como por el análisis anterior sabemos que los ceros de u a y son los originales de la planta, nos queda por determinar si existe algún otro cero que se agregue en la transmisión de r a u(*). Para analizar esto, plantiemos las ecuaciones del estimador/control:

 

                               [Ec. 58]

 

(*) Otra manera de pensar esto: que exista un cero en la transmisión de r a u significa que para ese modo de excitación en r no tenemos ningún “movimiento” en u, esto implica que como u no se mueve, tampoco se moverá y. Entonces ese modo en r no “mueve” a la señal y y por lo tanto es un cero también de transmisión de r a y (la salvedad está cuando justo coincide con un polo de u a y, que en dicho caso se cancelarían).

Veamos entonces los ceros que existen de r a u. Éstos serán las raíces del siguiente determinante:

 

                                 [Ec. 59]

 

Conclusión: Tenemos n grados de libertad (n elementos del vector M/N), para asignar la posición de n ceros de transmisión de r a u (y por lo tanto de r a y), que son las raíces de g(s).

 

Consideraciones:

· Para la respuesta dinámica, los ceros influyen en forma significativa en la respuesta transitoria a un escalón y por lo tanto generalmente se requerirá que los ceros se encuentren alejados 4 veces más que los polos dominantes del sistema, salvo que se quiera eliminar algún polo (estable) indeseable cancelándolo con uno de estos ceros.

· Para la respuesta estática (o estacionaria), existe una relación entre la ubicación de polos y ceros de lazo cerrado con la precisión con que se sigue a una señal de referencia. Ejemplo de ello está la relación de Truxal para sistemas de tipo I, en donde el error de estado estacionario a una rampa es:

 

                                    [Ec. 60]

 

donde pi son la posición de los polos de lazo cerrado y zj son los ceros de los polos de lazo cerrado (con sus signos). La demostración de esta fórmula se encuentra descripta en la página 211 del libro de referencia citada en la bibliografía de este capítulo.

Criterio de cómo utilizar esto: Si existen un par de cero/polo en la cual (pizj) es muy pequeño (y por lo tanto la influencia de este par sobre la respuesta transitoria es despreciable), pero además hacemos que (1/pi – 1/zj) sea considerablemente grande, podemos influir bastante en la constante de error estacionario sin afectar la parte transitoria.

Se puede comprobar también que para sistema de tipo II, el error de estado estacionario a una parábola vale la siguiente relación:

 

                                  [Ec. 61]

 

donde nuevamente las variables que definen la relación tienen el mismo significado que para la ecuación [60]. La demostración de esta fórmula se encuentra descripta aquí.

 

Observación:

De , tenemos:

a)      Para el caso 1: , cuyas raíces son los polos del estimador. Por lo tanto los ceros de transmisión de r a u se cancelan con los polos del estimador, confirmando resultados anteriores.

b)      Para el caso 2: , y reemplazando en la ecuación 59 tenemos:

 

                  [Ec. 62]

 

Posmultiplicando la última columna por C y sumándole a las n primeras columnas, y premultiplicando la última fila por B y sumándole a las primeras n filas, obtenemos:

 

                                         [Ec. 63]

 

Por lo tanto, mirando esta última ecuación, los ceros que agrega el compensador están fijados por L y K, y no hay manera de ubicarlos en otro lugar (notar que los ceros que quedan son los ceros de haber tomado las ecuaciones originales de la planta, y haber reemplazado el vector columna de entrada B por L y el vector fila de salida C por K).

 

Resumen:

La función de transferencia total de lazo cerrado será:

 

                                                      [Ec.64]

 

donde b(s) es el polinomio cuyas raíces definen los ceros de la planta (ceros de lazo abierto, que no se mueven); ac(s) y ae(s) son las ecuaciones características deseadas que se utilizaron para la ley de control y el estimador respectivamente; y finalmente g(s) son los ceros elegidos por el diseñador de la entrada a referencia.

 

Elección de la ganancia :

Ahora es el tiempo de determinar la ganancia  para los tres métodos de selección de M. El objetivo de esta elección es ajustar la ganancia estacionaria final del sistema entre r e y de manera que la misma sea unitaria .

a) Si elegimos el primer método, por el análisis que hemos hecho los estados estimados estacionarios son iguales a los estados reales estacionarios (puesto que el error de estimación tiende a cero). Por lo tanto podemos suponer que , y de esta manera evitar complicarme con las cuentas del compensador.

Supongamos que ya en el estacionario, tanto la señal uss como los estados xss sean proporcionales a la señal de entrada r: uss  = Nu . r ; xss = Nx . r. Por otro lado sabemos que por las ecuaciones de la planta, en el estacionario debe cumplirse que (ya que de tratarse de un estacionario las derivadas temporales deben ser nulas):

 

                           [Ec. 65]

 

Como en el estacionario queremos lograr que yss = rss, tenemos el siguiente conjunto de ecuaciones para determinar Nx y Nu:

 

              [Ec. 66]

 

Eliminando rss de las ecuaciones, y reescribiendo en forma matricial:

 

                         [Ec. 67]

 

Premultiplicando por la inversa de la primera matriz:

 

                                  [Ec. 68]

 

Obtenidos Nx y Nu, calculamos  como: ; puesto que u es:

 

            [Ec. 69]

 

b) Si elegimos el segundo método, el resultado es trivial; ya que debe ser = 0.

c) Si elegimos el tercer método, elegimos  de manera tal que la ganancia total a lazo cerrado sea unitaria (como en el primer método). Las ecuaciones de todo el sistema son:

 

              [Ec. 70]

 

donde  es el valor obtenido por el método 3 de . El sistema entonces tendrá una ganancia estacionaria de lazo cerrado igual a la unidad si se cumple que:

 

             [Ec. 71]

 

Resolviendo esta ecuación 71, obtenemos el valor de  como:

 

    [Ec. 72]

 

Los análisis hechos en esta sección fueron realizados utilizando un observador de orden completo, queda para el lector realizarlos para un estimador de orden reducido.

 

Ejemplo:

Tenemos el servomecanismo cuya función de transferencia es:

 

 

que puede ser representado por el siguiente conjunto de ecuaciones de estado:

 

 

Se puede comprobar que con el vector K = [8 3] se obtiene la siguiente ecuación característica deseada para la ley de control: .

Por requerimientos de control se pretende que la respuesta estacionaria a una rampa sea inferior al 10 % (por lo tanto Kv debe ser mayor o igual a 10), pero ahora tiene un Kv = 2. Esto lo podemos verificar aplicando la fórmula de Truxal, teniendo en cuenta que la planta no tiene ceros, y que con la retroalimentación los polos de lazo cerrado están en s = -2 ± 2.j:

 

 

Con los dos primeros métodos no puedo manejar el Kv, en la primera porque los ceros justos se agregan para cancelar los polos del estimador y por lo tanto el Kv quedaría con el mismo valor de 2; en el segundo se agregan ceros (además de los polos del estimador) pero no tengo grados de libertad para elegir Kv y sería mucha casualidad que el mismo diera mayor que 10 (el lector podría realizar los cálculos para determinar cuánto daría en este caso el Kv).

Por lo tanto me queda el tercer método para manejar el Kv.

Elegimos colocar un estimador de orden reducido (agregando por lo tanto un solo polo), y seleccionamos la ubicación de ese polo (p3) en s = -0.1. Notar que estamos haciendo lo opuesto a lo que generalmente realizamos para elegir la posición del estimador. La idea ahora es colocar el cero que agrega la entrada de referencia en un lugar muy cercano a éste s = ‑0.1, de manera que no se afecte la respuesta transitoria pero sí la respuesta estacionaria. Veamos dónde debe colocarse el cero:

 

 

Por lo tanto, para que Kv sea 10, el cero debe estar en:

 

 

Que como notamos está muy cercano al polo p3, con lo cual la respuesta transitoria no se verá afectada y podemos aumentar el Kv a 10 como era el requerimiento estacionario de control.

Entonces se diseña un estimador de orden reducido ubicando el polo del estimador en p3 = -0.1, y se determina el valor de M/N de manera que el cero quede ubicado en -0.962. Luego se determina la ganancia para que la ganancia estacionaria completa sea unitaria. Después de esto, puede comprobarse que la función de transferencia total del sistema es:

 

 

que posee un Kv = 10 como fue diseñado.

También se puede comprobar, que la función de transferencia del compensador así diseñado es equivalente a un compensador tipo adelanto de fase conjuntamente con uno de atraso de fase, que se diseñan en control clásico.

 

Control Integral

En control clásico es habitual el agregar compensadores con integradores puros, de manera que si el sistema está retroalimentado unitariamente, cambia el tipo de sistema por la cantidad de integradores puros que se hayan agregado.

Para realizar esta misma práctica en control por variable de estado debemos aumentar la dimensión del estado del sistema. Supongamos que el sistema de la planta original sea:

 

                                             [Ec. 73]

 

Entonces definimos una nueva variable de estado xI, cuya derivada sea la salida del sistema original:

 

                                                        [Ec. 74]

 

y por lo tanto .

Entonces el sistema extendido quedaría expresado del siguiente modo:

 

                        [Ec. 75]

 

Y ahora envés de tener que determinar un vector de retroalimentación de ganancias de n componentes, tendrá que ser de n+1: ; que se determina en forma semejante a lo que hacíamos previamente, pero el sistema por resolver será de (n+1)x(n+1).

El esquema de control agregando una entrada de referencia r será el siguiente:

 

Figura 9. Esquema del sistema de control con acción integral.

 

En el caso que no se tenga todas las variables de estado como medición, no existe problema de incorporar un estimador para alimentar al vector K, ya que para KI solo se necesita la medición (quedando un esquema con retroalimentación unitaria).

 

Ejemplo:

Supongamos tener una planta cuya función de transferencia sea:

 

 

Queremos que los polos del estimador se encuentren en s = -5 (polos dobles), ya que por la acción integral el sistema pasa a ser de orden 2, entonces la ecuación característica deseada será:

 

 

Y el sistema extendido tiene la siguiente forma:

 

 

Y resolviendo la ecuación característica de la ley de control para los polos propuestos, el vector de ganancias de retroalimentación es: [KI K] = [ 25  7 ]; y el esquema del sistema de control será:

 

Figura 10. Esquema resultante del ejercicio del sistema de control con acción integral.

 

De esta manera, el error de estado estacionario tanto para un escalón en r como en la perturbación w serán nulos. Queda como ejercicio al lector demostrarlo.

 

Volver al índice