Diseño en el espacio de estados
CAPITULO VIII: Diseño
en el espacio de estados
Introducción
A lo largo del curso, hemos desarrollados
modelos y hecho análisis dinámico de los mismos, siendo los modelos
no-lineales, variantes en el tiempo y de múltiples entradas y salidas. En la
medida que profundizábamos en el análisis, también fuimos particularizando el
mismo para los sistemas lineales, invariantes en el tiempo y que sean SISO: de
una entrada y una salida.
Ahora solo nos concentraremos en
resolver el problema de controlar una planta cuya dinámica es lineal,
invariante en el tiempo, y que presente una sola entrada y una sola salida.
Si eventualmente nos encontráramos
con tener que desarrollar un controlador para una planta no-lineal, deberíamos
buscar el punto de equilibrio (punto de operación) en el cual queremos mantener
la planta, y a partir del mismo linealizar el modelo, desarrollando luego el
controlador a partir de esa planta linealizada.
Si la planta es variante en el
tiempo (y si los parámetros variantes no cambian abruptamente y además tampoco
cambian demasiado), buscaremos aquel valor del parámetro variante en la que la
planta es más difícil de controlar y desarrollaremos el control para ese valor
del parámetro, esperando que una vez realizado el controlador funcione
correctamente también para todo el rango del parámetro variante.
Si el sistema tiene múltiples
entradas y salidas, una primera verificación que debería hacerse al sistema es
que la cantidad de entradas al sistema sea la misma cantidad de salidas. Luego
se debería realizar un análisis si el sistema puede “desacoplarse”: ver si se puede
identificar cada una de las salidas como afectada solo por una de las entradas
(sin que haya repeticiones), y realizar un controlador para cada uno de los
pares entrada-salida desacoplados. Este desacoplamiento no es siempre posible,
y para el caso que no sea posible otra estrategia a utilizar es ir haciendo
controladores “anidados”: realizar primero un controlador entre una salida y
entrada determinada, considerando que las otras entradas son nulas; introducir
este controlador como parte del sistema, y volver a elegir otro par
entrada-salida para realizar otro controlador, y así sucesivamente hasta agotar
todas las entradas con todas las salidas.
Una vez desarrollado el controlador,
siempre se procederá a verificar el funcionamiento del mismo a través de
simulaciones, y esta verificación se hace aún más necesaria cuando el sistema
presenta algunas de las características mencionadas anteriormente.
Unos de las características
atractivas del diseño de control utilizando el método del diseño de espacio de
estados es que el mismo consiste en una secuencia independiente de pasos.
Dichos pasos son los que describimos a continuación:
1) Diseño
de la ley de control: Se supone que se cuenta en todo momento con el valor
de cada uno de los estados de la planta a controlar, y se determina la acción
de control u (entrada de control a la
planta) como una combinación lineal de los estados. Los coeficientes de esa
“retroalimentación de estados” lo agrupamos en el vector que denominamos –K (ver figura 1). La determinación de K, para los sistemas controlables
–mencionamos algo en el capítulo 6-, está unívocamente ligada a los autovalores
del sistema retroalimentado y el problema se reduce en asignar un conjunto de
autovalores que correspondan con una performance temporal satisfactoria en
términos de tiempo de crecimiento, tiempo de establecimiento, sobrepico, etc.

Figura 1. Ley de control por retroalimentación
completa de los estados.
2) Construcción
del observador: Es muy raro que uno cuente con “mediciones” de todos los
estados de la planta, y por lo tanto es habitual no contar los valores de los
estados de la planta para realizar la retroalimentación de estados que se
mencionó en el paso anterior. Por lo tanto, es necesario construir un estimador
o observador (los dos términos se refieren a exactamente a lo mismo), que en
todo momento estime los estados de la planta a partir de la acción de control u que se ejerce sobre la planta y la
medición y (salida de la planta).
Veremos que siempre es posible realizar la construcción de dicho observador si
el sistema es observable.
3) Combinación
de la ley de control con el estimador: Una vez construído el observador,
determinamos la acción de control u,
alimentando la ley de control con los estados estimados de la planta:
, envés de utilizar los estados x propiamente dichos (ver figura 2). Cabría preguntarse si la
construcción del controlador de éste modo no cambia la posición de los polos
del sistema retroalimentado. La respuesta a esta inquietud, es que así
construído el controlador, el sistema retroalimentado conserva los polos
definidos por la ley de control, con adición de los polos del estimador.

Figura 2. Combinación de la ley de control con
el estimador.
4) Entrada
de referencia: Con el controlador armado hasta el paso anterior, el sistema
planta/controlador funciona correctamente como regulador: para volver al punto
de equilibrio a partir de una condición inicial distinta a ese punto de
equilibrio, o para el rechazo de perturbaciones. Distinto es el caso de
pretender que la salida y del
sistema, “siga” la evolución de una señal deseada de referencia r. El problema es cómo introducimos en
el esquema anterior (figura 2), dicha señal. La manera más sencilla de
realizarla es como se muestra en la figura 3, donde envés de introducir al
estimador la señal medida y, se la
alimenta con la diferencia entre la referencia y la medición (y-r).
Esta forma de introducir la entrada a referencia es semejante a la que se
utiliza en control clásico, pero como veremos no es la única manera de
introducir la referencia en el sistema, y que hay maneras más convenientes que
ésta. De la manera que el sistema ha sido retroalimentado, la posición de los
polos de la función transferencia entre la referencia r y la salida y quedan
completamente definidos. Veremos que según cómo introduzcamos esta señal de
referencia r dentro del controlador,
tendremos la capacidad de mover los ceros de la función de transferencia
mencionada.

Figura 3. Ejemplo de entrada de
referencia.
Ley
de control
El primer paso en el método de diseño de
control en variable de estado como se mencionó anteriormente es encontrar la
ley de control de retroalimentación de una combinación lineal de las variables
de estado.
Esta combinación lineal la podemos
expresar como el siguiente producto de vectores:
Ec.
[1]
Para la retroalimentación estamos
asumiendo que disponemos de todos los elementos del vector de estado. En la
práctica esta suposición es completamente poco probable, puesto que si tenemos
la capacidad de medir todos los estados (no siempre es el caso ya que pueden
existir estados que no se pueden
medir), económicamente no tiene sentido, puesto que los sensores son unas de
las partes más caras del lazo de control y tener que comprar un sensor para
cada una de las variables de estado sabiendo que el problema se puede
solucionar con uno solo de los sensores es un encarecimiento innecesario del
sistema de control.
Como vemos de la ecuación [1], si
tenemos un sistema de orden n, el
vector de incógnitas K es de n componentes. Por ser un sistema de
orden n, también tenemos la capacidad
de escoger la posición de n
autovalores. Por lo tanto tenemos n
grados de libertad (cada una de los componentes del vector K), para determinar las n
posiciones de los autovalores del sistema.
Sustituyamos la ley de
retroalimentación (ec. [1]) dentro de la ecuación de estado del sistema:
Ec.
[2]
Y por lo tanto ahora con la
retroalimentación de estados el sistema pasa a ser un sistema autónomo, cuya
dinámica está regida por los autovalores de la matriz (A-B.K); o sea los lugares del plano s
que cumple con siguiente la ecuación característica:
Ec.
[3]
Esta ecuación origina un polinomio
mónico de grado n. Escogiendo los
nuevos autovalores del sistema en s1,
s2, … sn, dá origen también a un polinomio mónico de grado n al cual llamamos ac(s):
Ec.
[4]
Igualando coeficiente a coeficiente
estos dos polinomios (ec. [3] y [4]) obtenemos n ecuaciones, dentro de las cuales están nuestras n incógnitas (los elementos del vector K). De esta manera, resolviendo el
sistema de ecuaciones de nxn, podemos
obtener el vector de ganancias K de
retroalimentación.
El trabajo de ubicar las raíces de
la ecuación característica lo veremos con mayor detenimiento en un próximo
punto, pero generalmente esta tarea requiere de un proceso de iteración del
diseñador.
Ejemplo:
Pretendemos controlar un oscilador
no-amortiguado de frecuencia w0, cuya una de sus representaciones por variable
de estado es la siguiente:

Los requerimientos de control exigen
colocar los dos autovalores del sistema controlado en una posición amortiguada
dos veces más rápida que la frecuencia de oscilación, o sea en la posición del
plano s = -2.w0.
Veamos primero que efectivamente el
sistema es un oscilador no-amortiguado. Para ello hallemos los autovalores de
la matriz A que son las raíces de la
siguiente ecuación característica:
Cuyas raíces son como esperábamos: s = ±j.w0. (oscilador no-amortiguado de frecuencia w0).
Por los requerimientos de control
queremos que la ecuación característica sea:
![]()
La ecuación característica aplicando
la retroalimentación de estado es la siguiente:

![]()
Igualando coeficiente a coeficiente
de ambos polinomios, obtenemos las siguientes dos ecuaciones:
por el término en s:
![]()
por el término independiente:
![]()
Y por lo tanto, el vector K de retroalimentación queda definido
como:
![]()
Ley de control para
sistema de orden mayor
La determinación del vector K llega a ser una tarea sencilla en
sistema de bajo orden, pero se vuelve una tarea más complicada cuanto mayor es
el orden del sistema. Para facilitar esa tarea, resulta conveniente pasar la
representación de variables de estado a su forma canónica de controlabilidad.
De esta manera el vector de ganancias de retroalimentación K se determina muy fácilmente.
Veamos para eso, cómo es la
representación de variables de estado en su forma canónica de controlabilidad:
Ec.
[5]
![]()
Con esta estructura especial que
tiene la matriz A, el polinomio de su
ecuación característica es:
Ec.
[6]
Calculemos en esta forma canónica
cómo es la matriz que representa la dinámica del sistema retroalimentado:
Ec.
[7]
Que sigue teniendo la misma estructura
que la matriz Ac original,
y por lo tanto el polinomio de su ecuación característica será por consiguiente:
Ec.
[8]
Y si el polinomio característico
deseado de los autovalores es:
Ec. [9]
La determinación de los componentes
del vector de ganancia K de
retroalimentación de estados se hace fácilmente:
![]()
Ec.
[10]
:
![]()
Por lo tanto, el procedimiento para
determinar el vector K en sistemas de
alto orden consistiría en hallar la matriz de transformación de estados T que lleve el sistema original a su
forma canónica de controlabilidad. Ya en su nueva representación determinar el
vector de retroalimentación Kc
en esa representación, y finalmente llevar éste vector a su representación
original a través de la matriz de transformación T.
Observar que un sistema podemos
siempre llevarlo a la forma canónica de controlabilidad si el sistema es
controlable, y siempre podemos encontrar el vector de retroalimentación K si podemos llevarla a dicha
representación. La inversa también se dá, no podemos hallar el vector de
retroalimentación K si el sistema no
es controlable (por ende no podemos llevarlo a su representación en la forma
canónica de controlabilidad).
Éste método de hallar el vector de
retroalimentación K se puede
sistematizar y reducir a una simple fórmula, conocida como la fórmula de
Ackermann, donde el vector de retroalimentación K (en la representación original del sistema) se determina como:
Ec.
[11]
donde C es la matriz de controlabilidad que
es:
y ac(.)
es el polinomio característico que define las raíces deseadas de la ley de
control, que se evalúa en la matriz A
del sistema (notar que para evaluar el polinomio en la matriz, todos los
términos del polinomio deben ser matrices de nxn, y por lo tanto el término independiente debe
multiplicarse por la matriz identidad de nxn).
Cabe también remarcar que esta
fórmula siempre puede evaluarse, siempre y cuando la matriz de controlabilidad C
sea invertible, y esto será así siempre que el sistema sea controlable.
Ejemplo:
Apliquemos la fórmula de Ackermann al problema
del último ejemplo. El polinomio característico deseado era:
![]()
por lo tanto su evaluación en la matriz A es:

La matriz de controlabilidad es:

Coincide que su inversa es
justamente la misma matriz.
Y aplicando la fórmula de Ackermann
volvemos a obtener nuevamente el vector K
de retroalimentación de estados:

Que obviamente coincide con el
resultado obtenido anteriormente.
Ejemplo:
Para el sistema cuya representación de estados
es la siguiente:

![]()
Buscar el vector de
retroalimentación de estados K que
cumpla con la siguiente ecuación característica:
![]()
Primero, veamos que z0 es un cero del sistema.
Para eso busquemos cuánto vale la función de transferencia de u a y:

Encontremos ahora cuánto vale la
ecuación característica del sistema retroalimentado:

![]()
![]()
Por lo tanto debe cumplirse que:
![]()
![]()
Resolviendo este sistema de
ecuaciones de 2x2, obtenemos cuánto deben valer cada una de las componentes del vector K de retroalimentación:
![]()
![]()
De este resultado podemos destacar
dos cosas:
-
Sabemos
que cuanto más cercano el cero de la planta (z0) esté de los polos de la misma (s = -3 ó -4), el sistema será más “difícil de controlar”; esto se
traduce que las componentes del vector K
se hacen cada vez más grande (requiriendo un mayor esfuerzo de la acción de
control). En el límite, cuando el sistema no es controlable, las componentes
del vector K se hacen infinito.
-
Si
requerimos también que el sistema actúe con mayor velocidad (que el tiempo de
crecimiento sea más chico y por lo tanto que el wn sea más grande), vemos que exigen
también que las componentes del vector K
sean más grande (en valor absoluto), y por lo tanto exigiendo también un mayor
esfuerzo en la acción de control.
Elección
de la ubicación de las raíces de la ley de control
Por lo que acabamos de ver, el esfuerzo de
control está relacionado con lo lejos que se hayan movido los polos originales
de la planta, y por lo tanto es una competencia entre una mejor performance de
la respuesta dinámica del sistema y un menor esfuerzo de la acción de control
requerida.
Además, también tenemos que los
ceros originales de la planta atraen a los polos, y por lo tanto se hace
difícil apartar un polo de un cero que se encuentre cercano. Pero por otro
lado, el comportamiento dinámico debido a un par de polo/cero cercanos se
anulan mutuamente. En este sentido, conviene dejar este polo en su ubicación
original y tratar de satisfacer los requerimientos de la respuesta dinámica
moviendo los polos restantes.
Entonces la filosofía de ubicar los
polos de la ley de control consiste en reparar solo los defectos que tienen la
respuesta de lazo abierto.
Veremos tres metodologías distintas
para elegir la ubicación de los polos de la ley de control, que son:
-
Segundo
orden dominante.
-
Diseño
de prototipos.
-
Lugar
geométrico de las raíces simétrico.
Segundo orden
dominante
En este método, se eligen la posición de dos
los polos de manera de satisfacer los requerimientos de la respuesta
transitoria, como ser tiempo de crecimiento, tiempo de establecimiento,
sobrepico, etc. El resto de los polos se eligen que se encuentren alejados de
éstos en un factor 4 para que no influyan en la respuesta transitoria, tratando
de no moverlos demasiado, y tratando además de amortiguarlos.
Si existen ceros en la planta
original, como los mismos permancen una vez cerrado el lazo de control, debería
buscarse que los polos dominantes sean lo suficientemente lentos como para no
ver la influencia de los ceros. En el caso de no ser posible, podría ubicarse
uno de los polos restantes en la cercanía de ese cero para acotar su influencia
sobre la respuesta transitoria.
Un caso típico de sistemas a
controlar, son algunos sistemas mecánicos que poseen modos de alta frecuencia
poco amortiguados y un par de modos de cuerpo rígido, que son de baja
frecuencia. Para estos tipos de sistemas se busca satisfacer los requerimientos
de la respuesta transitoria con los modos de cuerpo rígido, y los modos
vibratorios de alta frecuencia se los deja con la misma frecuencia (wn)
pero trasladándolos al eje real para amortiguarlos.
Diseño de prototipo
En este tipo de método, se ubican las n raíces de la ecuación características
en lugares predeterminados según un conjunto de polinomios que satisfacen algún
tipo de criterio normalizado con alguna frecuencia típica que requerimos que el
sistema tenga.
Por ejemplo, Graham y Lathrop (1953)
propusieron para plantas de distinto órden, cuál era el polinomio
característico que minimizaba un cierto índice conocido como la Integral del
Valor Absoluto del Error multiplicado por el tiempo (índice I. T. A. E. –
siglas en inglés: Intergral Time Absolute Error) ante la presencia de un
escalón a la entrada.
En fórmulas, el índice I.T.A.E. se
calcula como:
Ec.
[12]
Los polinomios que Graham y Lathrop
obtuvieron, fueron los siguientes, donde w0 es la frecuencia de corte que habíamos
mencionado:
|
n |
Ubicación de los polos según el criterio ITAE |
|
1 |
|
|
2 |
|
|
3 |
|
|
4 |
|
|
5 |
|
La respuesta de éstos polinomios dan
en general con un sobrepico. Si por los requerimientos de control se necesita
que la respuesta no posea sobrepico, entonces, se pueden utilizar los
polinomios de Bessel de grado n:
|
n |
Ubicación de los polos según polinomios de
Bessel |
|
1 |
|
|
2 |
|
|
3 |
|
|
4 |
|
Aunque con estos polinomios tenemos
la ventaja de eliminar el sobrepico, tenemos la desventaja de que la respuesta
se torna algo más lenta en comparación con los polinomios según el criterio
ITAE.
Observaciones respecto a ésta
metodología: la frecuencia que se utilice para definir los polinomios debe ser
semejante a las frecuencias del sistema original (si se elige una frecuencia
mucho mayor, esto provocará que el esfuerzo de control sea demasiado grande).
Si el sistema original tiene polos muy alejados en frecuencia, es mejor
dejarlos y aumentarles un poco la amortiguación.
Lugar geométrico de
las raíces simétrico
Una técnica muy utilizada en la teoría de
control óptimo, es la técnica del regulador cuadrático lineal óptimo (LQR en
sus siglas en inglés). Una versión simplificada de dicha teoría que es de fácil
aplicación es la siguiente:
Planteo del problema: Buscar la
ubicación de las raíces del sistema retroalimentado por variable de estado que
minimice el siguiente funcional:
Ec.
[13]
para el sistema:
Ec.
[14]
![]()
donde r balancea el efecto del error z con la acción de control u.
Observar que z no necesariamente es y
la salida del sistema. La variable z,
debe escogerse como un error que se quiere minimizar en conjunto con la acción
de control, y dicho error se puede calcular como una combinación lineal de los
estados de la planta.
Kailath (1980) demostró que los
polos de lazo cerrado que minimizan J
son las raíces estables de la ecuación:
Ec.
[15]
donde G0(s) es la función de transferencia de la
entrada u del sistema al error z, que está definida como:
Ec.
[16]
La ecuación
[15] es la que define el lugar de las raíces
simétrico respecto al eje imaginario respecto del parámetro variable r.
Entonces, para un dado r se encuentran la ubicación deseada
de las raíces que cumplan con los requerimientos de la respuesta transitoria, y
luego, por ejemplo, con Ackermann se determina el vector de ganancias de
retralimentación de estados K.
Ejemplo:
Se desea controlar una planta cuya ecuación de
estado es la siguiente:
![]()
donde el error que se quiere minimizar (en
contraposición de la acción de control) es la suma de ambas variables de
estado, por lo tanto:
![]()
Hallemos entonces la función de
transferencia de u a z:


Por lo tanto, el lugar geométrico de
las raíces al variar el parámetro r está dada por la siguiente ecuación
característica:
![]()
Y por lo tanto el lugar geométrico
de las raíces simétrico se muestra en la figura 4.

Figura 4. Lugar geométrico de las raíces
simétrico del ejemplo.
Supongamos que se desea además de la
posición de las raíces cumpla un óptimo, también sea lo más rápido posible. Del
lugar geométrico vemos que dicha posición es cuando ambas raíces se unen
nuevamente en el eje real. Determinemos entonces ese punto, para eso veamos
dónde la derivada con respecto a la variable compleaja s de la inversa de la función transferencia se hace nula:


![]()
Y por lo tanto esta derivada se hace
cero en s = 0.0,
, y
. De ellas, la raíz doble que nos interesa es la posición s =
.
Utilizando el criterio de magnitud,
podemos determinar el valor de r (suponiendo que el valor de a es:
):


Ahora, el polinomio característico
deseado será:
![]()
Que debe coincidir con la ecuación
característica del sistema retroalimentado:

![]()
Igualando coeficiente con
coeficiente:
![]()
![]()
Obteniendo así el vector de
retroalimentación K:
![]()
Diseño
del estimador
Normalmente en las plantas dinámicas que
deseamos controlar no disponemos a cada instante de tiempo t con todas las variables de estados x para determinar la acción de control u = -K.x. Entonces, ¿cómo realizamos el
control?
La solución de este problema es
mediante la construcción de un estimador
(u observador indistintamente).
Un observador se encarga en cada
instante de tiempo t de “estimar”
cuánto valen las variables de estado x
en base de la salida de la planta y
(medición) y la acción de control efectuada u.
El resultado del observador lo llamaremos variable de estado estimada
.
Según el estimador determine el
vector de variables de estado completo o solo un subconjunto del mismo, el
estimador recibe el nombre de observador
de orden completo u observador de
orden reducido.
Veamos a continuación la
construcción de un observador de orden completo.
Estimador de orden
completo
Un estimador consiste en realizar una
“simulación” del sistema para determinar el valor de las variables de estado
estimadas
. Una opción para armar el mismo, utilizando únicamente la
información de la acción de control u,
es mediante la siguiente ecuación:
[Ec.
17]
ya que las matrices A y B son conocidas (ya
que contamos con un modelo de la planta), y la acción de control u también puesto que es lo que nosotros
determinamos y enviamos a la planta. El único problema con esto es que no
conocemos la condición inicial de la que parte la planta real x(0), y así poner la misma a nuestra
simulación.
Analicemos con mayor detalle esto.
La ecuación de estado de la planta real es:
[Ec.
18]
con condición inicial x(0). Supongamos que nuestra simulación parta de otra condición
inicial que llamamos
. Veamos entonces cómo evoluciona el error
, restando la ecuación 18, la ecuación 17, obtenemos que:
[Ec. 19]
con condición inicial
. Esto es un sistema autónomo, cuya dinámica corresponde a la
de los autovalores de la matriz A. Entonces,
salvo que fortuitamente las condiciones iniciales del vector de variables de
estado coincida con el estimado, el error evolucionará con un error que estará
dado por los autovalores de A, o sea
la dinámica de la planta a lazo abierto. Si la planta original es inestable,
evidentemente esto no funcionará puesto que el error divergirá. Pero, además,
siendo la planta original estable, este estimador tampoco tiene sentido, puesto
que la ley de control la diseñamos generalmente para que el sistema responda
más rápidamente que la planta original, y no podemos alimentar la ley de
control con una estimación que tiene una dinámica igual a la de la planta.
Entonces, ¿cómo resolvemos el
problema?
El problema lo resolvemos usando la
regla habitual de control: “cuando tienes
un problema, usa retroalimentación”. ¿y qué es lo que retroalimentamos?
Disponemos de una información que no la hemos utilizado hasta el momento que es
la información de la salida de la planta y,
que comparándola con la salida que daría nuestra simulación lo utilizaremos
para retroalimentar el estimador como muestra en línea punteada la siguiente
figura:

Figura 5. Esquema del estimador con
retroalimentación.
Entonces la ecuación del observador
será en este caso:
[Ec. 20]
donde L
es un vector columna de n componentes
de ganancias proporcionales a determinar. Este vector L se elegirá de manera tal que el error de estimación converja de
manera conveniente.
Calculemos ahora como converge el
error de estimación. Restando a la ecuación 18 de la planta, la ecuación 20,
obtenemos:
![]()
[Ec.
21]
Por lo tanto, si no hay error de
modelado, el error de estimación convergerá con una dinámica que estará dada
por la ecuación característica:
[Ec. 22]
En la práctica, se puede comprobar
que aún habiendo pequeños errores en el modelado, se pueden conseguir errores
pequeños de estimación dada una adecuada elección del vector L.
Por lo tanto, eligiendo la posición
de n polos que definirán la dinámica
de convergencia del error de estimación, podemos determinar el valor de las n componentes del vector L (es un problema de nxn). El
problema es similar al de determinación del vector K para la ley de control. Entonces teniendo la ecuación
característica deseada del estimador:
[Ec.
23]
donde bi son las ubicaciones deseadas de los polos del
estimador. Igualando coeficiente a coeficiente con la ecuación 22 determinamos
los valores de los componentes del vector L.
En este problema, siempre podemos
determinar todos los componentes de L,
si el sistema es observable
(capacidad que tiene del sistema de observar todos los modos del sistema
basándose en la medición y).
Recordamos que la planta es
observable, si y solo si, la matriz de observabilidad O:
[Ec.
24]
es de rango completo.
También podemos aplicar la fórmula
de Ackerman para resolver este problema, ya que los autovalores de una matriz
son los mismos que los autovalores de la matriz traspuesta. Observando las
matrices, en la fórmula de Ackerman hay que reemplazar la matriz A por su traspuesta, la matriz B por la matriz C traspuesta, y el vector K
por el vector L traspuesto. Notar que
de esta manera, la matriz que hay que invertir es la matriz de observabilidad
traspuesta.
Ejemplo:
Sigamos con el ejemplo del oscilador
no-amortiguado, cuya representación por variables de estado volvemos a
describir:


Elijamos como polos del estimador un
polo doble en s = -10.w0. Por lo tanto la ecuación característica
deseada será:
![]()
Y sabemos que la ecuación
característica del estimador deberá ser:


Igualando coeficiente a coeficiente,
obtenemos el siguiente resultado:
![]()
![]()
Por lo tanto la ecuación del
observador será:

Observar que para la ley de control
habíamos ubicado sus polos en s = -2.w0, o sea que duplicamos la frecuencia natural de
la planta y pasamos de tener un coeficiente de amortiguamiento igual a 0 (no
existe amortiguamiento), a otro con lazo de retroalimentación de estados cuyo
coeficiente de amortiguamiento es 1 (completamente amortiguado). Notar que los
polos del estimador los ubicamos a una distancia 5 veces mayor que los polos de
la ley de control (son polos 5 veces más rápidos). Veremos más adelante que
ésta es una buena elección.
Estimador de orden
reducido
Si la salida del sistema es ya una de las
variables de estado (si no lo es, se podría realizar una transformación de
estado para que esto sí ocurriera), y además esta medición no es ruidosa, es
completamente innecesario realizar una estimación de dicha variable. Si la
señal de medición es ruidosa el observador de orden completo actuaría como
filtro de dicha variable.
Entonces, en el caso que la medición
no es ruidosa es conveniente construir un estimador de dimensión menor que solo
estime los estados no medidos. Para eso dividamos el vector de variables de
estado en: xa los estados
medidos; y xb los estados
no-medidos (que son los que deseamos estimar):

Por lo tanto la representación por
variables de estado podrá ser escrita como:
[Ec. 25a]
[Ec.
25b]
Entonces la dinámica de las
variables de estado no medidas es:
[Ec.
26]
y la dinámica de las variables de estado
medidas (si hablamos de sistemas SISO es una sola variable):
![]()
[Ec.
27]
Por lo tanto la ecuación 26 juega el
papel de las ecuaciones de estado, y la ecuación 27 la ecuación de salida,
permitiendo realizar el siguiente paralelismo con el observador de orden
completo:
|
O. orden completo |
O. orden reducido |
|
x |
xb |
|
A |
Abb |
|
B.u |
Aba.y+Bb.u |
|
y |
|
|
C |
Aab |
Con este paralelismo, armamos la
ecuación del estimador:
[Ec. 28]
Definiendo ahora el error de
estimación de las variables de estado no-medidas como:
[Ec. 29]
Usando la ecuación 26, 27, 28 y 29,
obtenemos cómo es la ecuación de la dinámica de éste error:
![]()
![]()
![]()
[Ec.
30]
Y por lo tanto la ecuación
característica que define los polos del estimador será:
[Ec. 31]
Que igualando coeficiente a
coeficiente con la ecuación característica deseada determinamos los componentes
del vector L. Notar que ahora L será un vector columna de la misma
dimensión de xb (llamemos nb), y que el determinante de
la ecuación 31 es de una matriz de nbxnb;
por lo tanto ahora debemos elegir solamente la posición de nb polos.
La ecuación 28 del estimador puede
ser reescrita como:
[Ec. 32]
La presencia de la derivada temporal
de la medición representa una dificultad, puesto que a pesar que la señal como
digimos previamente no es ruidosa, el poco ruido que tenga por el uso de su
derivada se verá amplificado. Entonces, para la implementación de este
observador es conveniente utilizar una variable auxiliar
; e integro numéricamente con la siguiente ecuación:
[Ec. 33]
y determino la estimación como:
[Ec.
34]
Las ecuaciones 33 y 34 son entonces
en conjunto las ecuaciones del observador de orden reducido; donde la ecuación
33 juega el papel de la ecuación de estado (con dos entradas: u e y),
y la ecuación 34 la ecuación de salida (notar que hay transmisión directa de y –una de las entradas– a la salida
).
Ejemplo:
Volviendo al ejemplo del oscilador
no-amortiguado, analizando las matrices tenemos que:

La ecuación característica será
entonces:
![]()
Elijo la ubicación del único polo
del estimador en s = -10.w0, por lo tanto la ecuación característica
deseada será:
![]()
Por lo tanto, de la comparación de
ambas ecuaciones determinamos que L =
10.w0.
La ecuaciones del estimador serán
entonces:
![]()
![]()
![]()
|
|
|
|
Selección de los polos
del estimador
Las reglas son similares que las utilizadas
para la selección de los polos de la ley de control. Generalmente los polos del
estimador se eligen entre 2 a 6 veces más rápidos que los de la ley de control,
así los polos de la ley de control quedan dominantes (polos más cercano al
origen en el plano s).
En caso que la medición sea muy
ruidosa, debemos tratar que el vector de ganancias L sea de magnitudes pequeñas (confiar más en el modelo que en la
medición), y esto resultará en polos del estimador que son más lentos y por lo
tanto influirán más significativamente en la respuesta transitoria del sistema
retroalimentado. En este caso, habrá que tomar un compromiso entre la reducción
del ruido de la medición y la respuesta transitoria más lenta.
Aunque en el estimador no exista el
problema de “demasiado esfuerzo para el actuador” (en un principio, en el
comienzo de los computadores el límite estaba en la precisión que éstos podían
manejar, pero con la máquinas que existen hoy en día ese ya no es un límite),
el hacerlo demasiado rápido trae como consecuencia una menor capacidad de
filtrado de ruido.
El equilibrio entre filtrado de ruido
y la rapidez de los polos del estimador se puede optimizar.
Supongamos tener un observador de
orden completo, cuyas ecuaciones reiteramos acá:
[Ec. 35]
con el cual tratamos de estimar los estados de
una planta que posee tanto perturbaciones en el modelo (w), como en la medición (v):
[Ec.
36.a]
[Ec.
36.b]
Como podemos observar de las
ecuaciones, cuando tengo un L que es
pequeño en magnitud, nos estamos apoyando más en el modelo y B1.w debería ser más pequeño que el ruido de medición v. Haciendo un razonamiento similar,
cuando tengo un L grande, nos estamos
apoyando más en la medición que en el modelo, y por lo tanto debería tener un
ruido en la medición v que sea
pequeño, sin importarme mucho cuan grande sea la perturbación en el modelo w.
La solución óptima a ésto es el
lugar geométrico simétrico de las raíces dado por la ecuación:
[Ec.
37]
donde q
es el parámetro que varía en el lugar geométrico de las raíces y que es
proporcional a la relación entre las varianzas (el cuadrado de la desviación
standard) del ruido de medición v y
de la perturbación del modelo w:
.
Mientras que la función de
transferencia Ge(s), es la función de transferencia desde
la perturbación w al ruido de la
medición:
[Ec. 38]
En función de cuanto valga la
relación de las varianzas de ambas señales ruidosas, es que obtenemos la mejor
opción para la ubicación de polos del estimador. Ellas serán las ubicaciones de
las raíces estables del lugar
geométrico simétrico de las raíces mencionado.
Diseño
del regulador
Combinemos ahora los resultados de haber
diseñado la ley de control y el estimador. Por simplificación vamos a suponer
que el observador que fue diseñado sea un estimador de orden completo, pero
resultados similares a los que llegaremos se obtienen utilizando un observador
de orden reducido.
Como se podrá observar, en este caso
si la planta original es de orden n,
cuando realizamos la retroalimentación de estados con un observador de orden
completo, el sistema retroalimentado es un sistema de orden 2.n. Por lo tanto debemos describir al
sistema eligiendo ahora 2.n variables
de estado. Elijamos como las n
primeras variables de estado a las variables de estado de la planta original: x, y las restantes n variables los errores de estimación:
.
Empecemos a determinar las
ecuaciones de estado del sistema extendido. De las ecuaciones de estado de la
planta tenemos:
![]()
[Ec.
39]
Por otro lado, del estimador sabemos
que el error de estimación responde a la siguiente dinámica:
[Ec.
40]
Y por lo tanto ya tenemos la
descripción completa:
[Ec.
41]
Donde ahora este sistema descripto
por la ecuación 41 es un sistema autónomo, cuya ecuación característica es:
[Ec.
42]
Y se puede demostrar matemáticamente
que dicho determinante es:
[Ec. 43]
Por lo tanto concluímos con algo que
esperábamos que sucediera: el sistema retroalimentado tiene como autovalores
(como polos), los polos de la ley de control en conjunto con los polos del
estimador.
Ahora bien, nunca nos preguntamos
con la parte que armamos del compensador, cómo era su función de transferencia.
Veamos como queda el sistema retroalimentado:

Figura 6. Esquema del sistema retroalimentado
con el regulador.
Toda la parte recuadrada en línea
punteada es lo que “armamos” para realizar el control, a la cual entra la señal
y de medición, y sale determinado
cuánto vale la acción de control. Las ecuaciones del compensador serán:
[Ec.
44]
Reacomodando los términos:
[Ec.
45]
Y por lo tanto la ecuación de
transferencia del compensador será:
[Ec. 46]
Que tendrá por polos las raíces de
la ecuación característica:
[Ec.
47]
Cuyos valores nunca antes habían
sido calculados. Notar que dichas raíces pueden ser inestables, y por lo tanto
la función de transferencia del compensador será inestable y esto no puede ser
posible porque originaría acciones de control divergentes (que no es deseado
puesto que, o alcanzaríamos siempre alguna saturación en la acción de control,
o quemaríamos el actuador: por ejemplo un motor). Entonces este cálculo es
siempre una cosa a tener en cuenta para verificar el controlador contruído.
Queda como ejercicio para el lector
el desarrollo de estas cuentas para el caso de un observador de orden reducido.
Ejemplo:
Sea la planta con la siguiente función de
transferencia:
![]()
Que en su forma canónica de
observabilidad queda representado por variable de estado de la siguiente
manera:

Determinamos primeramente el vector K de retroalimentación de estados. Para
eso utilizamos el criterio ITAE, polinomio de tercer orden, con una frecuencia w0 = 2 rad/seg.
Esto significa que los polos de la
ley de control los ubicamos en s = -1.42,
y s = ‑1.04±2.14j; y
la ecuación característica deseada será:
![]()
Con el mismo llegamos a obtener el
vector de retroalimentación de estados:
![]()
Realicemos un estimador de orden
completo, y utilicemos también el criterio ITAE con un w0 = 6 rad/seg. Entonces los polos del estimador
estarán en s = -4.25, y s = ‑3.13±6.41j; y la
ecuación característica deseada será:
![]()
Y así llegamos al vector de
ganancias para el estimador:

Determinemos ahora la función de
transferencia del compensador, que resulta en:
![]()
Que como vemos tiene un polo
inestable, y por lo tanto no es posible implementarlo puesto que generaría una
acción de control divergente.
Seguimiento
a referencia
Hasta ahora lo que hemos llegado a realizar del
control nos sirve como regulador: mantener la planta en el punto de operación y
no moverlo de ese punto. Este regulador también cumple la función de rechazar
perturbaciones, esto es, ante el cambio de una entrada no controlada (una
perturbación), lograr mantener el sistema en el punto de operación mencionado.
El seguimiento a referencia es un
problema distinto al de regulación, ya que supone la existencia de una señal de
referencia r. El problema de
seguimiento de referencia (o de servomecanismo) consiste en que la señal de
salida y siga (copie) la evolución
temporal de esta señal de referencia r
(señal deseada para y).
Entonces el problema consiste en ver
cómo introducimos en el esquema de control diseñado hasta ahora, la señal de
referencia r de modo que y trate de seguirla.
Las ecuaciones que hemos
desarrollado hasta ahora son las siguientes:
Planta:
[Ec.
48]
Regulador:
[Ec. 49]
Existen dos maneras evidentes de
introducir en el esquema de control la entrada de referencia (que no son las
únicas, veremos que existen más). Esas dos formas son las que muestran las
siguientes figuras:

Figura 7. CASO
A: Compensación en la retroalimentación.

Figura 8. CASO
B: Compensación en el lazo directo.
Como se puede observar, ambos
esquemas de control presentan los mismos polos de lazo cerrado (haciendo r = 0, ambos esquemas tienen los mismos
polos que el regulador), pero no tienen los mismos ceros y por lo tanto la
respuesta en el seguimiento de r
serán distintos:
CASO A: Un escalón en la entrada de
referencia en este esquema excita de igual modo el estimador como a la planta,
y por lo tanto no habrá un cambio en el error de estimación por la presencia de
este escalón en la referencia. Esto significa que la función de transferencia
de r a y debe tener ceros que cancelen los polos del estimador, así la
respuesta del sistema así retroalimentado y con esta entrada de referencia
tendrá como polos solo los polos de la ley de control, o sea las raíces de la
ecuación característica:
.
CASO B: Un escalón en la entrada de
referencia en este esquema excita al estimador (aparece un error de estimación)
que se atenúa con la dinámica propia del estimador. Esto significa que las
raíces tanto de la ley de control como las del estimador son excitadas en forma
conjunta, o sea los polos serán las raíces de la ecuación característica:
.
Es evidente después de este análisis
que es más conveniente utilizar el esquema del caso A.
Veamos ahora, la forma más general
de introducir la señal de referencia r(t) en el regulador es sumando términos
proporcionales a las ecuaciones del regulador:
[Ec.
50]
donde M
es un vector columna de n componentes
(n = es el orden del estimador), y N es un escalar (considerando un sistema
SISO).
De esta manera:
Existen varias posibilidades para
elegir los valores de M y N:
1) Que el error de estimación
sea independiente de r(t).
2) Que el control esté basado
directamente en la comparación entre r
e y, o sea esté basado en e = r
– y.
3) Máxima libertad para ajustar la
respuesta transitoria y estacionaria del sistema retroalimentado.
Para el caso 1:
Analicemos cómo es la dinámica del error de
estimación:
![]()
[Ec. 51]
Por lo tanto, para que los cambios
en el error de estimación no sean afectados por la señal r, M deberá ser igual a: M = B.N.
De esta manera, la ecuación 50
queda:
[Ec. 52]
Notar que este es el caso A
mencionado anteriormente.
Observar que si el actuador de la
planta posee una saturación, conviene indicar también dicha saturación al
estimador, así la saturación no afectará tampoco al error de estamación
.
Queda todavía cómo determinar el
valor de N, pero esto lo dejamos para
más adelante, después de haber visto todos los casos.
Para el caso 2:
Esto es la única alternativa que disponemos
cuando no se dispone de las señales r
e y por separado, sino que se dispone
solamente de la diferencia entre ambos. Ejemplo de ésto es por ejemplo el
termostato en el control de temperatura de un ambiente.
En este caso, eligiendo N = 0; y M = -L, conseguimos el
objetivo:
[Ec.53]
y como vemos las ecuaciones ahora solo dependen
de e = y – r. Notar que éste es
el caso B mencionado previamente.
Para el caso 3:
Para este caso, analicemos previamente que
sucede con los ceros de transmisión de r
a y, para el caso de no tener
estimador. En este caso la acción de control u toma el valor:
u = -K
. x + N . r [Ec. 54]
y por lo tanto las ecuaciones que gobiernan el
sistema retroalimentado serán:
[Ec. 55]
Los ceros de la transmisión de r a y
están dados por aquellos lugares del plano s
que cumplen la siguiente ecuación:
[Ec. 56]
Estas raíces son las mismas, si a
una columna de la matriz la multiplicamos por una constante y se la sumamos a
las otras columnas. Multipliquemos a la última columna por ki/N y sumemos
a cada una de las i columnas (i de 1
a n). Entonces las raíces de la
ecuación 56 son las mismas que las raíces de la siguiente ecuación:
[Ec.
57]
Por lo tanto los ceros de
transmisión de r a y no
dependen del valor de K. Además
podemos observar que estos ceros son los mismos ceros originales de la planta
(son los ceros de u a y).
Analicemos ahora el caso de tener un
estimador. Los ceros que hay de r a y serán los ceros que hay entre r y u,
más los ceros de u a y. Como por el análisis anterior sabemos
que los ceros de u a y son los originales de la planta, nos
queda por determinar si existe algún otro cero que se agregue en la transmisión
de r a u(*). Para analizar esto, plantiemos las ecuaciones del
estimador/control:
[Ec.
58]
(*) Otra manera de pensar esto: que exista un
cero en la transmisión de r a u significa que para ese modo de
excitación en r no tenemos ningún “movimiento”
en u, esto implica que como u no se mueve, tampoco se moverá y. Entonces ese modo en r no “mueve” a la señal y y por lo tanto es un cero también de
transmisión de r a y (la salvedad está cuando justo
coincide con un polo de u a y, que en dicho caso se cancelarían).
Veamos entonces los ceros que
existen de r a u. Éstos serán las raíces del siguiente determinante:
[Ec.
59]
Conclusión: Tenemos n
grados de libertad (n elementos del
vector M/N), para asignar la posición de n
ceros de transmisión de r a u (y por lo tanto de r a y),
que son las raíces de g(s).
Consideraciones:
· Para la respuesta dinámica, los
ceros influyen en forma significativa en la respuesta transitoria a un escalón
y por lo tanto generalmente se requerirá que los ceros se encuentren alejados 4
veces más que los polos dominantes del sistema, salvo que se quiera eliminar
algún polo (estable) indeseable cancelándolo con uno de estos ceros.
· Para la respuesta estática (o
estacionaria), existe una relación entre la ubicación de polos y ceros de lazo
cerrado con la precisión con que se sigue a una señal de referencia. Ejemplo de
ello está la relación de Truxal para sistemas de tipo I, en donde el error de
estado estacionario a una rampa es:
[Ec.
60]
donde pi
son la posición de los polos de lazo cerrado y zj son los ceros de los polos de lazo cerrado (con sus
signos). La demostración de esta fórmula se encuentra descripta en la página 211
del libro de referencia citada en la bibliografía de este capítulo.
Criterio de cómo utilizar esto: Si
existen un par de cero/polo en la cual (pi
– zj) es muy pequeño (y
por lo tanto la influencia de este par sobre la respuesta transitoria es
despreciable), pero además hacemos que (1/pi
– 1/zj) sea
considerablemente grande, podemos influir bastante en la constante de error
estacionario sin afectar la parte transitoria.
Se puede
comprobar también que para sistema de tipo II, el error de estado estacionario
a una parábola vale la siguiente relación:
[Ec.
61]
donde nuevamente las variables que definen la
relación tienen el mismo significado que para la ecuación [60]. La demostración
de esta fórmula se encuentra descripta aquí.
Observación:
De
, tenemos:
a) Para el caso 1:
, cuyas raíces son los polos del estimador. Por lo tanto los
ceros de transmisión de r a u se cancelan con los polos del
estimador, confirmando resultados anteriores.
b) Para el caso 2:
, y reemplazando en la ecuación 59 tenemos:
[Ec.
62]
Posmultiplicando la última columna
por C y sumándole a las n primeras columnas, y premultiplicando
la última fila por B y sumándole a
las primeras n filas, obtenemos:
[Ec.
63]
Por lo tanto, mirando esta última
ecuación, los ceros que agrega el compensador están fijados por L y K,
y no hay manera de ubicarlos en otro lugar (notar que los ceros que quedan son
los ceros de haber tomado las ecuaciones originales de la planta, y haber
reemplazado el vector columna de entrada B
por L y el vector fila de salida C por K).
Resumen:
La función de transferencia total de lazo
cerrado será:
[Ec.64]
donde b(s) es el polinomio cuyas raíces definen
los ceros de la planta (ceros de lazo abierto, que no se mueven); ac(s) y ae(s)
son las ecuaciones características deseadas que se utilizaron para la ley de
control y el estimador respectivamente; y finalmente g(s)
son los ceros elegidos por el diseñador de la entrada a referencia.
Elección de la
ganancia
:
Ahora es el tiempo de determinar la ganancia
para los tres métodos
de selección de M. El objetivo de
esta elección es ajustar la ganancia estacionaria final del sistema entre r e y
de manera que la misma sea unitaria .
a) Si elegimos el primer método, por
el análisis que hemos hecho los estados estimados estacionarios son iguales a
los estados reales estacionarios (puesto que el error de estimación tiende a
cero). Por lo tanto podemos suponer que
, y de esta manera evitar complicarme con las cuentas del
compensador.
Supongamos que ya en el
estacionario, tanto la señal uss
como los estados xss sean
proporcionales a la señal de entrada r:
uss = Nu
. r ; xss = Nx . r. Por otro lado sabemos que por las ecuaciones de la planta, en el
estacionario debe cumplirse que (ya que de tratarse de un estacionario las
derivadas temporales deben ser nulas):
[Ec.
65]
Como en el estacionario queremos
lograr que yss = rss, tenemos el siguiente
conjunto de ecuaciones para determinar Nx y Nu:
[Ec. 66]
Eliminando rss
de las ecuaciones, y reescribiendo en forma matricial:
[Ec.
67]
Premultiplicando por la inversa de la primera
matriz:
[Ec.
68]
Obtenidos Nx y Nu, calculamos
como:
; puesto que u es:
[Ec. 69]
b) Si elegimos el segundo método, el
resultado es trivial; ya que debe ser
= 0.
c) Si elegimos el tercer método,
elegimos
de manera tal que la
ganancia total a lazo cerrado sea unitaria (como en el primer método). Las
ecuaciones de todo el sistema son:
[Ec. 70]
donde
es el valor obtenido
por el método 3 de
. El sistema entonces tendrá una ganancia estacionaria de
lazo cerrado igual a la unidad si se cumple que:
[Ec. 71]
Resolviendo esta ecuación 71,
obtenemos el valor de
como:
[Ec. 72]
Los análisis hechos en esta sección
fueron realizados utilizando un observador de orden completo, queda para el
lector realizarlos para un estimador de orden reducido.
Ejemplo:
Tenemos el servomecanismo cuya
función de transferencia es:
![]()
que puede ser representado por el siguiente
conjunto de ecuaciones de estado:

Se puede comprobar que con el vector
K = [8 3] se obtiene la siguiente
ecuación característica deseada para la ley de control:
.
Por requerimientos de control se
pretende que la respuesta estacionaria a una rampa sea inferior al 10 % (por lo
tanto Kv debe ser mayor o
igual a 10), pero ahora tiene un Kv = 2.
Esto lo podemos verificar aplicando la fórmula de Truxal, teniendo en cuenta
que la planta no tiene ceros, y que con la retroalimentación los polos de lazo
cerrado están en s = -2 ± 2.j:
![]()
Con los dos primeros métodos no
puedo manejar el Kv, en la
primera porque los ceros justos se agregan para cancelar los polos del estimador
y por lo tanto el Kv
quedaría con el mismo valor de 2; en el segundo se agregan ceros (además de los
polos del estimador) pero no tengo grados de libertad para elegir Kv y sería mucha casualidad
que el mismo diera mayor que 10 (el lector podría realizar los cálculos para
determinar cuánto daría en este caso el Kv).
Por lo tanto me queda el tercer
método para manejar el Kv.
Elegimos colocar un estimador de
orden reducido (agregando por lo tanto un solo polo), y seleccionamos la
ubicación de ese polo (p3)
en s = -0.1. Notar que estamos
haciendo lo opuesto a lo que generalmente realizamos para elegir la posición
del estimador. La idea ahora es colocar el cero que agrega la entrada de
referencia en un lugar muy cercano a éste s = ‑0.1,
de manera que no se afecte la respuesta transitoria pero sí la respuesta
estacionaria. Veamos dónde debe colocarse el cero:
![]()
Por lo tanto, para que Kv sea 10, el cero debe estar
en:
![]()
Que como notamos está muy cercano al
polo p3, con lo cual la
respuesta transitoria no se verá afectada y podemos aumentar el Kv a 10 como era el
requerimiento estacionario de control.
Entonces se diseña un estimador de
orden reducido ubicando el polo del estimador en p3 = -0.1, y se determina el valor de M/N
de manera que el cero quede ubicado en -0.962. Luego se determina la ganancia
para que la ganancia estacionaria completa sea unitaria. Después de esto, puede
comprobarse que la función de transferencia total del sistema es:
![]()
que posee un Kv = 10 como fue diseñado.
También se puede comprobar, que la
función de transferencia del compensador así diseñado es equivalente a un
compensador tipo adelanto de fase conjuntamente con uno de atraso de fase, que
se diseñan en control clásico.
Control Integral
En control clásico es habitual el
agregar compensadores con integradores puros, de manera que si el sistema está
retroalimentado unitariamente, cambia el tipo de sistema por la cantidad de
integradores puros que se hayan agregado.
Para realizar esta misma práctica en
control por variable de estado debemos aumentar la dimensión del estado del
sistema. Supongamos que el sistema de la planta original sea:
[Ec.
73]
Entonces definimos una nueva
variable de estado xI,
cuya derivada sea la salida del sistema original:
[Ec.
74]
y por lo tanto
.
Entonces el sistema extendido
quedaría expresado del siguiente modo:
[Ec.
75]
Y ahora envés de tener que
determinar un vector de retroalimentación de ganancias de n componentes, tendrá que ser de n+1:
; que se determina en forma semejante a lo que hacíamos
previamente, pero el sistema por resolver será de (n+1)x(n+1).
El esquema de control agregando una
entrada de referencia r será el
siguiente:

Figura 9. Esquema del sistema de control con
acción integral.
En el caso que no se tenga todas las
variables de estado como medición, no existe problema de incorporar un estimador
para alimentar al vector K, ya que
para KI solo se necesita
la medición (quedando un esquema con retroalimentación unitaria).
Ejemplo:
Supongamos tener una planta cuya
función de transferencia sea:
![]()
Queremos que los polos del estimador
se encuentren en s = -5 (polos
dobles), ya que por la acción integral el sistema pasa a ser de orden 2,
entonces la ecuación característica deseada será:
![]()
Y el sistema extendido tiene la
siguiente forma:

Y resolviendo la ecuación
característica de la ley de control para los polos propuestos, el vector de
ganancias de retroalimentación es: [KI
K] = [ 25 7 ]; y el esquema del sistema de control será:

Figura 10. Esquema resultante del ejercicio del
sistema de control con acción integral.
De esta manera, el error de estado
estacionario tanto para un escalón en r
como en la perturbación w serán
nulos. Queda como ejercicio al lector demostrarlo.