Mudanças entre as edições de "Map2321"
(→Um circuito elétrico) |
(→Um modelo de economia) |
||
Linha 79: | Linha 79: | ||
A equação dinâmica é determinada pelas seguintes relações entre as variáveis | A equação dinâmica é determinada pelas seguintes relações entre as variáveis | ||
− | {{bluemath| | + | {{bluemath|1= : |
# <math>Y_n = C_n + I_n + G_n</math> | # <math>Y_n = C_n + I_n + G_n</math> | ||
# <math>C_n = f(Y_{n-1})</math> O nível de consumo depende da receita do último ano. | # <math>C_n = f(Y_{n-1})</math> O nível de consumo depende da receita do último ano. | ||
Linha 85: | Linha 85: | ||
O controle do sistema é <math>G_n</math>. A equação a diferenças finitas fica | O controle do sistema é <math>G_n</math>. A equação a diferenças finitas fica | ||
− | {{bluemath| <math>Y_n = f(Y_{n-1}) + g(f(Y_{n-1}) - f(Y_{n-2})) + G_n</math>}} | + | {{bluemath| 1= <math>Y_n = f(Y_{n-1}) + g(f(Y_{n-1}) - f(Y_{n-2})) + G_n</math>}} |
--[[Usuário:Patonelli|Patonelli]] 23h04min de 22 de agosto de 2009 (UTC)patonelli | --[[Usuário:Patonelli|Patonelli]] 23h04min de 22 de agosto de 2009 (UTC)patonelli | ||
Edição das 21h35min de 15 de janeiro de 2013
Se você quiser editar leia as Dicas de formatação deste wiki, e mãos à obra!. |
Aspectos históricos da teoria de Controle
Em praticamente todos os sistemas da natureza há a possibilidade de intervenção que permite exercer algum controle sobre o sistema. Aspectos tecnológicos nos fazem procurar uma forma de exercer este controle automaticamente. É o que chamaremos de retroalimentação do sistema.
Basicamente a origem da teoria de controle são os sistemas de regulagem, isto é, procura-se desenvolver um processo automático para que um sistema fique numa situação de equilíbrio. Assim um sensor detecta se o sistema está se desregulando e um controlador atuaria automaticamente para restabelecer o equilibrio. Claro que muitos mecanismos engenhosos foram desenvolvidos durante milênios para resolver este problema, porém um caso interessante era o de controle de velocidade de moinhos de vento. Huygens inventou um instrumento conhecido como flyball que na pratica resolvia o problema. Esta mesma idéia do flyball foi usada depois por Watt em máquinas para o controle de fluxo de vapor. Este modelo que funcionava na prática tinha um problema de excesso de vibração para velocidades muito altas. Foi Maxwell quem elaborou um modelo matemático para o flyball e colocou o problema de eliminação das vibrações como um problema de estabilização. Este foi, pode-se dizer, o primeiro problema matemático da teoria de controle.
No começo do século XX, o desenvolvimento das redes de comunicações telefônicas, propiciou o aparecimento de novos modelos e a utilização de métodos da teoria de funções a variáveis complexas para eliminação de ruídos e filtragens de sinais. Os trabalhos pioneiros nesta linha deveu-se a Black, Bode e Nyquist do grupo do laboratório Bell. O conjunto de métodos desenvolvidos por eles influenciou bastante a engenharia e é chamado de teoria de controle clássica. Isso foi mais ou menos em 1930. Depois da segunda guerra mundial os métodos de otimização ganharam importância e é um mérito da teoria de Pontriaguin o estudo da teoria de controle ótimo. O desenvolvimento da teoria de sistemas dinâmicos propiciou uma nova abordagem para os sistemas de controles lineares. Assim nas décadas de 1960 e 1970 desenvolveu-se bastante uma teoria estrutural dos sistemas de controle. E nesta abordagem "moderna" baseada no espaço de estados dos sistemas são importantes os conceitos de controlabilidade e observabilidade introduzidos por Kalman. No final do século passado desenvolveram-se os métodos geometricos para o estudo de sistema de controle não linear. Em todos estes tópicos há ainda pesquisa bastante ativa. --Patonelli 15h27min de 24 de agosto de 2009 (UTC)patonelli
Exemplos de sistemas de controle
Um satélite simples num campo newtoniano
Uma partícula de massa m está sob ação de um campo de acelerações central newtoniano. Além disso podemos colocar dois controles independentes, um na direção radial e outro na direção tangencial ur e uθ respectivamente. A equação dinâmica deste sistema é dada pela segunda lei de Newton:
m¨r=(−kr2+ur)er+uθeθ |
fazendo a massa m=1 para que eu não tenha que ficar digitando coisas a mais. Podemos reecrever as equações em coordenadas polares como:
¨r=r˙θ2−kr2+ur r¨θ=−2˙r˙θ+uθ |
Estas duas equações nos dão um sistema de controle não linear com duas entradas de controle. Voltaremos a este exemplo quando falarmos de linearização.
--Patonelli 21h10min de 22 de agosto de 2009 (UTC)patonelli
O pêndulo invertido
O pêndulo invertido é um problema clássico em teoria de controle, as equações do movimento são:
(M+m)¨x−ml¨θcosθ+ml˙θ2sinθ=F
ml(−gsinθ−¨xcosθ+l¨θ)=0 |
A variável de controle aqui é a força F
Um forno simplificado
A figura mostra o esquema de um forno constituído de uma jaqueta de um material (a parte cinza) que é aquecido por uma resistência, e o calor é transmitido para o interior do forno. A taxa de calor u(t) é o controle do sistema. As temperaturas (que estamos supondo ser uniformemente distribuídas no espaçao!) T1(t) e T2(t) são as variáveis de estados. Sendo c1 e c2 as capacidades térmicas da jaqueta e do interior do forno respectivamente; a1 e a2 área exterior e interior da jaqueta; r1 e r2 os coeficientes de transmissão de calor da parte externa e interna da jaqueta e T0 a temperatura exterior. A equação de balanço térmico nos dá:
c1˙x1(t)=(−r2a2−r1a1)x1+r2a2x2+u(t)
c2˙x2(t)=r2a2x1−r2a2x2 |
Onde x1=T1−T0 e x2=T2−T0
Um circuito elétrico
Na figura ao lado vemos as equações dinâmicas de alguns componentes elétricos: resistores, condensadores e indutores. Usaremos estas equações e as leis de Kirchoff dos nós e das malhas para escrever a relação dinâmica entre voltagem e corrente do circuito abaixo.
Chamaremos de x1 a voltagem pelo capacitor C do circuito, e de x2 a corrente através do indutor L Aplicando as leis constitutivas dos elementos e as leis de Kirchoff temos as relações dinâmicas
˙x1=−x1R1C+vR1C ˙x2=−x2R2L+vL |
Neste caso v(t) é a única entrada do sistema (e portanto o controle) e a corrente é a saída do sistema. Para encontrar a relação entre entrada e saída temos resolver uma equação diferencial nas variáveis x1 e x2, que podem ser interpretadas como variáveis auxiliares neste caso. --Patonelli 21h32min de 22 de agosto de 2009 (UTC)patonelli
Um modelo de economia
Num modelo simples podemos definir as seguintes variáveisYn é a receita anual no ano n
Cn total do consumo no ano n In investimento no ano Gn gastos do governo
A equação dinâmica é determinada pelas seguintes relações entre as variáveis
:
|
O controle do sistema é Gn. A equação a diferenças finitas fica
Yn=f(Yn−1)+g(f(Yn−1)−f(Yn−2))+Gn |
--Patonelli 23h04min de 22 de agosto de 2009 (UTC)patonelli
Caracterização dos sistemas lineares
Os exemplos acima nos dão as principais carecterísticas dos sistemas de controle. Dependendo do sistema ser contínuo ou discreto temos as equações
{{{1}}} |
e no caso discreto
{{{1}}} |
onde x∈Rn é a variável de estado, y∈Rp é a variável de saída e u∈Rm são os parâmetros de entrada.
As funções estruturais do sistema f:Rn×Rm→Rn e g:Rn×Rm→Rp são usadas para classificar os sistemas. No nosso caso estaremos interessado somente nos casos de sistemas lineares invariantes no tempo, ou seja quando
{{{1}}} |
Com A matriz n×n, B matriz n×m e C matriz p×n. Nas próximas sessões vamos analisar mais detalhadamente estes exemplos.
Uma técnica de linearização
Se (x0,u0) for um ponto de equilíbrio do campo f(x,u) então o sistema
{{{1}}} |
é o sistema linearizado em torno do ponto de equilíbrio. A mesma técnica é utilizada para o ponto de equilíbrio de um sistema discreto. Lembro que o ponto de equilíbrio de um sistema discreto satisfaz f(x0,u0)=x0 e do sistema contínuo f(x0,u0)=0
Como exemplo retomamos a equação do satélite. fazendo uθ=ur=0, encontramos um movimento circular uniforme que é uma trajetória de equilíbrio para um determinado momento angularr(t)=r0,θ(t)=ωt Agora fazemos as mudanças de variáveis:
{{{1}}} |
e usando a técnica de linearização ensinada obtemos os sistema linear:
{{{1}}} |
Exponencial de matrizes
Defineremos a exponencial de uma matriz A=(aij)∈Rn×n como a soma da série:
exp(A)=∑∞k=0Akk! |
Esta soma converge absolutamente uma vez que introduzimos no espaço das matrizes a norma induzida da norma euclidiana em Rn isto é
As principais propriedades da exponencial de matrizes:
{{{1}}} |
Solução das equações lineares não homegêneas
Em primeiro lugar note que pela propriedade 6 acima a curva x(t)=exp(tA)v é solução da equação diferencial
{{{1}}} |
para que satisfaça também a condição inicial x(t0)=x0 basta escolher v=exp(−t0A)x0 desta forma
{{{1}}} |
{{{1}}} |
Da mesma forma para resolvermos o problema não homogêneo:
{{{1}}} |
Notemos que a curva x(t)=exp(tA)v(t) satisfaz a equação: ˙x=Ax+exp(tA)˙v(t) Resolvendo a equação em v(t) exp(tA)˙v(t)=Bu(t) exp(t0A)v(t0)=x0 obtemos v(t)=x0+∫tt0exp(−sA)Bu(s)ds e finalmente obtemos a nossa aplicação de transição de estados
{{{1}}} |
Exemplo simples
O sistema ¨x=u(t) pode ser escrito como:
{{{1}}} |
A aplicação da fórmula para a condição inicial no instante t=0, lembrando que exp(tA)=(1t01), nos dá
{{{1}}} |
Controlabilidade
Antes de abordar controlabilidade convém falar de dois tópicos:
Controles admissíveis
A controlabilidade estuda a relação entre os controles e os pontos atingíveis no espaço de estados. Por isso é importante dar algumas propriedades estruturais do conjunto dos controles. Nesta disciplina chamaremos de Conjunto dos controles admissíveis o seguinte:
{{{1}}} |
Este conjunto tem as seguintes propriedades:
- É um espaço vetorial,
- É invariante pelo sistema dinâmico de translação θt
- É fechado pela concatenação ∧t0 para todo t0∈R
- Contém a família das funções constantes por partes
Um subconjunto de U com estas quatro propriedades também pode ser chamado de um conjunto de controles admissíveis e alteraria um pouco o estudo da controlabilidade. Este conjunto que vamos usar pode ser pensado como o maior conjunto de controles admissíveis.
A translação é definida como:
{{{1}}} |
e a concatenação no tempo t0 é definida assim
{{{1}}} |
Propriedades da aplicação de transição de estados
Para os sistemas de controle contínuos de forma geral, aplicação de transição de estados é uma aplicação:
ϕ:R×R×Rn×U→Rn |
Satisfazendo as propriedades:
- ϕ(t,t,x0,u(⋅))=x0, chamada de compatibilidade.
- ϕ(t2,t1,ϕ(t1,t0,x0,u(⋅)),v(⋅))=ϕ(t2,t0,x0,u∧t1v(⋅)), sistema dinâmico.
- ϕ(t1,t0,x0,u(⋅)) só depende do valor de u(t) no intervalo [t0,t1]
No caso dos sistemas lineares independentes do tempo temos
{{{1}}} |
e neste caso temos ainda as seguintes propriedades:
- ϕ(t,t0,x0,u(⋅))=ϕ(t,t0,x0,0)+ϕ(t1,t0,0,u(⋅)): decomposição entre dinâmica livre e controlada
- ϕ(t,t0,x0+x1,u(⋅)+v(⋅))=ϕ(t,t0,x0,u(⋅))+ϕ(t,t0,x1,v(⋅)): princípio da superposição
- ϕ(t,t0,x0,θt0u(⋅))=ϕ(t−t0,0,x0,u(⋅)): invariante no tempo.
Esta última propriedade é que nos justifica o estudo da controlabilidade só quando o tempo inicial é 0
Se a e b são dois pontos do espaço de estados Rn, dizemos que b é atingível em tempo T a partir de a se existir um controle admissível u(t)∈U tal que
{{{1}}} |
Nesta caso dizemos também que o controle u transfere a para b em tempo T. O conjunto de todos os pontos atingíveis a partir de a em tempo T>0 será denotado por A(a,T).
No caso do sistema linear é fácil verificar que
{{{1}}} |
Diremos que o sistema é controlável quando A(0,T)=Rn.
Matriz de controlabilidade
Note que o conjunto A(0,T) depende apenas das matrizes A, B do tempo T>0 e da família de controles admissíveis. Quando o sistema for controlável diremos que o par (A,B) é controlável.
Definiremos a matriz de controlabilidade de (A,B) (ou do sistema ) como
{{{1}}} |
esta matriz é simétrica, semidefinida positiva. Se for definida positiva então é invertível e neste caso o par (A,B) é controlável.
Basta verificar que para qualquer vetor do espaço de estados b∈Rn temos que o controle
{{{1}}} |
transfere a origem para b em tempo T
Assim QT ser invertível é uma condição suficiente para a controlabilidade. veremos que é também necessária.
Se o núcleo QT tem um elemento v≠0 então <QTv,v>=∫T0||B′exp(sA′)v||2ds=0. Pela analiticidade do integrando temos B′exp(sA′)v=0∀s.
Neste caso temos que para todo controle admissível u(⋅)∈U
{{{1}}} |
e isto significa que o vetor v não é acessível pois é ortogonal ao conjunto de atingibilidade de 0. Portanto para o sistema ser controlável é necessário que a matriz QT seja invertível.
Exercício resolvido
Verificar se é controlável o seguinte sistema:
\dot{\begin{bmatrix}x_1 \\ x_2 \\ x_3 \end{bmatrix
|} = \begin{bmatrix}
1 & 0 & -1\\
0 & 1 & 0\\
2 & 0 & -1
\end{bmatrix}
\begin{bmatrix}
x_1\\
x_2\\
x_3
\end{bmatrix} + \begin{bmatrix}
0\\
0\\
1
\end{bmatrix}u}}
QT=∫T0esABB′esA′ds A=[10−101020−1];A2=[−10001000−1];A3=[−101010−201];A4=I; esA=I+sA+s2A22!+s3A33!+... esA=[sin(s)+cos(s)0−sin(s)0es02sin(s)0−sin(s)+cos(s)]; esA′=[sin(s)+cos(s)02sin(s)0es0−sin(s)0−sin(s)+cos(s)]; QT=∫T0[sin(s)+cos(s)0−sin(s)0es02sin(s)0−sin(s)+cos(s)][001][001][sin(s)+cos(s)02sin(s)0es0−sin(s)0−sin(s)+cos(s)]ds QT=∫T0[sin2(s)0sin2(s)−sin(s).cos(s)000sin2(s)−sin(s).cos(s)0(cos(s)−sin(s))2]ds
Critério de controlabilidade de KalmanDefinimos o operador linear:
Verifica-se facilmente que o par (A,B) é controlável quando a imagem deste operador linear é o espaço de estados Rn. Como o espaço vetorial U é de dimensão infinita este operador não tem uma representação matricial. Mas se considerarmos o operador
definido como
com o auxilio do teorema de Cayley-Hamilton podemos mostrar que para qualquer par de matrizes (A,B) as imagens dos operadores l(A,B) e LT coincidem. Neste caso a dimensão da imagem do l(A,B) é o posto de sua matriz de representação numa base qualquer. Na base canônica a matriz de representação é a matriz de Kalman
Assim o par (A,B) é controlável se e somente se o posto de K(A,B) for n. Forma Normal de Kalman, ou decomposição de Kalman.Suponha que a dimensão da imagem do operador l(A,B) seja um número k estritamente menor que a dimensão do espaço de estados. Observamos que o subespaço vetorial V=Im(l(A,B)) é um subespaço invariante por A e que contém a imagem do operador B. Escolhendo uma base de Rn adaptada a este subespaço teremos que nesta nova base o sistema (A,B) terá a forma (˜A,˜B) com
onde A11∈Rk×k, A12∈Rk×(n−k), A22∈R(n−k)×(n−k) e B1∈Rk×m. Além disso o par (A11,B1) é controlável. Esta é a forma normal de Kalman É fácil obter as relações
onde P é a matriz de mudança de base da base adaptada para a base canônica. Sempre que tivermos esta relação dizemos que os pares (A,B) e (˜A,˜B) são equivalentes. ObservabilidadeRetomemos a equação do sistema linear
e verificamos a relação entre as condições iniciais do espaço de estado e a saída do sistema. A questão é: dado o controle admissível podemos identificar o estado inicial do sistema a partir da saída y(t). Diremos que os sistema é observável em tempo T se para quaisquer par de estados xa e xb diferentes, as respectivas funções de saída ya(t) e yb(t) também diferem. Ou seja: existe t∈[0,T] tal que ya(t)−yb(t)≠0. Temos que ya(t)−yb(t)=Cexp(tA)(xa−xb), daí concluímos que o sistema é observável em tempo T, ou o par (A,C) é observável, se e somente se, Cexp(tA)x≠0 para todo x∈Rn. Definimos a matriz de observabilidade :
Então verificamos que
|