Optimale Steuerung

(1)

Optimale Steuerung

Eugenia Fidas

Universitat Konstanz

13.Juli 2010

(2)

(3)

Inhalt

1. Zustandsgleichung

2. Das Optimalsteuerproblem

3. Notwendige Optimalit¨atsbedingungen erster Ordnung 4. Algorithm 1 (Abstiegsverfahren)

5. Matlab Beispiel

(4)

Seient_f ≥t◦ >0,r >0 und L>0. Wir betrachten das dynamische System

˙

x(t) = r

2 u₁(t) +u₂(t)

cos(ψ(t)) sin(ψ(t))

f¨urt ∈(t◦,t_f], (1a) ψ(t) =˙ r

2L u1(t)−u2(t)

f¨urt ∈(t◦,t_f] (1b) mit den Anfangsbedingungen

x(t◦) =x◦ und ψ(t◦) =ψ◦, (1c) wobeix◦= (x1◦,x2◦)^T ∈R² gilt.

(5)

1. Zustandsgleichung

Seieny = (x, ψ)^T : [t◦,t_f]→R²×R,y◦= (x◦, ψ◦)^T und

f(y,u) =







r

2(u1+u2) cosψ

r

2(u₁+u₂) sinψ

r

2L(u1−u2)







f¨ury = (x1,x2, ψ)∈R³,u = (u1,u2)∈R².

(6)

Kompakte Form:

˙

y(t) =f(y(t),u(t)) f¨ur t∈(t◦,t_f] und y(t◦) =y◦ (2) autonomes Anfangswertproblem f¨ur eine gegebene Steuerung u: [t◦,t_f]→R²

(7)

1. Zustandsgleichung

f ist stetig partiell differentierbar.

Jacobimatrix vonf : f⁰(y,u) =

∂f

∂y(y,u)

∂f

∂u(y,u)

= r 2







0 0 −(u₁+u₂) sinψ cosψ cosψ 0 0 (u₁+u₂) cosψ sinψ sinψ

0 0 0 ¹_L −¹_L







f¨ury = (x, ψ)∈R²×R undu = (u₁,u₂)∈R².

(8)

L¨osbarkeit?

Picard-Lindel¨of?

Globale Stetigkeit?

(9)

1. Zustandsgleichung

Nach dem Mittelwertsatz der Differentialrechnung gilt f¨ur y1 = (x1, ψ1),y2 = (x2, ψ2)∈R²×R,u = (u1,u2)∈R² und f¨ur Zwischenstellenξ1, ξ2 ∈R

kf(y1,u)−f(y2,u)k²₂=







r

2(u₁+u₂)(cosψ₁−cosψ₂)

r

2(u1+u2)(sinψ1−sinψ2) 0







2

=







−^r₂(u1+u2) sinξ1(ψ1−ψ2)

r

2(u₁+u₂) cosξ₂(ψ₁−ψ₂) 0







2

= r²

4 |u₁+u2|² |cos²ξ1|+|sin²ξ2|

|ψ₁−ψ2|²

≤ r²

2 |u₁+u2|²|ψ₁−ψ2|²

(10)

Also

kf(y1,u)−f(y2,u)k₂≤Lky₁−y2k₂ mitL=r|u₁+u2|/√

2.

⇒ f global Lipschitz-stetig

Satz von Picard-Lindelöf ⇒ (2) hat für jedes stetige u genau eine Lösungy ∈C¹([t◦,t_f];R³)

(11)

1. Zustandsgleichung

Bemerkung:

F¨uru ∈L²(t◦,tf;R²) gibt es genau eine schwache L¨osung y ∈H¹(t◦,t_f;R³) von (2), diey(t◦) =y◦ und die

Variationsgleichung

Z tf

t◦

˙

y(t)−f(y(t),u(t))T

p(t)dt = 0 (3) f¨ur alle p∈L²(t◦,t_f;R³) erf¨ullt.

(12)

Ein nichtlinearer L¨osungsoperator S:L²(t◦,t_f;R³)→H¹(t◦,t_f;R³)

mity =Su ist eindeutige L¨osung der Variationsgleichung (3) mity(t◦) =y◦ f¨ur die Steuerung u∈L²(t◦,tf;R²).

(13)

2. Das Optimalsteuerproblem

Gegeben:

vorgegebene Trajektorie x_d ∈L²(t◦,t_f;R²) vorgegebener nominaler Winkel ψ_d ∈L²(t◦,t_f;R) nominale Steuerungu_d ∈L²(t◦,t_f;R²)

Gewichtungsparameterα≥0

Regularisierungsparameterβ, γ≥0 mitβ+γ >0

(14)

Wir betrachten das Zielfunktional J(y,u) = 1

2 Z t_f

t◦

kx(t)−x_d(t)k²₂+α|ψ(t)−ψ_d(t)|²+ +βku(t)−ud(t)k²₂+γku(t)k˙ ²₂dt

f¨ury ∈Y :=H¹(t◦,tf;R³) undu ∈U mit U =

( L²(t◦,t_f;R²) wennγ = 0 gilt, H¹(t◦,tf;R²) wennγ >0 gilt.

(15)

2. Das Optimalsteuerproblem

Definiere HilbertraumZ =Y ×U mit der ¨ublichen Produkttopologie.

Das nichtlineare (unendlich-dimensionale) Optimerungsproblem lautet

minJ(z) u.d.N. z = (y,u)∈Z und (P) y˙(t) =f(y(t),u(t)), t∈(t◦,t_f],

y(t◦) =y◦.

Da das Anfangswertproblem (2) für eine gegebene Steuerung eindeutig lösbar ist, können wir mit y(u) =S(u) die zur Steuerungu eindeutig definierte Lösung von (2) bezeichnen.

(16)

reduziertes Zielfunktional: ˆJ :U →R

ˆJ(u) =J(y(u),u) f¨ur u∈U.

reduziertes Problem

min ˆJ(u) u.d.N. u ∈U. ( ˆP)

(17)

2. Das Optimalsteuerproblem

Istu^∗ eine (lokale) optimale L¨osung von ( ˆP), so l¨ost offenbar (y(u^∗),u^∗) das Problem (P).

Ist umgekehrt (y(u^∗),u^∗) eine optimale L¨osung von (P), so l¨ost u^∗ das reduzierte Problem ( ˆP).

Wir bezeichnen eine Lösungu^∗ von ( ˆP) als optimale Steuerung und die dazugehörige Lösungy(u^∗) des Anfangswertproblems (2) den zuu^∗ gehörende optimale Zustand.

(18)

Zun¨achst f¨uhren wir die LagrangefunktionL:Z×Y ×R³ →R ein:

L(z,p,p◦) =J(z) +hy˙ −f(y(·),u(·),pi_L2(t◦,tf;R³)+ y(t◦)−y◦

T

p◦

=J(z) +Rtf

t◦ y˙(t)−f(y(t),u(t))T

p(t)dt+ y(t◦)−y◦T

p◦

f¨urz = (y,u)∈Z und (p,p◦)∈Y ×R³.

(19)

3. Notwendige Optimalit¨ atsbedingungen erster Ordnung

Richtungsableitungen vonL:

Die Ableitung nach (p,p◦) ergibt die Zustandsgleichung (1).

Seienz = (y,u)∈X und (p,p◦)∈Y ×R³. Richtungsableitung nach der Variableny:

∂L

∂y(z,p,p◦)y_δ = Z t_f

t◦

x(t)−x_d(t)

x_δ(t) +α ψ(t)−ψ_d(t)

ψ_δ(t)dt

+ Z tf

t◦

˙

y_δ(t)−∂f

∂y(y(t),u(t))y_δ(t)T

p(t)dt+y_δ(t◦)^Tp◦

f¨ur eine beliebige Richtungy_δ = (x_δ, ψ_δ)∈Y.

(20)

Mitp = (px,p_ψ),px ∈H (t◦,t_f;R ),p_ψ ∈H (t◦,t_f;R), und p◦ = (px◦,pψ◦)∈R²×Rfolgt:

∂L

∂x(z,p,p◦)xδ= Z t_f

t◦

x(t)−xd(t)

xδ(t)dt+xδ(t◦)^Tpx◦

+ Z t_f

t◦

˙

xδ(t)−∂f

∂x(y(t),u(t))xδ(t)T

px(t)dt,

(4a)

∂L

∂ψ(z,p,p◦)ψδ= Z t_f

t◦

α ψ(t)−ψd(t) ψδ(t)dt +

Zt_f

t◦

ψ˙δ(t)− ∂f

∂ψ(y(t),u(t))ψδ(t)

pψ(t)dt+ψδ(t◦)pψ◦

(4b)

(21)

3. Notwendige Optimalit¨ atsbedingungen erster Ordnung

Gleich Null setzen und partielle Integration von (4a) liefert:

Z tf

t◦

x^∗(t)−x_d(t)−p˙^∗_x(t)−∂f

∂x(y^∗(t),u^∗(t))^Tp_x^∗(t)T

x_δ(t)dt +p^∗_x(t_f)^Tx_δ(t_f)− p_x^∗(t◦)−p_x◦^∗ T

x_δ(t◦) = 0

f¨ur eine beliebige Richtungx_δ ∈H¹(t◦,t_f;R²).

(22)

F¨ur Richtungen xδ ∈H¹(t◦,tf;R²) mitxδ(t◦) =xδ(tf) = 0:

Z t_f t◦

x^∗(t)−x_d(t)−p˙^∗_x(t)−∂f

∂x(y^∗(t),u^∗(t))^Tp_x^∗(t) T

x_δ(t)dt= 0.

f¨ur alle x_δ ∈H₀¹(t◦,t_f;R²)⊂H¹(t◦,t_f;R²).

(23)

3. Notwendige Optimalit¨ atsbedingungen erster Ordnung

Damit l¨ost die duale Variablep^∗_x die Differentialgleichung

−p˙_x^∗(t) = ∂f

∂x(y^∗(t),u^∗(t))^Tp_x^∗(t)+x_d(t)−x^∗(t) f¨ur t ∈(t◦,t_f).

(5a) Verwende (5a) und w¨ahlexδ∈H¹(t◦,tf;R²) mitxδ(t◦) = 0 und dann mit x_δ(t_f) = 0, so erhalten wir die Bedingungen

p_x^∗(t_f) = 0 und p^∗_x,◦ =p_x^∗(t◦). (5b)

Analog f¨ur die partielle Ableitung nachψund verwende (4b)

(24)

diedualen Gleichungenf¨urt ∈[t◦,tf)

−p˙^∗(t) = ∂f

∂y(y^∗(t),u^∗(t))^Tp^∗(t) +

x_d(t)−x^∗(t) α(ψ_d(t)−ψ^∗(t))

(6a)

p^∗(t_f) = 0, (6b)

p^∗_◦ =p^∗(t◦). (6c)

Hierbei gilt:

∂f

∂y(y^∗(t),u^∗(t))^Tp^∗(t) =





0 0 ₂^r −(u₁^∗(t) +u^∗₂(t)) sin(ψ^∗(t)) 0 0 ^r₂(u^∗₁(t) +u₂^∗(t)) cos(ψ^∗(t))

0 0 0





T

p^∗_x(t) p_ψ^∗(t)

f¨urt ∈[t◦,t_f].

(25)

3. Notwendige Optimalit¨ atsbedingungen erster Ordnung

Die L¨osung des linearen Anfangswertproblems (6a)-(6b) wird zu z^∗ = (y^∗,u^∗) geh¨orenderadjungierteroder dualer Zustand genannt.

(26)

∂L

∂u(z,p,p◦)uδ

= Z t_f

t◦

β u(t)−ud(t)

−∂f

∂u(y(t),u(t))^Tp(t)T

uδ(t) +γu(t)˙ ^Tu˙δ(t)dt.

Setze die partielle Ableitung der Lagrangefunktion an einer kritischen Stellez^∗= (y^∗,u^∗) und (p^∗,p^∗_◦) gleich Null, es folgt:

Z t_f

t◦

β u^∗(t)−ud(t)

−∂f

∂u(y^∗(t),u^∗(t))^Tp^∗(t)T

uδ(t)+γu˙^∗(t)^Tu˙δ(t)dt= 0.

(27)

3. Notwendige Optimalit¨ atsbedingungen erster Ordnung

F¨ur γ= 0 erhalten f¨ur allet ∈[t◦,tf]:

β u^∗(t)−u_d(t)

− ∂f

∂u(y^∗(t),u^∗(t))^Tp^∗(t) = 0 (7)

(28)

Andernfalls l¨ost u^∗ das nichtlineare (Dirichlet-)Randwertproblem

−γ¨u^∗(t) +βu^∗(t) = ∂f

∂u(y^∗(t),u^∗(t))^Tp^∗(t) +βud(t) f¨urt∈(t◦,tf),

˙

u^∗(t◦) = ˙u^∗(tf) = 0.

(8)

Hierbei gilt

∂f

∂u(y^∗(t),u^∗(t))^Tp^∗(t) = r 2

cos(ψ^∗(t)) sin(ψ^∗(t)) ¹_L cos(ψ^∗(t)) sin(ψ^∗(t)) −¹_L

!

p^∗(t) f¨urt∈[t◦,tf].

(29)

3. Notwendige Optimalit¨ atsbedingungen erster Ordnung

Das Optimalit¨atssystem erster Ordnung aus:

der Zustandsgleichung (2):

˙

y(t) =f(y(t),u(t)) f¨urt∈(t◦,tf] und y(t◦) =y◦

den adjungierten Gleichungen (6):

˙

p^∗(t) = ^∂f_∂y(y^∗(t),u^∗(t))^Tp^∗(t) +

xd(t)−x^∗(t) α(ψd(t)−ψ^∗(t))

f¨urt∈[t◦,tf)

p^∗(tf) = 0, p^∗◦=p^∗(t◦)

der Optimalit¨atsbedingung (7) bzw. (8):

β u^∗(t)−ud(t)

−^∂f_∂u(y^∗(t),u^∗(t))^Tp^∗(t) = 0 f¨ur allet∈[t◦,tf]

(30)

Jˆ⁰(u) =β u−u_d

−∂f

∂u(y(·),u(·))^Tp ∈L²(t◦,t_f;R²), (9) wobeiy = (x, ψ)^T ∈Y die Zustandsgleichung (2) l¨ost undp die L¨osung von

−p(t) =˙ ∂f

∂y(y(t),u(t))^Tp(t) +y_d(t)−y(t) f¨ur t∈[t◦,t_f), (10a)

p(tf) = 0, (10b)

p◦=p(t◦) (10c)

ist.

(31)

3. Notwendige Optimalit¨ atsbedingungen erster Ordnung

F¨ur γ >0 an der Stelle von (9):

ˆJ⁰(u) =−γ¨u+β(u−ud)−∂f

∂u(y(·),u(·))^Tp∈H⁻¹(t◦,tf;R³) =U⁰, (11)

wobei U⁰ den Dualraum von U bezeichnet.

Dann die Richtungsableitung von ˆJ and u in Richtung u_δ∈U:

hˆJ⁰(u),uδi_U0,U= Z t_f

t◦

γu(t)˙ ^Tu˙δ(t)+

β u(t)−u_d(t)

−∂f

∂u(y(t),u(t))^Tp(t)T

uδ(t)dt.

(32)

Beachte, dass wir den Dualraum vonL²(t◦,t_f;R²) mit L²(t◦,t_f;R²) identifizieren k¨onnen, das heißt, im Fall γ = 0 verwenden wirU⁰ =U.

Als numerisches Verfahren k¨onnen wir z.B. das in Algorithmus 1 verwenden.

(33)

4. Algorithm 1 (Abstiegsverfahren)

1: W¨ahle die Eingabedaten f¨ur (2): t_◦≥0,tf >t_◦, y_◦= (x_◦, ψ_◦)∈R³.

2: W¨ahle Daten f¨ur (P):α≥0,β >0,γ= 0 (β+γ >0), yd = (xd, ψd)∈L²(t_◦,tf;R³),ud ∈L²(t_◦,tf;R²).

3: W¨ahle Parameter f¨ur das Verfahren:kmax∈N,εabs≥εrel>0, c∈[10⁻⁴,10⁻³],u⁰∈U.

4: Berechne die L¨osungy⁰von (2) f¨uru=u⁰.

5: Werte ˆJ(u⁰) =J(y⁰,u⁰) aus.

6: Bestimmep⁰ aus (10) mity=y⁰undu=u⁰.

7: Berechne ˆJ⁰(u⁰) gem¨aß (9).

(34)

9: while kJˆ⁰(u^k)kU⁰ ≤ε_abs+ε_relkˆJ⁰(u⁰)kU⁰ or k≥k_max

10: W¨ahle die Richtungd^k =−J⁰(u^k)/

J⁰(u^k),J⁰(u^k) mit hˆJ⁰(u^k),d^kiU⁰,U<0.

11: Bestimme Schrittweitenparameters_k >0, so dass die Armijo-Regel Jˆ⁰(u^k+s_kd^k)≤ˆJ(u^k) +cs_khˆJ⁰(u^k),d^ki_U0,U

erf¨ullt ist.

12: Setzeu^k+1=u^k+skd^k undk =k+ 1;

(35)

4. Algorithm 1 (Fortsetzung 2)

13: if kˆJ⁰(u^k)kU⁰ > εabs+εrelkJˆ⁰(u⁰)kU⁰ ork <kmax

14: Berechne die L¨osungy^k von (2) f¨uru=u⁰.

15: Werte ˆJ(u^k) =J(y^k,u^k) aus.

16: Bestimmep^k aus (10) mity=y^k undu=u^k.

17: end if

18: end while