1: Wählex0 ∈X(hinreichend nahe an der Lösung ¯x)
2: fork=0,1,2, . . . do
3: Wähle einen invertierbaren Operator Mk ∈ L(X,Y).
4: Berechne sk durch Lösen von Mksk = −G(xk) und setze xk+1 = xk+sk.
5: end for
Frage: Konvergiert verallgemeinertes Newtonverfahren bei geeigneter Wahl vonMk?
verallgemeinertes Newtonverfahren
Frage: Konvergiert verallgemeinertes Newtonverfahren bei geeigneter Wahl vonMk?
Seidk ≔ xk− ¯x.
Frage: Konvergiert verallgemeinertes Newtonverfahren bei geeigneter Wahl vonMk?
Seidk ≔ xk− ¯x.
dk+1 =xk+1− ¯x
=xk+sk− ¯x
=Mk−1(Mkdk−G(xk))
=Mk−1(G( ¯x)+Mkdk−G(xk))
verallgemeinertes Newtonverfahren
Frage: Konvergiert verallgemeinertes Newtonverfahren bei geeigneter Wahl vonMk?
Seidk ≔ xk− ¯x.
dk+1 =xk+1− ¯x
=xk+sk− ¯x
=Mk−1(Mkdk−G(xk))
=Mk−1(G( ¯x)+Mkdk−G(xk))
Dieser Term soll klein werden.
Voraussetzungen:
verallgemeinertes Newtonverfahren
Voraussetzungen:
verallgemeinertes Newtonverfahren
Seien die Regularitätsbedingung und die Approximationsbedingung erfüllt.
verallgemeinertes Newtonverfahren
Seien die Regularitätsbedingung und die Approximationsbedingung erfüllt.
Seien die Regularitätsbedingung und die
verallgemeinertes Newtonverfahren
Seien die Regularitätsbedingung und die Approximationsbedingung erfüllt.
Ähnlich können wir abschätzen, wenn die Regularitätsbedingung und die alternative Approximationsbedingung erfüllt sind.
Wir haben gezeigt:
verallgemeinertes Newtonverfahren
Wir haben gezeigt:
Satz
SeiG : X →Ygegeben,XundY Banachräume. Seix0
hinreichend nahe an ¯x, der Lösung der GleichungG(x)=0und seien die Regularitäts- und die (alternative)
Approximationsbedingung erfüllt. Dann giltxk→ ¯xsuperlinear (mit Konvergenzordnung(1+α)).
SeiGnun stetig Fréchet-differenzierbar. Wähle dann Mk=G′(xk).
Klassischer Newton als Spezialfall
SeiGnun stetig Fréchet-differenzierbar. Wähle dann Mk=G′(xk).
Also erfülltGdie Approximationsbedingung.
Klassischer Newton als Spezialfall
Also erfülltGdie Approximationsbedingung.
IstG′sogarα-Hölder-stetig um ¯x, erhalten wir ähnlich die alternative Approximationsbedingung.
Die Regularitätsbedingung lautet hier
∀k≥0 :
(G′(xk))−1
L(Y,X)≤C
Klassischer Newton als Spezialfall
Die Regularitätsbedingung lautet hier
∀k≥0 :
Hinreichende Bedingung nach Satz von Banach über den inversen Operator, vgl. [3], Satz 4.3
G′( ¯x)∈ L(X,Y)ist invertierbar.
→vgl.Rn!
Insgesamt:
Klassischer Newton als Spezialfall
Insgesamt:
Satz
SeiG : X →Ystetig Fréchet-differenzierbar und seiG′( ¯x) invertierbar. Dann konvergiert das verallgemeinerte
Newtonverfahren mit Mk =G′(xk)lokal superlinear. FallsG′in einer Umgebung von ¯xzusätzlichα-Hölder-stetig, dann Konvergenzordnung1+α.
Verallgemeinertes Differential und Semiglattheit
Idee: FallsGnicht glatt, brauchen wir Ersatz fürG′.
Betrachte mengenwertige Funktion∂G : X ⇒L(X,Y)und wähle Mk ∈∂G(xk).
Betrachte mengenwertige Funktion∂G : X (X,Y)und wähle Mk ∈∂G(xk).
Approximationsbedingung lautet dann sup
M∈∂G( ¯x+d)
||G( ¯x+d)−G( ¯x)−Md||Y=o(||d||X)für||d||X →0
Verallgemeinertes Differential und Semiglattheit
Idee: FallsGnicht glatt, brauchen wir Ersatz fürG′.
Betrachte mengenwertige Funktion∂G : X ⇒L(X,Y)und wähle Mk ∈∂G(xk).
SeiG : X →Ystetig Fréchet-differenzierbar, dannG{G′}-semiglatt mit{G′}(x)≔{G′(x)}
Verallgemeinertes Differential und Semiglattheit
SeiG : X →Ystetig Fréchet-differenzierbar, dannG{G′}-semiglatt mit{G′}(x)≔{G′(x)}
Clarkes verallgemeinertes Differential:
SeiG : X →Ystetig Fréchet-differenzierbar, dannG{G′}-semiglatt mit{G′}(x)≔{G′(x)}
Clarkes verallgemeinertes Differential:
SeiG :Rn→Rmlokal Lipschitz-stetig. Dann
∂clG(x)=conv
M : xk→ x, G′(xk)→M, Gdifferenzierbar beixk
Verallgemeinertes Differential und Semiglattheit
SeiG : X →Ystetig Fréchet-differenzierbar, dannG{G′}-semiglatt mit{G′}(x)≔{G′(x)}
Clarkes verallgemeinertes Differential:
SeiG :Rn→Rmlokal Lipschitz-stetig. Dann
∂clG(x)=conv
M : xk→ x, G′(xk)→M, Gdifferenzierbar beixk
→wohldefiniert nach Satz von Rademacher
Beispiel:
Verallgemeinertes Differential und Semiglattheit
Beispiel: Betrachte f :R→R, f (x)≔P[βl;βr](x).
Beispiel: Betrachte f :R→R, f (x)≔P[βl;βr](x).
⇒∂clf (x)=
{0} x< βl∨x> βr
{1} βl < x< βr
conv{0,1}=[0; 1] x=βl∨x=βr
Verallgemeinertes Differential und Semiglattheit Ableitung zwischen 0 und 1
P[0;1](x)
Idee: Newtonverfahren auf semiglatte Funktionen anwenden.
Newton-Verfahren für semiglatte Funktionen
Idee: Newtonverfahren auf semiglatte Funktionen anwenden.
Regularitätsbedingung:
Idee: Newtonverfahren auf semiglatte Funktionen anwenden. Lokale superlineare Konvergenz folgt direkt mit Definition von Semiglattheit.
Anwendung auf ein optimales Steuerungsproblem
Wir wollen unsere Theorie nun auf das Optimalsteuerungsproblem min
min
• Ω⊂Rnbeschränkte, offene Teilmenge
• y∈H10(Ω)Zustand
• u∈L2(Ω)Steuerung
• A : H10(Ω)→H−1(Ω)ein linearer, elliptischer Differentialoperator (z.B.−∆)
• B∈ L(Lq(Ω),H−1(Ω)),q∈[1; 2[Kontrolloperator
• r ∈H−1(Ω)
Anwendung auf ein optimales Steuerungsproblem
Reduziere Problem mity=y(u)= A−1(r+Bu): min
u∈L2(Ω)
J(u)ˆ = 1
2||y(u)−yd||2
L2(Ω)+ α 2||u||2
L2(Ω)
s.t. βl≤u≤βr
(10)
h∇J(u),ˆ diL2(Ω) =hy(u)−yd,y′(u)diL2(Ω)+αhu,diL2(Ω) =
=hy′(u)∗(y(u)−yd)+αu,diL2(Ω)
Anwendung auf ein optimales Steuerungsproblem
h∇J(u),ˆ diL2(Ω) =hy(u)−yd,y′(u)diL2(Ω)+αhu,diL2(Ω) =
=hy′(u)∗(y(u)−yd)+αu,diL2(Ω)
Also
∇J(u)ˆ =y′(u)∗(y(u)−yd)+αu=αu+B∗(A−1)∗(A−1(r+Bu)−yd)=
≕αu+H(u)
h∇J(u),ˆ diL2(Ω) =hy(u)−yd,y′(u)diL2(Ω)+αhu,diL2(Ω) =
=hy′(u)∗(y(u)−yd)+αu,diL2(Ω)
Also
∇J(u)ˆ =y′(u)∗(y(u)−yd)+αu=αu+B∗(A−1)∗(A−1(r+Bu)−yd)=
≕αu+H(u)
DaB∈ L(Lq(Ω),H−1(Ω)), istB∗∈ L(H10(Ω),Lp(Ω))mit 1p+ 1q =1, d.h. p>2.
Anwendung auf ein optimales Steuerungsproblem
h∇J(u),ˆ diL2(Ω) =hy(u)−yd,y′(u)diL2(Ω)+αhu,diL2(Ω) =
=hy′(u)∗(y(u)−yd)+αu,diL2(Ω)
Also
∇J(u)ˆ =y′(u)∗(y(u)−yd)+αu=αu+B∗(A−1)∗(A−1(r+Bu)−yd)=
≕αu+H(u)
DaB∈ L(Lq(Ω),H−1(Ω)), istB∗∈ L(H10(Ω),Lp(Ω))mit 1p+ 1q =1, d.h. p>2. Weiter ist
H(u)=B∗(A−1)∗(A−1(r+Bu)−yd)
ein affiner OperatorL2(Ω)→Lp(Ω)und somit auch lokal Lipschitz-stetig (sogar global).
h∇J(u),ˆ diL2(Ω) =hy(u)−yd,y′(u)diL2(Ω)+αhu,diL2(Ω) =
=hy′(u)∗(y(u)−yd)+αu,diL2(Ω)
Also
∇J(u)ˆ =y′(u)∗(y(u)−yd)+αu=αu+B∗(A−1)∗(A−1(r+Bu)−yd)=
≕αu+H(u)
DaB∈ L(Lq(Ω),H−1(Ω)), istB∗∈ L(H10(Ω),Lp(Ω))mit 1p+ 1q =1, d.h. p>2. Weiter ist
H(u)=B∗(A−1)∗(A−1(r+Bu)−yd)
ein affiner OperatorL2(Ω)→Lp(Ω)und somit auch lokal Lipschitz-stetig (sogar global). H : L2(Ω)→L2(Ω)ist als affin lineare Funktion auch stetig Fréchet-differenzierbar.
Anwendung auf ein optimales Steuerungsproblem
Formuliere Problem als Operatorgleichung mitθ= 1α >0: Φ: L2(Ω)→L2(Ω)
Φ(u)=u−P[βl;βr](u−(1/α)(αu+H(u)))=u−P[βl;βr](−(1/α)H(u))=! 0
Formuliere Problem als Operatorgleichung mitθ= 1α >0: Φ: L2(Ω)→L2(Ω)
Φ(u)=u−P[βl;βr](u−(1/α)(αu+H(u)))=u−P[βl;βr](−(1/α)H(u))=! 0
gewünscht:Φsemiglatt.
Anwendung auf ein optimales Steuerungsproblem
Problem:Φeben nicht semiglatt.
Lemma
SeiΨ:R→Reine Lipschitz-stetige, aber nicht affin-lineare Funktion. Weiter seiΩ⊂Rnoffen und beschränkt. Dann ist für alle q∈[1,∞[der Operator
Ψ: Lq(Ω)∋u7→Ψ(u(·))∈Lq(Ω)
nicht∂Ψ-semiglatt.
Lösung: Resultat aus [2]:
Anwendung auf ein optimales Steuerungsproblem
Lösung: Resultat aus [2]:
Satz
SeiΩmessbar mit0< λ(Ω)<∞. SeiΨ:Rm→RLipschitz-stetig.
Sei Y ein Banachraum,1≤q< p≤ ∞,G : Y →Lq(Ω)lokal Lipschitz-stetig undG : Y →Lp(Ω)stetig Fréchet-differenzierbar.
∂ΨG: Y ⇒L(Y,Lq(Ω))
∂ΨG(y)={M : Mv=gT(G′(y)v), g∈L∞(Ω)m,
g(x)∈∂clΨ(G(y)(x))für fast alle x∈Ω}
Anwendung auf ein optimales Steuerungsproblem
Aus diesem allgemeinen Resultat folgt der Spezialfall:
Satz
Sei0< λ(Ω)<∞, f : L2(Ω)→L2(Ω)stetig Fréchet-differenzierbar und∇f erfülle die Bedingung
Es existierenα >0undp>2, sodass∇f (u)=αu+H(u)mit H : L2(Ω)→L2(Ω)stetig Fréchet-differenzierbar,
H : L2(Ω)→Lp(Ω)lokal Lipschitz-stetig.
Satz
Sei0< λ(Ω)<∞, f : L2(Ω)→L2(Ω)stetig Fréchet-differenzierbar und∇f erfülle die Bedingung
Es existierenα >0undp>2, sodass∇f (u)=αu+H(u)mit H : L2(Ω)→L2(Ω)stetig Fréchet-differenzierbar,
H : L2(Ω)→Lp(Ω)lokal Lipschitz-stetig.
Dann istΦ(u)=u−P[βl,βr](u− α1∇f (u)) ∂Φ-semiglatt
Anwendung auf ein optimales Steuerungsproblem
Aus diesem allgemeinen Resultat folgt der Spezialfall:
Satz
Sei0< λ(Ω)<∞, f : L2(Ω)→L2(Ω)stetig Fréchet-differenzierbar und∇f erfülle die Bedingung
Es existierenα >0undp>2, sodass∇f (u)=αu+H(u)mit
Beweis.
Setzeq=2,Ψ =P[βl,βr]undG=−α1Him “allgemeinen” Satz.⇒ Semiglattheit vonΨG.
Anwendung auf ein optimales Steuerungsproblem
Beweis.
Setzeq=2,Ψ =P[βl,βr]undG=−α1Him “allgemeinen” Satz.⇒ Semiglattheit vonΨG.
Φ =I−ΨG, also auch∂Φ-Semiglattheit vonΦund Formel für
∂Φ =I−∂Ψ.
Beweis.
Setzeq=2,Ψ =P[βl,βr]undG=−α1Him “allgemeinen” Satz.⇒ Semiglattheit vonΨG.
Φ =I−ΨG, also auch∂Φ-Semiglattheit vonΦund Formel für
vgl. Beispiel zu Clarkes verallgemeinertem Differential.
Anwendung auf ein optimales Steuerungsproblem
Voraussetzungen für diesen Spezialfall schon gezeigt, alsoΦ semiglatt.
Voraussetzungen für diesen Spezialfall schon gezeigt, alsoΦ semiglatt. Falls noch die Regularitätsbedingung
∀u∈L2(Ω)mit||u− ¯u||L2(Ω)< δ: ∀M∈∂Φ(u) :
Anwendung auf ein optimales Steuerungsproblem
Voraussetzungen für diesen Spezialfall schon gezeigt, alsoΦ semiglatt. Falls noch die Regularitätsbedingung
∀u∈L2(Ω)mit||u− ¯u||L2(Ω)< δ: ∀M∈∂Φ(u) : gilt, konvergiert das verallgemeinerte Newtonverfahren
Mksk =−Φ(uk),
lokal superlinear.
Dabei
Mk ≔I+ 1
αgk·H′(uk)= I+ 1
αgk·B∗(A−1)∗A−1B.
Anwendung auf ein optimales Steuerungsproblem
Hinze, Pinnau, Ulbrich S., Ulbrich M.: Optimization with PDE Constraints, Springer Science + Business Media B.V (2009) Ulbrich, M.: Semismooth Newton methods for operator equations in function spaces. SIAM J. Optim. 13, 805–841 (2003)
T. Schick: Kurz-Skript zu “Funktionalanalysis I”,http://www3.
mathematik.tu-darmstadt.de/fileadmin/home/users/
186/Skripte_Roch/funk.pdf