Nichtlineare Optimierung 7. Übungsblatt
Fachbereich Mathematik WS 2012/13
Prof. Dr. Irwin Yousept 6.12.2012
Hannes Meinlschmidt
Nächste Woche wieder Rechnerübung in S2|15 K313!
Gruppenübung
Aufgabe G1 (Verfahren der konjugierten Gradienten [Conjugated Gradient Method]) Gegeben sei die quadratische Funktion
q:Rn→R:y7→cTy+1 2yTC y
mitc∈RnundC∈Rn×nsymmetrisch positiv definit. Zur Bestimmung des (eindeutigen) globalen Minimums−C−1cvon qbetrachten wir folgenden Algorithmus:
Algorithmus 1: Verfahren der konjugierten Gradienten Wähle y0und berechneg0:=c+C y0;
1
ifg0=0then
2
STOP mit Ergebnisy0.
3
else
4
Setzek←0undd0=g0;
5
end
6
Berechneαk:= gk Tgk
dk TC dk;
7
Setze yk+1:=yk−αkdksowie gk+1:=gk−αkC dk;
8
ifgk+1=0then
9
STOP mit Ergebnisyk+1.
10
end
11
Berechneβk:= gk+1Tgk+1
gk Tgk ;
12
Setzedk+1:=gk+1+βkdk;
13
Setzek←k+1und gehe zu 7.
14
SeiVk+1definiert alsSpan{g0,C g0, . . . ,Ckg0}. Folgende Aussagen dürfen Sie als gegeben annehmen: Solangegk6=0ist, gilt:
(a) dk6=0,
(b) Vk+1=Span{g0, . . . ,gk}=Span{d0, . . . ,dk},
(c) die Vektorend0, . . .dksindpaarweiseC-konjugiert, d.h.
di TC dj=0 für allei,j∈ {0, . . . ,k}miti6=j, (d) gk+1ist orthogonal zum UnterraumVk+1, also gk+1⊥Vk+1.
Zeigen Sie damit: Es giltq(yk+1) =miny∈Vk+1q(y0+y)und das Verfahren berechnet in höchstensnSchritten das globale Minimum vonq.
Hinweis:Interpretieren Sie(d0, . . . ,dk)als Basis vonVk+1und formulieren Sie das Minimierungsproblem auf dem Unter- raum um in ein Minimierungsproblem aufRm für ein geeignetesm. Nutzen Sie dann die Konstruktion der yk aus dem Algorithmus und die in (a) bewiesenen Eigenschaften.
1
Aufgabe G2 (Inexaktes CG-Newton-Verfahren)
In der Vorlesung wurden inexakte Newton-Verfahren zur Minimierung einer zweimal stetig differenzierbaren Funktion f :Rn→Rvorgestellt. Um nun eine inexakte Lösung der Newton-Gleichung zu berechnen, kann man das CG-Verfahren aus Aufgabe G1 verwenden. Die Idee ist dabei, das CG-Verfahren auf die Funktionqk(s):= 12sT∇2f(xk)s+∇f(xk)Ts loszulassen und den Algorithmus abzubrechen, wenn das Residuumk∇f(xk) +∇2f(xk)skklein genug ist. Damit erhält man eine näherungsweise Lösung der Newton-Gleichung∇2f(xk)s=−∇f(xk).
Im allgemeinen Abstiegsverfahren verwenden wir also zur Berechnung der Suchrichtungsk das folgende, leicht modifi- zierte CG-Verfahren:
Algorithmus 2: Inexaktes CG-Newton-Verfahren zur Bestimmung der Suchrichtung
Input:α,ν∈(0, 1)beliebig, aber fest, aktuelle Iteriertexkdes allgemeinen Abstiegsverfahrens Wähle y0=0, setzeg0=∇f(xk)undd0:=∇f(xk), sowiej:=0;
1
if kgjk ≤min{ν,k∇f(xk)k}k∇f(xk)kthen(relatives Residuum klein genug)
2
STOP mitsk=yj.
3
end
4
ifdj T∇2f(xk)dj≤0then(Richtung nichtpositiver Krümmung)
5
STOP mit Ergebnissk=yj−sign(∇f(xk)Tdj)k∇f(xk)kkddjjk.
6
end
7
Berechneαj= gj Tgj
dj T∇2f(xk)dj;
8
Setze yj+1=yj−αjdjsowiegj+1:=gj−αj∇2f(xk)dj;
9
if−∇f(xk)Tyj+1<min{α,k∇f(xk)k}k∇f(xk)kkyj+1kthen(Abstiegsrichtung wird unzureichend)
10
STOP mit Ergebnissk=yj.
11
end
12
Berechneβj:= gj+1Tgj+1
gj Tgj und setzedj+1:=gj+1+βjdj;
13
Setze j← j+1und gehe nach 2;
14
Zur Bestimmung der Schrittweite im inexakten Newton-Verfahren werde die Armijo-Regel mit Parameternγ∈(0, 1/2) undβ∈(0, 1)verwendet. Seix0∈Rnund die NiveaumengeNf(x0)kompakt. Zeigen Sie:
(a) Es giltkskk ≥δk∇f(xk)kundkyjk ≥δk∇f(xk)kmit einemδ >0.
(b) Die erzeugten Suchrichtungensksind zulässig.
(c) Die mit der Armijo-Regel erzeugten Schrittweitenσksind zulässig.
(d) Ist∇2f(¯x)positiv definit und giltxk→x, so konvergiert¯ xk→¯x q-superlinear bzw. sogarq-quadratisch, falls∇2f in¯xlokal Lipschitz-stetig ist.
Hinweis:Zeigen Sie, dass es einK∈Ngibt, so dass das inexakte CG-Verfahren in allen Iterationenk≥K des Ab- stiegsverfahrens nur deshalb abbricht, weil das Residuum klein genug ist. Zeigen Sie nun, dass die Voraussetzungen des Konvergenzsatzes über Inexakte Newton-Verfahren fürF(x) =∇f(x)erfüllt sind.
Hinweis:Die beiden Ungleichungen
−∇f(xk)Tsk≥ k∇f(xk)k2
1+2k∇2f(xk)k und − ∇f(xk)Tyj≥ k∇f(xk)k2
1+2k∇2f(xk)k (1)
dürfen ohne weiteren Beweis verwendet werden.
2
Hausübung
Aufgabe H1 (Rang-1-Updates für Quasi-Newton-Verfahren) (4 Punkte)
(a) SeiH∈Rn×nregulär undu,v∈Rngegeben. Zeigen Sie: Die MatrixH+uvT ist regulär, wenn1+vTH−1u6=0ist, und es gilt die sogenannteSherman-Morrison-Formel
(H+uvT)−1=
I− H−1uvT 1+vTH−1u
H−1.
(b) In der Vorlesung haben wir gesehen, dass der Ansatz eines symmetrischen Rang-1 Quasi-Newton Updates zum Update
Hk+1=Hk+(yk−Hkdk)(yk−Hkdk)T
(yk−Hkdk)Tdk . (SR1)
führt. Leiten Sie mit der Sherman-Morrison-Formel die zur Formel (SR1) gehörige inverse Aufdatierungsformel Bk+1=Bk+(dk−Bkyk)(dk−Bkyk)T
(dk−Bkyk)Ty her.
Aufgabe H2 (BFGS-Aufdatierung) (5 Punkte)
(a) Zeigen Sie, dass die inverse BFGS-Aufdatierung auch in der Form BBF GSk+1 =VkTBkVk+ρkdkdk T geschrieben werden kann, wobeiVk=I−ρkykdk T undρk= 1
dk Tyk.
(b) Sei B0 ∈ Rn×n gegeben. Zur Berechnung der Suchrichtung im Schritt k eines BFGS-Verfahrens, d.h. sk =
−Bk∇f(xk), ist ein rekursives Verfahren in Funktion bfgsrek(k,w) angegeben. Zeigen Sie, dass der Aufruf v=bfgsrek(k,w)das Ergebnisv =Bkwliefert, wobeiBkdiek-te inverse BFGS-Matrix ist.
Funktionbfgsrek(k,w) ifk=0then
1
returnB0w;
2
end
3
Berechneρ= 1
dk−1Tyk−1 undα=ρdk−1Tw;
4
Setzew1=w−αyk−1;
5
Berechnew2=bfgsrek(k−1,w1);
6
returnw2+ (α−ρyk−1Tw2)dk−1
7
Aufgabe H3 (DFP und BFGS) (6 Punkte)
Sei Hk symmetrisch und invertierbar. Zeigen Sie, dass die DFP- und BFGS-Updates jeweils durch gegenseitige inverse Updates erzeugt werden können:
(a) Giltyk Tdk6=0,dk THkdk6=0undyk TH−1k yk6=0, so sindHk+1DF P sowieHk+1BF GSinvertierbar und es gilt (Hk+1DF P)−1= ΦBF GS(Hk−1,yk,dk)
und
(Hk+1BF GS)−1= ΦDF P(Hk−1,yk,dk).
Hinweis:Wegen yk Tdk 6=0lässt sich jeder Vektorv ∈Rnschreiben alsv =u+λdk, wobeiu⊥ yk(orthogonale Zerlegung). Berechnen Sie zunächstHk+1DF Pv, um die erste Gleichung zu zeigen. Benutzen Sie weiter, dassHk+1DF P die Quasi-Newton-Gleichung erfüllt.
(b) Ist Hk symmetrisch positiv definit und yk Tdk > 0, dann sindHk+1DF P,Hk+1BF GS und HB,λk+1für alle λ∈[0, 1] wieder positiv definit.
3