• Keine Ergebnisse gefunden

5Lokale Extrema mehrstelliger reeller Funktionen

Im Dokument Mathematik f¨ur Informatiker (Seite 156-161)

Wir diskutieren nun die Frage, wann hinreichend “gute” reelle Funktionen in mehreren Variablen ein lokales Extremum besitzen. Der Ordnung halber f¨uhren wir folgende Sprechweisen ein.

Definition VIII.5.1 (lokale Extrema)

Sei U ⊆Rn offen und f :U →R. Die Funktion f besitzt in a∈U ein

• lokales Minimum, wenn ein ε > 0 existiert, sodaß Uε(a) ⊆ U und f(a) ≤ f(x) f¨ur alle x∈Uε(a)

• lokales Maximum, wenn ein ε > 0 existiert, sodaß Uε(a) ⊆ U und f(a) ≥ f(x) f¨ur alle x∈Uε(a).

Wir sagen, daß f in a ein lokales Extremum besitzt, wenn f in a ein lokales Maximum oder ein lokales Minimum besitzt.

Die Funktion f besitzt in a∈U ein

• isoliertes lokales Minimum, wenn ein ε >0 existiert, sodaß Uε(a)⊆U und f(a)< f(x) f¨ur alle x∈Uε(a)\ {a}

• isoliertes lokales Maximum, wenn ein ε >0 existiert, sodaß Uε(a)⊆U und f(a)> f(x) f¨ur alle x∈Uε(a)\ {a}.

Wir sagen, daß f in a ein isoliertes lokales Extremum besitzt, wenn f in a ein isoliertes lokales Maximum oder ein isoliertes lokales Minimum besitzt.

Offenbar besitztf inakein lokales Extremum, wenn f¨ur alleε >0 mitUε(a)⊆U Punkte a1, a2 ∈Uε(a) existieren mit f(a1)< f(a)< f(a2). Einen solchen Punkt a nennen wir auchSattelpunkt, da in jeder noch so kleinen Umgebung von a die Funktionf Werte sowohl unter- als auch oberhalb von f(a) annimmt.22

Folgender Satz gibt eine notwendige Bedingung f¨ur das Vorliegen eines lokalen Extremums.

Satz VIII.5.2 Sei U ⊆ Rn offen und f : U → R differenzierbar. Wenn f in a∈U ein lokales Extremum hat, dann ist D(f)(a) = 0.

Beweis: F¨ur i = 1, . . . , n sei gi(t) :=a+tei. Wenn f in a ein lokales Extremum hat, dann hat f ◦gi in 0 ebenfalls ein lokales Extremum und somit Di(f)(a) = (f ◦gi)(0) = 0. Also ist D(f)(a) = 0, wenn f ina ein lokales Extremum hat.

Wir nennen a mit D(f)(a) = 0 kritische Punkte von f. Um ein Kriterium zu formulieren, ob in einem kritischen Punkt ein lokales Extremum vorliegt, ist fol-gender Begriff vonn¨oten.

22urn= 1 ist ein Beispiel die Funktionf(x) =x2k+1, die in 0 den Wert 0 hat aber in jeder noch so kleinen Umgebung von 0 echt positive und echt negative Werte annimmt.

Definition VIII.5.3 (Hesse-Matrix) Sei U ⊆Rn offen und f :U →R zweimal differenzierbar. Dann ist die Hesse-Matrixf¨urf im Punkt a∈U definiert als die n×n Matrix

H(f)(a) =

D1D1(f)(a) · · · D1Dnf(a) ... . .. ... DnD1(f)(a) · · · DnDnf(a)

Offenbar ist aufgrund von Satz VIII.4.1 die Hesse-Matrix H(f)(a) symmetrisch, wennf zweimal stetig differenzierbar ist.

Folgender Satz stellt hinreichende Bedingungen zur Verf¨ugung, um das Vorliegen lokaler Maxima bzw. deren Absenz festzustellen.

Satz VIII.5.4 Sei U ⊆Rn offen und f :U →Rn zweimal stetig differenzierbar.

Sei a∈U mit D(f)(a) = 0. Dann gilt

(1) Wenn H(f)(a) positiv definit ist, dann liegt in a ein isoliertes lokales Mi-nimum von f vor.

(2) Wenn H(f)(a) negativ definit ist, dann liegt in a ein isoliertes lokales Ma-ximum von f vor.

(3) Wenn H(f)(a) indefinit ist, dann liegt in a ein Sattelpunkt vor.

Beweis: Ohne Beschr¨ankung der Allgemeinheit nehmen wir an, U sei von der GestaltUε(a). Aufgrund von Satz VIII.4.2 gilt dann f¨ur alle x∈U, daß

f(x) =f(a) +D(f)(a)·(x−a) + 1

2(x−a)TH(f)(a+ξh)(x−a) f¨ur ein ξ∈]0,1[. Da nach AnnahmeD(f)(a) = 0, vereinfacht dies zu

f(x) =f(a) + 12(x−a)TH(f)(a+ξ(x−a))(x−a)

=f(a) +

n

P

i,j=1 1

2DiDj(f)(a+ξ(x−a))(x−a)i(x−a)j

Außerdem gilt aufgrund von Kor. VIII.4.3 f¨ur die Fehlerfunktionϕ(x) := f(x)− f(a)− 12(x−a)TH(f)(a)(x−a), daß lim

x→a ϕ(x)

||x−a||22.

Wir behandeln zuerst (1). Sei alsoA:=H(f)(a) als positiv definit angenommen.

Es gilt dannxTAx >0 f¨ur x∈S :={x∈Rn| ||x||2 = 1}. DaS kompakt ist und x 7→ xTAx stetig ist, gilt aufgrund von Satz VIII.2.10, daß α := inf

x∈SxTAx > 0.

Wir zeigen, daß nun

(∗) xTAx≥α||x||22

f¨ur alle x ∈ Rn. Die Ungleichung gilt nat¨urlich f¨ur x = 0. Wenn x 6= 0, setzen wir y := ||x||x

2 ∈ S. Also gilt yTAy ≥ α. Da aber yTAy = ||x||12 2

xTAx, folgt nun yTAy≥α||x||22.

Da lim

x→a ϕ(x)

||x−a||22 = 0, gibt es ein δ >0, sodaß

|ϕ(x)|< α

4||x−a||22 falls||x−a||2 < δ. Also gilt

f(x) =f(a) + 12(x−a)TA(x−a) +ϕ(x)≥f(a) + α2||x−a||22− |ϕ(x)|

≥f(a) + α2||x−a||22α4||x−a||22 =f(a) + α4||x−a||22

> f(a)

wenn 0<||x−a||2 < δ.

Somit haben wir gezeigt, daßf ina ein isoliertes lokales Minimum hat.

Die Behauptung (2) folgt aus (1), indem man (1) auf −f anwendet.

F¨ur (3) nehmen wir an, daß A := H(f)(a) indefinit sei. Es gibt dann x, y ∈ Rn mit ||x||2 = 1 = ||y||2, sodaß xTAx > 0 und yTAy < 0. ¨Ahnlich wie im Beweis von (1) kann man zeigen, daß einδ >0 existiert, sodaß f¨ur alle t∈]0, δ[ gilt, daß f(a+tx)> f(a) und f(a+ty)< f(a). Somit haben wir gezeigt, daßf inaeinen

Sattelpunkt hat.

Wir illustrieren nun die Anwendung dieses Satzes in folgendem Beispiel VIII.5.5

(1) Sei f :R2 → R : (x, y) 7→c+x2+y2. Da D(f)(x, y) = (2x,2y), ist (0,0) der einzige kritische Punkt von f. Da D1D2(f)(x, y) = 0 = D2D1f(x, y) und D1D1f(x, y) = 2 =D2D2f(x, y) ist

H(f)(0,0) =

2 0 0 2

Da alle Eigenwerte dieser Matrix echt positiv sind, liegt in (0,0) aufgrund von Satz VIII.5.4 ein isoliertes lokales Minimum der Funktion f vor, was aber auch leicht direkt zu beweisen ist.

(2) Sei f :R2 →R: (x, y)7→c−x2−y2. DaD(f)(x, y) = (−2x,−2y), ist(0,0) der einzige kritische Punkt von f. Da D1D2(f)(x, y) = 0 = D2D1f(x, y) und D1D1f(x, y) =−2 = D2D2f(x, y), ist

H(f)(0,0) =

−2 0 0 −2

Da alle Eigenwerte dieser Matrix echt negativ sind, liegt in (0,0) aufgrund von Satz VIII.5.4 ein isoliertes lokales Maximum der Funktion f vor, was aber auch leicht direkt zu beweisen ist.

(3) Sei f :R2 →R: (x, y)7→c+x2−y2. DaD(f)(x, y) = (2x,−2y), ist (0,0) der einzige kritische Punkt von f. Da D1D2(f)(x, y) = 0 = D2D1f(x, y) und D1D1f(x, y) = 2 und D2D2f(x, y) =−2, ist

H(f)(0,0) =

2 0 0 −2

Diese Matrix ist indefinit, also liegt aufgrund von Satz VIII.5.4 in (0,0) kein lokales Extremum der Funktion f vor.

Tats¨achlich liegt in (0,0) ein Sattelpunkt vor, da die Einschr¨ankung von f auf die x-Achse in (0,0) ein isoliertes lokales Maximum und die Ein-schr¨ankung von f auf die y-Achse in (0,0) ein isoliertes lokales Minimum hat. In jeder noch so kleinen Umgebung von (0,0)nimmt also die Funktion f Werte > c und Werte < c an.

(4) Betrachten wir die Funktionen f1, f2, f3 :R2 →R mit

f1(x, y) = x2+y4 f2(x, y) = x2 f3(x, y) = x2+y3

Wie man leicht nachrechnet, verschwindet der Gradient aller drei Funktio-nen im Punkt (0,0) und

H(fi)(0,0) =

2 0 0 0

Also hat in allen drei F¨allen die Hesse-Matrix im Punkt(0,0)den Eigenwert 0 und somit kann man mithilfe von Satz VIII.5.4 keine Aussage ¨uber die Natur eines solchen kritischen Punkts machen, denn

1) f1 hat in (0,0) ein isoliertes lokales Minimum

2) f2 hat in (0,0) ein lokales Minimum, das aber nicht isoliert ist 3) f3 hat in (0,0) kein lokales Extremum sondern einen Sattelpunkt.

Wir betrachten nun ein “realistisches” Beispiel.

Beispiel VIII.5.6

Wir betrachten Quader mit konstantem Volumen c > 0 und fragen uns, welcher davon die kleinste Oberfl¨ache hat. Die Seitenl¨angen eines Quaders seien gegeben durchx, y, z >0. Dann ist sein Volumenxyzund seine Oberfl¨ache2(xy+xz+yz).

Unter der Annahme, daß das Volumen xyz gleich c ist, ergibt sich z = xyc und die Oberfl¨ache ist 2(xy+xc +yc). Wir m¨ussen also untersuchen, wo die Funktion

f :{(x, y)∈R2 |x, y >0} →R: (x, y)7→2

xy+ c x + c

y

ein Minimum annimmt.

Zu diesem Zweck bestimmen wir vorerst die kritischen Punkte von f. Die ersten partiellen Ableitungen von f sind D1(f)(x, y) = 2(y− xc2) und D2(f)(x, y) = 2(x− yc2). Da x, y > 0, ist D(f)(x, y) = 0 genau, dann, wenn x2y = c = xy2, d.h. wenn x = y = c13 (da aus x2y = xy2 folgt x = y). Die zweiten partiellen Ableitungen von f sind

D1D1f(x, y) = 4c

x3 D2D2f(x, y) = 4c

y3 D1D2f(x, y) =D2D1f(x, y) = 2 und somit ist

H(f)(c13, c13) =

4 2 2 4

Diese Matrix ist positiv definit, wie man leicht mit dem Hurwitzschen Kriterium feststellt. Somit hat nach Satz VIII.5.4 die Funktion f im Punkt (c13, c13) ein isoliertes lokales Minimum. Wenn x=y=c13, dann ist auch z = xyc =c13. Wenn nunf ein globalesMinimum hat, dann muß es auch ein lokales Minimum sein und somit im Punkt (c13, c13) angenommen werden. Es gibt aber keinen all-gemeinen Grund, warum ein lokales Minimum auch ein globales Minimum sein muß. Um zu zeigen, daß dies dennoch der Fall ist, gehen wir folgendermaßen vor. F¨ur a > 0 betrachten wir die Einschr¨ankung von f auf {(x, y) ∈ R2 | xy = a∧x, y >0} und untersuchen, wo die Funktion f auf dieser Menge ihr globales Minimum annimmt.

Zu diesem Zwecke betrachten wir die Funktion ga:R+ →R:t7→f

t,a t

= 2 a+c

t + c at

und untersuchen, wo diese ihr globales Minimum annimmt. Wenn wir g0a(t) = 2c

a − c t2

gleich 0 setzen, erhalten wir als eindeutige L¨osung a12. Da ga(a12)< ga(t)⇔2

a+ 2c a12

<2 a+c

t + c at

⇔a+ 2c

a12 < a+ c t + c

at

⇔ 2c a12 < c

t + c at

⇔2ta12 < a+t2

⇔0< a−2ta12 +t2

⇔0<(t−a12)2

⇔t6=a12

hat ga ein isoliertes globales Minimum in a12. Wir suchen nun das Minimum der Funktion

h:R+→R:a7→ga(a12) = 2

a+ 2c a12

Ihre Ableitung ist h0(a) = 2

1−ca32

und somit gilt

h0(a)0⇔1−ca320⇔1ca32 ⇔a32c⇔ac23

wenn man f¨ur <, > oder = einsetzt. Somit ist h auf ]0, c23[ stark monoton fallend und auf ]c23,∞[ stark monoton wachsend.

Also hat h in c23 sein isoliertes globales Minimum. Da das isolierte globale Mi-nimum von g

c23 in (c23)12 = c13 liegt, haben wir bewiesen, daß f in (c13, c13) sein isoliertes globales Minimum hat.

Also ist der Quader mit Volumen c, der die kleinste Oberfl¨ache hat, der W¨urfel mit Seitenl¨ange c13.

Im Dokument Mathematik f¨ur Informatiker (Seite 156-161)