Kapitel 6 Diﬀerenzierbare Funktionen

(1)

47

Kapitel 6 Differenzierbare Funktionen

§ 1 Topologische Strukturen

Inhalt:

Umgebungen, innere Punkte, offene Mengen, abgeschlossene Mengen, H¨ aufungs- punkte, offener Kern und abgeschlossene H¨ ulle, Rand einer Menge.

Der Konvergenzbegriff im R

ⁿ

, kompakte Mengen und der Satz von Heine-Borel, Stetigkeit, Ungleichungen, stetiges Bild einer kompakten Menge, Satz vom globalen Maximum und Minimum, stetige Wege, Gebiete, Konvexit¨ at.

Zur Erinnerung: Der Abstand zweier Punkte x und y im R

ⁿ

ist gegeben durch die Zahl

d(x, y) := ky − xk = p

(y

₁

− x

₁

)

²

+ · · · + (y

_n

− x

_n

)

²

.

Man nennt die Funktion d : R

ⁿ

× R

ⁿ

→ R die euklidische Metrik auf dem R

ⁿ

. Sie hat folgende Eigenschaften:

1. d(x, y) ≥ 0 f¨ ur alle x, y ∈ X.

2. d(x, y) = 0 ⇐⇒ x = y.

3. d(x, y) = d(y, x) f¨ ur alle x, y ∈ X (Symmetrie).

4. d(x, y) ≤ d(x, z) + d(z, y) f¨ ur x, y, z ∈ X (Dreiecks-Ungleichung).

Definition:

Sei x

₀

∈ R

ⁿ

und ε > 0 eine reelle Zahl. Dann heißt U

_ε

(x

₀

) := {x ∈ R

ⁿ

: d(x, x

₀

) < ε}

die ε-Umgebung von x

₀

.

In R

²

ist U

_ε

(x

₀

) eine Kreisscheibe, im R

³

eine Kugel. Wir schreiben auch B

_ε

(x

₀

) ( ” B“ f¨ ur

” ball“). Der Rand geh¨ ort jeweils nicht dazu.

Eine beliebige Menge M ⊂ R

ⁿ

heißt eine Umgebung von x

₀

, falls es ein ε > 0 mit U

_ε

(x

₀

) ⊂ M gibt. Der Punkt x

₀

hat dann einen

” Sicherheitsabstand“ zum Rand

(2)

der Umgebung. M seinerseits kann aber beliebige Gestalt haben. Nat¨ urlich ist jede ε-Umgebung von x

₀

auch eine Umgebung von x

₀

im obigen Sinne.

Ein Punkt x

0

∈ M heißt innerer Punkt von M , falls M noch eine ganze Umgebung von x

₀

enth¨ alt.

Hausdorffscher Trennungssatz

Sind x, y ∈ R

ⁿ

zwei Punkte mit x 6= y, so gibt es Umgebungen U von x und V von y, so daß U ∩ V = ∅ ist.

Beweis: Wegen x 6= y ist r := d(x, y) > 0. Nun sei 0 < ε < r/2, U = U

_ε

(x) und V = U

_ε

(y). W¨ are z ein Punkt in U ∩V , so w¨ are d(x, y) ≤ d(x, z)+d(z, y) < 2ε < r.

Das w¨ are ein Widerspruch.

Definition:

Eine Menge M ⊂ R

ⁿ

heißt offen, falls es zu jedem x ∈ M ein ε > 0 gibt, so daß U

ε

(x) ⊂ M ist.

Eine Menge M ist also genau dann offen, wenn sie eine Umgebung von jedem ihrer Punkte ist. Dann ist jeder Punkt von M ein innerer Punkt von M .

Behauptung: Jede ε-Umgebung ist eine offene Menge.

Beweis: Sei y ∈ U

_ε

(x

₀

). Wir suchen eine δ-Umgebung von y, die noch ganz in U

ε

(x

0

) enthalten ist. Dazu sei r := d(y, x

0

). Dann ist 0 ≤ r < ε. Man kann eine positive reelle Zahl δ < ε − r finden. Ist x ∈ U

_δ

(y), also d(x, y) < δ, so ist d(x, x

₀

) ≤ d(x, y)+d(y, x

₀

) < δ +r < (ε−r)+r = ε. Das zeigt, daß U

_δ

(y) ⊂ U

_ε

(x

₀

) ist.

Satz (Eigenschaften offener Mengen)

Die offenen Mengen im R

ⁿ

besitzen folgende Eigenschaften:

1. Der R

ⁿ

und die leere Menge sind offen.

2. Der Durchschnitt endlich vieler offener Mengen ist wieder offen.

3. Die Vereinigung beliebig vieler offener Mengen ist wieder offen.

Beweis: 1) F¨ ur den R

ⁿ

und die leere Menge ist der Beweis trivial.

(3)

1 Topologische Strukturen 49

2) Seien M

₁

, . . . , M

_n

offen und M := M

₁

∩ . . . ∩ M

_n

. Ist x ∈ M , so gibt es Zahlen ε

_i

> 0 mit U

_ε_i

(x) ⊂ M

_i

f¨ ur i = 1, . . . , n. Setzt man ε := min(ε

₁

, . . . , ε

_n

), so liegt U

_ε

(x) in M .

3) Es sei M = {M

_ι

: ι ∈ I} eine Familie von offenen Mengen, M = [

ι∈I

M

ι

= {x ∈ R

ⁿ

: ∃ ι ∈ I mit x ∈ M

ι

}

deren Vereinigung, x ein Element von M . Ist x ∈ M

ι

, so gibt es ein ε > 0, so daß U

_ε

(x) ⊂ M

_ι

ist. Aber dann ist erst recht U

_ε

(x) ⊂ M .

Die Menge

◦

M aller inneren Punkte von M nennt man auch den offenen Kern von M . Diese Menge ist immer offen. Eine Menge ist genau dann offen, wenn sie mit ihrem offenen Kern ¨ ubereinstimmt.

Definition:

Eine Menge M ⊂ R

ⁿ

heißt abgeschlossen, falls R

ⁿ

\ M offen ist.

Satz (Eigenschaften abgeschlossener Mengen)

Die abgeschlossenen Mengen in einem metrischen Raum besitzen folgende Eigen- schaften:

1. Der R

ⁿ

und die leere Menge sind abgeschlossen.

2. Die Vereinigung endlich vieler abgeschlossener Mengen ist wieder abge- schlossen.

3. Der Durchschnitt beliebig vieler abgeschlossener Mengen ist wieder abge- schlossen.

Der Beweis ergibt sich unmittelbar aus den Eigenschaften der offenen Mengen durch Komplement-Bildung.

Definition:

Sei M ⊂ R

ⁿ

eine beliebige Teilmenge. Ein Punkt x

₀

∈ R

ⁿ

heißt ein H¨ aufungs-

punkt der Menge M , falls in jeder Umgebung von x

₀

ein Punkt x 6= x

₀

liegt, der

zu M geh¨ ort.

(4)

Ist x

₀

nicht H¨ aufungspunkt von M , so gibt es eine Umgebung U = U(x

₀

), so daß U ∩ M = {x

₀

} ist. In diesem Falle w¨ urde man x

₀

einen isolierten Punkt von M nennen.

Eine endliche Menge besitzt keine H¨ aufungspunkte. Auch Z hat keinen H¨ aufungs- punkt in R . Aber jede reelle Zahl ist ein H¨ aufungspunkt der Teilmenge Q ⊂ R .

Satz

Eine Menge M ⊂ R

ⁿ

ist genau dann abgeschlossen, wenn sie alle ihre H¨ aufungs- punkte enth¨ alt.

Beweis: 1) Sei M abgeschlossen und x

₀

ein H¨ aufungspunkt von M. W¨ urde x

₀

nicht zu M geh¨ oren, so w¨ are x

₀

ein Element der offenen Menge R

ⁿ

\ M . Dann g¨ abe es ein ε > 0, so daß auch noch U := U

ε

(x

0

) in R

ⁿ

\ M enthalten ist. Das w¨ are ein Widerspruch.

2) Es sei M eine Menge, die alle ihre H¨ aufungspunkte enth¨ alt. Wir betrachten einen beliebigen Punkt x

₀

∈ R

ⁿ

\ M . Da x

₀

kein H¨ aufungspunkt von M ist, gibt es eine Umgebung V = V (x

₀

) ⊂ R

ⁿ

, die keinen Punkt von M enth¨ alt. Weil so etwas mit jedem Punkt x

₀

∈ R

ⁿ

\ M geht, ist R

ⁿ

\ M offen und M selbst abgeschlossen.

Definition:

Ist M ⊂ R

ⁿ

eine beliebige Teilmenge und H(M ) die Menge aller H¨ aufungspunkte von M , so nennt man M := M ∪ H(M) die abgeschlossene H¨ ulle oder den Abschluß von M.

Satz

Sei M eine beliebige Teilmenge eines metrischen Raumes X. Dann gilt:

1. M ist abgeschlossen.

2. M ist genau dann abgeschlossen, wenn M = M ist.

Beweis: 1) Da R

ⁿ

\ M offen ist, ist M abgeschlossen.

2) Es ist M ⊂ M . Ist M abgeschlossen, so ist H(M ) ⊂ M, also sogar M = M . Ist

umgekehrt diese Gleichheit gegeben, so ist M abgeschlossen, nach (1).

(5)

1 Topologische Strukturen 51

Es ist z.B. (a, b) = [a, b], und im R

ⁿ

ist U

_ε

(x

₀

) = {x ∈ X : d(x, x

₀

) ≤ ε}.

Definition:

Ist M ⊂ R

ⁿ

eine beliebige Menge, so nennt man

∂M := M \

◦

M den Rand von M .

Ein Punkt x

0

∈ R

ⁿ

geh¨ ort genau dann zum Rand von M , wenn x

0

ein H¨ aufungs- punkt, aber kein innerer Punkt von M ist. Dann enth¨ alt jede Umgebung von x

₀

sowohl Punkte von M als auch Punkte von R

ⁿ

\ M .

Definition:

Eine Folge (x

_ν

) von Punkten im R

ⁿ

konvergiert gegen einen Punkt x

₀

, falls folgende Bedingung erf¨ ullt ist:

∀ ε > 0 ∃ ν

₀

, so daß ∀ ν ≥ ν

₀

gilt: kx

_ν

− x

₀

k < ε.

Man schreibt dann: lim

ν→∞

x

_ν

= x

₀

.

Man kann auch sagen: (x

_ν

) konvergiert im R

ⁿ

gegen x

₀

, falls d(x

_ν

, x

₀

) in R gegen 0 konvergiert.

In R ergibt das den bereits bekannten Konvergenzbegriff. Der Grenzwert ist ein- deutig bestimmt.

Ist x

_ν

= (x

^(ν)₁

, . . . , x

^(ν)n

) eine Punktfolge und x

₀

= (x

⁽⁰⁾₁

, . . . , x

⁽⁰⁾n

) ein fester Punkt, so ist

kx

ν

− x

0

k = q

(x

^(ν)₁

− x

⁽⁰⁾₁

)

²

+ · · · + (x

^(ν)n

− x

⁽⁰⁾n

)

²

.

Die Folge (x

_ν

) konvergiert also genau dann, wenn alle Komponentenfolgen (x

^(ν)_i

) konvergieren.

Satz (Charakterisierung abgeschlossener Mengen)

Eine Menge M ist genau dann abgeschlossen, wenn gilt: Ist (x

_ν

) eine Folge in

M , die im R

ⁿ

konvergiert, so liegt der Grenzwert ebenfalls in M .

(6)

Beweis: 1) Sei M abgeschlossen, (x

_ν

) eine Folge in M und x

₀

= lim

ν→∞

x

_ν

. Ist die Menge der Folgeglieder endlich, so muß x

₀

eines dieser Folgeglieder sein und daher in M liegen. Ist sie unendlich, so ist x

0

ein H¨ aufungspunkt von M und es folgt ebenfalls, daß x

₀

in M liegt.

2) M erf¨ ulle das Kriterium und x

₀

sei ein H¨ aufungspunkt von M . Dann liegt in jeder (1/ν)-Umgebung von x

₀

ein Punkt x

_ν

∈ M . Offensichtlich konvergiert (x

_ν

) gegen x

₀

. Also liegt x

₀

schon in M . Damit ist M abgeschlossen.

Eine Menge M ⊂ R

ⁿ

heißt beschr¨ ankt, falls es ein R > 0 gibt, so daß M in der Kugel B

_R

(0) = {x ∈ R

ⁿ

: d(x, 0) < R} enthalten ist. Eine Folge im R

ⁿ

heißt beschr¨ ankt, wenn die Menge der Folgeglieder beschr¨ ankt ist. Es gilt folgende Verallgemeinerung des Satzes von Bolzano-Weierstraß:

Satz (Bolzano-Weierstraß)

Sei x

ν

= (x

^(ν)₁

, . . . , x

^(ν)n

) eine beschr¨ ankte Folge im R

ⁿ

. Dann besitzt (x

ν

) eine konvergente Teilfolge.

Beweis: Es gibt ein R > 0, so daß alle x

_ν

in B

_R

(0) liegen. Aber dann liegen sie erst recht in I

ⁿ

= I × . . . × I , mit I := [−R, R].

(x

^(ν)₁

) besitzt eine konvergente Teilfolge (x

^(ν(i₁ ¹⁾⁾

) mit einem Grenzwert x

⁽⁰⁾₁

∈ I.

(x

^(ν(i₂ ¹⁾⁾

) besitzt eine konvergente Teilfolge (x

^(ν(i₂ ²⁾⁾

) mit einem Grenzwert x

⁽⁰⁾₂

∈ I, usw.

Schließlich erh¨ alt man eine konvergente Teilfolge (x

_ν(i_n₎

) von (x

_ν

).

Definition:

Eine Menge K ⊂ R

ⁿ

heißt kompakt, falls jede Punktfolge in K eine konvergente Teilfolge besitzt, deren Grenzwert ebenfalls in K liegt.

Satz von Heine-Borel

Eine Teilmenge K des R

ⁿ

ist genau dann kompakt, wenn sie abgeschlossen und

beschr¨ ankt ist.

(7)

1 Topologische Strukturen 53

Beweis: 1) Sei K kompakt. Ist K nicht beschr¨ ankt, so gibt es eine Punktfolge (x

_ν

) in K mit kx

_ν

k > ν. Dann ist auch jede Teilfolge von (x

_ν

) unbeschr¨ ankt. Das ist ein Widerspruch.

Sei nun x

₀

ein H¨ aufungspunkt von K. Dann gibt es f¨ ur jedes ν einen Punkt x

_ν

∈ K∩

B

_1/ν

(x

₀

). Die Folge (x

_ν

) konvergiert gegen x

₀

, und nach Voraussetzung konvergiert eine Teilfolge gegen ein Element von K. Das muß dann aber x

₀

sein. Also ist K abgeschlossen.

2) Sei jetzt K als abgeschlossen und beschr¨ ankt vorausgesetzt. Eine Punktfolge in K ist dann ebenfalls beschr¨ ankt, und nach Bolzano-Weierstraß gibt es eine Teilfolge, die gegen ein x

₀

∈ R

ⁿ

konvergiert. Aber weil K abgeschlossen ist, liegt x

₀

in K . Beispiele.

1. In R ist jedes abgeschlossene Intervall kompakt. Im R

ⁿ

ist jede abgeschlossene Kugel

B

_r

(x

₀

) = {x ∈ R

ⁿ

: kx − x

₀

k ≤ r}

kompakt.

2. Jede endliche Teilmenge des R

ⁿ

ist kompakt.

3. Sei (x

_ν

) eine konvergente Punktfolge im R

ⁿ

, mit Grenzwert x

₀

. Dann ist M := {x

₀

} ∪ {x

_ν

: ν ∈ N } kompakt. Man sieht das so: Jede Folge in M ist eine Teilfolge von (x

_ν

), oder die Folgeglieder nehmen nur endlich viele Werte an. In beiden F¨ allen gibt es eine Teilfolge, die in M konvergiert.

4. Ist X ⊂ R

ⁿ

kompakt und M ⊂ X eine abgeschlossene Teilmenge, so ist auch M kompakt. Der Beweis ist trivial.

Definition:

Sei M eine Teilmenge des R

^m

und f : M → R

ⁿ

eine Abbildung. f heißt stetig in x

₀

∈ M , falls gilt:

∀ ε > 0 ∃ δ > 0 s.d. ∀ x ∈ M mit kx − x

₀

k < δ gilt: kf (x) − f(x

₀

)k < ε.

f heißt stetig auf M , falls f in jedem Punkt von M stetig ist.

Anschaulich bedeutet dies: Zu jeder noch so kleinen Fehlerschranke ε kann man

eine davon abh¨ angige Schranke δ finden, so daß gilt: Ist eine Approximation x von

x

₀

gegeben und der Fehler < δ, so ist der Bildpunkt f (x) um weniger als ε von

f (x

₀

) entfernt.

(8)

Satz (Gleichwertige Beschreibungen der Stetigkeit)

Folgende Aussagen ¨ uber f : M → R

^m

und x

₀

∈ M sind ¨ aquivalent:

1. f ist stetig in x

₀

.

2. Zu jeder Umgebung V = V (f (x

₀

)) ⊂ R

ⁿ

gibt es eine Umgebung U = U (x

₀

) ⊂ R

^m

mit f(U ∩ M ) ⊂ V .

3. F¨ ur jede Folge (x

_ν

) in M mit lim

ν→∞

x

_ν

= x

₀

gilt auch lim

ν→∞

f (x

_ν

) = f (x

₀

).

Beweis: (1) = ⇒ (2):

Ist V eine Umgebung von f(x

₀

), so enth¨ alt V eine ε-Umgebung von f (x

₀

). Nach Definition der Stetigkeit gibt es ein δ > 0 mit f (U

_δ

(x

₀

) ∩ M ) ⊂ U

_ε

(f(x

₀

)). Wir setzen U := U

_δ

(x

₀

).

(2) = ⇒ (3):

Sei (x

_ν

) eine Folge in M , die gegen x

₀

konvergiert. Außerdem sei ein ε > 0 vorgege- ben. Es gibt eine Umgebung U = U (x

₀

) mit f (U ∩ M ) ⊂ U

_ε

(f (x

₀

)). F¨ ur ein geeig- netes ν

₀

liegen alle Folgeglieder x

_ν

mit ν ≥ ν

₀

in U . Dann ist kf (x

_ν

) − f(x

₀

)k < ε f¨ ur ν ≥ ν

₀

. Das bedeutet, daß (f(x

_ν

)) gegen f(x

₀

) konvergiert.

(3) = ⇒ (1):

Es sei das Folgenkriterium erf¨ ullt. Wir nehmen an, f sei nicht stetig in x

₀

. Dann gibt es ein ε > 0, so daß zu jedem ν ∈ N ein x

ν

mit kx

ν

− x

0

k < 1/ν und kf (x

_ν

) − f(x

₀

)k ≥ ε existiert. Aber das kann nicht sein.

Satz

Es seien M ⊂ R

^m

und N ⊂ R

ⁿ

Teilmengen, f : M → R

ⁿ

und g : N → R

^k

Abbildungen mit f (M ) ⊂ N . Ist f stetig in x

₀

∈ M und g stetig in y

₀

:=

f (x

₀

) ∈ N , so ist auch g ◦ f : M → R

^k

stetig in x

₀

.

Beweis: Sei z

0

:= g(y

0

) = (g ◦ f )(x

0

) und W = W (z

0

) ⊂ R

^k

eine Umgebung.

Dann gibt es eine Umgebung V = V (y

₀

) ⊂ R

ⁿ

mit g(V ∩ N ) ⊂ W , sowie eine

Umgebung U = U (x

₀

) ⊂ R

ⁿ

mit f (U ∩ M) ⊂ V . Es folgt, daß (g ◦ f)(U ∩ M ) ⊂ W

ist, also g ◦ f stetig in x

0

.

(9)

1 Topologische Strukturen 55

Beispiele.

1. Jede konstante Abbildung k : R

^m

→ R

ⁿ

ist stetig, denn die Bildmenge besteht nur aus einem einzigen Punkt.

2. Ist M ⊂ R

ⁿ

eine beliebige Teilmenge, so ist die identische Abbildung id

_M

: M → R

ⁿ

stetig, denn f¨ ur jede offene Teilmenge U ⊂ R

ⁿ

ist id

_M

(U ∩ M ) ⊂ U.

3. Sei f : R

^m

→ R

ⁿ

linear. Dann ist f bereits durch die Werte f(e

_i

), i = 1, . . . , m, festgelegt. Wir setzen

C :=

m

X

i=1

kf (e

_i

)k.

Dann erhalten wir f¨ ur x = x

₁

e

₁

+ · · · + x

_m

e

_m

die Absch¨ atzung kf (x)k = k

m

X

i=1

x

_i

· f(e

_i

)k

≤

m

X

i=1

|x

i

| · kf(e

i

)k

≤ C · max

i

|x

i

|

≤ C · kxk, denn es ist max

i

|x

i

| = p

(max

i

|x

i

|)

²

≤ p

(x

1

)

²

+ · · · + (x

m

)

²

.

Aus der gewonnenen Ungleichung leitet man sofort ab, daß f im Nullpunkt stetig ist: Ist ε > 0 gegeben, so w¨ ahlen wir δ := ε/C. F¨ ur kxk < δ ist kf(x)k ≤ C · kxk < ε.

Ist x

₀

∈ R

^m

ein beliebiger Punkt, so ist

kf (x) − f (x

0

)k = kf(x − x

0

)k ≤ C · kx − x

0

k.

Jetzt folgt wie oben, daß f auch in x

0

(und damit ¨ uberall) stetig ist.

4. Es sei M ⊂ R

^m

eine beliebige Teilmenge. Sind f, g : M → R

ⁿ

stetige Abbil- dungen, so sind auch die Abbildungen f + g : M → R

ⁿ

und f • g : M → R (mit (f • g)(x) := f (x) • g(x)) stetig. Auf den Beweis verzichten wir hier.

5. Eine Abbildung f = (f

₁

, . . . , f

_n

) : M → R

ⁿ

ist genau dann stetig, wenn alle

Komponenten-Funktionen f

_i

: M → R stetig sind. Eine komplexe Funktion

f ist deshalb genau dann stetig, wenn Realteil und Imagin¨ arteil stetig sind,

und dann folgt, daß auch f stetig ist.

(10)

Satz

Sei B ⊂ R

ⁿ

eine offene Teilmenge und f : B → R eine stetige Funktion. Dann ist auch die Menge M := {x ∈ B : f(x) > 0} offen.

Beweis: Sei x

₀

∈ M , also r

₀

:= f (x

₀

) > 0. Ist 0 < ε < r

₀

, so gibt es ein δ > 0, so daß U

_δ

(x

₀

) ⊂ B und |f (x) − f (x

₀

)| < ε f¨ ur x ∈ U

_δ

(x

₀

) ist. F¨ ur jedes x ∈ U

_δ

(x

₀

) ist dann 0 < r

₀

− ε = f(x

₀

) − ε < f (x), also x ∈ M . Also ist M offen.

Folgerung

Sei B ⊂ R

ⁿ

offen. Sind f, g : B → R stetig, so gilt:

1. {x ∈ B : f (x) < g(x)} ist offen.

2. {x ∈ B : f (x) 6= g (x)} ist offen.

Beweis: 1) {f < g} = {g − f > 0} ist offen, wegen des Satzes.

2) Da auch {f > g} = {g < f } offen ist, muß {f 6= g} = {f < g} ∪ {f > g} offen sein.

Satz (¨ uber das stetige Bild einer kompakten Menge)

Sei K ⊂ R

^m

kompakt und f : K → R

ⁿ

eine stetige Abbildung. Dann ist auch f (K) kompakt.

Beweis: Sei (y

_ν

) eine Folge von Punkten in f (K). Dann gibt es zu jedem ν einen Punkt x

ν

∈ K mit f(x

ν

) = y

ν

. Weil K kompakt ist, besitzt die Folge (x

ν

) eine in K konvergente Teilfolge (x

_ν_i

), ihr Grenzwert in K sei mit x

₀

bezeichnet. Wegen der Stetigkeit von f konvergiert (y

_ν_i

) gegen y

₀

:= f(x

₀

), und dieser Punkt liegt in f (K ).

Satz (vom globalen Minimum und Maximum)

Auf einer kompakten Teilmenge K ⊂ R

ⁿ

nimmt jede stetige Funktion ihr Maxi-

mum und ihr Minimum an.

(11)

1 Topologische Strukturen 57

Beweis: f (K ) ⊂ R ist kompakt, also abgeschlossen und beschr¨ ankt. Demnach existieren y

−

:= inf f (K) und y

₊

:= sup f(K), und sie sind in f (K) enthalten. Also gibt es Punkte x

−

und x

₊

in K mit f (x

−

) = y

−

und f (x

₊

) = y

₊

.

Speziell nimmt also eine stetige Funktion f : [a, b] → R immer Maximum und Minimum an und ist demnach beschr¨ ankt.

Zur Erinnerung: Ein stetiger (parametrisierter) Weg im R

ⁿ

ist eine stetige Abbil- dung α : I → R

ⁿ

, wobei I ein endliches oder unendliches Intervall ist.

Beispiele.

1. Sind x

0

, y

0

zwei Punkte im R

ⁿ

, so wird die Verbindungsstrecke von x

0

und y

₀

durch

α(t) := x

₀

+ t(y

₀

− x

₀

) = (1 − t)x

₀

+ ty

₀

parametrisiert, 0 ≤ t ≤ 1. Wir verstehen unter der Verbindungsstrecke aber auch die Bildmenge

S(x

₀

, y

₀

) := α([0, 1]) = {x = (1 − t)x

₀

+ ty

₀

: 0 ≤ t ≤ 1}.

2. Im R

²

ist der Kreis um a = (a

1

, a

2

) mit Radius r > 0 gegeben durch α(t) = (a

₁

+ r cos(t), a

₂

+ r sin(t)), 0 ≤ t ≤ 2π.

Definition:

Eine offene Menge G ⊂ R

ⁿ

heißt zusammenh¨ angend oder ein Gebiet, falls gilt:

Zu je zwei beliebigen Punkten x, y ∈ G gibt es einen stetigen Weg α : [0, 1] → G mit α(0) = x und α(1) = y.

Ein Gebiet kann nicht in zwei offene Mengen zerlegt werden.

Satz (von der Unzerlegbarkeit von Gebieten)

Sei G ⊂ R

ⁿ

ein Gebiet und B ⊂ G eine offene nicht-leere Teilmenge. Ist auch G \ B offen, so muß B = G sein.

Beweis: Sei x

0

∈ B und y

0

ein beliebiger Punkt von G. Weil G ein Gebiet ist, gibt es einen stetigen Weg α : [0, 1] → G mit α(0) = x

₀

und α(1) = y

₀

. F¨ ur kleines t liegt α(t) noch in der offenen Menge B.

Sei t

₀

:= sup{t ∈ [0, 1] : α(s) ∈ B f¨ ur 0 ≤ s ≤ t}. Wir wollen zeigen, daß t

₀

= 1

und damit y

₀

∈ B ist. Also nehmen wir an, es sei t

₀

< 1. Wegen der Offenheit von

(12)

B kann α(t

₀

) nicht in B liegen. Wegen der Offenheit von G \ B kann es aber auch nicht in G \ B liegen. Das ist ein Widerspruch, die Annahme ist falsch.

Definition:

Eine Teilmenge M ⊂ R

ⁿ

heißt konvex, falls mit je zwei Punkten von M auch deren Verbindungsstrecke in M enthalten ist.

Beispiele.

1. Jedes Intervall ist eine konvexe Teilmenge von R . 2. Offene und abgeschlossene Kugeln im R

ⁿ

sind konvex.

3. Jede offene konvexe Menge ist ein Gebiet. Umgekehrt braucht ein Gebiet nicht unbedingt konvex zu sein. So ist z.B. das Gebiet

G = {(x, y) ∈ R

²

: −1 < x < 1 und 1 − x

²

< y < 2}

nicht konvex.

(13)

2 Partielle Differenzierbarkeit 59

§ 2 Partielle Differenzierbarkeit

Inhalt:

Richtungsableitungen, partielle Ableitungen, h¨ ohere partielle Ableitungen, der Satz von Schwarz, Vektorfelder, der Nabla-Operator, spezielle Kettenregel, Eigenschaf- ten des Gradienten.

Sei nun G ⊂ R

ⁿ

ein Gebiet und f : G → R eine Funktion. Wie kann man sich eine solche Funktion veranschaulichen? Ist n = 2, so ist der Graph

G

_f

:= {(x

₁

, x

₂

, z) ∈ G × R | z = f (x

₁

, x

₂

)}

eine Fl¨ ache im R

³

. Jede

” vertikale Gerade“ {(a, b, z) | z ∈ R } durch einen festen Punkt (a, b) ∈ G trifft den Graphen in genau einem Punkt.

Eine andere M¨ oglichkeit der Darstellung ist die Benutzung von

” H¨ ohenlinien“. In G liegen die Niveaumengen

N

_c

(f ) := {x ∈ G | f (x) = c},

im Falle n = 2 sind das Linien. Man kennt diese Darstellung von den Landkarten her.

Ist allerdings n > 2, so ist eine anschauliche Darstellung von f durch den Graphen oder durch Niveaumengen kaum noch praktikabel.

Definition:

Sei G ⊂ R

ⁿ

ein Gebiet, a ∈ G und f : G → R eine Funktion. F¨ ur v ∈ R

ⁿ

bezeichnet man

D

_v

f (a) := lim

t→0

f(a + tv) − f(a) t

als Richtungsableitung von f in a in Richtung v (sofern der Grenzwert existiert).

Was bedeutet das anschaulich?

Durch α(t) := a + tv wird eine Gerade L ⊂ R

ⁿ

durch den Punkt a mit Richtungs- vektor v parametrisiert. Die Funktion

f

_L

(t) := f ◦ α(t) = f(a + tv)

(14)

ist eine gew¨ ohnliche Funktion einer Ver¨ anderlichen, und die Richtungsableitung von f in a mit Richtung v ist nichts anderes als die gew¨ ohnliche Ableitung (f

_L

)

⁰

(0).

Den Graphen von f

L

erh¨ alt man, indem man den Graphen von f mit der ¨ uber der Geraden L gelegenen

” senkrechten“ Ebene {(x, z) ∈ R

ⁿ

× R | x ∈ L} schneidet.

. . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . ... . . .. . . .. . . .. . . .. . . .. . . .. . ..

.. .. .. .. .. .. .. .. .. .. .

a L

s

v

.. .. .. .. .. .. .. .. .. .. .. .. ..s

f(a)

G

_f

B

Beispiel.

Sei f : R

²

→ R definiert durch f (x, y) := 1 − x

²

− y

²

, vektoriell geschrieben also

f (x) = 1 − x • x.

Ist a = (a

₁

, b

₁

) und v = (v

₁

, v

₂

), so ist

f

_L

(t) = f (a + tv) = 1 − (a + tv) • (a + tv)

= 1 − a • a − 2tv • a − t

²

v • v, also

D

_v

f(a) = (f

_L

)

⁰

(0)

= −2v • a.

Ist a 6= 0, so verschwindet die Richtungsableitung D

_v

f (a) = 0 genau dann,

wenn der Richtungsvektor v auf dem Ortsvektor a senkrecht steht. In a = 0

verschwindet jede Richtungsableitung.

(15)

2 Partielle Differenzierbarkeit 61

Eigenschaften der Richtungsableitung

f und g seien in a in Richtung v differenzierbar, c sei eine Konstante. Dann sind auch c · f , f + g und f · g in a in Richtung v differenzierbar, und es gilt:

1. D

_v

(c · f )(a) = c · D

_v

f (a).

2. D

_v

(f + g)(a) = D

_v

f(a) + D

_v

g(a).

3. D

v

(f · g)(a) = f (a) · D

v

g(a) + D

v

f (a) · g(a).

Die Beweise funktionieren wie bei den Funktionen von einer Ver¨ anderlichen.

Eine besondere Rolle spielen die Richtungsableitungen in Richtung der Einheits- vektoren e

₁

, . . . , e

_n

:

Definition:

Die Funktion f sei in a in Richtung des i–ten Einheits–Vektors e

_i

differenzierbar.

Dann heißt

∂f

∂x

_i

(a) := D

_e_i

f (a)

die i–te partielle Ableitung von f in a. Man schreibt auch f

_x_i

(a) daf¨ ur.

Wenn alle partiellen Ableitungen von f in a existieren, dann heißt f in a partiell differenzierbar.

Wie f¨ uhrt man die partielle Differentiation praktisch durch?

Sei a = (a

1

, . . . , a

n

). Dann gilt:

∂f

∂x

_i

(a) = D

_e_i

f (a) = lim

t→0

f (a + te

i

) − f (a) t

= lim

t→0

1 t (f (a

₁

, . . . , a

_i

+ t, . . . , a

_n

) − f (a

₁

, . . . , a

_i

, . . . , a

_n

))

= lim

s→ai

f (a

₁

, . . . , a

_i−1

, s, a

_i+1

, . . . , a

_n

) − f (a

₁

, . . . , a

_i−1

, a

_i

, a

_i+1

, . . . , a

_n

) s − a

_i

= d

ds

s=ai

f (a

₁

, . . . , a

i−1

, s, a

_i+1

, . . . , a

_n

).

Um also die i–te partielle Ableitung von f in a auszurechnen, muß man in

f (x

₁

, . . . , x

_n

) die Variablen x

_j

, j 6= i, durch die Konstanten a

_j

(also die Kom-

ponenten von a) ersetzen. Danach h¨ angt die Funktion nur noch von der einen ver-

bliebenen Variablen x

_i

ab und kann im gew¨ ohnlichen Sinne nach dieser Variablen

an der Stelle a

_i

differenziert werden.

(16)

Beispiel.

Sei f (x, y, z) := x

²

· cos(yz).

Um partiell nach x zu differenzieren, muß man die Variablen y und z festhal- ten und nur die Funktion x 7→ x

²

· cos(yz ) betrachten. Also ist

∂f

∂x (x, y, z) = 2x · cos(yz ).

Um partiell nach y zu differenzieren, muß man die Variablen x und z festhal- ten und nur die Funktion y 7→ x

²

· cos(yz) betrachten. So erh¨ alt man

∂f

∂y (x, y, z) = x

²

· (− sin(yz) · z) = −x

²

z sin(yz) und analog

∂f

∂z (x, y, z) = −x

²

y sin(yz).

Es sieht so aus, als h¨ atte man die Verallgemeinerung der Differenzierbarkeit auf mehrere Ver¨ anderliche gefunden. Aber leider ist die partielle Differenzierbarkeit eine zu schwache Eigenschaft. Sie hat noch nicht einmal die Stetigkeit der Funktion selbst zur Folge:

Beispiel.

Wir betrachten die Funktion f(x, y) :=





 xy

²

x

²

+ y

⁴

f¨ ur (x, y) 6= (0, 0) 0 f¨ ur (x, y) = (0, 0).

Die Funktionen x 7→ f(x, 0) ≡ 0 und y 7→ f (0, y) ≡ 0 sind sicherlich im Nullpunkt differenzierbar. Also ist f in 0 = (0, 0) partiell differenzierbar.

Andererseits ist f dort nicht stetig:

Wenn man y

_ν

:= ((a

_ν

)

²

, a

_ν

) setzt, mit einer Nullfolge (a

_ν

), so konvergiert diese Folge gegen (0, 0), aber es ist

ν→∞

lim f (y

_ν

) = lim

ν→∞

(a

ν

)

⁴

2(a

_ν

)

⁴

= 1

2 .

Das d¨ urfte nicht passieren, wenn f im Nullpunkt stetig w¨ are.

Eine weitere Schw¨ ache der partiellen Differenzierbarkeit tritt auf, wenn man h¨ ohere

Ableitungen betrachtet:

(17)

2 Partielle Differenzierbarkeit 63

Ist B ⊂ R

ⁿ

offen und f : B → R in allen Punkten von B partiell differenzierbar, so bilden die partiellen Ableitungen ∂f

∂x

_i

(x) wieder reellwertige Funktionen auf B.

Sind sie alle stetig, so nennt man f stetig partiell differenzierbar.

Definition:

Sei B ⊂ R

ⁿ

offen, a ∈ B und f : B → R uberall partiell differenzierbar. Alle ¨ partiellen Ableitungen ∂f

∂x

i

seien in a noch einmal partiell differenzierbar. Dann definiert man f¨ ur i, j = 1, . . . , n :

∂

²

f

∂x

_i

∂x

_j

(a) := ∂

∂x

_i

∂f

∂x

_j

(a).

Man nennt diesen Ausdruck auch die 2–te partielle Ableitung von f nach x

i

und x

_j

an der Stelle a, und schreibt daf¨ ur auch f

_x_i_x_j

(a).

Man beachte die Reihenfolge! Zuerst wird nach der Variablen differenziert, die am weitesten rechts steht!

Beispiel.

Sei f (x

₁

, x

₂

) := e

^k·x¹

· cos(x

₂

). Dann gilt:

∂f

∂x

₁

(x) = k · e

^k·x¹

· cos(x

₂

) und ∂f

∂x

₂

(x) = −e

^k·x¹

· sin(x

₂

), sowie

∂

²

f

∂x

₁

∂x

₂

(a) = ∂

²

f

∂x

₂

∂x

₁

(a) = −ke

^ka¹

sin(a

₂

).

Man kann sich nun fragen, ob man die 2-ten Ableitungen immer miteinander vertau- schen kann, ob es also bei h¨ oheren partiellen Ableitungen nicht auf die Reihenfolge ankommt. Leider ist das nicht generell der Fall:

Beispiel.

Sei f(x, y) :=







xy x

²

− y

²

x

²

+ y

²

f¨ ur (x, y) 6= (0, 0), 0 f¨ ur (x, y) = (0, 0).

Dann gilt f¨ ur (x, y) 6= (0, 0) :

(18)

∂f

∂x (x, y ) = ∂

∂x

x

³

y − y

³

x x

²

+ y

²

= (3x

²

y − y

³

)(x

²

+ y

²

) − (x

³

y − y

³

x)2x (x

²

+ y

²

)

²

= x

⁴

y + 4x

²

y

³

− y

⁵

(x

²

+ y

²

)

²

, also

∂f

∂x (0, y) = −y (f¨ ur y 6= 0).

Weiter ist

∂f

∂x (0, 0) = lim

x→0

f(x, 0) − f(0, 0)

x = 0.

Also ist sogar ∂f

∂x (0, y) ≡ −y f¨ ur alle y und ∂

²

f

∂y∂x (0, 0) = −1.

Entsprechend erhalten wir f¨ ur (x, y) 6= (0, 0) :

∂f

∂y (x, y ) = ∂

∂y

x

³

y − y

³

x x

²

+ y

²

= (x

³

− 3y

²

x)(x

²

+ y

²

) − (x

³

y − y

³

x)2y (x

²

+ y

²

)

²

= x

⁵

− 4x

³

y

²

− xy

⁴

(x

²

+ y

²

)

²

, also

∂f

∂y (x, 0) ≡ x f¨ ur x 6= 0, und

∂f

∂y (0, 0) = lim

y→0

f (0, y) − f (0, 0)

y = 0.

Somit ist ∂

²

f

∂x∂y (0, 0) = +1.

Zum Gl¨ uck gilt folgendes hinreichende Kriterium f¨ ur die Gleichheit der gemischten

zweiten Ableitungen:

(19)

2 Partielle Differenzierbarkeit 65

Satz von Schwarz

Sei B ⊂ R

ⁿ

offen und f : B → R auf ganz B nach allen Variablen partiell differenzierbar, a ∈ B.

Wenn die gemischten zweiten Ableitungen ∂

²

f

∂x

_i

∂x

_j

(x) und ∂

²

f

∂x

_j

∂x

_i

(x) auf einer Umgebung von a in B existieren und in a stetig sind, so ist

∂

²

f

∂x

_i

∂x

_j

(a) = ∂

²

f

∂x

_j

∂x

_i

(a).

Auf den etwas technischen Beweis verzichten wir hier.

Definition:

Sei G ⊂ R

ⁿ

ein Gebiet. Ein Vektorfeld auf G ist eine Abbildung F : G → R

ⁿ

, die jedem x ∈ G einen Vektor F (x) ∈ R

ⁿ

zuordnet.

Graphisch stellt man das Vektorfeld dar, indem man in jedem Punkt x den zuge- ordneten Vektorpfeil F (x) zeichnet. Dadurch wird deutlich gemacht, daß es auf die

r r

r r##

r

gesamte Abbildung F ankommt, nicht nur auf die einzelnen Werte.

Manchmal versteht man deshalb unter einem Vektorfeld auf G auch die Menge aller Paare (x, F (x)) mit x ∈ G.

Die Bildung der partiellen Ableitungen ∂f

∂x

i

einer Funktion f kann man auch als Anwendung des

” linearen Operators“ D

_i

:= ∂

∂x

i

auf die Funktion f auffassen.

Man faßt nun gerne die n Operatoren D

₁

, . . . , D

_n

zu einem vektoriellen Operator zusammen:

∇ :=

∂

∂x

₁

, . . . , ∂

∂x

_n

. (

” Nabla“) Dieser Operator kann auf verschiedene Weise wirken.

Sei G ⊂ R

ⁿ

offen.

1. Ist f : G → R eine stetig partiell differenzierbare Funktion, so heißt das

Vektorfeld

(20)

grad(f ) := ∇f = ( ∂f

∂x

₁

, . . . , ∂f

∂x

_n

)

das Gradientenfeld von f . Der Wert grad(f )(a) wird als Gradient von f in a bezeichnet.

2. Sei v = (v

₁

, . . . , v

_n

) : G → R

ⁿ

ein Vektorfeld, dessen s¨ amtliche Komponenten v

i

stetig partiell differenzierbar sind. Dann heißt die Funktion

div(v) := ∇ • v = ∂v

₁

∂x

₁

+ · · · + ∂v

_n

∂x

_n

die Divergenz von v.

3. Sei jetzt speziell n = 3 und v : G → R

³

ein stetig partiell differenzierbares Vektorfeld. Dann heißt das Vektorfeld

rot(v) := ∇ × v = ( ∂v

₃

∂x

₂

− ∂v

₂

∂x

₃

, ∂v

₁

∂x

₃

− ∂v

₃

∂x

₁

, ∂v

₂

∂x

₁

− ∂v

₁

∂x

₂

) die Rotation von v.

Man beachte, daß bei ∇ • v und ∇ × v nicht einfach nur Multiplikationen zwischen den Komponenten von ∇ und denen von v durchgef¨ uhrt werden, sondern daß die partiellen Ableitungen in ∇ als Operatoren auf den Komponenten von v wirken!

Die vereinfachte Schreibweise mit dem ∇ kann daher leicht zu Fehlern f¨ uhren.

Divergenz und Rotation werden sp¨ ater ausf¨ uhrlicher in einem Kapitel ¨ uber Vektor- analysis behandelt werden, mit dem Gradienten und seiner Bedeutung besch¨ aftigen wir uns noch einmal weiter unten in diesem Paragraphen.

Lemma (schwacher Mittelwertsatz)

Sei x

₀

= (x

⁽⁰⁾₁

, . . . , x

⁽⁰⁾n

) ∈ R

ⁿ

, f : U

_ε

(x

₀

) → R partiell differenzierbar und x ∈ U

_ε

(x

₀

) beliebig. Die Punkte z

₀

, . . . , z

_n

seien definiert durch z

₀

:= x

₀

und z

_i

:= z

i−1

+ (x

_i

− x

⁽⁰⁾_i

) · e

_i

f¨ ur i = 1, . . . , n.

Dann liegen alle z

i

und die Verbindungsstrecken von z

i−1

nach z

i

in U

ε

(x

0

), und auf jeder dieser Verbindungsstrecken gibt es einen Punkt c

_i

, so daß gilt:

f(x) = f (x

0

) +

n

X

i=1

∂f

∂x

_i

(c

i

) · (x

i

− x

⁽⁰⁾_i

) .

(21)

2 Partielle Differenzierbarkeit 67

x y z

r

z

₀

= x

₀

r

z

₁

r

z

2

r

z

₃

= x

.. .. .. .. .. .. ...

.. .. .. .. .. .. ..

.. .. .. .. .. ... ..............

.. .. .. .. .. .. .. .. ...

.. .. .. .. .. .

.. .. .. .. .. .. .. ..

e.

c

1

e

c

₂

e

c

₃

Beweis: Es ist z

_i

= (x

₁

, . . . , x

_i

, x

⁽⁰⁾_i+1

, . . . , x

⁽⁰⁾n

), also kz

_i

− x

₀

k ≤ kx − x

₀

k < ε.

Wegen der Konvexit¨ at der Kugel liegen auch die Verbindungsstrecken in U

_ε

(x

₀

).

Sei g

_i

: [0, 1] → R definiert durch g

_i

(t) := x

⁽⁰⁾_i

+ t(x

_i

− x

⁽⁰⁾_i

). Dann ist z

i−1

+ t(z

_i

− z

i−1

) = (x

₁

, . . . , x

i−1

, g

_i

(t), x

⁽⁰⁾_i+1

, . . . , x

⁽⁰⁾_n

) .

Die Funktion f

_i

(s) := f (x

₁

, . . . , x

i−1

, s, x

⁽⁰⁾_i+1

, . . . , x

⁽⁰⁾n

) ist f¨ ur jedes t ∈ [0, 1] in g

_i

(t) differenzierbar, und es gilt:

f

_i

◦ g

_i

(t) = f(z

_i−1

+ t(z

_i

− z

_i−1

)).

Weiter ist f

_i⁰

(s) = f

_x_i

(x

₁

, . . . , x

i−1

, s, x

⁽⁰⁾_i+1

, . . . , x

⁽⁰⁾n

) und daher (f

_i

◦ g

_i

)

⁰

(t) = f

_i⁰

(g

_i

(t)) · g

⁰_i

(t) = ∂f

∂x

_i

(z

i−1

+ t(z

_i

− z

i−1

)) · (x

_i

− x

⁽⁰⁾_i

).

Nach dem Mittelwertsatz gibt es ein ξ

_i

∈ (0, 1) mit

(f

_i

◦ g

_i

)

⁰

(ξ

_i

) = f

_i

(g

_i

(1)) − f

_i

(g

_i

(0)) = f (z

_i

) − f(z

i−1

) . Setzen wir c

_i

:= z

i−1

+ ξ

_i

(z

_i

− z

i−1

), so ist

n

X

i=1

∂f

∂x

_i

(c

_i

) · (x

_i

− x

⁽⁰⁾_i

) =

n

X

i=1

(f (z

_i

) − f (z

i−1

))

= f (x) − f (x

₀

) .

Folgerung (Spezielle Kettenregel)

Ist B ⊂ R

ⁿ

offen, I ein Intervall, α : I → B in t

₀

∈ I ein differenzierbarer Weg und f : B → R partiell differenzierbar und in a := α(t

0

) sogar stetig partiell differenzierbar, so ist auch f ◦ α : I → R in t

₀

differenzierbar, und es gilt:

(f ◦ α)

⁰

(t

0

) = ∇f(a) • α

⁰

(t

0

) =

n

X

i=1

∂f

∂x

_i

(α(t

0

)) · α

⁰_i

(t

0

).

(22)

Beweis: Wir w¨ ahlen ein ε > 0, so daß U

_ε

(a) ⊂ B ist, und ein δ > 0, so daß α(t) ∈ U

_ε

ist, f¨ ur |t − t

₀

| < δ. Nach dem gerade bewiesenen Satz kann man zu jedem t Punkte c

_i

= c

_i

(t), i = 1, . . . , n, mit kc

_i

− ak ≤ kα(t) − ak finden, so daß gilt:

f (α(t)) − f (α(t

₀

)) =

n

X

i=1

∂f

∂x

_i

(c

_i

)(α

_i

(t) − α

_i

(t

₀

)).

Teilt man beide Seiten durch t − t

₀

und l¨ aßt man t gegen t

₀

gehen, so streben alle Punkte c

i

(t) gegen a, und man erh¨ alt die Behauptung.

Folgerung

Ist B ⊂ R

ⁿ

offen, f : B → R partiell differenzierbar und in a ∈ B sogar stetig partiell differenzierbar, so existieren in a alle Richtungsableitungen von f , und es ist D

_v

f(a) = ∇f(a) • v.

Beweis: F¨ ur einen beliebigen Richtungsvektor v 6= 0 sei α(t) := a + tv. Dann ist f ◦ α in t = 0 differenzierbar, und weil α

⁰

(t) ≡ v ist, folgt:

(f ◦ α)

⁰

(0) = ∇f (a) • v.

Andererseits ist

(f ◦ α)

⁰

(0) = lim

t→0

f ◦ α(t) − f ◦ α(0)

t − 0 = lim

t→0

f (a + tv) − f(a)

t ,

und das ist die Richtungsableitung D

_v

f (a).

Wir k¨ onnen jetzt das Wesen des Gradienten etwas besser ergr¨ unden:

Sei B ⊂ R

ⁿ

offen und f : B → R eine stetig partiell differenzierbare Funktion. F¨ ur c ∈ R sei

F

_c

:= {x ∈ B | f(x) = c}

die entsprechende Niveaumenge von f .

Satz

Sei a ∈ B, f(a) = c und ∇f(a) 6= 0.

1. ∇f (a) zeigt in die Richtung, in der f am schnellsten w¨ achst.

2. Ist α : (−ε, ε) → R

ⁿ

ein differenzierbarer Weg mit α(0) = a, der ganz in

F

c

verl¨ auft, so steht ∇f (a) auf α

⁰

(0) senkrecht.

(23)

2 Partielle Differenzierbarkeit 69

Beweis: 1) Wir betrachten beliebige Vektoren v mit kvk = 1. Zu zeigen ist, daß D

_v

f(a) genau dann sein Maximum annimmt, wenn v in die Richtung des Gradienten zeigt. Tats¨ achlich ist

D

_v

f(a) = ∇f (a) • v

= k∇f (a)k · kvk · cos θ, wobei θ ∈ [0, π] der Winkel zwischen v und ∇f (a) ist.

Dieser Ausdruck wird genau dann maximal, wenn θ = 0 ist, also v = ∇f (a) k∇f (a)k . 2) Verl¨ auft α ganz in F

_c

, so ist f ◦ α(t) ≡ c, also

0 = (f ◦ α)

⁰

(0) = ∇f(a) • α

⁰

(0).

Man sagt dann auch, der Gradient steht auf der Niveaumenge senkrecht.

(24)

§ 3 Totale Differenzierbarkeit

Inhalt:

Linearformen und Tangentialebenen, totale Differenzierbarkeit, Differential, Be- rechnung der totalen Ableitung, Differenzierbarkeitskriterium, Beispiele differen- zierbarer Funktionen, Mittelwertsatz.

Wir wollen jetzt den Differenzierbarkeitsbegriff noch einmal ¨ uberdenken. Bei der partiellen Differenzierbarkeit haben wir folgende M¨ angel festgestellt:

• Eine partiell differenzierbare Funktion braucht nicht stetig zu sein.

• Ist eine Funktion 2× partiell differenzierbar, so h¨ angen die Werte der zweiten Ableitungen von der Reihenfolge der Differentiation ab.

Erinnern wir uns noch einmal an die Situation in einer Ver¨ anderlichen:

Sei I ⊂ R ein offenes Intervall, t

0

∈ I und f : I → R eine Funktion. Ist f in t

0

differenzierbar, so existiert der Grenzwert f

⁰

(t

0

) := lim

t→t0

f(t) − f (t

₀

) t − t

₀

. Setzen wir

δ(t) := f(t) − f (t

₀

)

t − t

₀

− f

⁰

(t

₀

), so gilt:

1. f(t) = f (t

₀

) + f

⁰

(t

₀

) · (t − t

₀

) + δ(t) · (t − t

₀

) f¨ ur t ∈ I.

Hier ist L(t) := f (t

0

) + f

⁰

(t

0

) · (t − t

0

) eine affin-lineare Funktion mit L(t

0

) = f(t

₀

), und der Ausdruck δ(t) · (t − t

₀

) ist der

” Fehler“, den man macht, wenn man f durch L approximiert.

2. lim

t→t0

δ(t) = 0.

Das zeigt, daß der Fehler mit t → t

₀

quadratisch gegen Null geht. Dadurch wird zum Ausdruck gebracht, daß sich die Graphen von f und L ¨ uber t

₀

nicht nur treffen, sondern sich sogar

” tangential“ ber¨ uhren.

3. Die Tangente an den Graphen von f im Punkte (t

0

, f(t

0

)) ist der Graph der affin-linearen Funktion

L(t) = f (t

0

) + f

⁰

(t

0

) · (t − t

0

).

(25)

3 Totale Differenzierbarkeit 71

Allgemein ist eine Gerade im R

²

durch einen Punkt (a, b) gegeben durch eine Glei- chung der Form

A(x − a) + B(y − b) = 0, mit A, B ∈ R und (A, B) 6= (0, 0).

Soll diese Gerade der Graph einer affin-linearen Funktion sein, so darf sie nicht

” senkrecht“ (d.h. nicht parallel zur y-Achse) verlaufen. Es muß also B 6= 0 sein, und man kann die Gleichung nach y aufl¨ osen:

y = b + α(x − a), mit α := −A/B.

Soll die Gerade in (a, b) den Graphen von f treffen, so muß b = f(a) sein. Soll sie dort außerdem die gleiche Steigung wie f besitzen, so muß α = f

⁰

(a) sein, so daß die Geradengleichung die Form

y = f (a) + f

⁰

(a)(x − a) annimmt.

Im Falle mehrerer Ver¨ anderlicher versuchen wir jetzt genauso vorzugehen. Der Ein- fachheit halber betrachten wir zun¨ achst n = 2.

Sei G ⊂ R

²

ein Gebiet und z = f(x, y) eine stetig partiell differenzierbare Funktion.

Wir suchen die Tangentialebene an den Graphen im Punkt (a, b, c) mit c = f(a, b).

Eine solche Ebene im R

³

wird durch eine Gleichung der Form A(x − a) + B(y − b) + C(z − c) = 0 beschrieben, mit (A, B, C) 6= (0, 0, 0).

Damit die Ebene nicht senkrecht auf der x-y-Ebene steht, muß C 6= 0 sein. Also kann man die Gleichung folgendermaßen aufl¨ osen:

z = c + p(x − a) + q(y − b), mit p = −A/C und q = −B/C.

Die (senkrechte) Ebene y = b trifft den Graphen von f in einem 1-dimensionalen Graphen z = f (x, b). Die Tangente an diesen Graphen im Punkt (x, b, z) = (a, b, c) ist durch die Gleichung z = c + ∂f