• Keine Ergebnisse gefunden

Allgemeiner ist eine Umgebung U von x eine Menge, die eine ε-Umgebung B ε (x ) enth¨ alt.

N/A
N/A
Protected

Academic year: 2021

Aktie "Allgemeiner ist eine Umgebung U von x eine Menge, die eine ε-Umgebung B ε (x ) enth¨ alt."

Copied!
49
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Umgebung

Als ε-Umgebung eines Punktes x ∈ R n bezeichnet man die offene Kugel um x mit Radius ε:

B ε (x ) = { y ∈ R n : | y − x | < ε } .

Allgemeiner ist eine Umgebung U von x eine Menge, die eine ε-Umgebung B ε (x ) enth¨ alt.

1 / 195

Offene Menge

Eine Menge D ⊆ R n heißt offen, wenn jeder Punkt x ∈ D eine Umgebung U besitzt, die ganz in D enthalten ist. Damit enth¨ alt eine offene Menge keinen ihrer Randpunkte. Insbesondere sind R n und die leere Menge ∅ offen.

F¨ ur eine beliebige Menge D bezeichnet D ⊆ D das Innere von D, d.h, die Menge aller Punkte mit einer Umgebung in D.

2 / 195

Abgeschlossene Menge

Eine Menge D ⊆ R n heißt abgeschlossen, wenn die Grenzwerte x jeder konvergenten Folge von Punkten x k ∈ D in D liegen. Damit enth¨ alt eine abgeschlossene Menge jeden ihrer Randpunkte. Insbesondere sind R n und die leere Menge ∅ abgeschlossen.

F¨ ur eine beliebige Menge D bezeichnet D ⊇ D den Abschluss von D, d.h.

die Menge aller Grenzwerte von konvergenten Folgen in D.

3 / 195

Rand einer Menge

Der Rand ∂D einer Menge D ⊆ R n besteht aus allen Punkten x , f¨ ur die jede Umgebung U sowohl Punkte innerhalb als auch außerhalb von D enth¨ alt.

Alternativ kann der Rand als Differenz von Abschluss und Inneren,

∂D = D \ D definiert werden.

4 / 195

(2)

Kompakte Menge

Eine beschr¨ ankte und abgeschlossene Menge D ⊆ R n bezeichnet man als kompakt.

Aquivalent dazu sind folgende Charakterisierungen: ¨

Jede Folge in D besitzt eine konvergente Teilfolge mit Grenzwert in D.

Jede ¨ Uberdeckung von D mit offenen Mengen besitzt eine endliche Teil¨ uberdeckung.

5 / 195

Beispiel

Illustration von Mengeneigenschaften H¨ alfte einer Kreisscheibe,

D : x 2 + y 2 < 1 ∧ y > 0 , mit Rand ∂D = H ∪ S ,

H : x 2 + y 2 = 1 ∧ y ≥ 0 Halbkreis S : S : ( − 1, 1) × { 0 } Geradensegment

D offen: keine Randpunkte wegen strikter Ungleichungen H abgeschlossen: Relationen =, ≥ und ≤ bleiben bei Grenzwertbildung erhalten

S weder offen noch abgeschlossen:

Produkt einer offenen und abgeschlossenen Menge D, ¯ ∂D kompakt: abgeschlossen und beschr¨ ankt

6 / 195

Multivariate Funktion

Eine reelle Funktion f von mehreren Ver¨ anderlichen x k , f : R n ⊇ D → W ⊆ R m , x 7→ f (x ) ,

ordnet einem Punkt/Vektor x = (x 1 , . . . , x n ) t aus dem Definitionsbereich D einen Punkt/Vektor f (x ) = f (x 1 , . . . , x n ) = (f 1 (x ), . . . , f m (x )) t aus dem Wertebereich W = f (D) zu.

Je nach der Dimension m unterscheidet man zwischen skalaren (m = 1) und vektorwertigen (m > 1) Funktionen. Ist n = 1 und f stetig, so parametrisiert f eine Kurve im R m .

F¨ ur m, n ≤ 3 verwendet man meist keine Indizes und bezeichnet die Variablen mit x , y , z . Beispielsweise schreibt man f¨ ur m = n = 2

x y

7→

f (x , y ) g (x, y )

.

-1 2 0

2 1

0 0

-2 -2 -2 0 2

-2 -1 0 1 2

Wie in der Abbildung illustriert ist, k¨ onnen zur Visualisierung skalarer Funktionen der Graph

{ (x , f (x )) : x ∈ D } und die Niveaumengen

{ x ∈ D : f (x ) = c }

benutzt werden.

(3)

Eine vektorwertige Funktion l¨ asst sich veranschaulichen, indem man die Vektoren f (x ) als Pfeile mit den Punkten x assoziiert.

-2 0 2

-2 0 2

9 / 195

Multivariate Polynome

Ein Polynom p in n Variablen x 1 , . . . , x n ist eine Linearkombination von Monomen:

p(x ) = X

α

a α x α , x α = x 1 α 1 · · · x n α n , mit α k ∈ N 0 .

Je nach Summationsbereich unterscheidet man zwischen totalem Grad ≤ m: P

α = α 1 + · · · + α n ≤ m;

maximalem Grad ≤ m: max α = max k α k ≤ m.

F¨ ur bivariate und trivariate Polynome bezeichnet man die Variablen meist mit x , y bzw. x , y , z. Beispielsweise bilden die Monome

(x , y ) 7→ x j y k , j , k ≥ 0, j + k ≤ m

10 / 195

eine Basis f¨ ur die bivariaten Polynome vom totalen Grad ≤ m, und eine Basis f¨ ur die trivariaten Polynome mit maximalen Grad ≤ m besteht aus den Monomen

(x , y , z) 7→ x j y k z ` , 0 ≤ j , k , ` ≤ m .

Man bezeichnet ein n-variates Polynom p als homogen vom Grad k , wenn p(sx) = s k p(x ) f¨ ur s ∈ R .

Ein solches Polynom ist eine Linearkombination der Monome x 7→ x α mit P α = k .

Die Dimensionen der drei n-variaten Polynomr¨ aume entsprechen den Anzahlen der relevanten Monome:

homogen vom Grad k totaler Grad ≤ m maximaler Grad ≤ m k + n − 1

n − 1

m + n n

(m + 1) n

.

11 / 195

Beweis

(i) Bivariate Polynome (n = 2):

Auflistung der homogenen Monome

k = 0 : 1

k = 1 : x , y

k = 2 : x 2 , xy , y 2 k = 3 : x 3 , x 2 y , y 2 x , y 3 . . . ,

Anzahl k + 1 = k+2 2 1

− 1

f¨ ur Grad k

Dimension der bivariaten Polynome vom totalen Grad ≤ m:

1 + 2 + · · · + (m + 1) = (m + 2)(m + 1)

2 =

m + 2 2

(m + 1) 2 Monome vom maximalen Grad ≤ m x j y k , j, k ≤ m

12 / 195

(4)

(ii) Homogene n-variate Polynome vom Grad k:

identifiziere den Exponent

1 , . . . , α n ), α 1 + · · · + α n = k eines relevanten Monoms mit einer strikt monotonen Folge

β 1 = α 1 + 1 β 2 = α 1 + α 2 + 2 . . .

β n 1 = α 1 + · · · + α n 1 + (n − 1) aus { 1, . . . , k + n − 1 } , d.h.

α j = β j − β j 1 − 1 mit β 0 = 0, β n = k + n

k+n − 1 n − 1

M¨ oglichkeiten

13 / 195

(iii) n-variate Monome vom totalen Grad ≤ m:

⇐⇒ (n + 1)-variate homogene Monome vom Grad m:

x 1 α 1 · · · x n α n ⇐⇒ x 1 α 1 · · · x n α n x m

P α i

n+1

(Letzter Exponent liegt fest.) Dimension des Polynomraums

m + (n + 1) − 1 (n + 1) − 1

(iv) n-variate Polynome vom maximalen Grad ≤ m:

Analog zum bivariaten Fall existieren (m + 1) n Monome x 7→ x α mit 0 ≤ α j ≤ m.

14 / 195

Beispiel

Verschiedene bi- und trivariate Polynome bivariates Polynom mit totalen Grad ≤ 3

p(x , y ) = a 0,0 + (a 1,0 x + a 0,1 y ) + (a 2,0 x 2 + a 1,1 xy + a 0,2 y 2 ) +(a 3,0 x 3 + a 2,1 x 2 y + a 1,2 xy 2 + a 0,3 y 3 ) bzw. p(x 1 , x 2 ) = P

α 1 +α 2 ≤ 3 a α x 1 α 1 x 2 α 2

spezielles homogenes bivariates Polynom vom Grad 5 (x , y ) 7→ p(x , y ) = 7x 5 − 8x 3 y 2 + 6xy 4 bzw. p(x 1 , x 2 ) = 7x (5,0) − 8x (3,2) + 6x (1,4)

trivariates Polynom mit maximalem Grad ≤ 1 in drei Variablen:

p(x , y , z) = a 0,0,0 + (a 1,0,0 x + a 0,1,0 y + a 0,0,1 z )

+(a 1,1,0 xy + a 1,0,1 xz + a 0,1,1 yz) + a 1,1,1 xyz

Stetigkeit multivariater Funktionen

Eine Funktion f : R n ⊇ D → R m ist in einem Punkt (a 1 , . . . , a n ) ihres Definitionsbereichs D stetig, wenn

x → a = ⇒ f (x ) → f (a) , d.h. f¨ ur alle ε > 0 existiert δ(ε) > 0, so dass

| x − a | < δ = ⇒ | f (x ) − f (a) | < ε . Gilt dies f¨ ur alle Punkte a ∈ D, so ist f stetig auf D.

Existiert der Grenzwert f¨ ur einen Punkt a auf dem Rand ∂D des

Definitionsbereichs, so l¨ asst sich f in diesen Randpunkt stetig fortsetzen.

Stetigkeit ist vertr¨ aglich mit den arithmetischen Operation, d.h. eine Summe, ein Produkt und ein Quotient stetiger Funktionen ist stetig. Bei der Bildung eines Quotienten muss lediglich vorausgesetzt werden, dass der Nenner keine Nullstelle hat. Desweiteren ist die

Hintereinanderschaltung stetiger Funktionen stetig.

(5)

Beispiel

Unstetigkeit nicht-konstanter bivariater in Polarkoordinaten gegebener Funktionen f , die nur vom Winkel und nicht vom Radius abh¨ angen f : (r, ϕ) 7→ f (ϕ) mit x = r cos ϕ,

y = r sin ϕ, r = p

x 2 + y 2 z.B.

f (x , y ) = xy

x 2 + y 2 = cos ϕ sin ϕ

-1 0 1

-1 0 1

-0.5 0 0.5

Einschr¨ ankung auf Gerade durch den Ursprung, g : y = mx bzw.

g : ϕ = c konstanter Funktionswert:

f (x , mx) = mx 2

x 2 + (mx ) 2 = m

1 + m 2 = c m bzw. f (ϕ) = cos ϕ sin ϕ = c ϕ nicht stetig fortsetzbar f¨ ur (x, y ) → (0, 0), da verschiedener Grenzwert f¨ ur jede Ursprungsgerade:

lim

x → 0 f (x , mx ) = lim

x → 0

m

1 + m 2 = m 1 + m 2

17 / 195

Extremwerte stetiger Funkionen

Eine stetige Funktion f : R n ⊇ D → R besitzt auf einer kompakten Menge K ⊆ D sowohl ein Minimum als auch ein Maximum.

Auf dem links abgebildeten Funktionsgraphen sind Minima und ein Maximum markiert. Bei den Niveaulinien erkennt man die Extremstellen durch geschlossene Kurven, die diese Punkte einschließen.

-1 4 0 1 2

2 4

3

0 2

-2 -2 0

-4 -4 -4 -2 0 2 4

-4 -2 0 2 4

18 / 195

Aquivalenz von Normen ¨

Jede Vektornorm k · k in R n ist zur euklidischen Norm | · | ¨ aquivalent, d.h.

es gibt positive Konstanten c k mit

c 1 k x k ≤ | x | ≤ c 2 k x k f¨ ur alle x ∈ R n .

19 / 195

Beweis

Die Ungleichungen sind skalierungsinvariant, d.h. invariant unter der Substitution x → sx mit s ∈ R .

betrachte nur Vektoren x auf der Einheitssph¨ are S : | x | = 1

k x k 6 = 0 f¨ ur x ∈ S = ⇒ Stetigkeit der Funktion x 7→ | x | / k x k ( ∗ ) S kompakt = ⇒ ∃ positives Minimum c 1 und Maximum c 2

( ∗ ) Beweis der Stetigkeit der Norm mit Hilfe der Dreiecksungleichung:

k x k ≤ k x − y k + k y k , k y k ≤ k y − x k + k x k

= ⇒ (nach Umformung)

± ( k x k − k y k ) ≤ k x − y k bzw. | k x k − k y k | ≤ k x − y k , d.h. k k ist Lipschitz-stetig mit Konstante 1

20 / 195

(6)

Lipschitz-Stetigkeit

Eine Funktion f ist Lipschitz-stetig auf einer Menge D, wenn eine Lipschitz-Konstante c existiert, so dass

|| f (x ) − f (y ) || ≤ c || x − y ||

f¨ ur alle x , y ∈ D.

Ist f stetig differenzierbar und D konvex, so kann die Lipschitz-Konstante mit Hilfe der Norm der Jacobi-Matrix abgesch¨ atzt werden:

c ≤ sup

x ∈ D || f 0 (x )

| {z }

J

||

mit k J k = max k z k =1 k Jz k .

21 / 195

Beispiel

Stetigkeit der radialen Funktion

f (x ) = r α , r = | x | = q

x 1 2 + · · · + x n 2

0 1 1

1 0

2

0 -1 -1

0 1 1

1 0

2

0 -1 -1

0 1 1

1 0

2

0 -1 -1

α = 1 α = 2 α = 0.5

22 / 195

(i) α = 1:

f ist global Lipschitz-stetig, denn

| r − r 0 | = || x | − | x 0 || ≤ | x − x 0 | , d.h. c = 1 ist Lipschitz-Konstante f¨ ur D = R n

(ii) α > 1:

f ist Lipschitz-stetig auf beschr¨ ankten Mengen D Mittelwertsatz = ⇒

| r α − (r 0 ) α | = αs α− 1 | r − r 0 | mit s zwischen r und r 0

Lipschitz-Konstante c = max x D α | x | α 1 (iii) 0 < α < 1:

f ist stetig aber nicht Lipschitz-stetig in einer Umgebung von (0, 0), denn

| r α − 0 α | ≤ c | r − 0 | ist f¨ ur r → 0 nicht erf¨ ullbar

(iv) α < 0:

f ist unstetig bei 0, denn lim r 0 r α = ∞

Konvergenz von Vektoren

Eine Folge von Vektoren x k ∈ R n konvergiert gegen einen Vektor x , lim

k →∞ x k = x bzw. x k → x f¨ ur k → ∞ , wenn f¨ ur alle ε > 0 ein Index k ε existiert mit

| x k − x | < ε f¨ ur k > k ε . Mit anderen Worten enth¨ alt jede ε-Umgebung

B ε (x ) = { y : | y − x | < ε } alle bis auf endlich viele Folgenelemente.

Aquivalent zur Konvergenz von (x ¨ k ) ist die Konvergenz aller Komponenten der Folge, d.h. es k¨ onnen eindimensionale Konvergenzkriterien

herangezogen werden.

(7)

Beispiel

alternierende Projektion auf zwei Geraden

Konvergenz der Folge (x k , y k ) t gegen den Schnittpunkt (x , y ) t Illustration f¨ ur die abgebildeten Geraden

x k y k

:

0 0

,

0 1

,

1/2 1/2

, 1/2

1

, 3/4

3/4

, . . . → 1

1 Konvergenz der ersten Komponente:

x 2k = x 2k+1 = 1 − (1/2) k → 1 ,

denn

1 − 1 + (1/2) k

= (1/2) k < ε f¨ ur k > k ε = − ld ε

25 / 195

Cauchy-Kriterium f¨ ur Vektoren

Eine Folge von Vektoren x k ∈ R n konvergiert genau dann, wenn sie eine Cauchy-Folge ist, d.h. wenn f¨ ur alle ε > 0 ein k ε existiert mit

| x ` − x k | < ε f¨ ur `, k > k ε .

Dies ist gleichbedeutend damit, dass jede der n Komponenten der Folge x 1 , x 2 , . . . konvergiert.

Aufgrund der ¨ Aquivalenz von Normen im R n kann anstelle der Euklidischen Norm auch jede andere Vektornorm verwendet werden.

Eine oft einfach zu verifizierende hinreichende Bedingung f¨ ur das Cauchy-Kriterium ist geometrische Konvergenz. In diesem Fall gilt

| x k +1 − x k | ≤ c | x k − x k 1 | mit einer Konstanten c < 1.

26 / 195

Beweis

Geometrische Konvergenz = ⇒ Cauchy-Kriterium

Dreiecksungleichung, Absch¨ atzung f¨ ur benachbarte Folgenelemente

= ⇒

| x ` − x k | = | x ` − x `− 1 + x `− 1 − x `− 2 + · · · + x k+1 − x k |

≤ | x ` − x ` 1 | + | x ` 1 − x ` 2 | + · · · + | x k+1 − x k |

≤ c λ ` 1 + c λ ` 2 + · · · + c λ k

= c λ k (1 + λ + λ 2 + · · · ) ≤ c

1 − λ λ k = c 0 λ k < ε f¨ ur ` > k > k ε = ln(ε/c 0 )/ ln λ

27 / 195

Beispiel bin¨ arer Baum:

neue Segmente jeweils um den Faktor λ (0 < λ < 1) verk¨ urzt und in einem Winkel von ϑ an- gef¨ ugt

geometrische Konvergenz sukzes- siver Verzweigungspunkte x k :

| x k+1 − x k | = c λ k Cauchy-Folge, denn

| x ` − x k | ≤ | x ` − x `− 1 | + | x `− 1 − x `− 2 | + · · · + | x k+1 − x k |

≤ c λ `− 1 + c λ `− 2 + · · · + c λ k

= c λ k (1 + λ + λ 2 + · · · ) ≤ c

1 − λ λ k = c 0 λ k < ε f¨ ur ` > k > k ε = ln(ε/c 0 )/ ln λ

28 / 195

(8)

Kontrahierende Abbildung Eine Abbildung

g : D → D, D ⊆ R n , ist kontrahierend, wenn in einer geeigneten Norm

k g (x) − g(y ) k ≤ c k x − y k , x , y ∈ D , mit c < 1 gilt.

Die Konstante c wird als Kontraktionskonstante von g bezeichnet. Sie kann f¨ ur eine konvexe Menge D mit Hilfe der Jacobi-Matrix durch

c ≤ sup

x ∈ D k g 0 (x ) k

abgesch¨ atzt werden mit der Matrixnorm k J k = max k x k =1 k Jx k .

29 / 195

Beispiel

Richardson-Iteration zur L¨ osung eines linearen Gleichungssystems Ax = b f¨ ur eine symmetrische positiv definite Matrix: A

x 7→ g (x ) = x − ω(Ax − b) kontrahierend, falls ω gen¨ ugend klein gew¨ ahlt wird Begr¨ undung:

g (x ) − g (y ) = Q(x − y ), Q = E − ωA Eigenwerte von Q:

% k = 1 − ωλ k mit λ k > 0 den Eigenwerten von A

ω = 1/ max k λ k = ⇒ % k ≥ 0 und c = k Q k = max

k % k = 1 − (min

k λ k )/(max

k λ k ) < 1

bei Verwendung der der euklidischen Norm zugeordneten Matrixnorm k k

30 / 195

Banachscher Fixpunktsatz

Ist g eine kontrahierende Abbildung, die eine nicht leere, abgeschlossene Menge D ⊂ R n in sich abbildet, d.h. gilt

D = D 6 = ∅

x ∈ D = ⇒ g (x ) ∈ D

k g (x ) − g (y ) k ≤ c k x − y k ∀ x , y ∈ D mit c < 1, dann besitzt g einen eindeutigen Fixpunkt x = g (x ) ∈ D.

Ausgehend von einem beliebigen Punkt x 0 ∈ D kann x durch die Iterationsfolge

x 0 , x 1 = g(x 0 ), x 2 = g(x 1 ), . . . approximiert werden.

F¨ ur den Fehler gilt

k x − x ` k ≤ c `

1 − c k x 1 − x 0 k

d.h. die Iterationsfolge konvergiert f¨ ur jeden Startpunkt linear.

Der Fixpunktsatz gilt allgemeiner in vollst¨ andigen metrischen R¨ aumen. Da

die Translationsinvarianz und Homogenit¨ at der Norm nicht ben¨ otigt wird,

kann man k x − y k durch eine allgemeine Abstandsfunktion d(x , y )

ersetzen.

(9)

Beweis

(i) g (D) ⊆ D = ⇒ x ` ∈ D f¨ ur alle ` > 0 (ii) Kontraktionsbedingung = ⇒

k x `+1 − x ` k = k g (x ` ) − g(x ` 1 ) k ≤ c k x ` − x ` 1 k Iteration

k x `+1 − x ` k ≤ c ` k x 1 − x 0 k (iii) Dreiecksungleichung = ⇒

k x k − x ` k ≤ k x k − x k 1 k + k x k 1 − x k 2 k + · · · + k x `+1 − x ` k

≤ (c k 1 + · · · + c ` ) k x 1 − x 0 k = c c k c `

− 1 k x 1 − x 0 k

1 c ` c k x 1 − x 0 k

Cauchy-Konvergenz der Folge x 0 , x 1 , . . . gegen einen Grenzwert x

33 / 195

(iv) Kontraktionsbedingung = ⇒

k g (x ) − x k ≤ k g (x ) − g(x k ) k + k g (x k ) − x k ≤ c k x − x k k + k x k+1 − x k Grenzwert k → ∞ = ⇒ x Fixpunkt

(v ) x eindeutig, da

k x ˜ − x k = k g (˜ x ) − g (x ) k ≤ c k x ˜ − x k mit c < 1

(vi) Absch¨ atzung f¨ ur den Fehler ⇐ = Bilden des Grenzwerts f¨ ur k → ∞ in der Ungleichung (iii) f¨ ur k x k − x ` k

34 / 195

Beispiel

Gest¨ ortes lineares System:

Ax + εf (x ) = b

mit einer quadratischen invertierbaren Matrix A und einer Lipschitz-stetigen Funktion f (Konstante c f )

L¨ osung mit Hilfe der Iteration

x → g (x ) = A 1 (b − εf (x ))

Pr¨ ufe die Voraussetzungen des Banachschen Fixpunktsatzes f¨ ur die abgeschlossene Kugel um p = A 1 b mit Radius r,

D = { y : k y − p k ≤ r } , p = A 1 b

35 / 195

(i) g (D) ⊂ D:

f¨ ur x ∈ D

k g (x ) − p k = ε k A 1 f (x ) k ≤ ε k A 1 k max

y ∈ D k f (y ) k g (x ) ∈ D (Abstand zu p ≤ r ), falls

ε ≤ r

k A 1 k max y D k f (y ) k (ii) Kontraktionsbedingung:

k g (x ) − g (y ) k = ε k A 1 (f (x ) − f (y ) k ≤ ε k A 1 k c f

| {z }

c

k x − y k

mit c < 1, falls

ε < 1 k A 1 k c f

Beide Bedingungen, (i) und (ii), sind f¨ ur hinreichend kleines ε erf¨ ullt.

36 / 195

(10)

Partielle Ableitungen

Die partielle Ableitung ∂ k f einer Funktion f : R n 3 D → R m nach der k -ten Variablen x k ist die Ableitung der univariaten Funktion

x k 7→ f (x 1 , . . . , x k , . . . , x n ) ,

bei der die Variablen x j , j 6 = k, als Konstanten betrachtet werden. Man schreibt auch

k f = f x k = ∂f

∂x k ,

bzw. wenn x , y , z als Variablen verwendet werden, ∂ x f = f x = ∂f /∂x ,

y f = f y , etc.. Gem¨ aß der Definition der univariaten Ableitung gilt

k f (x ) = lim

h → 0

f (. . . , x k + h, . . .) − f (. . . , x k , . . .)

h .

37 / 195

Partielle Ableitungen sind sowohl f¨ ur skalare (m = 1) als auch f¨ ur vektorwertige (m > 1) reelle Funktionen definiert. In beiden F¨ allen bleibt der Funktionstyp beim partiellen Ableiten erhalten. Definitionsgem¨ aß gilt

k

 f 1

.. . f n

 =

k f 1 .. .

k f n

 ,

d.h. die partielle Ableitung wird simultan in den Komponenten gebildet.

Die ¨ ubliche Konvention ist, sowohl f¨ ur die Variable x als auch f¨ ur die Funktion f Spaltenvektoren zu verwenden. Dies ist wichtig bei der Definition der totalen Ableitung bzw. einer linearen Approximation von f .

38 / 195

Beispiel

Partielle Ableitungen f¨ ur verschiedene Funktionstypen (i) Skalare Funktionen:

skalare partielle Ableitungen x

y

7→ f (x , y ) = xy 2

f x (x , y ) = y 2 , ∂f (x , y )

∂y = 2xy

 x 1 x 2 x 3

 7→ f (x 1 , x 2 , x 3 ) = x 1 3 x 2 + x 1 x 3 2

1 f (x ) = 3x 1 2 x 2 + x 3 2 , f (x )

∂x 2 = x 1 3 , f x 3 (x 1 , x 2 , x 3 ) = 2x 1 x 3 (Verwendung der verschiedenen alternativen Notationen)

(ii) Vektorwertige Funktion:

gleiche Komponentenzahl der partiellen Ableitungen r

t

7→ f (r, t) =

r cos t r sin t

f r (r, t) =

cos t sin t

, f t (r, t) =

− r sin t r cos t

 x 1 x 2 x 3

 7→

f 1 (x 1 , x 2 , x 3 ) f 2 (x 1 , x 2 , x 3 )

=

x 2 3 x 3 x 1 2 + x 1 x 3 2

1 f (x ) =

1 f 1 (x )

1 f 2 (x )

=

0 2x 1 + x 3 2

∂f (x 1 , x 2 , x 3 )

∂x 2 =

3x 2 2 x 3 0

3 f (x 1 , x 2 , x 3 ) =

x 2 3 2x 1 x 3

(11)

Mehrfache partielle Ableitungen

Zweifache (hintereinander ausgef¨ uhrte) partielle Ableitungen werden mit

jk f = f x k x j = ∂ 2 f

∂x j ∂x k

bezeichnet. Analog schreibt man ∂ jk` . . . f f¨ ur partielle Ableitungen h¨ oherer Ordnung.

Sind die partiellen Ableitungen stetig, so spielt die Reihenfolge der

Differentiation keine Rolle. In diesem (Normal)fall kann man alternativ die Multiindex-Notation

α f = ∂ 1 α 1 · · · ∂ n α n f , α = (α 1 , . . . , α n ) ,

verwenden, wobei der Index α k ∈ N 0 die Anzahl der partiellen Ableitungen nach der k-ten Variablen bezeichnet. Die Summe | α | = α 1 + · · · + α n ist die Ordnung der partiellen Ableitung. Beispielsweise ist f¨ ur eine glatte Funktion f von 3 Variablen ∂ (2,1,3) f = ∂ 1 223 3 f eine partielle Ableitung der Ordnung | (2, 1, 3) | = 2 + 1 + 3 = 6.

41 / 195

Beispiel

Partielle Ableitungen h¨ oherer Ordnung verschiedener Funktionstypen (i) f (x , y ) = x /y :

f x = 1/y , f y = − x /y 2 , f xx = 0, f yy = 2x /y 3 , f xy = f xy = − 1/y 2 (ii) f (x 1 , x 2 ) =

cos(x 1 x 2 ) sin(x 1 + x 2 )

:

1 f =

− x 2 sin(x 1 x 2 ) cos(x 1 + x 2 )

, ∂ 21 f =

− x 1 x 2 cos(x 1 x 2 )

− sin(x 1 + x 2 )

(iii) f (x 1 , x 2 , x 3 ) = exp(x 1 + 2x 2 + 3x 3 ):

1 f = f , ∂ 2 f = 2 exp(x 1 + 2x 2 + 3x 3 ) = 2f , ∂ 3 f = 3f

(3,1,2) f = ∂ 1 323 2 f = 1 3 · 2 · 3 2 f = 18f

42 / 195

Beispiel

Partielle Ableitungen der Funktion

f (x 1 , . . . , x n ) = exp(i(ω t x ) = exp(i(ω 1 x 1 + · · · + ω n x n )) (ebene Welle)

Kettenregel

k f (x ) = iω k exp(iω t x )

`k f (x ) = (iω ` )(iω k ) exp(iω t x ) und somit

α f (x ) = (iω) α exp(iω t x ) = i |α| y α exp(iω t x ) mit α = (α 1 , ..., α n ) und ω α = ω 1 α 1 · · · ω α n n

z.B. (n = 2):

(3,4) f (x ) = i 7

|{z} − i

ω 1 3 ω 2 4 exp(i(ω 1 x 1 + ω 2 x 2 ))

43 / 195

Partielle Ableitungen von multivariaten Polynomen

Die partielle Ableitung

α x β = ∂ 1 α 1 . . . ∂ n α n

x 1 β 1 · · · x n β n eines Monoms ist nur dann ungleich Null, wenn α ≤ β ⇐⇒ α k ≤ β k ∀ k, und in diesem Fall gleich

c x β α , c =

n

Y

k=1

β kk − 1) · · · (β k − α k + 1) = β!/α!

mit (j , k, . . .)! = j! k ! · · · . Insbesondere ist

α x β | x=0 = α!δ α,β . Gilt f¨ ur ein Polynom p(x ) = P

β c β x β

α p ≡ 0 ∀ α mit | α | = α 1 + · · · + α n = m , so hat p totalen Grad < m, d.h. c β = 0 f¨ ur | β | ≥ m.

44 / 195

(12)

Beweis zu zeigen:

p = X

β

c β x β , ∂ α p ≡ 0 ∀ α mit | α | = m = ⇒ c β = 0 ∀ β mit | β | ≥ m Widerspruchsannahme: c β 6 = 0 f¨ ur ein β mit | β | ≥ m

w¨ ahle α mit | α | = m und α ≤ β

α p(x ) = X

β 0 ≥ α

c β 00 !/α!) x β 0 α 6≡ 0 ,

da mindestens der Summand mit β 0 = β nicht verschwindet im Gegensatz zu der Annahme, dass alle partiellen Ableitungen der Ordnung m identisch Null sind

45 / 195

Vertauschbarkeit partieller Ableitungen

Sind die ersten und zweiten partiellen Ableitungen einer Funktion f : D 3 R n → R stetig, so gilt

jk f = ∂ kj f .

F¨ ur hinreichend glatte Funktionen ist also die Reihenfolge partieller Ableitungen vertauschbar. Insbesondere rechtfertigt dies die Multiindex-Schreibweise.

Angewandt auf die Komponenten gilt die Aussage ebenfalls f¨ ur vektorwertige Funktionen f : D 3 R n → R m .

46 / 195

Beweis

Variablen x ` , ` 6 = j , k, irrelevant f¨ ur die partielle Ableitungen ∂ j , ∂ k betrachte o.B.d.A. eine bivariate Funktion f (x, y )

bezeichne mit

g (x ) = f (x , B) − f (x , A), h(y ) = f (b, y ) − f (a, y ) die Differenzen in y - bzw. x - Richtung und berechne

Q = f (b, B) − f (b, A) − f (a, B)+f (a, A) mit Hilfe des eindimensionalen Mittelwertsatzes (MWS) auf zwei verschiedene Arten

Q = [f (b, B) − f (b, A)] − [f (a, B) − f (a, A)]

= g (b) − g (a)

=

MWS (b − a)g x (c )

= (b − a)[f x (c, B) − f x (c, A)]

=

MWS (b − a)(B − A)f xy (c, C ) f¨ ur ein c ∈ (a, b) und C ∈ (A, B)

Q = [f (b, B) − f (a, B)] − [f (b, A) − f (a, A)]

= h(B) − h(A)

=

MWS (B − A)h y (C ? )

= (B − A)[f y (b, C ? ) − f y (a, C ? )]

=

MWS (B − A)(b − a)f yx (c ? , C ? )

f¨ ur ein c ? ∈ (a, b) und C ? ∈ (A, B)

(13)

Gleichsetzen = ⇒

f xy (c, C ) = f yx (c ? , C ? )

Verkleinerung des Rechtecks durch Grenz¨ ubergang (b → a, B → A) = ⇒ f xy (a, A) = f yx (a, A)

aufgrund der Stetigkeit der gemischten zweiten Ableitungen

49 / 195

Totale Ableitung und Jacobi-Matrix

Eine Funktion f : D 3 R n → R m ist in einem Punkt x differenzierbar, wenn f (x + h) = f (x ) + f 0 (x )h + o( | h | )

f¨ ur | (h 1 , . . . , h n ) | → 0.

Die Ableitung f 0 ist die Jacobi-Matrix der partiellen Ableitungen:

f 0 = (∂ 1 f , . . . , ∂ n f ) =

1 f 1 · · · ∂ n f 1 .. . .. .

1 f m · · · ∂ n f m

 und gem¨ aß den Regeln des Matrix/Vektor-Kalk¨ uls ist

f 0 (x)h = ∂ 1 f (x )h 1 + · · · + ∂ n f (x )h n .

Hinreichend f¨ ur die Existenz der Ableitung f 0 (x ) ist die Stetigkeit der partiellen Ableitungen in einer Umgebung von x .

Alternative gebr¨ auchliche Schreibweisen sind f 0 = J f = ∂(f 1 , . . . , f n )

∂(x 1 , . . . , x n ) .

50 / 195

F¨ ur eine skalare Funktion (m = 1) bezeichnet man die Ableitung als Gradient,

(∂ 1 f , . . . , ∂ n f ) = f 0 = (grad f ) t =

1 f .. .

n f

t

.

Dabei ist zu beachten, dass die n × 1-Jacobi-Matrix ein Zeilen- und der Gradient ein Spaltenvektor ist; deshalb ist die Transposition t notwendig.

F¨ ur die Parametrisierung einer Kurve t 7→ f (t) = (f 1 (t), . . . , f m (t)) t (n = 1) bezeichnet man den m-Vektor f 0 (t) als Tangentenvektor.

Um die lineare Approximation kleiner ¨ Anderungen ( | h | → 0) hervorzuheben, schreibt man

df = ∂f

∂x 1 dx 1 + · · · + ∂f

∂x n dx n mit sogenannten Differentialen df und dx k .

51 / 195

Beweis

betrachte bivariate Funktionen (analoge Argumentation im multivariaten Fall)

(i) zeige: Existenz von f 0 = ⇒ f 0 = (∂ 1 f , . . . , ∂ n f ) F¨ ur eine bivariate Funktion f (x , y ) und h = (s , 0) t gilt

f (x + s, y ) = f (x , y ) + f 0 (x , y ) (s, 0) t + o( | (s , 0) | )

= f (x , y ) + (J f ) 1 s + o( | s | ) , wobei (J f ) 1 die erste Spalte von J f bezeichnet.

Division durch s und Bilden des Grenzwerts f¨ ur s → 0 (J f ) 1 = lim

s → 0

f (x + s, y ) − f (x , y )

s + lim

s → 0 = o( | s | )

s = ∂ 1 f (x , y ) + 0 analoge Argumentation f¨ ur (J f ) 2

52 / 195

(14)

(ii) zeige: Stetigkeit von ∂ 1 f , . . . , ∂ n f = ⇒ Existenz von f 0 betrachte eine skalare Funktion f (x , y )

Mittelwertsatz = ⇒

f (x + s, y + t) = [f (x + s , y ) − f (x , y )] + [f (x + s, y + t) − f (x + s, y )]

+f (x , y )

= s f x (ξ, y ) + t f y (x + s , η) + f (x , y ) mit ξ ∈ (x , x + s ), η ∈ (y , y + t)

Stetigkeit von f x und f y = ⇒

f x (ξ, y ) = f x (x , y ) + o( | s | ), f y (x + s, η) = f y (x , y ) + o ( | (s, t) | ) f¨ ur | (s , t)

| {z }

h

| → 0 und damit die Differenzierbarkeit der Funktion f :

f (x + s, y + t) = f (x , y ) + sf x (x , y ) + tf y (x , y ) + o( | h | ) separates Betrachten der Komponenten vektorwertiger Fall

53 / 195

Beispiel

Differenzierbarkeit der Funktion

f (x , y ) = xy x 2 + y 2 (i) Unstetigkeit im Ursprung:

x lim → 0 f (x , x ) = x 2

x 2 + x 2 = 1 2 6 = − 1

2 = lim

x → 0 f (x , − x )

= ⇒ f nicht stetig und damit auch nicht differenzierbar bei (0, 0) (ii) Existenz der partiellen Ableitungen:

f (x , 0) = f (0, y ) = 0

= ⇒

f x (0, 0) = f y (0, 0) = 0

54 / 195

(iii) Unstetigkeit beider partieller Ableitungen im Ursprung:

bestimme den Grenzwert der partiellen Ableitung f x (x , y ) = y 3 − x 2 y

(x 2 + y 2 ) 2 f¨ ur (x , y ) → (0, 0) entlang verschiedener Kurven:

y = x lim

x → 0 f x (x , x ) = lim

x → 0

0

(x 2 + x 2 ) 2 = 0 und

y = x 2 lim

x → 0 f x (x , x 2 ) = lim

x → 0

x 6 − x 4

(x 2 + x 4 ) 2 = lim

x → 0

x 2 − 1

(1 + x 2 ) 2 = − 1 Die Unstetigkeit der partiellen Ableitung f y im Ursprung folgt analog.

Beispiel = ⇒

Die Existenz der partiellen Ableitungen ist nicht ausreichend f¨ ur Differenzierbarkeit.

Beispiel

Uberpr¨ ¨ ufung der Definition der Ableitung/Jacobi-Matrix f¨ ur

f (x , y ) =

x + 2y xy 3x 2 + y 2

 , f 0 (x , y ) = (f x (x , y ), f y (x , y )) =

1 2

y x

6x 2y

berechne den Fehler R = f (x + s, y + t) − f (x , y ) − f 0 (x , y )(s, t ) t f (x +s, y +t)=

(x + s) + 2(y + t) (x + s)(y + t) 3(x + s) 2 + (y + t) 2

 , f 0 (x , y ) s

t

=

s + 2t ys + xt 6xs + 2yt

= ⇒ R = (0, st , 3s 2 + t 2 ) t = o ( | (s, t) | ),

d.h. jede Komponente strebt f¨ ur (s , t) → (0, 0) schneller gegen 0 als

| h | = | (s, t) |

(15)

Beispiel

Jacobi-Matrizen verschiedener Dimension

(i) Gradient der skalaren Funktion (x , y ) t 7→ r(x , y ) = p

x 2 + y 2 : r x = (1/2)(x 2 + y 2 ) 1/2 (2x ) = x /r , Symmetrie = ⇒ r y = y /r und folglich

r 0 = (r x , r y ) = (x /r, y /r ) = (grad r ) t (ii) Tangentenvektor, der durch

c(t ) =

 cos t

sin t t

 parametrisierten Kurve (Schraubenlinie):

c 0 (t) =

− sin t cos t

1

57 / 195

(iii) Jacobi-Matrix, der durch ϑ

ϕ p

7→

 x y z

 =

sin ϑ cos ϕ sin ϑ sin ϕ

cos ϑ

 definierten Parametrisierung der Einheitssph¨ are:

p 0 = ∂(x , y , z)

∂(r, ϑ, ϕ) =

x ϑ x ϕ y ϑ y ϕ z ϑ z ϕ

 =

cos ϑ cos ϕ − sin ϑ sin ϕ cos ϑ sin ϕ sin ϑ cos ϕ

− sin ϑ 0

58 / 195

Multivariate Kettenregel

F¨ ur die Hintereinanderschaltung

h = g ◦ f : x 7→ y = f (x ) 7→ z = g(y ) = h(x ) , stetig differenzierbarer Funktionen f : R n ⊇ U → R ` und g : R ` ⊇ V → R m mit f (U ) ⊆ V gilt

h 0 (x ) = g 0 (y )

| {z }

m ×`

f 0 (x )

| {z }

`× n

,

d.h. die m × n-Jacobi-Matrix von h ist das Produkt der Jacobi-Matrizen von f und g . Die einzelnen Eintr¨ age von h 0 ergeben sich durch

Matrixmultiplikation:

∂h i

∂x k =

`

X

j=1

∂g i

∂y j

∂f j

∂x k , i = 1, . . . , m, k = 1, . . . , n .

59 / 195

Diese Identit¨ at vereinfacht sich, wenn eine oder zwei der Dimensionen gleich eins sind. Beispielsweise hat eine multivariate Funktion g entlang einer Kurve mit Parametrisierung f ,

x 7→ h(x ) = g (f 1 (x ), . . . , f ` (x )) , die Ableitung

dh

dx = ∂ 1 g (f (x ))f 1 0 (x ) + · · · + ∂ ` g(f (x ))f ` 0 (x ) = (grad g ) t

f (x) f 0 (x ) , d.h. h 0 (x ) ist das Skalarprodukt aus Gradient von g und Tangentenvektor von f .

F¨ ur Funktionen von zwei oder drei Ver¨ anderlichen werden oft statt der Index-Schreibweise verschiedene Buchstaben f¨ ur die Variablen verwendet.

Beispielsweise ist die Jacobi-Matrix der Funktion x

y

7→

p(u(x , y ), v (x , y )) q(u (x , y ), v (x , y ))

gem¨ aß der Kettenregel das Matrixprodukt

p u p v q u q v

(u(x,y),v(x,y))

u x u y v x v y

(x,y)

.

60 / 195

(16)

Beweis

Definition der Ableitung und Jacobi-Matrix:

ϕ(x + ∆x ) = ϕ(x ) + ϕ 0 (x )∆x + o ( | ∆x | ) Existenz der Ableitungen f 0 (x ) und g 0 (y ) = ⇒

g (f (x +∆x )) = g(f (x )+f 0 (x )∆x + o( | ∆x | )

| {z }

∆y

) = g (y )+[g 0 (y ) ∆y ]+o ( | ∆y | )

Formel f¨ ur die Jacobi-Matrix von h = g ◦ f , da [g 0 (y ) ∆y ] = g 0 (y )f 0 (x )

| {z }

h 0 (x)

∆x + o( | ∆x | )

und | ∆y | = O( | ∆x | )

61 / 195

Beispiel

Jacobi-Matrix der Hintereinanderschaltung der Funktionen

y = f (x ) =

x 3 sin x 1 e x 2 /x 3

, g (y ) =

 y 1 y 1 + ln y 2

0 y 2 cos y 1

 f¨ ur x = p = (π, 0, 1) t

f 0 (x ) | x=p =

x 3 cos x 1 0 sin x 1 0 e x 2 /x 3 − e x 2 /x 3 2

| x=p

=

− 1 0 0 0 1 − 1

g 0 (y ) | y=f (p) =

1 0

1 1/y 2

0 0

− y 2 sin y 1 cos y 1

| y=(0, 1)

=

 1 0 1 1 0 0 0 1

62 / 195

Kettenregel h 0 (π, 0, 1) = g 0 (0, 1) f 0 (π, 0, 1) und nach Einsetzen

h 0 (π, 0, 1) =

 1 0 1 1 0 0 0 1

− 1 0 0 0 1 − 1

=

− 1 0 0

− 1 1 − 1

0 0 0

0 1 − 1

Beispiel

Kettenregel f¨ ur eine skalare Funktion f (x , y ) entlang einer Kurve t 7→ (x (t), y (t)) t

Spezialisierung der allgemeinen Formel d

dt f (x (t), y (t)) = f x (x (t), y (t))x 0 (t) + f y (x (t), y (t))y 0 (t) (Skalarprodukt von Gradient und Tangentenvektor)

Anwendung im konkreten Fall

f (x , y ) = xy 2 , x = cos t, y = sin t (Kreis) Gradient: (f x , f y ) t = (y 2 , 2xy ) t , Auswertung entlang der Kurve (sin 2 t, 2 cos t sin t ) t

Tangentenvektor: (x 0 , y 0 ) t = ( − sin t, cos t) t

(17)

Einsetzen in die Kettenregel d

dt f (x (t), y (t)) = (sin 2 t, 2 cos t sin t)

− sin t cos t

= − sin 3 t + 2 cos 2 t sin t = 2 sin t − 3 sin 3 t Vergleich mit der direkten Berechnung:

f (x (t), y (t)) = cos t sin 2 t = ⇒ d

dt f (x (t), y (t)) = − sin t(sin 2 t) + cos t(2 sin t cos t) X

65 / 195

Beispiel

Berechnung des Gradienten der Funktion h = g ◦ f f¨ ur f (x , y ) =

x + y x − y x 2 + y 2 − 1

 , g (u, v , w ) = u 2 + v 2 + w 2

Jacobi-Matrix von f

f 0 = (f x , f y ) =

1 1

1 − 1 2x 2y

 Gradient von g

(grad g ) t = g 0 = (2u, 2v , 2w) = 2(x + y , x − y , x 2 + y 2 − 1)

66 / 195

Kettenregel, h 0 (x , y ) = g 0 (f (x , y ))f 0 (x , y ) = ⇒ (grad h) t

| {z }

h 0

= (grad g ) t

| {z }

g 0

f 0 = 2

x + y + x − y + 2x (x 2 + y 2 − 1) x + y − x + y + 2y (x 2 + y 2 − 1)

t

und nach Vereinfachung

grad h = 4(x 2 + y 2 ) x

y

67 / 195

Beispiel

Transformation von Gradienten bei affiner Abbildung eines Referenzdreiecks

Parametrisierung eines allgemeinen Dreiecks D mit Eckpunkten a = (a 1 , a 2 ) t , b, c, ausgehend von dem Referenzdreieck D : x 1 + x 2 ≤ 1, x k ≥ 0

y = p(x ) = a + (b − a)x 1 + (c − a)x 2 Jacobi-Matrix

p 0 (x ) = ∂(y 1 , y 2 )

∂(x 1 , x 2 ) = (b − a, c − a) =

b 1 − a 1 c 1 − a 1 b 2 − a 2 c 2 − a 2

Kettenregel = ⇒

(grad h(x )) t = (grad g (y )) t p 0 (x ), h(x ) = g (p(x)) f¨ ur skalare Funktionen g und h

Anwendung: Aufstellen von Steifigkeitsmatrizen f¨ ur Finite Elemente

68 / 195

(18)

Richtungsableitung

Die Ableitung einer Funktion f : R n 3 D → R in Richtung eines Vektors v = (v 1 , . . . , v n ) t im Punkt x ist die Steigung der univariaten Funktion t 7→ f (x + tv ) an der Stelle t = 0:

v f (x 1 , . . . , x n ) = lim

t → 0

f (x + tv ) − f (x )

t =

d

dt f (x + tv )

t=0

.

Speziell ist ∂ e k f mit e k dem k -ten Einheitsvektor die partielle Ableitung bzgl. der k -ten Koordinate.

Aufgrund der Kettenregel gilt

v f (x) = (grad f (x )) t v = ∂ 1 f (x )v 1 + · · · + ∂ n f (x )v n . Die lokale ¨ Anderung von f ist somit maximal (minimal) f¨ ur v = s grad f (x ) mit s > 0 (s < 0).

69 / 195

Die Richtungsableitung kann allgemeiner auch f¨ ur eine vektorwertige Funktion f : R n 3 D → R m definiert werden. Bei der Berechnung ist dann der Gradient durch die Jacobi-Matrix zu ersetzen:

v f (x ) = f 0 (x ) v .

70 / 195

Beispiel

Berechnung der Richtungsableitung der Funktion f (x , y ) = x 2 y 3 im Punkt (x , y ) = (2, − 1)

Gradient

grad f (x, y ) | (2, − 1) =

2xy 3 3x 2 y 2

(2,− 1)

= − 4

12 Richtungableitung

v f (2, − 1) = ( − 4, 12) v 1

v 2

= − 4v 1 + 12v 2 maximal f¨ ur

v = s − 4

12

mit s > 0 , also z.B. f¨ ur v = ( − 1, 3)

N¨ aherung (lineare Taylor-Approximation) f¨ ur den gr¨ oßten lokalen Anstieg von f :

f (2 − t, − 1 + 3t) ≈ f (2, − 1) + t∂ v f (2, − 1)

= − 4 + t( − 4, 12) − 1

3

= − 4 + 40t

f¨ ur kleine Werte von t

(19)

Tangente

Der Tangentenvektor einer mit einer stetig differenzierbaren Funktion f : t 7→ (f 1 (t), . . . , f n (t)) t

parametrisierten Kurve im Punkt f (t 0 ) ist die Ableitung f 0 (t 0 ), falls mindestens eine der Komponenten f k 0 (t 0 ) ungleich Null ist. Die Tangente ist in diesem Normalfall die durch

f (t 0 ) + f 0 (t 0 )(t − t 0 ), t ∈ R , parametrisierte Gerade.

Ist f 0 (t 0 ) der Nullvektor, so ist die Parametrisierung bei t 0 sin- gul¨ ar. Ein Tangentenvektor kann, muss aber nicht existieren, denn die Tangentenrichtung kann sich im Punkt f (t 0 ) abrupt ¨ andern.

73 / 195

Beispiel

Tangentenvektor und Tangente f¨ ur die Schraubenlinie C : t 7→ f (t) = (cos t, sin t, t) t

(i) Tangentenvektor:

f 0 (t) = ( − sin t, cos t, 1) t (ii) Tangente im Punkt f (3π):

f (3π) = ( − 1, 0, 3π) t f 0 (3π) = (0, − 1, 1) t

Parametrisierung t 7→

− 1 0 3π

+

 0

− 1 1

 (t − 3π)

0 1 5

1 10

0 15

-1 0

-2 -1

74 / 195

Beispiel

Stetige und unstetige ¨ Anderung des Tangentenvektors an einem singul¨ aren Kurvenpunkt

(i) t 7→ f (t) = (t 3 , t 2 ) t :

abrupte Richtungs¨ anderung f¨ ur t 0 = 0 von (0, − 1) t nach (0, 1) t m¨ oglich, da f 0 (0) = (0, 0) t

75 / 195

(ii) t 7→ g (t) = (t 3 , t 4 ) t

stetige Tangenten¨ anderung trotz f 0 (0) = (0, 0) t Umparametrisierung

s = t 3 , f (t) = g(s) = s

s 4/3

= ⇒ g 0 (s) = (1, 4s 1/3 /3) t stetig bei s = 0

76 / 195

(20)

Tangentialebene

Die Tangentialebene im Punkt p = (p 1 , . . . , p n ) t einer durch S : f (x 1 , . . . , x n ) = c

implizit definierten Fl¨ ache besitzt die Darstellung E : 0 = (grad f (p)) t (x − p) =

n

X

k=1

k f (p)(x k − p k ) ,

falls mindestens eine der Komponenten ∂ k f (p) des Gradienten ungleich Null ist. Der Normalenvektor von E ist also parallel zu grad f .

Ist grad f (p) = (0, . . . , 0) t , so muss eine Tangentialebene im Punkt p nicht existieren. Beispielsweise kann die Fl¨ ache eine Kante oder Spitze haben.

77 / 195

F¨ ur den Graph einer Funktion x 7→ x n = g (x 1 , . . . , x n 1 ) ist E : x n − g (q) =

n − 1

X

k=1

k g (q)(x k − q k )

die Gleichung der Tangentialebene im Punkt (q 1 , . . . , q n 1 , g (q)) t . Die partielle Ableitung ∂ k g (q) entspricht somit der Steigung der

Tangentialebene in Richtung der k-ten Koordinatenachse. Die Normale der Tangentialebene ist parallel zu ( − ∂ 1 g (q), . . . , − ∂ n 1 g (q), 1) t .

78 / 195

Wird eine Fl¨ ache S ⊂ R n durch eine Parametrisierung beschrieben, S : (s 1 , . . . , s n 1 ) t 7→ (h 1 (s), . . . , h n (s)) t ,

so spannen die partiellen Ableitungen ∂ k h(s ) die Tangentialebene E im Punkt p = h(s ) auf, d.h.

E : p +

n − 1

X

k=1

s kk h(p), s k ∈ R .

Beweis

(i) Implizite Darstellung einer Fl¨ ache durch f (x 1 , . . . , x n ) = c : Definition der totalen Ableitung f 0 = (grad f ) t = ⇒

f (x ) = f (p) + gradf (p) t (x − p) + o( | x − p | ) Vernachl¨ assigung des Terms o( | x − p | ), f (x ) = f (p) = c Gleichung der Tangentialebene

(ii) Darstellung einer Fl¨ ache als Funktionsgraph y = g (x 1 , . . . , x n 1 ):

∆y =

n − 1

X

i=1

i g(q)(∆x i ) + o ( | ∆x | ) mit ∆y = y − g (q) und ∆x = x − q

Vernachl¨ assigung des Restgliedes Darstellung der Tangentialebene

(21)

Beispiel

Tangentialebenen f¨ ur den Kegel

K : f (x , y , z ) = x 2 + y 2 − z 2 = 0

grad f (x , y , z ) = (2x , 2y , − 2z ) t Tangentialebene im Punkt (x 0 , y 0 , z 0 )

E : 2x 0 (x − x 0 ) + 2y 0 (y − y 0 ) − 2z 0 (z − z 0 ) = 0 Tangentialebene im Punkt (x 0 , y 0 , z 0 ) = (3, 4, 5)

E : 0 = 6(x − 3) + 8(y − 4) − 10(z − 5) = 6x + 8y − 10z (Jede) Tangentialebene enth¨ alt den Ursprung.

grad f (x 0 , y 0 , z 0 ) = (0, 0, 0) t f¨ ur (x 0 , y 0 , z 0 ) = (0, 0, 0) keine Tangentialebene an der Spitze des Kegels

81 / 195

Beispiel

Tangentialebenen f¨ ur den den Funktionsgraph von

g (x ) = | x − p | 1 − | x + p | 1 , x = (x 1 , x 2 )

(Potential eines Dipols mit Ladungen in den Punkten ± p = ± (p 1 , p 2 ))

k (x 1 2 + x 2 2 ) 1/2 = ( − 1/2)(x 1 2 + x 2 2 ) 3/2 (2x k )

k g (x ) = x k + p k

| x + p | 3 − x k − p k

| x − p | 3 , k = 1, 2 Gleichung der Tangentialebene E im Punkt x = q = (q 1 , q 2 )

x 3 − g (q) =

2

X

k=1

q k + p k

| q + p | 3 − q k − p k

| q − p | 3

| {z }

∂ k g (q)

(x k − q k )

= (q + p)((x 1 , x 2 ) − q) t

| q + p | 3 − (q − p)((x 1 , x 2 ) − q) t

| q − p | 3

82 / 195

z.B. f¨ ur q = (0, 0)

g (q) = 0, E : x 3 = 2 p 1 x 1 + p 2 x 2

| p | 3

Tangentialebene verl¨ auft durch den Ursprung und enth¨ alt die Gerade senkrecht zu p

keine Tangentialebenen in den Singularit¨ aten (x = ± p)

83 / 195

Beispiel

Tangentialebene des Hyperboloids H : (ϕ, z ) 7→ h(ϕ, z) = ( p

1 + z 2 cos ϕ, p

1 + z 2 sin ϕ, z ) t im Punkt p = (1, − 1, 1) = h( − π/4, 1) t

partielle Ableitungen der Parametrisierung

h ϕ (ϕ, z ) =

− √

1 + z 2 sin ϕ

√ 1 + z 2 cos ϕ 0

, h z (ϕ, z) =

√ z

1 + z 2 cos ϕ

√ z

1 + z 2 sin ϕ 1

 Auswertung im Ber¨ uhrpunkt

h ϕ ( − π/4, 1) =

− √

2 ( − 1/ √

√ 2) 2 (1/ √

2) 0

 =

 1 1 0

 , h z ( − π/4, 1) =

 1/2

− 1/2 1

84 / 195

(22)

parametrische Darstellung der Tangentialebene E :

 x y z

 =

 1

− 1 1

 + s

 1 1 0

 + t

 1/2

− 1/2 1

 , s , t ∈ R Vektorprodukt der aufspannenden Vektoren Normale

 1

− 1 0

 ×

 1/2 1/2 1

 =

− 1

− 1 1

 und der impliziten Darstellung

E : 0 = ( − 1, − 1, 1)

x − 1 y − ( − 1)

z − 1

 bzw. x + y + z = − 1

85 / 195

Multivariate Taylor-Approximation

Eine in einer Umgebung D eines Punktes a = (a 1 , . . . , a m ) (n + 1)-mal stetig differenzierbare Funktion f : D → R von m Ver¨ anderlichen x k kann durch ein Taylor-Polynom vom totalen Grad ≤ n approximiert werden:

f (x ) = X

|α|≤ n

1

α! ∂ α f (a)(x − a) α + R

mit α! = α 1 ! · · · α m !, ∂ α = ∂ 1 α 1 · · · ∂ m α m , y α = y 1 α 1 · · · y m α m und dem Restglied

R = X

|α| =n+1

1

α! ∂ α f (u)(x − a) α , u = a + θ(x − a) , f¨ ur ein θ ∈ [0, 1].

F¨ ur x → a strebt der Fehler mit der Ordnung n + 1 gegen Null:

R = O( | x − a | n+1 ) .

86 / 195

F¨ ur Funktionen von zwei oder drei Variablen werden meist anstelle von (x 1 , . . .) die Bezeichnungen (x , y ) bzw. (x , y , z ) verwendet. Beispielsweise hat das quadratische Taylor-Polynom f¨ ur eine bivariate Funktion in dieser Notation die Form

p(x , y ) = f (x 0 , y 0 ) + f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(x − x 0 ) + 1

2 f xx (x − x 0 ) 2 + f xy (x − x 0 ) 2 + 1

2 f yy (y − y 0 ) 2 und f¨ ur eine trivariate Funktion

p (x , y , z ) = f (x 0 , y 0 , z 0 ) + . . .

|{z}

8 Terme

+ 1

2 f zz (x 0 , y 0 , z 0 )(z − z 0 ) 2 .

Beweis

Zur¨ uckf¨ uhrung auf den univariaten Fall (o.B.d.A. a = 0):

setze

f (x 1 , ..., x m ) = f (tx 1 , ..., tx m ) | t=1 = g (t) | t=1 Taylor-Entwicklung der univariaten Funktion g (t) im Nullpunkt

g (t ) = g (0) + g 0 (0) t + · · · + 1

n! g (n) (0)t n + R mit

R = 1

(n + 1)! g (n+1) (θt)t n+1

f¨ ur ein θ ∈ [0, 1]

Abbildung

Illustration von Mengeneigenschaften H¨ alfte einer Kreisscheibe,

Referenzen

ÄHNLICHE DOKUMENTE

• Selbst wenn Sie eine Denition oder eine Aussage kennen, hilft es, sich diese mit Beispie- len zu veranschaulichen. • Manche Aussagen lassen sich leichter per Widerspruchsbeweis

Peter Junghanns Technische Universit¨ at Chemnitz Dr. Ralf Hielscher Fakult¨ at f¨ ur Mathematik.. PD Dr.. Die Menge aller Randpunkte von A bezeichnen wir mit ∂A. abgeschlossen)

Bool mit false &lt; true ist

[r]

Eine hinreichende Bedingung f¨ ur ein lokales Minimum (Maximum) in einem kritischen Punkt x ∗ im Innern des Definitionsbereichs D ist, dass ebenfalls die zweiten partiellen

Eine hinreichende Bedingung f¨ ur ein lokales Minimum (Maximum) in einem kritischen Punkt x ∗ im Innern des Definitionsbereichs D ist, dass ebenfalls die zweiten partiellen