Berlin, 26. August 2002
Lutz Lehmann
Rechnen mit Vektoren (Lineare Algebra)
Humboldt–Universität zu Berlin Institut für Mathematik (Mat.–Nat. Fak. II) http://www.mathematik.hu-berlin.de/∼llehmann/
Inhaltsverzeichnis
1 Lineare Abbildungen und Matrizen 2
1.1 Grundbegriffe . . . 2
1.2 Die Basisabbildung . . . 3
1.3 Linearformen . . . 4
1.4 Matrizen linearer Abbildungen . . . 5
1.5 Basistransformation, ko– und kontravariant . . . 6
2 Jordan’sche Normalform von Operatormatrizen 6 2.1 f iteriert . . . . 6
2.2 Faktorisierung . . . 7
2.3 Mehrfache Nullstellen . . . 9
2.4 Charakteristisches Polynom und Normalform . . . 10
2.5 Beispiel 1 . . . 10
3 Symmetrische Matrizen 11 3.1 Bilinearformen . . . 11
3.2 Symmetrische Bilinearformen . . . 12
3.3 Anwendung . . . 12 Zusammenfassung
Lineare Algebra ist eines der zentralen Gebiete der Mathematik. Alles, was effizient gelöst werden kann, sind lineare Gleichungssyteme oder Probleme, die sich auf eine Folge solcher Systeme reduzieren lassen.
Grundlage dieser Darstellung ist ein Artikel von Sheldon Axler,1 der nach der “richtigen” Darstellung der Matrizentheorie fragt.
1 Lineare Abbildungen und Matrizen
Der Raumbegriff war einmal der der Euklidischen Geometrie. Seit Gauß und Rie- mann2steht aber die Übereinstimmung von physikalischem Raum mit dieser Geome- trie zur Diskussion, deren Höhepunkt die Allgemeine Relativitätstheorie von Einstein ist. Definitionsgrundlage für den allgemeineren Raumbegriff ist aber die Vergleich- barkeit im Kleinen mit einem linearen Raum, die stetige und eineindeutige Zuord- nung eines Raumpunktes zu einem Satz von Maßzahlen, Koordinaten (zugeordnete Größen). Damit wird aber zur Bestimmung des Raumbegriffes das vorherige Vorhan- densein des linearen Raumes notwendig.
Die Dynamik im Raum wird auf Arithmetik der Koordinaten zurückgeführt, was eine Theorie dieser Arithmetik, der Vektorrechnung notwendig macht. Es ist dabei eine Frage der Übersichtlichkeit, wann immer es geht mit der Gesamtheit der Koordinaten, dem Vektor, zu rechnen.
1.1 Grundbegriffe
Folgendes sei intuitiv klar oder leicht nachzuschlagen:
• Definition eines Körpers K : Axiome, z.B. K=Q,R,C ;
• Definition von K –Vektorräumen V , W : Axiome;
• die Vorstellung einer m×n –Matrix A= ((ai,j))1≤i≤m
1≤j≤n
als Zahlenschema mit m Zeilen und n Spalten;
• die Berechnung desMatrixprodukts einer m×n – mit einer n×p –Matrix als m×p –Matrix, AB= ((∑nj=1ai jbjk))1≤i≤m
1≤k≤p
• Kn als Bezeichnung des Raums der n×1 –Matrizen bzw. Spaltenvektoren, Kn∗ sei der Raum der 1×n –Matrizen bzw. Zeilenvektoren;
1http://math.sfsu.edu/axler/DwD.html
2http://www.maths.tcd.ie/pub/HistMath/People/Riemann/Geom/
• Definition einer linearen Abbildung f : V→W ;
• ein lineares Funktional α: V→K ist eine lineare Abbildung;
• Begriff des dualen Vektorraums als Menge der linearen Funktionale (s.u.).
1.2 Die Basisabbildung
Eine Basis E= (e1, . . . ,en) eines K –Vektorraumes V der Dimension n definiert eine Abbildung E : Kn→V , x= (x1, . . . ,xn)7→∑ieixi. Fassen wir das Tupel E als Zeilenvektor auf, so ergibt sich die Schreibweise
E(x) = (e1, . . . ,en)
x1
... xn
.
Die lineare Unabhängigkeit der Basisvektoren ergibt die Injektivität von E , ihre Ei- genschaft, ein Erzeugendensystem zu sein, die Surjektivität. Mithin ist E bijektiv mit Inverser E−1: V→Kn, v7→ e∗1(v), . . . ,e∗n(v)t
.
Bemerkung: Die Hoch– und Tiefstellung der Indizes ist in dieser Form in Differen- tialgeometrie und Physik verbreitet, sollte aber unten nicht mit den Polynompotenzen verwechselt werden.
Kanonische Basis: Sei δk der Spaltenvektor, der in der k –ten Zeile eine 1 , sonst eine 0 enthält. Damit ist dann ∆= (δ1, . . . ,δn) eine Basis von Kn, die auch als kanonisch bezeichnet wird. Als n×n –Matrix ist ∆ einfach die Einheitsmatrix, die Basisabbildung die identische Abbildung, die jeden Spaltenvektor unverändert läßt.
Für eine Basis eines beliebigen n –dimensionalen Vektorraums ist dann E(δk) =ek, i.e., δk=E−1(ek) die Koordinatendarstellung von ek, somit auch
e∗i(ek) =δik=
(1 i=k 0 i6=k.
Beispiel: Polynome p(X)∈K[X] vom Grad kleiner n . Sie sind durch ihre Koeffi- zienten bestimmt, d.h. nach obigem ist E= (1,X,X2, . . . ,Xn−1), der Vektor c∈Kn
wird auf
E c= (1,X, . . . ,Xn−1)
c1 c2 ... cn
=c1+c2X+c3X2+· ··+cnXn−1
abgebildet. Man überlege sich, warum E eine Basis ist.
1.3 Linearformen
Eine Linearform α∈V∗ ist eine lineare Abbildung α: V →K . Die oben definier- ten e∗k sind damit Linearformen. Mit V∗ wird der Vektorraum aller Linearformen bezeichnet.
Beispiel: Bleiben wir bei den Polynomen. Die Auswertung eines Polynoms an ei- nem Punkt, αx(p):=p(x), definiert eine Linearform, αx(p+µq):=p(x) +µq(x).
Eine Basis E definiert eine Adjungierte zur Basisabbildung E∗: V∗→Kn∗ durch
E∗(α)(x) =α E(x)= (α1, . . . ,αn)
x1
... xn
,
(α1, . . . ,αn) =α◦E= α(e1), . . . ,α(en) . Für deren Inverse gilt
(E∗)−1(α1, . . . ,αn) (v) =
(α1, . . . ,αn) E−1(v)= (α1, . . . ,αn)
e∗1(v)
... e∗n(v)
.
Die Adjungierte (E−1)∗: Kn∗→V∗ zur Inversen definiert die duale Basisabbildung I.e., e∗1, . . . ,e∗n
ist eine Basis des Dualraumes.
Sei δk der Spaltenvektor, der in der k –ten Zeile eine 1 , sonst eine 0 enthält. Dann ist E(δk) =ek, i.e., δk die Koordinatendarstellung von ek, somit auch
e∗i(ek) =δik=
(1 i=k 0 i6=k.
Beispiel: Wir betrachten jetzt Auswerteabbildungen zu paarweise verschiedenen Punkten x1, . . . ,xn und suchen die Basis, zu der αx1, . . . ,αxn die duale Basis ist. Ge- sucht sind also Polynome pk mit αxi(pk) =δik. Das gibt uns n−1 Nullstellen vor.
Da der Grad von pk kleiner als n ist, kommt nur pk(x) =c(x−x1). . .(x−xi−1)(x− xi+1). . .(x−xn) mit einer Konstanten c in Frage. Wegen pk(xk) =1 erhalten wir die Polynome der Lagrange–Interpolation
pk(x) = ∏i6=k(x−xi)
∏i6=k(xk−xi).
Zur Erbauung finde man heraus, wie sich die duale Basis zur Monombasis durch Auswertefunktionale darstellen läßt (Newton–Interpolation).
1.4 Matrizen linearer Abbildungen
Sei V ein m – und W ein n –dimensionaler K –Vektorraum. Sei φ: V →W eine lineare Abbildung. Wählen wir jetzt Basen E von V und F von W , so können wir die zusammengesetzte Abbildung A=Aφ,F,E=F−1◦φ◦E betrachten:
Km−→E V−→φ W −−→F−1 Kn.
Hier wird also ein Spaltenvektor auf lineare Art auf einen anderen abgebildet. Schau- en wir uns dies im Detail an. Es ist
F◦A(x) =φ◦E(x) =
∑
j
φ(ej)xj=
∑
i,j
fiaijxj=
∑
i
fiyi,
i.e., A entspricht der Matrix ((aij)) =
f∗i(φ(ej))
y=A x=
a11 . . . a1m
... ...
an1 . . . anm
x1
... xm
.
1.5 Basistransformation, ko– und kontravariant
Seien E= (e1, . . . ,en) und F= (f1, . . . ,fn) zwei Basen des K –Vektorraumes V . Wir untersuchen den Übergang von der Basis E zur Basis F . Dabei sollen die geo- metrischen Objekte, i.e., die Vektoren in V , unverändert bleiben.
Dann können wir im obigen Sinn die Matrix TE,F der Identität IV : V→V betrach- ten: TE,F=E−1◦IV◦F=E−1◦F : Kn→Kn. Da es mit TF,E=F−1◦E eine inverse Abbildung gibt, ist diese Transformation bijektiv, also ein Isomorphismus.
Weiterhin ist F =E◦TE,F, i.e., die Matrix TE,F gibt an, wie sich die Zeile der Basisvektoren von F aus der Zeile der Basisvektoren von E ergibt. Dies ist der einfachste Fall einer kovarianten Transformation, der Basisvektor E ist der Prototyp eines kovarianten Vektors.
Betrachten wir die Identität für einen Vektor: v=∑ieixi=Ex=∑jfjyj=Fy . Die Koordinaten der Basis F bestimmen sich aus denen der Basis E als y=F−1Ex= TF,Ex . Das ist die Inverse der Basistransformation, deshalb nennt man den Koordina- tenvektor kontravariant.
Betrachten wir die dualen Basen (E−1)∗ und (F−1)∗. Es ist wegen F=E◦TE,F auch F−1=TE,F−1◦E−1 und damit (F−1)∗= (E−1)∗◦(TF,E)∗, d.h. (TF,E)∗ ist die Transfomation(–smatrix) der dualen Basen, i.e., auch die Spalte der dualen Basis ist kontravariant.
2 Jordan’sche Normalform von Operatormatrizen
Sei V ein C –Vektorraum der Dimension n∈N . Sei f : V→V eine lineare Abbil- dung auf V (Endomorphismus). Jede Basis E= (e1, . . . ,en)von V erzeugt über die Koordinatendarstellung von f
f(ek) =
∑
n i=1eiaik
eine Matrix A∈Gl(n,C). Wird E als Isomorphismus Cn→V aufgefaßt, so ist A=E−1◦f◦E . Gesucht ist nun eine Basis, bezüglich welcher die Matrix A eine besonders einfache Form hat.
2.1 f iteriert
Wir suchen zunächst über f definierte nichttriviale Unterräume. Sei dazu 06=e1∈V ein beliebiger Vektor. Zu diesem kann man die Folge
ek:=fk(e1):= f(ek−1), k>1
konstruieren. Mit dieser Folge suchen wir jetzt das kleinste m∈N , so daß e1, . . . ,em noch linear unabhängig ist, e1, . . . ,em+1 jedoch linear abhängig. Das ist spätestens bei m=n der Fall. Damit ist zum einen mit E= (e1, . . . ,em): Cm→V der Unter- raum U :=Bild E f –invariant, enthält also die gesamte Folge(ek)k∈N, zum anderen kann em+1 als Linearkombination in U ausgedrückt werden,
vm+1=cm−1em+· · ·+c0e1, ck∈C.
In dieser Basis hat f|U die schon übersichtliche Matrixdarstellung
f◦E=E◦
0 0 . . . 0 c0
1 0 . . . 0 c1
0 1 . . . 0 c2
... . .. ...
0 0 . . . 1 cm−1
2.2 Faktorisierung
Sei p(t):=tm+cm−1tm−1+· · ·+c1t+c0, dann ist p(f)e1=0 , wobei im konstanten Term die identische Abbildung IV auf V hinzuzufügen ist =⇒ ker p(f)3e1. Lemma 1
Es ist U⊂ker p(f), i.e., für jedes v∈U gilt p(f)(v) =0
Beweis: Es ist v=α0e1+·· ·+αm−1em=a(f)(e1), wobei a(t) =α0+α1t+· · ·+ αm−1tm−1. Polynome in f kommutieren, damit ist
p(f)(v) =p(f)a(f)(v0) =a(f)p(f)(v0) =0.
# Nun besitzt p nach dem Fundamentalsatz der Algebra eine Zerlegung als Produkt von Linearfaktoren,
p(t) = (t−λ1)· · ·(t−λm),
insbesondere gibt es zu jeder Nullstelle λk ein Polynom pk mit p(t) = (t−λk)pk(t).
Es gilt
• Da IV und f vertauschbar sind, ist auch p(t) = (f−λ1IV)· ··(f−λmIV),
• (f−λkIV)pk(f)e1=0 ,
• pk(f)e16=0 , da sonst e1, . . . ,em linear abhängig wären,
• wk:=pk(f)v0∈U erfüllt also f(wk) =λkwk. Definition 2
Ein Vektor v aus dem K–Vektorraum V heißt Eigenvektor zum Eigenwert λ von f : V→V, falls f(v) =λv.
Bemerkung 3
Das ist äquivalent zur Aussage v∈ker(f−λIV).
Damit ergibt sich eine weiter vereinfachte Form der Matrix Satz 4
Sind λ1, . . . ,λm paarweise verschiedene Eigenwerte von f mit Eigenvektorene1, . . . ,em,
so sind diese linear unabhängig und f hat aufU=BildE die Matrixdarstellung
f◦E=E◦diag(λ1, . . . ,λm) =E◦
λ1 0 . . . 0
0 λ2
... . .. ...
0 . . . λm
Beweis: Angenommen, es bestünde eine lineare Abhängigkeit, d.h. es gäbe Zahlen at= (α1, . . . ,αm) mit
E a=α1e1+·· ·+αmem=0
Wenden wir auf beiden Seiten mehrfach f an und beachten, daß die ek Eigenvekto- ren sind, so ergibt sich
fs(E a) =λ1sα1e1+· ··+λmsαmem=0, ∀k∈N.
Das heißt letztendlich, daß für jedes Polynom q∈C[T] gilt
∑
kq(λk)αkek=0.
Da es jedoch unter diesen Polynomen auch solche gibt, die an allen Stellen λk bis auf ein λi verschwinden, muß αiik=0 für jedes i=1, . . . ,m gelten, nach Voraus-
setzung also αi=0 . #
2.3 Mehrfache Nullstellen
Betrachten wir folgendes Beispiel: f :=
λ 1 0 λ
: C2→C2 mit v0= 0
1
, v1= 1
λ
, v2= 2λ
λ2
. Es ist v2−2λv1=−λ2v0, also p(t) = (t−λ)2. Nun ist zwar (f−λI2)v0=
1 0
ein Eigenvektor mit Eigenwert λ, aber es ist der einzige nach obigem Rezept erhältliche Vektor. Wir müssen die Basis noch um v0 ergänzen, um den von den vk aufgespannten Unterraum zu erhalten.
Satz 5
Sei p das minimale normierte Polynom zu v∈V mit p(f)v=0. Unter Beach- tung der Vielfachheiten ist p(t) =∏Mi=1(t−λi)mi, wobei ∑Mk=1mi=m und die λi
paarweise verschieden sind.
Dann bilden die Vektoren
E= (E1, . . . ,EM), Ek= (ek,1, . . . ,ek,mk)
mit ek,1:=∏i6=k(f−λiIV)mi(v), ek,p= (f−λkIV)p−1(ek,1) eine Basis vonU. Beweis: Zu zeigen ist die lineare Unabhängigkeit, aus der Dimensionsbetrachtung folgt dann die Basiseigenschaft. Es ist für p<mk
f(ek,p) = (f−λkIV)(ek,p) +λkek,p=vk,p+1+λkvk,p
Es ist also
f(Ekak) =f(
∑
j
ek,jαk,j) = (vk,1, . . . ,vk,mi)(λkImk+Nmk)(αk,1, . . . ,αk,mk)t,
wobei Imk = ((δij)) und Nmk = ((δi+1j)). Es sei daran erinnert, daß (Nmk)l = ((δi+lj)), damit (Nmk)l=0 für n≥mk (ÜA). Damit ist dann
fr(Ekak) =Ek(λkImk+Nmk)rak
=Ek
∑
s
r s
λr−sk (Nmk)sak
=
∑
s
1
s!r(r−1). . .(r−s+1)λrk−sEk(Nmk)sak
Ist 0=∑k,jαk,jvk,j=∑kEkak, so ist damit auch für jedes Polynom q
0=
∑
k,s
1
s!q(s)(λk)vk(Nmk)sak
Damit muß aber für jedes s und jedes k gelten 0=Ek(Nmk)sak und damit wieder
ak=0 . #
2.4 Charakteristisches Polynom und Normalform
Suchen optimale Startvektoren, die verallgemeinerte Eigenvektoren mit möglichst großem Unterraum sind. Weiter wie in jeder anderen Ausführung.
Satz 6
Die Summe der UnterräumeUλ=ker(f−λIV)n ist V und ist direkt, i.e., paarweise Schnitte sind immer {0}.
2.5 Beispiel 1
Justus im Forum von matheplanet.com : “Jordansche Basis”
Sei f : C5→C5 gegeben durch die Matrix in kanonischer Basis
A=
−3 1 −3 −2 −2
0 −2 1 0 0
1 0 0 1 1
1 0 1 0 1
1 0 1 1 0
.
Das charakteristische Polynom ist χA(λ) =−(λ+1)5, deshalb muß der Kern der Potenzen von B :=A−(−1)Id betrachtet werden.
B=
−2 1 −3 −2 −2
0 −1 1 0 0
1 0 1 1 1
1 0 1 1 1
1 0 1 1 1
ker B=Span
−1 1 1 0 0
,
−1 0 0 1 0
,
−1 0 0 0 1
, im B=Span
−3 1 1 1 1
,
1
−1 0 0 0
B2=
−3 −3 0 −3 −3
1 1 0 1 1
1 1 0 1 1
1 1 0 1 1
1 1 0 1 1
ker B2=Span
−1 1 1 0 0
,
−1 0 0 1 0
,
−1 0 0 0 1
,
1
−1 0 0 0
, im B2=Span
−3 1 1 1 1
Die Erzeugenden wurden so gewählt, daß offensichtlich
ker B∩im B=Span{v2= (−3,1,1,1,1)t} ist und der kanonische Vektor v0=e2 die Bildräume erzeugt.
Wir erhalten dim ker B=3 , also geometrische Vielfachheit 3 , also drei Jordan- blöcke. Um auf Dimension 5 zu kommen, müssen diese Blöcke Dimensionen 1,2,2 oder 1,1,3 haben. Im ersten Fall wäre dim ker B2=5 , im zweiten 4 , offensicht- lich tritt hier zweite Fall ein. Die Basis für den 3 –dimensionalen Block ist v0=e2, v1=Bv0, und v2=Bv1=B2v0, die Erzeugenden der anderen beiden Blöcke sind jetzt zwei beliebige der Erzeugenden von ker B (liefert immer eine Basisergänzung zu v1= (1,−1,0,0,0)t).
3 Symmetrische Matrizen
3.1 Bilinearformen
Abbildung b : V×V→K , linear in erstem und zweiten Argument.
b erzeugt eine Abbildung b]: V→V∗, indem v die lineare Abbildung b](v): V→ K : w→b(v,w) zugeordnet wird. Ist b] bijektiv, so heißt b nicht ausgeartet. In diesem Fall sei die Inverse als b[:= (b])−1 bezeichnet.
Sei g eine nicht ausgeartete Bilinearform, b eine allgemeine. Dann definiert f :=
g[◦b] einen Endomorphismus auf V , der wieder auf Normalform gebracht werden kann.
3.2 Symmetrische Bilinearformen
Seien g , b wie oben und symmetrisch. Dann gilt für Eigenvektoren e1,e2von f zu Eigenwerten λ16=λ2
b(e1,e2) =λ1g(e1,e2) =b(e2,e1) =λ2g(e2,e1), e1 und e2 sind also bezüglich g orthogonal.
3.3 Anwendung
Festkörpermechanik: Bauen starren Körper aus einzelnen Massepunkten um die 0∈ R3, Punktmasse mi am Punkt qi. Eine Bewegung ist gegeben durch eine Drehung A(t) dieses Gebildes um die Null und nachfolgende Verschiebung um x(t). Dabei ist
qi(t) =A(t)qi+x(t), q˙i(t) =A(t)q˙ i+x(t).˙
Üblicherweise setzt man ˙A(t) =: A(t)W(t), damit ergibt sich aus A(t)tA(t) =Id nach Ableiten, daß W antisymmetrisch ist, W(t)t+W(t) =0 , parametrisiert als W=
0 −w3 w2 w3 0 −w1
−w2 w1 0
, so daß W x=w×x . Die kinetische Energie bestimmt sich nun als
2T=
∑
i
mikq˙i(t)k2=
∑
i
mi kW(t)qik2+2hA(t)W(t)qi,x(t˙ )i+kx(t)˙ k2
Es erweist sich also als sinnvoll, von vornherein auf ∑imiqi=0 zu bestehen, was auch als Schwerpunktsystem bezeichnet wird, da der Schwerpunkt (bei Konstruk- tion) im Ursprung liegt, als auch, die Bilinearform des ersten Terms als solche zu bezeichnen und zu diagonalisieren. Widmen wir dieser noch einige Betrachtungen.
Die Wirkung einer antisymmetrischen 3×3 –Matrix auf einen Vektor läßt sich als Kreuzprodukt darstellen, W q=w×q , damit die Norm dieses Ausdrucks als
kw×qk2=hw×q,w×qi=kwk2kqk2− hw,qi2=hw,(kqk2Id−qqt)wi
Die symmetrische Matrix in der kinetischen Energie wird also M :=
∑
i
mi(kqik2Id−qiqti)
Da wir es mit geometrische Konstellationen zu tun haben, suchen wir eine Drehung der Ausgangslage, unter welcher gilt: M=diag(λ1,λ2,λ3).