• Keine Ergebnisse gefunden

Aufgabe 42 (Output entziffern)

N/A
N/A
Protected

Academic year: 2021

Aktie "Aufgabe 42 (Output entziffern)"

Copied!
20
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Dr. Marcel Dettling 23.06.2010

Dr. Daniel Haase FS 2010

daniel.haase@math.ethz.ch

Grundlagen der Mathematik II (LVA 401-0622-00 U)

L¨ osung 14

(Ferienserie)

Aufgabe 40 (Lineare Gleichungssysteme)

Berechne das Inverse der Matrix

A =

2 1 0 0 3 5 1 1 1

per Hand. Bestimme ihre Determinante (mit der Laplaceregel), einen Eigenwert und einen zugeh¨origen Eigen- vektor.

L¨osung

Diese Aufgabe kann man l¨osen, indem man das Invertierungsverfahren aus der ¨Ubung anwendet, d. h. indem man die drei linearen GleichungssystemeAx=ei f¨ur die Standardbasisvektorene1, e2, e3 simultan l¨ost:

A I

2 1 0 1 0 0

0 3 5 0 1 0

1 1 1 0 0 1

0 −1 −2 1 0 −2

0 3 5 0 1 0

1 1 1 0 0 1

0 1 2 −1 0 2

0 3 5 0 1 0

1 1 1 0 0 1

0 1 2 −1 0 2

0 0 −1 3 1 −6

1 0 −1 1 0 −1

0 1 2 −1 0 2

0 0 1 −3 −1 6

1 0 −1 1 0 −1

0 1 0 5 2 −10

0 0 1 −3 −1 6

1 0 0 −2 −1 5

1 0 0 −2 −1 5

0 1 0 5 2 −10

0 0 1 −3 −1 6

Also istAinvertierbar mit

A−1 =

−2 −1 5

5 2 −10

−3 −1 6

 . Die Determinante ist

2 1 0

0 3 5

1 1 1

Zeilen I−2III=

0 −1 −2

0 3 5

1 1 1

Laplace

=

Spalte I 1·(−1)3+1·

−1 −2

3 5

= (−5−(−6)) = 1.

(2)

Das charakteristische Polynom ist f(λ) =

2−λ 1 0

0 3−λ 5

1 1 λ−1

Spalten

=

I−(2λ)II

0 1 0

−λ2+ 5λ−6 3−λ 5

−1 +λ 1 λ−1

Laplace

=

Zeile I 1·(−1)1+2·

−λ2+ 5λ−6 5

−1 +λ λ−1

= −

(−λ2+ 5λ−6)(λ−1)−5(−1 +λ)

= λ3−6λ2+ 16λ−11.

Von diesem Polynom kann man beispielsweise die Nullstelleλ= 1 raten, dies ist dann ein Eigenwert vonA. Ein zugeh¨origer Eigenvektor entsteht als L¨osung des linearen Gleichungssystems

(A−λI)x = 0.

Die zu diesem System geh¨orende Matrix bringen wir auf Zeilenstufenform (die rechte Seite 0 lassen wir dabei weg):

A−λI =

λ=1

1 1 0 0 2 5 1 1 0

III−I

−→

1 1 0 0 2 5 0 0 0

 .

Wir haben einen freien Parameter tin der dritten Spalte, und zwei Pivots in den anderen Spalten. Die zweite Zeile 2x2+ 5t = 0 f¨uhrt aufx2=−52·t. Die erste Zeilex1+x2=x152t= 0 f¨uhrt aufx1= 52t, also ist die L¨osungsmenge des Systems

L =

 x1 x2 x3

 : (A−I)x= 0

=

5 2t

52t t

 : t∈R

und wir erhalten f¨ur jede Wahlt ∈ Reine L¨osung, d. h. einen Eigenvektor von A zum Eigenwertλ= 1. Die einfachste Wahlt= 2 f¨uhrt auf den Eigenvektor

x =

 5

−5 2

.

Aufgabe 41 (Ein großes LGS)

Gegeben sei das lineare Gleichungssystem

4 0 2 −6 −1

4 0 −2 6 1

4 4 1 7 −1

10 15 7 22 −5

−20 −30 −14 −44 10

·x =

 2 6 13 46

−92

uber den reellen Zahlen. Bringe die augmentierte Matrix auf Zeilenstufenform, bestimme den Rang sowie eine¨ Basis des Vektorraums, der von den Zeilen der Matrix erzeugt wird. Entscheide, ob das LGS l¨osbar ist, und bestimme mit Hilfe der Kurzanleitung aus der ersten Woche die allgemeine L¨osungsmenge des Systems.

L¨ose diese Aufgabe per Hand (es treten allerdings Br¨uche auf).

L¨osung

Zun¨achst bringen wir die augmentierte Matrix auf Zeilenstufenform:

4 0 2 −6 −1 2

4 0 −2 6 1 6

4 4 1 7 −1 13

10 15 7 22 −5 46

−20 −30 −14 −44 10 −92

II,III−I

−→

4 0 2 −6 −1 2

0 0 −4 12 2 4

0 4 −1 13 0 11

10 15 7 22 −5 46

−20 −30 −14 −44 10 −92

(3)

V+2IV

−→

4 0 2 −6 −1 2

0 0 −4 12 2 4

0 4 −1 13 0 11

10 15 7 22 −5 46

0 0 0 0 0 0

I,II : 2

−→

2 0 1 −3 −12 1

0 0 −2 6 1 2

0 4 −1 13 0 11

10 15 7 22 −5 46

0 0 0 0 0 0

IV−5I

−→

2 0 1 −3 −12 1

0 0 −2 6 1 2

0 4 −1 13 0 11

0 15 2 37 −52 41

0 0 0 0 0 0

III : 4

−→

2 0 1 −3 −12 1

0 0 −2 6 1 2

0 1 −14 134 0 114 0 15 2 37 −52 41

0 0 0 0 0 0

IV−15III

−→

2 0 1 −3 −12 1

0 0 −2 6 1 2

0 1 −14 134 0 114 0 0 2344745214

0 0 0 0 0 0

IV+238II

−→

2 0 1 −3 −12 1

0 0 −2 6 1 2

0 1 −14 134 0 114 0 0 0 112 38 112

0 0 0 0 0 0

Permutation

−→

2 0 1 −3 −12 1 0 1 −14 134 0 114

0 0 −2 6 1 2

0 0 0 112 38 112

0 0 0 0 0 0

 .

Wir lesen ab: Der Rang istr= 4, das ist auch die Dimension des von den Zeilen vonAerzeugten Vektorraums.

Das Gleichungssystem ist l¨osbar, weil in jeder Nullzeile der Zeilenstufenform auch eine Null auf der rechten Seite steht. Die vier ersten Zeilen der letzten Matrix erzeugen den gleichen Vektorraum wie alle Zeilen von A (weil die letzte Zeile eine Nullzeile ist und nichts beitr¨agt), eine Basis dieses Raums ist also

 2 0 1

−3

12

 ,

 0 1

14

13 4

0

 ,

 0 0

−2 6 1

 ,

 0 0 0

11 23 8

 .

Diese Vektoren bilden eine Basis, weil sie linear unabh¨angig sind (das folgt aus der Zeilenstufenform), und weil sie den Zeilenraum vollst¨andig erzeugen (denn wir wissen wegen r = 4 schon, dass vier linear unabh¨angige Vektoren dazu gen¨ugen). Die Dimension des L¨osungsraums des SystemsAx=b istk=n−r= 5−4 = 1, wir haben eine spezielle L¨osungx(0) und eine homogene L¨osung x(1) abzulesen, der gesamte L¨osungsraum ist dann von der Form L=

x(0)1x(1) : λ∈R .

Wir lesen die spezielle L¨osung ab: Es gibt eine Unbestimmtex5, da Spalte 5 kein Pivot hat. Wir setzenx5= 0 ein damit die Rechnung einfach wird:

• Einsetzen in Zeile IV ergibt 112x4= 112, alsox4= 1.

• Einsetzen in Zeile III ergibt−2x3+ 6·1 = 2, alsox3= 2.

• Einsetzen in Zeile II ergibtx212+134 =114, alsox2= 0.

• Einsetzen in Zeile I ergibt 2x1+ 2−3 = 1, alsox1= 1.

Eine spezielle L¨osung des linearen Gleichungssystems ist also

x(0) =

 1 0 2 1 0

 .

Nun berechnen wir eine L¨osungx(1)des homogenen SystemsAx= 0. Es gibt wieder eine Unbestimmtex5wegen des fehlenden Pivots. Die triviale L¨osung x(1)= 0 k¨onnen wir nicht nehmen (ist nicht linear unabh¨angig), also fangen wir diesmal mit der Wahlx5= 1 an.

• Einsetzen in Zeile IV ergibt 112x4+38 = 0, alsox4=−443.

• Einsetzen in Zeile III ergibt−2x3−6·443 + 1 = 0, alsox3=1344.

(4)

• Einsetzen in Zeile II ergibtx214·1344134 ·443 = 0, also x2= 1344.

• Einsetzen in Zeile I ergibt 2x1+1344+ 3·44312= 0, also x1= 0.

Ein m¨oglicher L¨osungsvektor des homogenen Systems ist somit

x(1) =

 0

13 44 13 44

443

1

 .

Jedes lineare Vielfache dieses Vektors ist auch eine homogene L¨osung, man kann auch das 44-fache

 0 13 13

−3 44

nehmen wenn man Br¨uche vermeiden m¨ochte (das darf man aber nicht mit der inhomogenen L¨osungx(0) ma- chen).

Die L¨osungsmenge des GleichungssystemsAx= 0 ist dann

L =









 1 0 2 1 0

 +λ

 0 13 13

−3 44

: λ∈R









 .

Aufgabe 42 (Output entziffern)

Betrachte das NB-File zu Serie 14 von der Homepage. Darin wurde eine lineare Regression mit den gegebenen Daten in Mathematica ausgef¨uhrt. Lies Dir die Mathematica-Hilfe zum Befehl LinearModelFitdurch, beant- worte dann anhand des Outputs die folgenden Fragen:

(a) Wie lautet die vonMathematicagefundene Regressionsgleichung?

(b) Welche Residuen hat diese Gleichung f¨ur die Daten? Welcher Parameter ist am besten gesch¨atzt?

(c) WelchenY-Wert sagt das Modell f¨ur (x(1), x(2), x(3)) = (2,3,4) voraus?

(d) Die Koeffizienten ˆβj aus dem Output sind wie alle Sch¨atzer unsicher. Bestimme ein Intervall um βˆ0, das 95% der Wahrscheinlichkeitsmasse (bzgl. der N(0,1)-Verteilung) enth¨ahlt. Verwende bei der Standardisierung die in der Parametertabelle angegebene Standardabweichung.

L¨osung Der Output ist

(5)

Wir haben also eine lineare Regression mit 3 AusgangsvariablenX1, X2, X3, einer ZielvariableY die linear von diesen abh¨angen soll, sowie 5 Datens¨atze.

Zu a): Die Regressionsgleichung kann man entweder direkt von der Ausgabe des Befehls BestFit ablesen, oder aus derestimate-Spalte der Parametertabelle:

Y = 0.375 + 1.125X1 − 0.875X2 + 1.75X3. Zu b): Die Residuen wurden durch den Befehl FitResidualsberechnet:

r1 = −0.5 , r2 = 0.5 , r3 = 0.5 , r4 = −0.5 , r5 = 1.77·10−15 ≈ 0.

Das Residuum f¨ur den f¨unften Datensatz ist in Wirklichkeit Null, der Wert 10−15 kommt durch Rechenun- genauigkeiten in Mathematica zustande. Am besten Gesch¨atzt ist der Parameter ˆβ2, der Koeffizient von X2, denn er hat in der Parametertabelle die kleinste Standardabweichung bzw. den kleinstenP-Wert. Die Residuen haben damit nichts zu tun: sie geben an wie gut die f¨unf Datens¨atze zum Modell passen, und nicht wie gut die 4 Parameter gesch¨atzt sind.

Zu c): Die Vorhersage des Modells entsteht, indem man die Ausgangswerte x1 = 2, x2 = 3 und x3 = 4 in die Regressionsgleichung einsetzt:

y = 0.375 + 1.125·2 − 0.875·3 + 1.75·4 = 7.

Zu d): Die Abszisse β0 der Regressionsgleichung ist eine Zufallsvariable, die von den gezogenen Datenwerten abh¨angig ist. F¨ur die f¨unf konkret vorliegenden Datens¨atze bekommt man den konkreten Sch¨atzwert ˆβ0= 0.375.

Um diesen Wert sollen wir ein Intervall I legen, so dassP(β ∈ I) = 95% ist bzgl. der Normalverteilung. Die Variable β0 ist noch nicht standardnormalverteilt, ihre Standardisierung (so dass der Intervallmittelpunkt ˆβ0

ist) lautet

Z = β0−βˆ0 ˆ

σ = β0−0.375 1.65 .

Dabei wurde die (gesch¨atzte) Standardabweichung ˆβ0 = 1.65 aus der zweiten Spalte der Parametertabelle abgelesen. Diese ber¨ucksichtigt (beiMathematica) bereits die Stichprobenzahl, man muss also nicht zus¨atzlich durch √

n dividieren. Laut Aufgabe ist die Normalverteilung einzusetzen (was eigentlich unzul¨assig ist, da ˆσ

(6)

gesch¨atzt wurde und die Stichprobenzahl viel zu klein ist, aber darum geht es in dieser Aufgabe nicht):

95% = 0.95 =! P(−a≤Z≤a) = Φ(a)−Φ(−a) = 2Φ(a)−1

f¨ur die Verteilungsfunktion Φ(z) der Standardnormalverteilung. Aus der Tabelle (oderMathematica) liest man den Quantilswerta= 1.96 ab. Diesen Wert m¨ussen wir vonZ aufβ0umrechnen:

95% = P(−1.96≤Z≤1.96) = P

−1.96 ≤ β0−0.375

1.65 ≤ 1.96

= P(−2.859≤β0≤3.609). Also ist das gesuchte Intervall I = [−2.859,3.609]. Gemessen am eigentlichen Wert ˆβ0 ist es sehr breit: die kleine Stichprobenzahl f¨uhrt dazu, dass der Sch¨atzwert ˆβ0 nicht sonderlich vertrauensw¨urdig ist.

Aufgabe 43 (Hypothesentest mit St¨ orenfried)

Eine Zufallsvariable X seiN(µ,4)-verteilt mit unbekanntem Mittelwert µund bekannter Standardabweichung σ(X) = 2. Eine Testreihe ergibt die folgenden Werte:

0 , 1 , −1 , 2 , 3 , 2 , 2 , 3 , 120 , 0 , 2.

Berechne ein Annahmeintervall f¨ur ¯X beim Test der NullhypotheseH0:µ= 1 gegen die AlternativeHA: µ6= 1 auf dem Signifikanzniveauα= 10% unter der gegebenen Standardabweichung, sowie das Annahmeintervall unter der Annahme, dasσfehlerhaft ist und daher aus der Stichprobe gesch¨atzt werden muss. Wie interpretiert man diese Tests?

L¨osung

Annahmeσ(X) = 2:

Die standardisierte Testvariable ist

Z =

X¯−µ0

σ/√

n ∼ N(0,1),

sie hat die kumulative Verteilungsfunktion Φ der Standardnormalverteilung. Die Konfidenzgleichung lautet P(−a < Z < a) = 90% = 0.9,

das ist gleichbedeutend mit Φ(a)−Φ(−a) = 0.9 oder (durch Verwendung von Φ(−a) = 1−Φ(a)) mit 2Φ(a)−1 = 0.9, also Φ(a) = 0.95. Nachschlagen in der Tabelle ergibt a= 1.645, die Konfidenzgleichung ist

0.9 = P(−1.645< Z <1.645) = P

−1.645 <

X¯−µ0

2/√

11 < 1.645

= P

−1.645 < X¯ −1

0.603 < 1.645

= P(0.008<X <¯ 1.992).

Das Annahmeintervall f¨ur das Stichprobenmittel ¯X ist somit [0.008,1.992]. F¨ur den konkreten Mittelwert mit St¨orenfried

¯ x = 1

11(0 + 1−1 + 2 + 3 + 2 + 2 + 3 + 120 + 0 + 2) = 134

11 ≈ 12.18 lehnt der Test H0 erwartungsgem¨aß ab.

Annahmeσ(X) unbekannt:

Bei unbekannter Standardabweichung muss man stattσdie Sch¨atzung ˆσaus der Stichprobe verwenden:

(ˆσ)2 = 1 n−1

n

X

k=1

(x−x)¯ 2 = 1

10 (0−12.18)2+ (1−12.18)2+ (−1−12.18)2+ (2−12.18)2+ (3−12.18)2 +(2−12.18)2+ (2−12.18)2+ (3−12.18)2+ (120−12.18)2+ (0−12.18)2+ (2−12.18)2

≈ 1280.36 also ˆσ ≈ 35.79. Da das wahre σ nicht bekannt und n viel zu klein ist, muss der t-Test anstelle des z-Tests verwendet werden. Die standardisierte Testvariable f¨ur diesen Test ist

T =

X¯ −µ0 ˆ σ/√

n =

X¯ −1 35.79/√

11 = X¯ −1

10.791 ∼ tn−1 mit der Konfidenzgleichung

P(−a < T < a) = 90% = 0.9 ⇔ 2F(a)−1 = 0.9 ⇔ F(a) = 0.95

(7)

wobei F die kumulative Verteilungsfunktion der t-Verteilung mitn−1 = 10 Freiheitsgraden ist. Nachschlagen in der Tabelle ergibt den Wert a= 1.812, die Konfidenzgleichung ist

0.9 = P(−1.812< T <1.812) = P

−1.812 <

X¯ −1

10.791 < 1.812

= P(−18.553<X <¯ 20.553). Der Annahmebereich ist hier also [−18.553,20.553]. Das gezogene Stichprobenmittel ¯x= 12.18 ist hier enthal- ten, also beh¨alt dieser TestH0 bei.

Interpretation: Der gemessene Wert x = 120 unter der Annahme σ(X) = 2 zieht das Stichprobenmittel so weit hoch, dass es aus dem Annahmebereich herausf¨allt. Die Annahme σ = 2 bedeutet informell, dass der Wert 120nicht als Messfehler interpretiert werden kann, da Messfehler nur im Bereich±2 wahrscheinlich sind.

Folglich muss der wahre Mittelwertµhoch sein. Es ist also einfach wahrscheinlicher, dass unsere Nullhypothese falsch ist und die 10 kleinen Werte nur Zufall waren, als dass ein einziger Wert so extrem falsch ist. Folgerichtig wirdH0abgelehnt.

Falls die Standardabweichung als unbekannt angenommen wird sieht die Interpretation ganz anders aus: jetzt zieht der Unterschied zwischen dem St¨orenfried und den 10 kleinen Werten die Standardabweichung hoch: der St¨orenfried wird also korrekt als Messfehler interpretiert, folglich reicht ¯x= 12.18 nicht aus, um H0 zu wider- sprechen. Dabei zahlt man aber einen Preis: Wenn es m¨oglich ist dass ein derart hoher Messfehler auftritt, ist das ganze Experiment an sich unsicher, das Annahmeintervall ist daher recht breit.

Aufgabe 44 (Verschiedene Stichprobenzahl)

Zwei Zufallsvariablen X und Y seien jeweils normalverteilt mit unbekannten Mittelwerten µX undµY, sowie gleicher bekannter Standardabweichung σ(X) =σ(Y) = 3. Gegeben seien die Stichproben

(x1, x2, x3) = (10,11,12) , (y1, y2, y3, y4, y5) = (2,3,1,2,1)

verschiedener L¨ange. Entscheide die NullhypotheseH0: µX−µY = 9 gegen die AlternativeH0: µX−µY 6= 9 auf dem 5%-Niveau. Berechne auch den P -Wert und interpretiere ihn: wie knapp war die Testentscheidung?

L¨osung

Da die gemeinsame Standardabweichungσ= 2 vorgegeben ist darf man einenz-Test verwenden. Die standar- disierte Testvariable f¨ur die Differenz ∆ =µX−µY zweier unbekannter Mittelwerte ist

Z =

∆¯ −∆0 qσ21

n1 +σn22

2

=

∆¯ −9 q9

3+95

=

∆¯ −9 2.19 . Die beiden Sch¨atzer f¨ur die Mittelwerte sind

¯ x1 = 1

3(10 + 11 + 12) = 11.00 , x¯2 = 1

5(2 + 3 + 1 + 2 + 1) = 1.80. Der Sch¨atzer f¨ur ihre Differenz ist dann ˆ∆ = ¯x1−x¯2= 9.20. Die Teststatistik ergibt sich zu

z = 9.20−9

2.19 = 0.091.

Auf dem 5%-Niveau ist das Annahmeintervall stets [−1.96,1.96], der Test entscheidet also f¨urH0. Der P -Wert zum Test ist

P = 2P(Z≥ |z|) = 2P(Z≥0.091) = 2(1−Φ(0.091)) = 2(1−0.5359) = 93%.

Dies ist ein so extrem hoher P -Wert, dass die Testentscheidung f¨urH0 kaum zu vermeiden ist: man m¨usste ein l¨acherliches Signifikanzniveau von 93% w¨ahlen, damit die Stichprobe H0 widerlegt. Das liegt an der niedrigen Stichprobenzahl: sie verursacht eine zu grosse Unsicherheit. Um H0 zu widerlegen muss ¯∆ extrem weit von

0 = 9 entfernt sein. Oder der Stichprobe wird durch hohes Niveau α eine so grosse Signifikanz k¨unstlich zugebilligt, dass auch ein kleiner Abstand ausreicht.

(8)

Aufgabe 45 (Lineare Regression)

Bestimme eine Regressionsebene y=β(0)(1)x(1)(2)x(2) f¨ur die Datenwerte Stichprobe 1 2 3 4 5

Y 0 0 1 1 0

X(1) 2 1 2 1 2

X(2) -1 0 1 2 3

Bestimme die Residuen dazu. Verwende f¨ur die RechnungMathematica, die entsprechenden Befehle finden sich in dem File zu Aufgabe 42. Die Datentupel werden in der Form (x(1), . . . , x(n), y) definiert.

L¨osung

Die entsprechendenMathematica-Kommandos lauten

Im FS2009 war diese Aufgabe auf der Ferienserie per Hand zu l¨osen. Hier die Rechnung dazu (diese Rechnung ist nicht relevant f¨ur die Pr¨ufung 2010):

Wir nehmen eine lineare Abh¨angigkeit der Form

y = β(0)(1)X(1)(2)X(2)

an, und wollen dazu die Sch¨atzer ˆβj der Koeffizienten βj ausrechnen. Die Methode der kleinsten Quadrate bestimmt diese Werte so, dass der (quadratische) Abstand der Messdaten zur gefundenen Gleichung minimal ist. Dazu stellen wir die Matrix X auf: Jede Zeile geh¨ort zu einem Datensatz aus den Messdaten, und ist von der Form (1x1· · ·xk), wobeik= 2 hier die Anzahl der Steigungskoeffizientenβjist. Die 1 am Anfang der Zeile geh¨ort zum Abschnittskoeffizientenβ0. Einsetzen der Messdaten liefert

X =

1 2 −1

1 1 0

1 2 1

1 1 2

1 2 3

 .

(9)

Die Messwerte der Zufallsvariablen Y tragen wir in den Vektor

y =

 0 0 1 1 0

ein. Angenommen die lineare Abh¨angigkeit ist richtig, und β0, β1, β2 sind die richtigen Koeffzienten, dann gilt X·β=yals lineares Gleichungssystem. Nun ist die Abh¨angigkeit aber nicht sicher, und die Koeffizienten kennen wir nicht, also l¨osen wir statt des LGS Xβ =y das Kleinste-Quadrate-System (XTX)β =XTy, denn dieses hat immer eine L¨osung, die der

”echten“ L¨osung am n¨achsten kommt. Das kann man nun machen, indem man XTX invertiert und auf die andere Seite bringt, oder indem man das System auf Zeilenstufenform bringt und eine spezielle L¨osung abliest (die dann, weil XTX regul¨ar ist, auch die einzige L¨osung des Systems ist). Wir berechnen erstmal

XT·X =

1 1 1 1 1

2 1 2 1 2

−1 0 1 2 3

·

1 2 −1

1 1 0

1 2 1

1 1 2

1 2 3

=

5 8 5

8 14 8 5 8 15

 .

Wir rechte Seite des Kleinste-Quadrate-Systems ist

XT ·y =

1 1 1 1 1

2 1 2 1 2

−1 0 1 2 3

·

 0 0 1 1 0

=

 2 3 3

 ,

wir haben also das LGS

5 8 5

8 14 8 5 8 15

·β =

 2 3 3

zu bearbeiten, und wir wissen schon dass es nur genau einen L¨osungsvektor gibt. Umformen der augmentierten Matrix ergibt

5 8 5 2

8 14 8 3

5 8 15 3

Elimination Spalte 1−→

5 8 5 2

0 65 0 −15

0 0 10 1

 .

Diese Matrix hat schon Zeilenstufenform, und wir lesen

βˆ =

17 30

16

1 10

ab. Das sind die Sch¨atzer der linearen Gleichung:

βˆ0 = 17

30 , βˆ1 = −1

6 , βˆ2 = 1 10 und die Regressionsebene lautet

y = 17 30−1

6x(1)+ 1 10x(2).

(10)

Die Residuen, d. h. die Fehler die wir machen wenn wir diese Gleichung als die richtige annehmen, sind

R =

 R1

R2

R3

R4 R5

= y−X·βˆ =

152

25

2 3 2 5

158

 .

Die StreuungE des linearen Modells hat die Varianz Var[E] =d 1

n−k−1

n

X

j=1

R2j = 1 5−2−1

4 225+ 4

25+4 9+ 4

25+ 64 225

= 24

45 ≈ 0.53. Die Varianz des Sch¨atzersβj ist dann

Var[βd j] = dVar[E]·xjj wobei xjj derj-te Diagonaleintrag der Matrix

(XTX)−1 =

5 8 5

8 14 8 5 8 15

−1

=

73

3043101

43 56 0

101 0 101

ist, wobei von Null ab gez¨ahlt wird. Wir erhalten Var[βd 0] = 24

45·73

30 ≈ 1.297 , Var[βd 1] = 24 45·5

6 ≈ 0.444 , Var[βd 2] = 24 45· 1

10 ≈ 0.053. Das ergibt dann die Standardabweichungen

bσ[β0] = q

Var[βd 0] ≈ 1.138 , bσ[β1] = q

Var[βd 1] ≈ 0.666 , bσ[β2] = q

Var[βd 2] ≈ 0.230. Der Koeffizientβ2 ist durch ˆβ2 gut gesch¨atzt worden, w¨ahrend die Sch¨atzung ˆβ0 eher unsicher ist.

Aufgabe 46 (Matrizenrechnerei)

Gegeben seien die folgenden Matrizen:

A = 0 1

1 0

, B =

0 0 0 1 1 1 2 2 2

 , C =

 0 1 1 1 1 0

 . Entscheide, welche der Matrizenprodukte

A·A , A·B , A·C , B·A , B·C , C·CT , CT·C , BCA , ABC , ACB

existieren, und berechne deren Ergebnis. Bestimme von A, A2,B und B2 die Eigenwerte und Eigenvektoren, sowie die Determinante.

L¨osung

Nur die folgenden Produkte existieren:

A·A = 1 0

0 1

, B·C =

 0 0 2 2 4 4

 , C·CT =

1 1 0 1 2 1 0 1 1

 , CT·C = 2 1

1 2

, B·C·A =

 0 0 2 2 4 4

. Die Determinanten sind

det(A) =

0 1 1 0

= 0−1 = −1 , det(A2) = det(I) = 1

(11)

sowie

det(B) =

0 0 0 1 1 1 2 2 2

= 0 (wegen Nullzeile) , det(B2) = det(B)2 = 0. Zur Bestimmung der Eigenwerte vonAbrauchen wir das charakteristische Polynom:

det(A−λE) =

−λ 1

1 −λ

= λ2−1 = (λ−1)·(λ+ 1).

Die MatrixAhat die Eigenwerteλ=±1, wie man es auch erwartet wenn das QuadratA2=E(Einheitsmatrix) nur den Eigenwert Eins hat. Man sieht hier sofort dass der Eigenraum zu λ=−1 erzeugt wird von

x(−1) = 1

−1

und der Eigenraum vonλ= 1 von

x(1) = 1

1

.

Das charakteristische Polynom vonB ist dagegen det(B−λE) =

−λ 0 0

1 1−λ 1

2 2 2−λ

=

Laplace (−λ)·

1−λ 1 2 2−λ

= (−λ)·((1−λ)(2−λ)−2) = −λ3+ 3λ2 = −λ2·(λ−3).

Es hat die Nullstellenλ= 0 undλ= 3. Wir bestimmen den Eigenraum zum Eigenwertλ= 0: das ist die Menge aller x∈R3 so dassBx= 0xist, also gerade die L¨osungsmenge des homogenen LGSBx= 0. Wir bestimmen es mit dem Gaußverfahren (auch wenn man es hier ebenfalls direkt sehen kann):

0 0 0 0 1 1 1 0 2 2 2 0

III−2II

−→

0 0 0 0 1 1 1 0 0 0 0 0

Permutation

−→

1 1 1 0 0 0 0 0 0 0 0 0

 .

Die augmentierte Matrix in Zeilenstufenform hat nur ein einziges Pivot in der ersten Zeile, somit Rangr= 1.

Damit ist die Dimension des L¨osungsraumsk=n−r= 2, d. h. es gibt zwei linear unabh¨angige Eigenvektoren zum Eigenwertλ= 0, also ist auch die geometrische Vielfachheit dieses Eigenwerts zwei. Das L¨osungsverfahren sieht nun wie folgt aus: die Variablen x2 undx3 sind frei, weil ihre Spalten kein Pivot haben. Die Variablex1

wird dann durch diese beiden in der ersten Zeile bestimmt. Wir wollen zwei linear unabh¨angige Vektoren, dazu setzen wir einmalx2= 0 und x3= 1, und dannx2= 1 undx3= 0 an:

(t,0,1)Zeile I−→ t+ 1 = 0 ⇒ t=−1 , (t,1,0)Zeile I−→ t+ 1 = 0 ⇒ t=−1

also sind die beiden gesuchten L¨osungsvektoren (und damit die Eigenvektoren zum Eigenwertλ= 0) x(1) =

−1 0 1

 , x(2) =

−1 1 0

.

Nun berechnen wir den Eigenraum zum Eigenwertλ= 3, das ist die L¨osungsmenge des SystemsBx= 3x, oder umgeformt (B−3E)x= 0, d. h. die L¨osungsmenge des Systems

−3 0 0

1 −2 1

2 2 −1

·x =

 0 0 0

 . Wir berechnen die Zeilenstufenform dazu:

-3 0 0 0

1 -2 1 0 2 2 -1 0

III: (−3)

−→

1 0 0 0

1 -2 1 0 2 2 -1 0

−→II−I III−2I

1 0 0 0

0 -2 1 0 0 2 -1 0

III+II

−→

1 0 0 0

0 -2 1 0

0 0 0 0

. Wie erwartet istr= 2 und damit k=n−r= 1, der Eigenraum wird von einem Eigenvektor erzeugt, ablesen ergibt beispielsweise

x(3) =

 0

1 2

1

 .

(12)

Wenn man keine Br¨uche haben will kann man auch das Doppelte

 0 1 2

nehmen. Tats¨achlich ist das ein Eigenvektor zum Eigenwertλ= 3, denn es gilt

0 0 0 1 1 1 2 2 2

·

 0 1 2

 =

 0 3 6

 = 3·

 0 1 2

 .

Mit dem gleichen Verfahren kann man die Eigenwerte und Eigenvektoren vonB2 ausrechnen, aber wenn man genau hinschaut sieht man dassB2= 3·B ist, also weiss man auch ohne Rechnung dassB2 das dreifache der Eigenwerte vonB hat:λ= 0,9. Die Eigenvektoren sind die gleichen wie f¨urB selbst, denn es gilt

B2x = B(Bx) = B(λx) = λ(Bx) = λ(λx) = λ2x f¨ur jeden Eigenvektorxzum Eigenwert λ.

Aufgabe 47 (Lineare Unabh¨ angigkeit)

Zeige, dass die Vektoren

x(1) =

 1 1 2 2

, x(2) =

 2 3 1 1

, x(3) =

 4 5 5 5

, x(4) =

 3 5 0 0

, x(5) =

 1 0 5 5

linear abh¨angig sind. Finde eine konkrete Nullkombination aus diesen Vektoren. Bestimme dann eine Basis des von diesen Vektoren erzeugten Vektorraums.

L¨osung

Eine konkrete Nullkombination istx(3)−x(4)−x(5)= 0, damit ist auch schon gezeigt dass die Vektoren linear abh¨angig sind. Es sei

U = n

λ1x(1)+· · ·+λ5x(5) : λ1, . . . , λ5∈R o

der Vektorraum, der von diesen Vektoren aufgespannt wird. Wir verwenden die Zeilenstufenform, um eine Basis vonU zu finden. Dazu schreiben wir die Vektoren als Zeilen in eine Matrix:

1 1 2 2 2 3 1 1 4 5 5 5 3 5 0 0 1 0 5 5

| {z }

Zeilen erzeugenU

Elimination

−→

Spalte 1

1 1 2 2

0 1 −3 −3

0 1 −3 −3

0 2 −6 −6

0 −1 3 3

Elimination

−→

Spalte 2

1 1 2 2

0 1 −3 −3

0 0 0 0

0 0 0 0

0 0 0 0

| {z }

Zeilen erzeugen immer nochU

.

Die letzten drei Zeilen tragen zu U nichts bei, und die ersten beiden Zeilen sind wegen der Stufe linear un- abh¨angig. Also ist eine Basis von U gegeben durch

a(1) =

 1 1 2 2

, a(2) =

 0 1

−3

−3

 .

Je nachdem wie man umgeformt hat kann man hier auch andere Basen bekommen.

Aufgabe 48 (Wahr oder falsch)

Entscheide f¨ur die folgenden Aussagen, ob sie jeweils wahr oder falsch sind. Versuche eine Begr¨undung f¨ur Deine Aussage anzugeben (durch einen kleinen Beweis, oder ein Gegenbeispiel):

(a) Es seiA eine quadratische Matrix, dann ist der Kern vonAeine Teilmenge des Kerns vonA2.

(13)

(b) Es seiA eine quadratische Matrix, dann ist das Bild vonAeine Teilmenge des Bilds vonA2.

(c) Bei einemt-Test f¨ur einen Mittelwert wird das Annahmeintervall f¨ur das Stichprobenmittel ¯X k¨urzer, wenn man die Stichprobenzahl erh¨oht und die anderen Daten gleichbleiben.

(d) Bei einem z-Test f¨ur eine Mittelwertdifferenz wird das Annahmeintervall f¨ur das Stichprobenmittel X¯ k¨urzer, wenn man das Niveauαerh¨oht und die anderen Daten gleichbleiben.

(e) IstA eine quadratische Matrix, so ist die L¨osung xder NormalgleichungATAx=ATb immer auch eine L¨osung vonAx=b.

(f) Das Produkt zweier regul¨arer Matrizen ist wieder regul¨ar.

(g) Die Summe zweier regul¨arer Matrizen ist wieder regul¨ar.

(h) Die Dichtefunktionf(x) einer stetigen Zufallsvariable erf¨ullt 0≤f(x)≤1 f¨ur allex∈R. (i) Die Verteilungsfunktion F(x) einer stetigen Zufallsvariable erf¨ullt 0≤F(x)≤1 f¨ur allex∈R. (j) SindnVektoren linear unabh¨angig, so auch jede Teilauswahl dieser Vektoren.

(k) SindnVektoren linear abh¨angig, so auch jede Obermenge dieser Vektoren.

(l) Der Interquartilsabstand einer Stichprobe ist immer gr¨oßer als ihre Standardabweichung.

(m) Der Interquartilsabstand einer Stichprobe ist immer kleiner als ihre Standardabweichung.

(n) Ist Aregul¨ar, so istAx=bf¨ur jede rechte Seitebl¨osbar.

(o) IstAnicht die Nullmatrix, so istAx=bf¨ur mindestens einb6= 0 l¨osbar.

(p) Wenn der Pearson-Korrelationskoeffizient zweier Datenreihen Null ist, sind diese linear abh¨angig.

(q) Wenn der Pearson-Korrelationskoeffizient zweier Datenreihen nicht Null ist, sind diese linear un- abh¨angig.

L¨osung

Zu a): Die Aussage ist wahr: Liegt xim Kern von A, so istAx= 0. Dann ist auch A2x=A·Ax=A·0 = 0.

Also liegt xauch im Kern von A2. Oder als Mengen Kern(A) ⊆Kern(A2). Quadrieren macht den Kern also gr¨oßer oder l¨asst ihn gleich.

Zu b): Da Kern und Bild gegens¨atzliche Mengen sind darf man vermuten, dass Quadrieren das Bild verkleinert oder gleichl¨asst, dann w¨are Aussabe (b) aber falsch. Das ist auch so: beispielsweise ist f¨ur

A = 0 1

0 0

, A2 = 0 0

0 0

das Bild vonAdie Menge 1

0 (eine Gerade), dagegen ist das Bild vonA2nur der Nullpunkt.

Zu c): Das ist richtig: Rein anschaulich erh¨oht eine h¨ohere Stichprobenzahl die Sicherheit des Tests, d. h. er wird schon bei geringeren Abweichungen zuH0ablehnen. Mathematisch sieht man das an der standardisierten Testvariable

T =

X¯ −µ0

ˆ σ/√

n .

IstI= [a, b] das Annahmeintervall f¨ur die standardisierte TestvariableT, so ist T ∈I ⇔ a≤T ≤b ⇔ σˆ

√n·a+µ0 ≤ X¯ ≤ σˆ

√n·b+µ0.

Das Annahmeintervall f¨ur T ist immer gleich, das Annahmeintervall f¨ur den Mittelwert ¯X ist dagegen σˆ

√n·a+µ0, σˆ

√n·b+µ0

.

Hier trittnim Nenner auf, es wird also k¨urzer wenn wirnerh¨ohen und alles andere unver¨andert lassen.

Zu d): Diese Aussage ist richtig, ein h¨oheres Signifikanzniveauαf¨uhrt immer zu einer h¨oheren Ablehnungswahr- scheinlichkeit d. h. zu einem kleinerem Annahmebereich, ganz egal welchen Test wir betrachten. Mathematisch sieht man das an der Annahmebedingung

Z = ∆−∆0

qσ

1

n1 +nσ2

2

! [−a, a]

(14)

wobei das Annahmeintervall f¨urZgenau die Wahrscheinlichkeitsmasse 2Φ(a)−1 = 1−αenth¨alt. Ein h¨oheresα f¨uhrt also zu einer kleineren Wahrscheinlichkeit f¨ur das Intervall, also muss es k¨urzer sein weil die Verteilungs- funktion Φ monoton ist. Damit ist auch das Annahmeintervall f¨ur die Mittelwertdifferenz ∆ = ¯X1−X¯2 k¨urzer, da es durch eine lineare Transformation aus [−a, a] entsteht. Welche Werte dabei im Nenner der Standardisie- rung stehen spielt dabei keine Rolle.

Zu e): Diese Aussage ist falsch, eine L¨osung ˆx von ATAx = Abminimiert nur den Fehler den man im Sys- tem Ax=b macht, aber es kann trotzdem ein Fehler auftreten (wenn Ax=b unl¨osbar ist), dann ist ˆx auch keine L¨osung von Ax=b. Die umgekehrte Aussage von (e) ist dagegen richtig: l¨ost ˆxdas System Ax=b, so auch das SystemATAx=ATb (weil eine exakte L¨osung immer den Fehler auf Null bringt, und damit optimal ist).

Zu f): Die Aussage ist richtig. Sind A und B regul¨ar, so ist det(A) 6= 0 und det(B) 6= 0. Dann ist auch det(AB) = det(A)·det(B)6= 0, also ist auchAB regul¨ar. Ihre Inverse istB−1·A−1.

Zu g): F¨ur die Summe ist die Aussage falsch, beispielsweise sind A =

1 0 0 1

, B = 0 1

1 0

jeweils regul¨ar, aber die Summe

A+B = 1 1

1 1

ist singul¨ar weil die Zeilen linear abh¨angig sind.

Zu h): Die Aussage ist falsch: es wird nur gefordert, dass die Masse unter der Funktion (d. h. das Integral) die Gesamtwahrscheinlichkeit Eins ergibt und dass die Funktion nicht negativ wird. Bei Integralen kann (wenn der Funktionsgraph eng genug ist) auch eine H¨ohe >1 auftreten und die Gesamtmasse trotzdem = 1 sein. Ein Beispiel ist die Gleichverteilung auf dem Intervall [0,12], die Dichtefunkion dazu ist

f(x) =

2 falls 0≤x≤12

0 sonst .

Bei diskreten Wahrscheinlichkeitsverteilungen kann das dagegen nicht eintreten: die Summe von endlich vielen Zahlen ist≤1 nur wenn alle Einzelzahlen≤1 sind (wenn es keine negativen Zahlen gibt).

Zu i): F¨ur die Verteilungsfunktion ist die Aussage dagegen korrekt, denn es gilt

F(x) =

x

Z

−∞

f(t)dt ≤

Z

−∞

f(t)dt = 1.

Zu j): Das ist richtig. Man erkl¨art es sich am besten mit der Zeilenstufenform: Schreibt man die Vektoren als Zeilen in eine Matrix, so sind sie linear unabh¨angig wenn in der Zeilenstufenform keine Nullzeilen stehen. Startet man nur mit einer Teilauswahl dieser Zeilen, so stehen einem weniger M¨oglichkeiten f¨ur die Zeilenumformungen zur Verf¨ugung, also kann man erst recht keine Nullzeile konstruieren.

Zu k): Das ist die analoge Aussage zu j): Ist es m¨oglich aus n gegebenen Zeilen eine Nullzeile zu konstruie- ren, so kann man das auch wenn man zus¨atzliche Zeilen anf¨ugt, indem man die Umformungen erstmal nur auf den ersten nZeilen ausf¨uhrt bis die Nullzeile erscheint.

Zu l) Diese Aussage ist falsch, das sieht man einfachsten an einer Stichprobe x1 < x2 < x3 < x4 < x5 mit genau 5 schon sortierten Werten. Dann ist das erste Quartil der Wert vonx2, der Median istx3, das dritte Quartil ist x4. Der Interquartilsabstand ist also x4−x2. Jetzt k¨onnen wir aberx1 und x5 auseinanderziehen um die Standardabweichung beliebig gross zu machen, w¨ahrend der Interquartilsabstand gleich bleibt.

Zu m): Auch diese Aussage ist falsch, die Standardabweichung wird klein wenn viele Datenwerte gleich sind.

(15)

Ein Gegenbeispiel dazu istx1, x2=−1,x3= 0 undx4, x5= 1 mit Mittelwert und Median Null, der Interquar- tilsabstand ist x4−x2= 2 und die Standardabweichung ist tats¨achlich kleiner:

σ = r1

4((−1−0)2+ (−1−0)2+ (0−0)2+ (1−0)2+ (1−0)2) = 1.

Zu n): Das ist richtig, die L¨osung ist dann der Vektorx=A−1·b. Man kann auch mit dem Bild argumentieren:

WennA regul¨ar ist muss der Rangrmaximal sein, das Bild vonAist also der ganze Vektorraum (der damitb enth¨alt).

Zu o): Das ist auch richtig: Wenn A nicht die Nullmatrix ist gibt es eine Spalte a in der irgend eine Kom- ponente 6= 0 steht. Dann hat das SystemAx=adie L¨osungej f¨ur denj-ten Standardbasisvektor, wobeij der Index der Spalteain Aist. Derj-te Standardbasisvektor holt gerade diej-te Spalte ausAheraus.

Zu p): Diese Aussage ist falsch. Der Pearson-Korrelationskoeffizient ist definiert als p = 1

n−1

n

X

i=1

xi−x¯ ˆ σx

·yi−y¯ ˆ σy

wobei ¯xund ˆσxdie empirischen Kenngr¨oßen der ersten Stichprobe, und ¯y und ˆσy die empirischen Gr¨oßen der zweiten Stichprobe sind. In dieser Formel kann man die empirischen Standardabweichungen aus der Summe ziehen:

p = 1

(n−1)ˆσxσˆy

n

X

i=1

(xi−x)(y¯ i−y)¯ .

Dieser Wert ist Null nur wenn die Summe Null ist. Im Gegensatz zu Varianz und Standardabweichung wird hier aber nicht ¨uber Quadrate, sondern ¨uber gemischte Terme summiert, es ist also durchaus m¨oglich dass die Summanden sich wegheben. Mit ein wenig Probieren (oder indem man ein lineares Gleichungssystem in denxi

l¨ost...) kommt man beispielsweise auf das Gegenbeispiel

x = (1,1,−2) , y = (−1,1,0). F¨urn= 2 kann man ¨ubrigens kein Gegenbeispiel finden.

Zu q): Diese Aussage ist falsch. F¨ur zwei identische Stichproben ist der Korrelationskoeffizient p = 1 (die h¨ochstm¨ogliche Korrelation: die beiden Stichproben h¨angen zu 100% voneinander ab). Diese sind aber linear abh¨angig.

Die letzten beiden Aussagen zeigen, dass der Korrelationskoeffizient nicht geeignet ist als Test f¨ur lineare Abh¨angigkeit, was schade ist weil er viel einfacher auszurechnen ist als beispielsweise die Determinante. Lei- der gibt es ein Resultat aus der Mathematik, dass die Determinante bis auf kleine Modifikationen die einzige Testfunktion ist die das leistet.

Aufgabe 49 (Die Wahrscheinlichkeitsverteilungen)

W¨ahle in jedem Aufgabenteil die Parameter zur Verteilung so, dassE(X) = 2 undσ(X) = 2 ist:

(a) X∼Bin(n, p) binomialverteilt, mit n=Versuchszahl undp=Einzelwahrscheinlichkeit f¨ur Erfolg.

(b) X∼P oi(λ) Poissonverteilt mit Parameterλ.

(c) X∼U[a, b] gleichverteilt auf dem Intervall [a, b].

(d) X∼N(µ, σ2) normalverteit mit Mittelwertµund Varianzσ2.

L¨osung

Zu a): Bei einer Binomialverteilten Zufallsariable ist E(X) = np und σ(X)2 = np(1 −p), also σ(X) = pnp(1−p). Wir haben also die Gleichungennp = 2 undnp(1−p) = 4 zu l¨osen. Daraus folgt aber 1−p= 2 was unmm¨oglich ist wegen 0≤p≤1. Es gibt keine Binomialverteilung die das leistet, die Varianz ist bei dieser

(16)

Verteilung nie gr¨osser als der Mittelwert (weil es bei nVersuchen garnicht m¨oglich ist, VariablenwerteX < 0 oderX > nzu bekommen).

Zu b): Bei der PoissonverteilungP oi(λ) ist diese Wahl auch nicht m¨oglich, weil der einzige Parameterλsowohl Mittelwert wie Varianz identisch festlegt. Die Standardabweichung ist dagegen√

λ.

Zu c): Bei der Gleichverteilung ist der Erwartungswert der Mittelpunkt des Intervalls, wir haben also [a, b] = [2−d,2 +d] f¨ur ein passendesd > 0 zu w¨ahlen. Das Intervall hat die L¨ange 2d, wegen der Normierung auf Gesamtmasse 1 ist die Dichtefunktion dann

f(x) = 1

2d falls 2−d≤x≤2 +d

0 sonst .

Die Varianz einer gleichverteilten Zufallsvariable ist

σ(X)2 = (b−a)2 12 , das ist hier

σ(X)2 = (2 +d−(2−d))2

12 = 1

3d2. Man kann sie alternativ auch direkt ¨uber das Integral ausrechnen:

σ(X)2 =

Z

−∞

(x−E(X))2f(x)dx = 1 2d

2+d

Z

2−d

(x−2)2dx = · · · = 1 3d2. Da die Varianzσ(X)2= 4 sein soll m¨ussen wird= 2√

3 w¨ahlen. Die gesuchte Verteilung ist also die Gleichver- teilung auf dem Intervall [2−2√

3,2 + 2√

3] = [−1.46,5.46].

Zu d): F¨ur die Normalverteilung kann man den Erwartungswert und die Varianz direkt durch die beiden Para- meter µundσ2vorschreiben, wir nehmen alsoN(µ, σ2) =N(2,4).

Aufgabe 50 (Lineare Transformation)

Eine Stichprobe mit 20 Datenwerten habe den Mittelwert ¯x= 1 und die Varianz s2X = 4. Eine lineare Trans- formation der gesamten VerteilungY =aX+bf¨uhrt auf den Mittelwert ¯y= 2 und die Varianzs2Y = 1. Welche Koeffizienten stehen in der Transformationsgleichung?

L¨osung

Der Mittelwert verh¨alt sich linear: ¯y =aX+b =a·x¯+b. Dagegen verh¨alt sich die Varianz quadratisch, sie ignoriert aber die Verschiebung umb:s2Y =s(aX+b)2=a2s2X. Also haben wir die beiden Gleichungen

a·x¯+b = a·1 +b = 2 , a2s2X = a2·4 = 1.

zweiten Gleichung folgta=12 odera=−12. Aus der ersten Gleichung dannb= 2−12 oderb= 2 +12. Man hat also die beiden M¨oglichkeiten (a, b) = (12,32) und (a, b) = (−12,52). Eine Streckung um einen negativen Wert ist durchaus zul¨assig.

Aufgabe 51 (Kunstoff mischen)

Ein Block aus Kunststoff soll produziert werden mit den folgenden Eigenschaften: Gewicht 950Kg, Volumen 1m3, Preis in etwa 920CHF. Zur Verf¨ugung stehen zwei Sorten verschiedener Kunststoffe:

• Polypropylen (PP, leicht aber teuer): 1m3 hat die Masse 900Kg, und kostet 2CHF pro Kilo.

• Polyethylen (PE, schwer und billig): 1m3 hat die Masse 970Kg, und kostet 1CHF pro Kilo.

(a) Modelliere die Produktion als lineares Gleichungssystem in Unbestimmten x1 (verwendete m3 PP) undx2 (verwendete m3PE), und begr¨unde warum es unl¨osbar ist.

(b) Finde Parameterx1 undx2mit der Methode der kleinsten Quadrate, so dass die Summe der Fehler- quadrate minimal wird. Welche Eigenschaften hat der produzierte Block mit diesen Parametern?

(17)

(c) Angenommen es steht noch ein dritter Ausgangskunststoff zur Mischung bereit, welche Bedingung muss er erf¨ullen damit die Produktionskriterien exakt erf¨ullt werden k¨onnen wenn man alle drei Stoffe im richtigen Verh¨altnis mischt?

(d) Angenommen man verwendet noch einen Kunststoff PX, der pro m3 900Kg wiegt aber daf¨ur 100 CHF pro Kilo kostet. Laut Teil (c) ist das lineare Gleichungssystem jetzt quadratisch und eindeutig l¨osbar, obwohl PX die gleichen Eigenschaften wie PP hat, aber viel mehr Geld kostet. Welche zentrale Eigenschaft linearer Gleichungssysteme ist zwar mathematisch korrekt, f¨uhrt aber in diesem Modell zu einem unbrauchbaren Ergebnis?

Hinweis: F¨ur die Matrizenrechnungen kann man Mathematica verwenden. Hier ist es sinnvoll, die Werte mit Nachkommastellen einzugeben (also970.0statt970), sonst entstehen in der Rechnung unsch¨one Br¨uche.

L¨osung

Zu a): Angenommen man verwendet x1 m3 PP und x2 m3 PE, dann erh¨alt man einen Block mit Volumen x1+x2m3, Gewicht 900x1+ 970x2 Kg zum Preis von 2·900·x1+ 1·970·x2 CHF. Wir lassen die Einheiten weg, und schreiben die Zeilen als lineares Gleichungssystem mit Unbestimmtenx1 undx2:

x1 + x2 = 1

900x1 + 970x2 = 950 1800x1 + 970x2 = 920

bzw.

1 1 1

900 970 950 1800 970 920

Dieses System ist ¨uberbestimmt: es hat drei Zeilen, aber nur zwei Unbestimmte. Der Gaußalgorithmus ergibt

1 1 1

900 970 950 1800 970 920

 −→

1 1 1

0 70 50

0 -830 -880

 −→

1 1 1

0 1 57

0 -830 -880

 −→

1 1 1

0 1 57 0 0 −20107

 . Die letzte Zeile des Systems ist unerf¨ullbar, also ist das System unl¨osbar.

Setzt man

A =

1 1

900 970 1800 970

 , b =

 1 950 920

 so lautet die Normalengleichung f¨ur dieses LGS

AT ·A˜x = AT ·b bzw. ˜x = (AT·A)−1·AT ·b . Ausrechnen dieser Matrizen ergibt

AT·A =

1 900 1800 1 970 970

·

1 1

900 970 1800 970

 =

4050001 2619001 2619001 1881801

(ATA)−1 =

1881801

7621296938007621296938002619001

7621296938002619001

4050001 762129693800

 , AT ·b =

1 900 1800 1 970 970

·

 1 950 920

 =

2511001 1813901

⇒ x¯ = (ATA)−1·ATb =

1881801

7621296938007621296938002619001

7621296938002619001

4050001 762129693800

·

2511001 1813901

=

1881801·2511001

7621296938002619001·1813901 762129693800

2619001·2511001

762129693800 +4050001·1813901 762129693800

 =

1881801·2511001

7621296938002619001·1813901 762129693800

2619001·2511001

762129693800 +4050001·1813901 762129693800

 ≈

−0.03 1.01

.

Der mit diesen Parametern produzierte Block hat (formal) das Volumen ˜x1 + ˜x2 = 0.98 m3, das Gewicht 900·x˜1+ 970˜x2=−27 + 979.7 = 952.7 Kg, und kostet 1800˜x1+ 970˜x2=−54 + 979.7 = 925.7 CHF. Dies ist nat¨urlich keine sinnvolle L¨osung, sondern die bestm¨ogliche Approximation an die Zielwerte ohne R¨ucksicht auf Nebenbedingungen an die Parameter, vgl. Teil (d).

Zu c): Ein zus¨atzlicher Kunststoff f¨uhrt im linearen Gleichungssystem zu einer neuen Unbestimmten x3 bzw.

einer neuen Spalte in der Matrix A. Man erh¨alt ein (3×3)-System, es ist genau dann eindeutig l¨osbar, wenn seine Determinante nicht Null ist, bzw. wenn die Spalten linear unabh¨angig sind. Damit der neue Kunststoff also etwas bringt d¨urfen seine Werte nicht eine Linearkombination der Werte der beiden anderen Stoffe sein.

(18)

Zu d): Der neue Stoff PX erf¨ullt die Bedingungen aus (c): Da nur eine Komponente im Vergleich zu PP ge¨andert wurde, gibt es keine lineare Abh¨angigkeit. Das kann man auch dadurch pr¨ufen, dass man die Deter- minante der neuen MatrixB ausrechnet. Damit ist das SystemBx=bohne Ausgleichsrechnung exakt l¨osbar.

Der Gaußalgorithmus ergibt

1 1 1 1

900 970 970 950 1800 970 90000 920

 −→

1 1 1 1

900 970 970 950 0 -970 88060 -980

 −→

1 1 1 1

0 70 70 50

0 -970 88060 -980

−→

1 1 1 1

0 1 1 57

0 -970 88060 -980

 −→

1 1 1 1

0 1 1 57

0 0 89030 −20107

 −→

1 1 1 1

0 1 1 57

0 0 1 −6232102010

 . Ablesen ergibt den Wert

x3 = − 2010

623210 ≈ −0.003.

Eine grundlegende Eigenschaft linearer Gleichungssysteme (¨uberR) ist, dass die L¨osungskoeffizienten negativ werden k¨onnen, was mathematisch korrekt, in unserem Beispiel aber sinnlos ist, da man aus dem Gemisch nicht 0.003m3 PX

”abziehen“ kann und daf¨ur 90000x3≈290 CHF bekommt. In Teil (b) war der negative Wert ˜x1

dagegen akzeptabel, da die Normalengleichung per Definition nur eine N¨aherungsl¨osung liefert, und man auf Null aufrunden darf. Um dieses Problem realistisch zu l¨osen muss man die Nebenbedingung x3 ≥ 0 in das System einf¨uhren. Die Theorie zur L¨osung linearerUngleichungssysteme ist gut entwickelt, ¨ubersteigt aber die Inhalte diese Vorlesung.

Aufgabe 52 (Eigenwerte berechnen)

Gegeben seien die folgenden Matrizen:

A = 1 1

2 2

, B =

1 1 1 0 1 0 0 1 2

 , C =

1 1 0 0 0 2 1 0 0 0 3 1 0 0 0 4

 .

Berechne die Eigenwerte der Matrizen per Hand, und pr¨ufe das Ergebnis mit Mathematica mit dem Kom- mandoEigenvalues.

L¨osung

Der Ansatz ¨uber das charakteristische Polynom det(A−λI) liefert det(A−λI) =

1−λ 1 2 2−λ

= (1−λ)(2−λ)−1·2 = λ2−3λ = (λ−0)·(λ−3) mit Nullstellenλ= 0,3, dies sind die Eigenwerte vonA. F¨ur die MatrixB erh¨alt man ebenso

det(B−λI) =

1−λ 1 1

0 1−λ 0

0 1 2−λ

Laplace

=

2. Zeile (1−λ)

1−λ 1 0 2−λ

= (1−λ)(1−λ)(2−λ).

Es macht keinen Sinn das Produkt auszumultiplizieren: die Nullstellenλ= 1,2 kann man hier direkt ablesen.

F¨ur die MatrixC gilt

det(C−λI) =

1−λ 1 0 0

0 2−λ 1 0

0 0 3−λ 1

0 0 0 4−λ

.

(19)

Mehrfache Laplace-Entwicklung jeweils nach der 1. Spalte ergibt

1−λ 1 0 0

0 2−λ 1 0

0 0 3−λ 1

0 0 0 4−λ

= (1−λ)

2−λ 1 0

0 3−λ 1

0 0 4−λ

= (1−λ)(2−λ)

3−λ 1 0 4−λ

= (1−λ)(2−λ)(3−λ)(4−λ). Aus diesem Polynom liest man die Eigenwerte/Nullstellen λ= 1,2,3,4 ab.

Aufgabe 53 (Schnelles Ablesen)

Bestimme Eigenwerte und Eigenvektoren der Matrix A =

1 a 1 0 2 0 0 0 a

 in Abh¨angigkeit des Parametersa∈R:

(a) Versuche zuerst, die Eigenwerte und Eigenvektoren ohne Bestimmung des charakteristischen Polynoms zu finden. Das ist m¨oglich weilAeine Dreiecksmatrix ist.

(b) Berechne nun die Eigenwerte und Eigenvektoren ausf¨uhrlich mit der Methode aus der ¨Ubung ¨uber das charakteristische Polynom und die Kerne vonA−λI.

L¨osung

Zu a): Wie bei der vorigen Aufgabe darf man bei Dreiecksmatrizen die Eigenwerte direkt aus der Diagonale ablesen (das kann man auch leicht mit der Laplace-Entwicklung nachpr¨ufen):λ1= 1,λ2= 2 undλ3=a, das gilt f¨ur allea∈R. Also sind zwei Eigenwerte fest, der dritte h¨angt vom Parameteraab. Da die Diagonalelemente 2 undaalleine in ihrer Zeile stehen kann man sofort die Eigenvektorenx2= (0,1,0)T undx3= (0,0,1)T ablesen.

F¨ur den ersten Eigenvektorx1 muss man dagegen das Gleichungssystem in Teil (b) l¨osen.

Zu b): Die vollst¨andige Rechnung f¨ur das charakteristische Polynom ist det(A−λI) =

1−λ a 1

0 2−λ 0

0 0 a−λ

Laplace= (1−λ)·

2−λ 0 0 a−λ

= (1−λ)·((2−λ)(a−λ)−0) = (1−λ)(2−λ)(a−λ),

und wir lesen die Nullstellen/Eigenwerte 1,2, aab. Die Menge der Eigenvektoren berechnen wir ¨uber die Kerne der MatrizenA−λI f¨ur die drei Eigenwerteλ. Den freien Parameterabehandeln wir einfach wie eine Zahl die wir nicht kennen. Die augmentierte Matrix zum System (A−λI)x= 0 ist also

1−λ a 1 0

0 2−λ 0 0

0 0 a−λ 0

 . F¨ur den ersten Eigenwertλ1= 1 erhalten wir

0 a 1 0

0 1 0 0

0 0 a−1 0

I−aII

−→

0 0 1 0

0 1 0 0

0 0 a−1 0

I−(a1)II

−→

0 0 1 0

0 1 0 0

0 0 0 0

Tausch

−→

0 1 0 0

0 0 1 0

0 0 0 0

 .

(20)

Ein L¨osungsvektor ist hier

x1 =

 1 0 0

 . F¨ur den zweiten Eigenwertλ2= 2 erhalten wir

−1 a 1 0

0 0 0 0

0 0 a−2 0

Tausch

−→

−1 a 1 0

0 0 a−2 0

0 0 0 0

 . Hier die zweite Komponente frei, also ist

x2 =

 a 1 0

 ein L¨osungsvektor.

F¨ur den dritten Eigenwertλ2=aerhalten wir

1−a a 1 0

0 2−a 0 0

0 0 0 0

 . Hier liest man die L¨osung

x3 =

 1 0 a−1

ab. Fallsa= 1 odera= 2 ist gibt es noch mehr L¨osungsvektoren (die Eigenvektoren der beiden vorigen Rech- nungen). Beachte dass man hier nicht durch 2−aoder die anderen Terme dieaenthalten dividieren darf, da sie Null sein k¨onnten. Das ist auch nicht notwendig, da nach einer vollst¨andigen L¨osung des Systems nicht gefragt ist, ein einzelner L¨osungsvektor gen¨ugt.

Man sieht aber auch, dass man die Eigenvektoren im Gegensatz zu den Eigenwerten nicht einfach

”schnell“

ablesen kann fallsAeine Dreiecksmatrix ist.

Referenzen

ÄHNLICHE DOKUMENTE

Dann erh¨ alt man die folgende Gleichung (man beachte die Definition des

Beweisen Sie die Dimensionsformel: Sei ϕ : V → W eine lineare Abbildung zwischen K-Vektorr¨ aumen und dim V

auch die ersten beiden Spalten orthogonal

[r]

[r]

Wann sind Vektoren linear abh¨ angig bzw. , ~ a n heißen linear abh¨ an- gig , wenn mindestens einer dieser Vektoren als Lin- earkombination der anderen darstellbar ist; an-

Fakult¨at f¨ur