Statistik und Wirtschaftsmathematik – Zusammenfassung
Malte L. Jakob
10. Dezember 2019
Inhaltsverzeichnis
I. Wirtschaftsmathematik 4
1. Wichtige Begriffe 5
2. Zinsrechnung 6
2.1. Lineare Verzinsung . . . 6
2.1.1. Zinslauf . . . 6
2.1.2. Zinsusancen . . . 6
2.1.3. Girokonten . . . 7
2.2. Exponentielle Verzinsung . . . 8
2.3. Vor- und Nachsch¨ussige Zinsen . . . 8
2.3.1. Konforme Zinss¨atze . . . 8
2.4. Unterj¨ahrige Verzinsung . . . 9
2.5. Gemischte Verzinsung . . . 9
3. Rentenrechnung 10 3.1. Nachsch¨ussige Rente . . . 10
3.2. Vorsch¨ussige Rente . . . 10
3.3. Ewige Rente . . . 11
4. Kapitalaufbau und Kapitalverzehr 12 4.1. Unterj¨ahrige Ratenzahlung . . . 12
4.1.1. Sparbuchmethode . . . 12
4.1.2. ICMA-Methode . . . 13
4.1.3. US-Methode . . . 13
II. Statistik 14
5. Grundbegriffe 15 6. Kennzahlen statistischer Verteilung 17 6.1. Arithmetisches Mittel . . . 176.2. Geometrisches Mittel . . . 17
6.3. Median . . . 17
6.4. Modus . . . 17
6.5. Varianz (Streuung) und Standardabweichung . . . 17
6.6. Gini-Koeffizient . . . 18
7. Kenngr¨oßen f¨ur statistische Zusammenh¨ange 19
7.1. Nominale Kenngr¨oßen . . . 19
7.2. Metrische Kenngr¨oßen . . . 20
7.3. Ordinale Kenngr¨oßen . . . 20
8. Kombinatorik 22 8.1. Permutationen . . . 22
8.2. Binomialkoeffizient . . . 22
8.2.1. Kombinationen . . . 22
8.2.2. Variationen . . . 23
9. Wahrscheinlichkeit 24 9.1. Verteilung und Verteilungsfunktion . . . 24
9.2. Kenngr¨oßen . . . 25
9.3. Binomialverteilung . . . 25
9.4. Poisson- und exponentielle Verteilung . . . 25
9.5. Hypergeometrische Verteilung . . . 26
III. Lineare Optimierung 27
10. Lineare Optimierung 28 10.1. Graphische L¨osung . . . 2810.2. Rechnerische L¨osung . . . 29
10.3. Primaler Simplex-Algorithmus . . . 30
10.4. Umwandlung von Aufgabenstellungen . . . 31
10.5. Verfahren zur Berechnung einer zul¨assigen Basisl¨osung . . . 31
Teil I.
Wirtschaftsmathematik
1. Wichtige Begriffe
Basierend auf dem Buch
”Finanzmathematik Kompakt“von Rainer Schwenkert und Yvonne Stry.
Begriff Erkl¨arung
Kapital Geld
Zins meist in p.a. (per annum = per Jahr) angegeben Zinstermin Termin, zu dem Zinsen f¨allig werden
Zinsfuß p (z.B. 5)
2. Zinsrechnung
Es gibt Lineare und Exponentielle Verzinsung. Die Unterschiede werden in Tabelle 2.1 dargestellt.
2.1. Lineare Verzinsung
Lineare Verzinsung (z.B. beim Kauf eines Bundesschatzbriefes A) wird wie folgt berechnet:
Kn=K0· 1 + p
100·n
Hierbei wird jede Annuit¨at der gleiche Zinssatz auf das Grundkapital berechnet. Hinzugekommene Zinsen werden ausgezahlt und nicht erneut verzinst.
2.1.1. Zinslauf
Der Zinslauf ist der Zeitraum, in dem Zinsen Tats¨achlich gezahlt werden.
Anfang: Tag der Einzahlung oder des Kaufs. = Valutaerstellung Ende: Tag vorder Zinszahlung.
Achtung: Banken setzen Valuta anders:
Einzahlung: Valuta am Tag darauf.
Auszahlung: Valuta am selbigen Tag.
2.1.2. Zinsusancen
Zinsusancen fallen an, wenn der Zinslauf nicht mit dem Zinslauf der Bank ¨ubereinstimmt.
(z.B. wenn eine Aktie erst am 5. Januar gekauft wird, der Zeitlauf der Bank allerdings am 1. Januar beginnt.) Die Bank zahlt die Zinsen f¨ur ihrenZeitlauf. Sie bekommen
Lineare Verzinsung Exponentielle Verzinsung GleicherZinsbetrag. GleicheZinsrate.
Kn=K0· 1 +100p ·n
Kn =K0· 1 + 100p n
Tabelle 2.1.: Unterschiede zwischen Linearer und exponentieller Verzinsung
also Zinsen f¨ur Tage, zu denen noch keine Zinsen gezahlt werden sollten. Um das auszugleichen, wird der entsprechende Betrag zur¨uckgezahlt – die sogenannten Zinsusancen.
Berechnet wird dieser Betrag wie folgt:
z=K0·i·t
wobei i = 100p und t = eine der folgenden Zinsusancen, die zu unterschiedlichen Zwecken angewandt werden.
1. Standard
Zinstage
Basistage → actualactual
Bei fast allen St¨uckzinsberechnungen von Wertpapieren wird diese Zinsusance verwendet. Es heißt
”actual“da hier die tats¨achlichen Tage verwendet werden.
(Schaltjahre werden ber¨ucksichtigt.) 2. International
Zinstage
360 →actual360
Bei internationalen Wertpapieren wird mit einem Standardjahr von 360 gerechnet.
3. EU-Zinsmethode
30,42 365
Die EU geht von einem 365 Tage langem Jahr aus, bei dem alle Monate gleich lang sind – 30,42 Tage.
4. Girokonto
30 360
Banken gehen beim Girokonto von 30 Tage langen Monaten aus. Dementsprechend ist das Jahr 360 Tage lang.
2.1.3. Girokonten
Neben den Besonderheiten bei den Valutas und den Zinsusancen wird auch noch eine andere Formel zur Berechnung der Zinsen zugrunde gelegt. Diese Formel leitet sich wie folgt her:
z = K0·i·t
= K0·100p ·360d
z = K0d 100
| {z }
Zinszahl
/ 360 p
|{z}
Zinsteiler
Diese Formel nennt sich die
”Kaufm¨annische Zinsformel“. Hierbei wird f¨ur jede Periode, in der der Kontostand gleich bleibt, eine Zinszahl berechnet. Diese Zinszahlen werden
Weitere Zusammenfassungen von Malte Jakob gibt es unter i-malte.jimdofree.com Tag Valuta Ver¨anderung Tage Zinszahl
31.3.2012 31.3.2012 1.000e 35 350 5.5.2012 6.5.2012 +500e
Saldo 1.500e 28 420
4.6.2012 4.6.2012 -1.100e
Saldo 400 e 27 108
Summe 878
Tabelle 2.2.: Beispielhafte Berechnung unterschiedlicher Zinszahlen eines Quartals
2.2. Exponentielle Verzinsung
Bei exponentieller Verzinsung werden auf bereits bestehende Zinsen erneut Zinsen berechnet. Der sogenannte Zinseszins. Exponentielle Verzinsung wird wie folgt berechnet:
Kn=K0·qn mit qn= 1 +i
2.3. Vor- und Nachsch¨ ussige Zinsen
Bei der Bezahlung von Zinsen kann zwischen vor- und nachsch¨ussigen Zinsen unterschieden werden. Vorsch¨ussige Zinsen werden auch mita(f¨ur advanced) bezeichnet, nachsch¨ussige Zinsen hingegen mit d (f¨ur dekursiv).
Bei nachsch¨ussigen Zinsen wird der gesamte Betrag (z.B. 5.000e) aus- bzw. eingezahlt.
Am Ende der Zinszeit wird der gesamte Betrag + Zinsen ausbezahlt.
Bei vorsch¨ussigen Zinsen wird ein Betrag vereinbart, der verliehen werden soll (z.B.
5.000 e). Dieser Betrag wird jedoch nicht voll aus- bzw. eingezahlt, sondern die Zinsen werden im voraus einbehalten (z.B. 4.500 e). Am ende der Zinszeit wird der volle Betrag zur¨uckgezahlt (z.B: 5.000 e). Um herauszufinden, wie viel Geld man bei vorsch¨ussigen Zinsen zu Beginn ein- bzw. auszahlt, werden folgende Formeln verwendet:
linear exponentiell K0=Kn·(1−i·n) K0=Kn·(1−i)n
2.3.1. Konforme Zinss¨ atze
M¨ochte man herausfinden, zu welchem Zinssatz id man Geld anlegen muss, um mit nachsch¨ussiger Verzinsung genau so viel Zinsen zu erhalten, wie mit einer vorsch¨ussigen Verzinsung zu einem Zinssatzia, so sucht man sogenanntezueinander konforme Zinss¨atze.
Die Formeln hierf¨ur sind:
linear exponentiell id= 1−n·iia
a id= 1−iia
a
Mit n = Laufzeit. Aus den Formeln l¨asst sich ablesen, dassid immer h¨oher sein muss alsia, um gleich viele Zinsen zu erhalten.
2.4. Unterj¨ ahrige Verzinsung
Ist eine Zinsperiode kleiner als ein Jahr – sondern m Perioden pro Jahr – und man m¨ochte die Verzinsung f¨ur ein Jahr (bzw. n Jahre) berechnen, so ergibt sich folgende Formel:
Kn =K0·
1 + i m
m·n
= K0·(1 +ip)m·n
M¨ochte man den Zinssatz, der bei j¨ahrlicher Verzinsung die selben Zinsen abwirft (konformer Zinssatz), so sucht man den effektive Zinssatz. Die Formel hierf¨ur lautet
ief f = (1 +ip)m−1
W¨ahlt man f¨ur die Perioden m eine immer gr¨oßere Anzahl lim
m→∞ 1 + mim·n
so l¨auft der Ausdruck gegen ei und man spricht vonstetiger Verzinsung. Die Formel f¨ur das Endkapital nach n Jahren bei stetiger Verzinsung lautet:
Kn =K0·ei·n
Der hierzu konforme Zinssatz (ief f) wird mit folgender Formel berechnet:
ief f =ei−1
2.5. Gemischte Verzinsung
Wird ein Kredit aufgenommen, der nicht genau zu Beginn der Zinszeit aufgenommen wird, so wird bis zum n¨achsten Zinstermin mit einfacher Verzinsung gerechnet. Nach dem Zinstermin wird normal exponentiell verzinst. Wird auch nicht zum Zinstermin abgehoben, wird bis zum Abheben ebenfalls einfach verzinst. Die Usance ist hierbei
30
360. Die Verwendete Formel ist:
Kn=K0·
1 + t1
360·i
| {z }
Zeitraum1
· (1 +i)n
| {z }
N ormaleV erzinsung
·
1 + t2
360·i
| {z }
Zeitraum2
3. Rentenrechnung
Eine Rente ist ein konstanter Fluss an Ein- bzw. Auszahlungen in periodischen Raten r, die ¨uber eine gewisse Laufzeit verzinst werden. Renten gibt es ebenfalls vorsch¨ussig und nachsch¨ussig.
3.1. Nachsch¨ ussige Rente
M¨ochte man berechnen, wie viel Geld bei nachsch¨ussiger Rente (Geld jeweils am Ende des Jahres einzahlen), so wird die Formel f¨ur denRentenendwert verwendet:
Rn=r·
n
X
i=1
qi−1=r· qn−1 q−1
| {z }
Rentenendwertf aktor sn
M¨ochte man wissen, wie viel die Rente nachnJahren heute wert ist, so ben¨otigt man die Formel f¨ur denRentenbarwert
R0= Rn
qn =r· sn
qn =r· 1
qn · qn−1 q−1
| {z }
Rentenbarwertf aktor bn
M¨ochte man wissen, wie viele Jahrenman von einem KapitalR0bei einer Verzinsung von i, jedes Jahr am Jahresende eine Rate r abheben kann, bevor das Geld alle ist, verwendet man folgende Formel:
n=−ln 1−Rr0 ·i ln(1 +i)
3.2. Vorsch¨ ussige Rente
Im Vergleich zur Nachsch¨ussigen Rente, wird die Rate r jeweils am Jahresanfang eingezahlt. Somit wird die erste Einzahlung bereits verzinst (dies war bei der nachsch¨ussigen Rente nicht der Fall). Somit m¨ussen alle Formeln f¨ur die vorsch¨ussige Rente um den
Faktorq angepasst werden:
s0n = q·qq−1n−1 b0n = qn−11 ·qq−1n−1 R0n = r·s0n R00 = r·b0n= Rqn0n Die Umformung nach nmmuss wie folgt angepasst werden:
n= 1− ln
q−Rr00 ·i ln(1 +i)
3.3. Ewige Rente
M¨ochte man wissen, wie viel Geld man zu einem gegebenen Zinssatz anlegen muss, um auf Ewig eine gewisse Rate abheben zu k¨onnen, ohne dass das Anfangskapital schrumpft, so verwendet man die Formel f¨ur dieewige Rente. Die Formel hierf¨ur ist:
linear exponentiell R0= ri R00=q·ri
4. Kapitalaufbau und Kapitalverzehr
Wenn man Geld einzahlt, das verzinst wird, und danach in Raten erneut Geld einzahlt (oder abhebt) so spricht man von Kapitalaufbau (oder Kapitalverzehr).
Wird eingezahlt und sofort danach beginnen die Ratenzahlungen, so kann folgende Gleichung verwendet werden, um das Kapital nach n Jahren zu berechnen:
Aufbau Verzehr
Kn=K0·qn+r·qq−1n−1 Kn=K0·qn−r· qq−1n−1
M¨ochte man wissen, welche Rate man n Jahre lang abheben kann, bis das Geld zu Ende ist, l¨asst sich folgende Formel zu Hilfe ziehen:
r=−Kn·qn· q−1 qn−1
Beginnt man nun allerdings nicht direkt nach der Ersten Einzahlung mit den Ratenzahlungen, sondern l¨asst das Kapital erstnsJahre vermehren und beginnt dann f¨urnE Jahre mit den Raten, so l¨asst sich mitnG =nS+nE folgende Formel herleiten:
Kn=K0·qnG−r·qnE−1 q−1
F¨ur die obige Fragestellung der passenden Rate ergibt sich folgende Formel:
r=−Kn·qnG· q−1 qnE−1
4.1. Unterj¨ ahrige Ratenzahlung
Erfolgt die Ratenzahlung nicht J¨ahrlich sondern in m Perioden pro Jahr, so gibt es mehrere Methoden f¨ur die Berechnung der Verzinsung:
4.1.1. Sparbuchmethode
Bei der Sparbuchmethode wird f¨ur die Verzinsung der unterj¨ahrigen Ratenzahlung die lineare Verzinsung angewandt. Zuerst wird die effektive JahresraterEberechnet. Diese zu r konforme j¨ahrliche Rentenrate wird dann immer in die normale nachsch¨ussige
Rentenformel (Punkt 3.1) eingesetzt. Die unterj¨ahrige Rentenrate hingegen kann sowohl vorsch¨ussig als auch nachsch¨ussig gezahlt werden:
Vorsch¨ussig Nachsch¨ussig rE=r m+m−12 ·i
r0E=r m+m+12 ·i verwendeter Unterj¨ahriger Zinssatz:ip=mi.
4.1.2. ICMA-Methode
Bei der Methode der International Capital Market Association wird innerhalb des Jahres exponentiell statt linear verzinst. Somit werden weniger Zinsen f¨ur unterj¨ahrige Ratenzahlungen generiert. Hierbei wirdip anders berechnet: ip= (1 +i)m1 .
Das Kapital nachnJahren beimPerioden pro Jahr wird dann wie folgt berechnet:
Rn,m=r· qpm·n−1 qp−1
4.1.3. US-Methode
Die US-Methode funktioniert gleich wie die ICMA-Methode, außer dass ip= i m . F¨ur den Rest der Berechnung kann die Formel der ICMA-Methode hergezogen werden. Bei der US-Methode werden die meisten Zinsen f¨ur unterj¨ahrige Ratenzahlungen generiert.
Teil II.
Statistik
5. Grundbegriffe
Bei der Statistik gibt es einige Grundbegriffe, die in Tabelle 5.1 gelistet werden. Bei Merkmalen wird auch noch zwischen verschiedenen Merkmalstypen, wie in Taelle 5.2, unterschieden. Mit diesen Begriffen lassen sich nun Statistische Erhebungen erstellen.
Hierbei wird zwischenabsoluter H¨aufigkeit(die Anzahl an Elementen mit entsprechender Merkmalsauspr¨agung) undrelativer H¨aufigkeit(Absolute H¨aufigkeit / Referenzgruppe) unterschieden.
Die relative H¨aufigkeit kann sowohl auf die Grundgesamtheit bezogen werden, als auch auf eine spezielle Gruppe (z.B. M¨annlich / Weiblich).
Begriff Beispiel
Erhebungseinheit Pr¨uflinge Grundgesamtheit Alle Pr¨uflinge
Merkmal Punkte
Weitere Zusammenfassungen von Malte Jakob gibt es unter i-malte.jimdofree.com
Merkmalstyp Beschreibung Beispiel
Nominal Wertungsfreie Elemente, die durch Zahlen Codiert werden k¨onnen 1: Sony, 2: Phillips . . .
Ordinal Gewertete Codierung mit Zahlen 1: Sehr gut, 2: Gut . . .
Imperisch
Alles, was in Zahlen ausgedr¨uckt werden kann
Kontinuierlich (Stetig) Diskret
Alle Werte innerhalb eines Intervalls (z.B. 2,3) Nur ganze Werte Tabelle 5.2.: Merkmalstypen
6. Kennzahlen statistischer Verteilung
6.1. Arithmetisches Mittel
Das Arithmetische Mittel wird wie folgt berechnet:
x= PN
i=1xi
N =
k
X
i=1
Pi·xi
WobeiPidie relative H¨aufigkeit des entsprechenden Elements ist undkdie Anzahl an Merkmalsauspr¨agungen.
6.2. Geometrisches Mittel
pn
Πni=1xi
6.3. Median
Der Median eignet sich f¨ur einen ”Durchschnitt”, bei dem Ausreißer weniger stark ber¨ucksichtigt werden. hierbei werden alle Elemente aufsteigend sortiert. Ist die Anzahl der Elemente der Grundgesamtheit ungerade, so wird das Mittlere Element als Median ausgew¨ahlt. Ist sie gerade, so wird der Mittelwert aus den beiden mittleren Elementen als Median gew¨ahlt.
6.4. Modus
Der Modus w¨ahlt den Wert, der am h¨aufigsten in der Gesamtheit vorkommt.
6.5. Varianz (Streuung) und Standardabweichung
Varianz:
2
PN
i=1(xi−x)2 Xk 2
Weitere Zusammenfassungen von Malte Jakob gibt es unter i-malte.jimdofree.com
6.6. Gini-Koeffizient
Der Gini-Koeffizient ist ein Wert, der eine Aussage ¨uber die Verteilung von Merkmalsauspr¨agungen in gewissen Merkmalsgruppen aussagt.
Hat jede Gruppe den selben Anteil, (z.B. Von 100 Personen hat jede Person 1e), so
ist der Gini-Koeffizient 0 – also eine perfekte Gleichverteilung. Sind alle Merkmalsauspr¨agungen auf eine Erhebungseinheit konzentriert, (z.B. Eine Person hat 100 e, der Rest 0) so
handelt ist der Gini-Koeffizient 1 – Hierbei handelt es sich dann um die maximale Konzentration Amax. Diese Konzentration wird wie folgt berechnet:
Amax= 1 2
1− 1
N
WobeiNdie Anzahl der Erhebungseinheiten ist (Achtung: nicht die Anzahl der Gruppen!).
Der Gini-Koeffizient wird daraufhin wie folgt berechnet:
G= Lorenzfl¨ache
1
2 1−N1
Die Lorenzfl¨ache ist hierbei die Fl¨ache, die zwischen der Kurve der Gleichverteilung und der Lorenzkurve liegt.
Die Lorenzkurve ist eine Kurve, die den kumulativen Anteil an den Merkmalsauspr¨agung mit dem kumulativen Anteil an der Grundgesamtheit in Verbindung bringt.
Diese Fl¨ache l¨asst sich jedoch nicht so leicht berechnen. Die Fl¨ache, die unter der Lorenzkurve liegt hingegen schon. Diese Fl¨ache l¨asst sich in lauter rechtwinklige Dreiecke und Rechtecke aufteilen, deren Fl¨achen sich leicht berechnen lassen. Die Summe dieser Fl¨achen wird daraufhin von der Fl¨ache abgezogen, die unter der Gleichverteilung liegt (= 12); Das Ergebnis ist die Lorenzfl¨ache.
7. Kenngr¨ oßen f¨ ur statistische Zusammenh¨ ange
Ein statistischer Zusammenhang liegt immer dann vor, wenn die Verteilung nicht der Erwartung entspricht, z.B. wenn 60% aller Studierenden weiblich sind, so sollte der Anteil an weiblichen Studierenden in jedem Studiengang ebenfalls bei 60% liegen – andernfalls liegt ein statistischer Zusammenhang zwischen Geschlecht und bevorzugten Studiengang vor.
Es gibt unterschiedliche Kenngr¨oßen f¨ur die unterschiedlichen Merkmalstypen. Treten in einer Betrachtung mehrere Typen auf, so gibt es eine Reihenfolge:
1. Metrisch 2. Ordinal 3. Nominal
Hierbei wird die Kenngr¨oße f¨ur den Merkmalstypen ausgewertet, der in dieser Anordnung am tiefsten liegt.
7.1. Nominale Kenngr¨ oßen
Bei obigem Beispiel waren beide Merkmale (Geschlecht und Studiengang) Nominal – also wertungsfreie Werte, die durch Zahlen codiert werden k¨onnen.
Das Zusammenhangsmaßχ2wird bei nominalen Merkmalstypen wie folgt berechnet:
χ2=N·
s
X
i=1
t
X
j=1
(pbij−peij)2 peij
!
Hierbei sindiundj die entsprechenden Merkmalsauspr¨agungen (hier Geschlecht und Studiengang), undsundtdie entsprechende Anzahl der Merkmalsauspr¨agungen (z.B.
2 Geschlechter und 5 Studieng¨ange→s= 2;t= 5).pesteht f¨ur die erwartete relative H¨aufigkeit (bezogen auf die Grundgesamtheit) der jeweiligen Merkmalskombination, pb steht f¨ur die tats¨achlich beobachtete.
Weitere Zusammenfassungen von Malte Jakob gibt es unter i-malte.jimdofree.com Das Ergebnis reicht von 0 bis 1, wobei 0 bedeutet, dass es gar keinen Zusammenhang gibt und 1 weist auf einen nahezu statischen Zusammenhang hin. 0,5 macht dementsprechend keine Aussage.
7.2. Metrische Kenngr¨ oßen
Besteht eine Auswertung aus zwei metrischen Merkmalen, so kann ein Merkmal in Abh¨angigkeit des anderen in einem Koordinatensystem dargestellt werden (z.B. x- Achse = Alter, y-Achse = Einkommen).
Von diesen x und y Merkmalen wird nun der Mittelwert x und y berechnet. F¨ur jedes Merkmal wird nun ein Rechteck berechnet, das den Abstand zum Mittelwert in beiden Dimensionen darstellt. Aus allen Rechtecken wird daraufhin der Mittelwert gebildet und es entsteht die Kovarianz:
PN
i=1(xi−x)·(yi−y)
N =sxy
Nun wird die Kovarianz noch durch die Standardabweichungen (Siehe Punkt 6.5) der einzelnen Merkmale geteilt, sodass der Korrelations- Koeffizient entsteht:
r= sxy
sx·sy Wobei
0<|r|<1
Je n¨aher|r| an 1 ist, desto st¨arker ist die Korrelation. Istr >0 so handelt es sich um einen aufsteigenden Zusammenhang, istr <0, ist es ein absteigender Zusammenhang.
EineRegressionsgerade mit der Gleichungy =mx+bist eine Gerade, die Versucht den Verlauf der Punkte bestm¨oglich anzun¨ahern. Mathematisch ausgedr¨uckt, ist es die gerade, bei der die Summe allerResiduen – die y-Abst¨ande der Geraden an Stelle x zu den Punkten an der Stelle x – minimal ist. Die Koeffizienten werden wie folgt berechnet:
m= sxy
s2x b=y−m·x
7.3. Ordinale Kenngr¨ oßen
Ordinale Merkmale werden anhand einer Skala bewertet (z.B. Schulnoten von 1 bis 6).
Meist werden allerdings nicht die selben Skalen verwendet. Ebenfalls beeinflusst selbst bei gleichen Skalen die Wahl der Skala das Ergebnis (z.B. statt Schulnoten 0 bis 199 Punkte). Um diese St¨orfaktoren zu beseitigen, werden die Merkmale von den Skalen in eindeutige R¨ange ¨ubertragen. Gibt es z.B. mehrere Sch¨uler mit Noten in einer Klausur und die beste Note ist 2, so bekommt der Sch¨uler mit der besten Note den Rang 1 – selbst wenn es nicht die beste Note auf der angewandten Skala war – der zweitbeste den Rang 2 usw. Haben mehrere Sch¨uler den selben Wert auf der Skala, so wird der
entsprechende Mittelwert berechnet. z.B. haben 3 Sch¨uler die Note 2,1 (zweitbeste Note), also Belegen die Sch¨uler die R¨ange 2, 3 und 4 – der Mittelwert hieraus ist 3:
dieser Rang wird all diesen Sch¨ulern zugewiesen. Der n¨achste Sch¨uler bekommt den Rang 4, dann 5 usw.
Ist dieses Einordnen in R¨ange bei beiden Merkmalen erfolgt, so kann die Methode aus 7.2 angewandt werden.
8. Kombinatorik
8.1. Permutationen
Wenn danach gefragt wird, in wie vielen verschiedenen ReihenfolgennObjekte angeordnet werden k¨onnen, dann fragt man nach der Anzahl der PermutationenPn =n!. F¨ur sehr großenkann dieStirlingsche Formel angewandt werden:
n→∞lim(n!) = lim
n→∞
√
2πn·nn·e−n·
1 + 1
12n+ 1
288n2 +· · ·
Wobei f¨ur große n der Ausdruck nach e−n vernachl¨assigt werden kann. Zudem gibt es noch eine gesonderte Formel f¨ur die zirkul¨are Permutation (z.B. Anordnung von G¨asten bei einem kreisrunden Tisch): (n−1)!.
Bei Permutationen, bei denen es mehrere Gleiche Elemente k1, . . . , kn gibt, gilt folgende Formel:
Pn(k1,...,kn)= n!
k1!· · · · ·kn!
8.2. Binomialkoeffizient
Sollen aus einer Gewissen Menge n nur eine gewisse Anzahl k entnommen werden (ohne Wiederholung), so ist die Anzahl der Kombinationen:
n k
:= n!
k!(n−k)!
F¨ur den Binomialkoeffizienten gelten folgende Rechenregeln:
0 0
= n
0
= n
n
= 1 n+ 1
k+ 1
= n
k
+ n
k+ 1
8.2.1. Kombinationen
Kombinationen zeichnen sich durch folgende Merkmale aus: ausn Elementen werden k Elemente ausgew¨ahlt und zusammengestellt. Die Reihenfolge ist hierbei egal.
Die Formel f¨ur eine Kombination, bei der es keine Wiederholungen gibt (z.B. Lotto), ist:
Cn,k= n
k
Ohne Wiederholung Mit Wiederholung Kombinationen
k-ter Ordnung Cn,k= n
k
Cn(k)=
n+k−1 k
Ungeordnete Stichproben Variationen
k-ter Ordnung Vn,k= (n−k)!n! Vn(k)=nk Geordnete Stichproben Ohne zur¨ucklegen Mit zur¨ucklegen
Tabelle 8.1.: ¨Ubersicht der Formeln Alle Elemente angeordnet?
@
@
@ R
Ja Nein
Alle verschieden?
@
@
@ R
Ja Nein
Pn Pn(k)
Reihenfolge wichtig?
@
@
@ R
Ja Nein
Wiederholungen? Wiederholungen?
@
@
@ R
Ja Nein @
@
@ R
Ja Nein
Vn(k) Vn,k Cn(k) Cn,k
Treten Wiederholungen auf (z.B. bei M¨unzw¨urfen), dann gilt folgende Formel:
Cn(k)=
n+k−1 k
8.2.2. Variationen
Eine Variation ist wie eine Kombination. Der einzige Unterschied ist, dass hier die REihenfolge der Elemente wichtig ist.
Die Formel f¨ur eine Variation ohne Wiederholungen lautet:
Vn,k = n!
(n−k)!
Kommen Wiederholungen vor, so gilt:
9. Wahrscheinlichkeit
Bei der Wahrscheinlichkeitsrechnung gibt es eine Zufallsvariable X, die verschiedene Wertexiannehmen kann, wobei die Wahrscheinlichkeit / relative H¨aufigkeit des Auftretens dieses Wertes pi, mit 0≤pi≤1, entspricht.
F¨urpi gelten zudem noch folgendes:
Pn
i=1pi= 1 pi= lim
N→∞
hi N
Mithi= absolute H¨aufigkeit des Wertes.
F¨ur die Wahrscheinlichkeit gilt zudem noch folgendes:
P(P(xi)∨P(xj) =P(xi) +P(xj)(=bP) P(P(xi)∧P(xj)) =P(xi)·P(xj)(=Π)b
9.1. Verteilung und Verteilungsfunktion
−4 −2 0 2 4
0.1 0.2 0.3 0.4
xi P(xi)
Wahrscheinlichkeiten werden auch oft in Graphen wie diesem dargestellt. Die Wahrscheinlich- keitsverteilung gibt f¨ur einen gewissen Wert xi dessen WahrscheinlichkeitP(xi) an.
Die VerteilungsfunktionF(xi) gibt die alle aufsummierten Wahrscheinlichkeiten bis inklusive die des Wertes an:F(xk) =Pk
i=1P(xi).
Zudem gilt:
P(a < X < b) =F(b)−F(a) P(a < X) = 1−F(a)
9.2. Kenngr¨ oßen
Die Kenngr¨oßen sind gleich wie in 6 beschrieben, jedoch gibt es andere Bezeichnungen:
Mittelwert: µ, oder E(x), wobei x ein beliebiger Ausdruck oder die Zufallsvariable sein kann. DasE steht f¨ur
”Erwartungswert“.
Varianz/Standardabweichung σ=sbzw.σ2=s2=v
Der Zusammenhang zwischen Mittelwert und Varianz ist wie folgt definiert:
σ2=E((X−µ)2) =E(X2)−µ2
Zudem gibt es die Schiefheit (Skewness), die angibt, wie viel die Wahrscheinlichkeit nach Links/rechts zur Mitte verschoben ist:
γ= Pn
i=1(xi−µ)3·P(xi) σ3
9.3. Binomialverteilung
Die Binomialverteilung ist ein Beispiel f¨ur eine diskrete Wahrscheinlichkeitsverteilung.
Voraussetzung hierf¨ur ist, dass die ZufallsvariableX nur zwei Werte annehmen kann:
Gew¨unschtes Ergebnis und nicht gew¨unschte Ergebnis. So giltP(1) =P(1) undP(2) = 1−P(1).
Gibt es nun eine ungeordnete Stichprobe mit zur¨ucklegen, bei der es n Ziehungen gibt und man wissen m¨ochte, wie groß die Wahrscheinlichkeit f¨ur k
”Treffer“ ist, so gilt die Formel:
pk(1−p)n−k· n
k
=P(X=k) =Bn,p(k) Wobeipdie Wahrscheinlichkeit f¨ur einen
”Treffer“ ist.
Die Verteilungsfunktion kumuliert auch hier die Wahrscheinlichkeiten auf.
9.4. Poisson- und exponentielle Verteilung
Wenn die Wahrscheinlichkeit f¨ur das Auftreten sehr gering ist (p→0) und die Anzahl
Weitere Zusammenfassungen von Malte Jakob gibt es unter i-malte.jimdofree.com Diese Approximation wird Poisson-Verteilung genannt. Oft wird diese Formel f¨ur Seltene Ereignisse ab n≥10∧p≤0,05 verwendet.
Werden ¨uber einen langen Zeitraum Versuche zu unwahrscheinlichen Ereignissen durchgef¨uhrt, bei denen die Wahrscheinlichkeiten gleich bleiben, so ist die Anzahl der Auftretenden Ergebnisse ¨uber die verschiedenen Experimente ebenfalls nach der Poisson-Verteilung verteilt. Der Abstand xzwischen zwei solcher Ereignisse ist dann nach derExponentiellen Verteilungverteilt, die einen Spezialfall derWeibull-Verteilung darstellt, wobeiλ=µ, also der Mittelwert der bisherigen Experimente:
f(x) = 1
1 λ
· x−0
1 λ
1−1
·e−
x−0 1 λ
1
=λ·e−λx
Das Ergebnis ergibt einen Abstandx >0, zwischen zwei Ergebnissen in dem nicht mit der Poisson-Verteilung approximiert werden darf.
W¨ahlt man f¨ur die Weibull-Verteilung andere Parameter, so kann sie zurWigner- Verteilung vereinfacht werden:
f(x) =πx 2 ·e−πx
2 4
9.5. Hypergeometrische Verteilung
W¨ahrend die Binomialverteilung angewandt wird, wenn es Ziehungen mit Zur¨uckliegen gibt, sollte beiZiehungen ohne zur¨ucklegendieHypergeometrische Verteilungangewandt werden. F¨ur große n N¨ahern sich die Verteilungen an, bei kleineren n ist es jedoch relevant, ob zur¨uckgelegt wird oder nicht.
Wenn also wie z.B. bei einem Lottospiel eine Menge N aus zwei untermengen N1
und N2 besteht (hier:
”Gewinner-Zahlen“ und
”Verlierer-Zahlen“), aus denen ohne zur¨ucklegen jeweils eine gewisse Anzahl n1 und n2 gezogen werden soll (hier z.B. 6 richtige, 0 falsche), so lautet die Formel f¨ur die Hypergeometrische Verteilung wie folgt:
P(X =n1) =HN1,N2,n(n1) =
N1
n1
· Nn2
2
N n
Teil III.
Lineare Optimierung
10. Lineare Optimierung
Bei der linearen Optimierung geht es um die L¨osung eines linearen Ungleichungssystems, deren Zielfunktion von mehreren Variablen abh¨angt und f¨ur diese Variablen zus¨atzliche Nebenbedingungen existieren.
Eine Zielfunktion
F( x1, x2, . . . , xp
| {z }
Strukturvariablen
) =c1·x1+c2·x2+· · ·+cp·xp
soll maximiert werden. Dies kann z.B. Erl¨os des Verkaufs von p unterschiedlichen Produkten sein. Hierbei gibt es jedochmlineare Nebenbedingungen
a11x1+a12x2+· · ·+a1pxp≤b1 a21x1+a22x2+· · ·+a2pxp≤b2 ... + ... +. ..+ ... ≤ ... am1x1+am2x2+· · ·+ampxp≤bm
die erf¨ullt werden m¨ussen. z.B. Begrenzungen in der Arbeitszeit oder in Rohstoffen zur Produktion. Zudem gibt es eine Positivit¨atsbedingung xi ≥ 0 i = 1, . . . , p, die Sicherstellt, dass alle Komponenten positiv sind (da man z.B. keine negative Anzahl an Produkten verkaufen kann).
Ein Vektor~x= (x1, x2, . . . , xp) heißt
L¨osung, wenn er alle Nebenbedingungen erf¨ullt
zul¨assige L¨osung, wenn er eine L¨osung ist und die Positivit¨atsbedingung erf¨ullt optimale L¨osung, wenn er eine zul¨assige L¨osung ist, die die Zielfunktion optimiert.
10.1. Graphische L¨ osung
Ein solches lineares Problem kann graphisch gel¨ost werden, wenn die Zielfunktion lediglich von zwei Strukturvariablen abh¨angt.
In diesem Fall kann jede Nebenbedingung nachx2aufgel¨ost werden und die entsprechende Gerade in ein Koordinatensystem eingezeichnet werden, in dem x2 auf der y- undx1
auf der x-Achse liegt. Da die Form der Nebenbedingungen immer ≤entspricht, so ist jeder Punkt der links von / unter allen Geraden ist eine L¨osung des Problems. Ist der Punkt f¨ur x1 undx2≥0, so ist er auch noch eine zul¨assige L¨osung.
Nun wird die Zielfunktion (im unteren Graphen rot) ebenfalls nach x2 aufgel¨ost an den Ursprung gezeichnet und so lange nach rechts/oben verschoben, bis sie den
¨außerst-m¨oglichen Eckpunkt des L¨osungsraumes (Simplex) erreicht hat. Dies ist das Optimum, da jede Erh¨ohung vonx1 oderx2dazu f¨uhren w¨urde, dass es keine L¨osung mehr ist und die werte somit an ihrem gemeinsamen Maximum angekommen sind.
0 20 40 60 80 100
0 20 40 60 80 100 120
x1
x2
10.2. Rechnerische L¨ osung
Werden jedoch mehr als zwei Strukturvariablen verwendet, so ist eine graphische L¨osung nicht mehr m¨oglich. So muss die Zielfunktion ummSchlupfvariablen erweitert werden. Da die eigentliche Funktion jedoch nicht beeinflusst werden darf, werden diese mit 0 multipliziert:
F(x1, x2, . . . , xp, xp+1, . . . , xp+m) =c1·x1+c2·x2+· · ·+cp·xp+ 0·xp+1+· · ·+ 0·xp+m
Zus¨atzlich werden die Nebenbedingungen mit den Schlupfvariablen erweitert:
a11x1+a12x2+· · ·+a1pxp +xp+1 ≤b1
a21x1+a22x2+· · ·+a2pxp +xp+2 ≤b2
... + ... +. ..+ ... ≤ ...
am1x1+am2x2+· · ·+ampxp +xp+m≤bm
Nun werden alleBasisl¨osungenberechnet. Eine Basisl¨osung ist eine L¨osung der jeweiligen Nebenbedingungen, in der p Variablen = 0 gesetzt werden. Diese variablen werden
Basisvariablengenannt, die anderen heißenNichtbasisvariablen. Der Wert der Nichtbasisvariablen wird berechnet. Um alle Basisl¨osungen zu erhalten m¨ussen also alle M¨oglichkeiten der
Weitere Zusammenfassungen von Malte Jakob gibt es unter i-malte.jimdofree.com
10.3. Primaler Simplex-Algorithmus
Da die Berechnung aller Basisl¨osungen sehr aufw¨andig sein kann, wurde ein Algorithmus entwickelt. Hierf¨ur wird zuerst einSimplex-Tableauerstellt, in das eine zul¨assige Basisl¨osung eingef¨ugt wird (meist die, in der alle Strukturvariablen = 0 sind). Dies sieht dann wie folgt aus:
Nichtbasisvariable Basisvariablen (BV) x1 . . . xp xp+1 . . . xp+m bi
BV
xp+1 a11 . . . a1p 1 . . . 0 b1
... ... . .. ... . .. ...
xp+m am1 . . . amp 0 . . . 1 bm
F-Zeile −c1 . . . −cp 0 . . . 0 0
Dabei ist der Eintrag in der Zelle unten Rechts der aktuelle Wert der Zielfunktion.
Der Algorithmus folgt folgendem Verhaltensmuster:
1. Wahl der T-Spalte
Suche die Spalte mit den gr¨oßten Betragswert der negativen Zahlen in der F- Zeile. (Bei gleichen Werten darf frei zwischen diesen gew¨ahlt werden).
2. Wahl der zugeh¨origen S-Zeile
Falls in der Spalte nur Werte ≤ 0 sind, so kann die Berechnung abgebrochen werden und es gibt keine optimale L¨osung. Andernfalls ist die S-Zeile diejenige, bei der das Ergebnis der Rechnung abs
st f¨urast>0 minimal ist. Das Elementast heißtPivotelement.
3. Berechnung der neuen Basisl¨osung des neuen Simplex-Tableaus
a) Die bisherige Basisvariable der S-Zeile wird mit der Nichtbasisvariable der T-Spalte vertauscht
b) Die S-Zeile wird mit ast normiert, also jeder wert der Zeile durch das Pivotelement geteilt.
c) Alle Elemente ¨uber und unter dem Pivotelement (auch das der F-Zeile) werde mithilfe von Umformungen (Gauß-Verfahren) zu 0 gemacht.
4. Wiederholen
Schritte 1 bis 3 werden so lange wiederholt, bis alle Elemente der F-Zeile ≥0 sind.
Der Wert der Strukturvariablen kann aus dem End-Tableau herausgelesen werden.
Er steht in derbi-Zelle in der entsprechenden Zeile. Sollte eine Strukturvariable keine eigene Zeile haben, so ist sie 0.
10.4. Umwandlung von Aufgabenstellungen
Der primale Simplex-Algorithmus kann nur auf Maximierungsprobleme angewandt werden, bei dem alle Nebenbedingungen die Struktur
c1·x1+· · ·+cp·xp≤bi aufweisen. Hat eine Nebenbedingung die Struktur
c1·x1+· · ·+cp·xp≥bi
, so kann sie durch eine Multiplikation mit −1 umgewandelt werden:
−c1·x1+· · ·+−cp·xp≤ −bi
Entspricht die Struktur einer Nebenbedingung einer Gleichung c1·x1+· · ·+cp·xp=bi
, so kann diese in zwei nebenbedinungen umgewandelt werden:
c1·x1+· · ·+cp·xp≤bi c1·x1+· · ·+cp·xp≥bi
Hierbei muss die untere Ungleichung noch mit−1 multipliziert werden.
Handelt es sich bei dem linearen Problem um einMinimierungsproblem, so muss die ZielfunktionF(x1, . . . , xp) mit−1 multipliziert werden.
10.5. Verfahren zur Berechnung einer zul¨ assigen Basisl¨ osung
Der primale Simplex-Algorithmus funktioniert nur, wenn er mit einer zul¨assigen Basisl¨osung beginnt. Sollte die eingesetzte Basisl¨osung (meist werden alle Strukturvariablen auf 0 gesetzt) ung¨ultig sein, was sich leicht erkennen l¨asst, da in diesem Fall die bi-Spalte mindestens einen negativen Wert beinhaltet, so muss zuerst eine zul¨assige Basisl¨osung gefunden werden. Hierbei wird in folgenden Schritten verfahren:
1. Wahl der S-Zeile
Ist inbi alles positiv, so ist die Basisl¨osung bereits zul¨assig. Ansonsten wird die Zeile als S-Zeihle gew¨ahlt, bei derbi am kleinsten ist.
2. Wahl der T-Spalte
Falls es in der gefundenen S-Zeile kein a < 0 gibt, gibt es keine zul¨assige
Weitere Zusammenfassungen von Malte Jakob gibt es unter i-malte.jimdofree.com 4. Wiederholen
Schritte 1 bis 3 werden so lange wiederholt, bis allebi≥0 sind. Ist dies der Fall, so kann nun mit dem Verfahren aus 10.3 begonnen werden.