Statistik und Wirtschaftsmathematik

(1)

Statistik und Wirtschaftsmathematik – Zusammenfassung

Malte L. Jakob

10. Dezember 2019

(2)

Inhaltsverzeichnis

I. Wirtschaftsmathematik 4

1. Wichtige Begriffe 5

2. Zinsrechnung 6

2.1. Lineare Verzinsung . . . 6

2.1.1. Zinslauf . . . 6

2.1.2. Zinsusancen . . . 6

2.1.3. Girokonten . . . 7

2.2. Exponentielle Verzinsung . . . 8

2.3. Vor- und Nachsch¨ussige Zinsen . . . 8

2.3.1. Konforme Zinss¨atze . . . 8

2.4. Unterj¨ahrige Verzinsung . . . 9

2.5. Gemischte Verzinsung . . . 9

3. Rentenrechnung 10 3.1. Nachsch¨ussige Rente . . . 10

3.2. Vorsch¨ussige Rente . . . 10

3.3. Ewige Rente . . . 11

4. Kapitalaufbau und Kapitalverzehr 12 4.1. Unterj¨ahrige Ratenzahlung . . . 12

4.1.1. Sparbuchmethode . . . 12

4.1.2. ICMA-Methode . . . 13

4.1.3. US-Methode . . . 13

II. Statistik 14

5. Grundbegriffe 15 6. Kennzahlen statistischer Verteilung 17 6.1. Arithmetisches Mittel . . . 17

6.2. Geometrisches Mittel . . . 17

6.3. Median . . . 17

6.4. Modus . . . 17

6.5. Varianz (Streuung) und Standardabweichung . . . 17

6.6. Gini-Koeffizient . . . 18

(3)

7. Kenngrößen für statistische Zusammenhänge 19

7.1. Nominale Kenngr¨oßen . . . 19

7.2. Metrische Kenngr¨oßen . . . 20

7.3. Ordinale Kenngr¨oßen . . . 20

8. Kombinatorik 22 8.1. Permutationen . . . 22

8.2. Binomialkoeffizient . . . 22

8.2.1. Kombinationen . . . 22

8.2.2. Variationen . . . 23

9. Wahrscheinlichkeit 24 9.1. Verteilung und Verteilungsfunktion . . . 24

9.2. Kenngr¨oßen . . . 25

9.3. Binomialverteilung . . . 25

9.4. Poisson- und exponentielle Verteilung . . . 25

9.5. Hypergeometrische Verteilung . . . 26

III. Lineare Optimierung 27

10. Lineare Optimierung 28 10.1. Graphische L¨osung . . . 28

10.2. Rechnerische L¨osung . . . 29

10.3. Primaler Simplex-Algorithmus . . . 30

10.4. Umwandlung von Aufgabenstellungen . . . 31

10.5. Verfahren zur Berechnung einer zul¨assigen Basisl¨osung . . . 31

(4)

Teil I.

Wirtschaftsmathematik

(5)

1. Wichtige Begriffe

Basierend auf dem Buch

”Finanzmathematik Kompakt“von Rainer Schwenkert und Yvonne Stry.

Begriff Erkl¨arung

Kapital Geld

Zins meist in p.a. (per annum = per Jahr) angegeben Zinstermin Termin, zu dem Zinsen f¨allig werden

Zinsfuß p (z.B. 5)

(6)

2. Zinsrechnung

Es gibt Lineare und Exponentielle Verzinsung. Die Unterschiede werden in Tabelle 2.1 dargestellt.

2.1. Lineare Verzinsung

Lineare Verzinsung (z.B. beim Kauf eines Bundesschatzbriefes A) wird wie folgt berechnet:

Kn=K0· 1 + p

100·n

Hierbei wird jede Annuit¨at der gleiche Zinssatz auf das Grundkapital berechnet. Hinzugekommene Zinsen werden ausgezahlt und nicht erneut verzinst.

2.1.1. Zinslauf

Der Zinslauf ist der Zeitraum, in dem Zinsen Tats¨achlich gezahlt werden.

Anfang: Tag der Einzahlung oder des Kaufs. = Valutaerstellung Ende: Tag vorder Zinszahlung.

Achtung: Banken setzen Valuta anders:

Einzahlung: Valuta am Tag darauf.

Auszahlung: Valuta am selbigen Tag.

2.1.2. Zinsusancen

Zinsusancen fallen an, wenn der Zinslauf nicht mit dem Zinslauf der Bank ¨ubereinstimmt.

(z.B. wenn eine Aktie erst am 5. Januar gekauft wird, der Zeitlauf der Bank allerdings am 1. Januar beginnt.) Die Bank zahlt die Zinsen f¨ur ihrenZeitlauf. Sie bekommen

Lineare Verzinsung Exponentielle Verzinsung GleicherZinsbetrag. GleicheZinsrate.

Kn=K0· 1 +₁₀₀^p ·n

Kn =K0· 1 + ₁₀₀^p n

Tabelle 2.1.: Unterschiede zwischen Linearer und exponentieller Verzinsung

(7)

also Zinsen f¨ur Tage, zu denen noch keine Zinsen gezahlt werden sollten. Um das auszugleichen, wird der entsprechende Betrag zur¨uckgezahlt – die sogenannten Zinsusancen.

Berechnet wird dieser Betrag wie folgt:

z=K0·i·t

wobei i = ₁₀₀^p und t = eine der folgenden Zinsusancen, die zu unterschiedlichen Zwecken angewandt werden.

1. Standard

Zinstage

Basistage → ^actual_actual

Bei fast allen St¨uckzinsberechnungen von Wertpapieren wird diese Zinsusance verwendet. Es heißt

”actual“da hier die tats¨achlichen Tage verwendet werden.

(Schaltjahre werden ber¨ucksichtigt.) 2. International

Zinstage

360 →^actual₃₆₀

Bei internationalen Wertpapieren wird mit einem Standardjahr von 360 gerechnet.

3. EU-Zinsmethode

30,42 365

Die EU geht von einem 365 Tage langem Jahr aus, bei dem alle Monate gleich lang sind – 30,42 Tage.

4. Girokonto

30 360

Banken gehen beim Girokonto von 30 Tage langen Monaten aus. Dementsprechend ist das Jahr 360 Tage lang.

2.1.3. Girokonten

Neben den Besonderheiten bei den Valutas und den Zinsusancen wird auch noch eine andere Formel zur Berechnung der Zinsen zugrunde gelegt. Diese Formel leitet sich wie folgt her:

z = K₀·i·t

= K0·₁₀₀^p ·₃₆₀^d

z = K0d 100

| {z }

Zinszahl

/ 360 p

|{z}

Zinsteiler

Diese Formel nennt sich die

”Kaufm¨annische Zinsformel“. Hierbei wird f¨ur jede Periode, in der der Kontostand gleich bleibt, eine Zinszahl berechnet. Diese Zinszahlen werden

(8)

Weitere Zusammenfassungen von Malte Jakob gibt es unter i-malte.jimdofree.com Tag Valuta Ver¨anderung Tage Zinszahl

31.3.2012 31.3.2012 1.000e 35 350 5.5.2012 6.5.2012 +500e

Saldo 1.500e 28 420

4.6.2012 4.6.2012 -1.100e

Saldo 400 e 27 108

Summe 878

Tabelle 2.2.: Beispielhafte Berechnung unterschiedlicher Zinszahlen eines Quartals

2.2. Exponentielle Verzinsung

Bei exponentieller Verzinsung werden auf bereits bestehende Zinsen erneut Zinsen berechnet. Der sogenannte Zinseszins. Exponentielle Verzinsung wird wie folgt berechnet:

K_n=K₀·qⁿ mit qⁿ= 1 +i

2.3. Vor- und Nachsch¨ ussige Zinsen

Bei der Bezahlung von Zinsen kann zwischen vor- und nachschüssigen Zinsen unterschieden werden. Vorschüssige Zinsen werden auch mita(für advanced) bezeichnet, nachschüssige Zinsen hingegen mit d (für dekursiv).

Bei nachsch¨ussigen Zinsen wird der gesamte Betrag (z.B. 5.000e) aus- bzw. eingezahlt.

Am Ende der Zinszeit wird der gesamte Betrag + Zinsen ausbezahlt.

Bei vorsch¨ussigen Zinsen wird ein Betrag vereinbart, der verliehen werden soll (z.B.

5.000 e). Dieser Betrag wird jedoch nicht voll aus- bzw. eingezahlt, sondern die Zinsen werden im voraus einbehalten (z.B. 4.500 e). Am ende der Zinszeit wird der volle Betrag zur¨uckgezahlt (z.B: 5.000 e). Um herauszufinden, wie viel Geld man bei vorsch¨ussigen Zinsen zu Beginn ein- bzw. auszahlt, werden folgende Formeln verwendet:

linear exponentiell K₀=K_n·(1−i·n) K₀=K_n·(1−i)ⁿ

2.3.1. Konforme Zinss¨ atze

Möchte man herausfinden, zu welchem Zinssatz i_d man Geld anlegen muss, um mit nachschüssiger Verzinsung genau so viel Zinsen zu erhalten, wie mit einer vorschüssigen Verzinsung zu einem Zinssatzia, so sucht man sogenanntezueinander konforme Zinssätze.

Die Formeln hierf¨ur sind:

linear exponentiell i_d= _1−n·iⁱ^a

a i_d= _1−iⁱ^a

a

(9)

Mit n = Laufzeit. Aus den Formeln l¨asst sich ablesen, dassi_d immer h¨oher sein muss alsi_a, um gleich viele Zinsen zu erhalten.

2.4. Unterj¨ ahrige Verzinsung

Ist eine Zinsperiode kleiner als ein Jahr – sondern m Perioden pro Jahr – und man m¨ochte die Verzinsung f¨ur ein Jahr (bzw. n Jahre) berechnen, so ergibt sich folgende Formel:

Kn =K0·

1 + i m

m·n

= K0·(1 +ip)^m·n

Möchte man den Zinssatz, der bei jährlicher Verzinsung die selben Zinsen abwirft (konformer Zinssatz), so sucht man den effektive Zinssatz. Die Formel hierfür lautet

ief f = (1 +ip)^m−1

Wählt man für die Perioden m eine immer größere Anzahl lim

m→∞ 1 + _mⁱ^m·n

so l¨auft der Ausdruck gegen eⁱ und man spricht vonstetiger Verzinsung. Die Formel f¨ur das Endkapital nach n Jahren bei stetiger Verzinsung lautet:

Kn =K0·e^i·n

Der hierzu konforme Zinssatz (ief f) wird mit folgender Formel berechnet:

ief f =eⁱ−1

2.5. Gemischte Verzinsung

Wird ein Kredit aufgenommen, der nicht genau zu Beginn der Zinszeit aufgenommen wird, so wird bis zum n¨achsten Zinstermin mit einfacher Verzinsung gerechnet. Nach dem Zinstermin wird normal exponentiell verzinst. Wird auch nicht zum Zinstermin abgehoben, wird bis zum Abheben ebenfalls einfach verzinst. Die Usance ist hierbei

30

360. Die Verwendete Formel ist:

Kn=K0·

1 + t1

360·i

| {z }

Zeitraum1

· (1 +i)ⁿ

| {z }

N ormaleV erzinsung

·

1 + t2

360·i

| {z }

Zeitraum2

(10)

3. Rentenrechnung

Eine Rente ist ein konstanter Fluss an Ein- bzw. Auszahlungen in periodischen Raten r, die über eine gewisse Laufzeit verzinst werden. Renten gibt es ebenfalls vorschüssig und nachschüssig.

3.1. Nachsch¨ ussige Rente

Möchte man berechnen, wie viel Geld bei nachschüssiger Rente (Geld jeweils am Ende des Jahres einzahlen), so wird die Formel für denRentenendwert verwendet:

Rn=r·

n

X

i=1

qⁱ⁻¹=r· qⁿ−1 q−1

| {z }

Rentenendwertf aktor sn

Möchte man wissen, wie viel die Rente nachnJahren heute wert ist, so benötigt man die Formel für denRentenbarwert

R₀= R_n

qⁿ =r· s_n

qⁿ =r· 1

qⁿ · qⁿ−1 q−1

| {z }

Rentenbarwertf aktor b_n

M¨ochte man wissen, wie viele Jahrenman von einem KapitalR₀bei einer Verzinsung von i, jedes Jahr am Jahresende eine Rate r abheben kann, bevor das Geld alle ist, verwendet man folgende Formel:

n=−ln 1−^R_r⁰ ·i ln(1 +i)

3.2. Vorsch¨ ussige Rente

Im Vergleich zur Nachschüssigen Rente, wird die Rate r jeweils am Jahresanfang eingezahlt. Somit wird die erste Einzahlung bereits verzinst (dies war bei der nachschüssigen Rente nicht der Fall). Somit müssen alle Formeln für die vorschüssige Rente um den

(11)

Faktorq angepasst werden:

s⁰_n = q·^q_q−1ⁿ⁻¹ b⁰_n = _qn−1¹ ·^q_q−1ⁿ⁻¹ R⁰_n = r·s⁰_n R⁰₀ = r·b⁰_n= ^R_q_n⁰ⁿ Die Umformung nach nmmuss wie folgt angepasst werden:

n= 1− ln

q−^R_r⁰⁰ ·i ln(1 +i)

3.3. Ewige Rente

Möchte man wissen, wie viel Geld man zu einem gegebenen Zinssatz anlegen muss, um auf Ewig eine gewisse Rate abheben zu können, ohne dass das Anfangskapital schrumpft, so verwendet man die Formel für dieewige Rente. Die Formel hierfür ist:

linear exponentiell R0= ^r_i R⁰₀=q·^r_i

(12)

4. Kapitalaufbau und Kapitalverzehr

Wenn man Geld einzahlt, das verzinst wird, und danach in Raten erneut Geld einzahlt (oder abhebt) so spricht man von Kapitalaufbau (oder Kapitalverzehr).

Wird eingezahlt und sofort danach beginnen die Ratenzahlungen, so kann folgende Gleichung verwendet werden, um das Kapital nach n Jahren zu berechnen:

Aufbau Verzehr

K_n=K₀·qⁿ+r·^q_q−1ⁿ⁻¹ K_n=K₀·qⁿ−r· ^q_q−1ⁿ⁻¹

M¨ochte man wissen, welche Rate man n Jahre lang abheben kann, bis das Geld zu Ende ist, l¨asst sich folgende Formel zu Hilfe ziehen:

r=−Kn·qⁿ· q−1 qⁿ−1

Beginnt man nun allerdings nicht direkt nach der Ersten Einzahlung mit den Ratenzahlungen, sondern lässt das Kapital erstnsJahre vermehren und beginnt dann fürnE Jahre mit den Raten, so lässt sich mitnG =nS+nE folgende Formel herleiten:

Kn=K0·qⁿ^G−r·qⁿ^E−1 q−1

F¨ur die obige Fragestellung der passenden Rate ergibt sich folgende Formel:

r=−K_n·qⁿ^G· q−1 qⁿ^E−1

4.1. Unterj¨ ahrige Ratenzahlung

Erfolgt die Ratenzahlung nicht J¨ahrlich sondern in m Perioden pro Jahr, so gibt es mehrere Methoden f¨ur die Berechnung der Verzinsung:

4.1.1. Sparbuchmethode

Bei der Sparbuchmethode wird für die Verzinsung der unterjährigen Ratenzahlung die lineare Verzinsung angewandt. Zuerst wird die effektive Jahresrater_Eberechnet. Diese zu r konforme jährliche Rentenrate wird dann immer in die normale nachschüssige

(13)

Rentenformel (Punkt 3.1) eingesetzt. Die unterjährige Rentenrate hingegen kann sowohl vorschüssig als auch nachschüssig gezahlt werden:

Vorsch¨ussig Nachsch¨ussig r_E=r m+^m−1₂ ·i

r⁰_E=r m+^m+1₂ ·i verwendeter Unterj¨ahriger Zinssatz:ip=_mⁱ.

4.1.2. ICMA-Methode

Bei der Methode der International Capital Market Association wird innerhalb des Jahres exponentiell statt linear verzinst. Somit werden weniger Zinsen f¨ur unterj¨ahrige Ratenzahlungen generiert. Hierbei wirdip anders berechnet: ip= (1 +i)^m¹ .

Das Kapital nachnJahren beimPerioden pro Jahr wird dann wie folgt berechnet:

R_n,m=r· q_p^m·n−1 qp−1

4.1.3. US-Methode

Die US-Methode funktioniert gleich wie die ICMA-Methode, außer dass ip= i m . Für den Rest der Berechnung kann die Formel der ICMA-Methode hergezogen werden. Bei der US-Methode werden die meisten Zinsen für unterjährige Ratenzahlungen generiert.

(14)

Teil II.

Statistik

(15)

5. Grundbegriffe

Bei der Statistik gibt es einige Grundbegriffe, die in Tabelle 5.1 gelistet werden. Bei Merkmalen wird auch noch zwischen verschiedenen Merkmalstypen, wie in Taelle 5.2, unterschieden. Mit diesen Begriffen lassen sich nun Statistische Erhebungen erstellen.

Hierbei wird zwischenabsoluter Häufigkeit(die Anzahl an Elementen mit entsprechender Merkmalsausprägung) undrelativer Häufigkeit(Absolute Häufigkeit / Referenzgruppe) unterschieden.

Die relative H¨aufigkeit kann sowohl auf die Grundgesamtheit bezogen werden, als auch auf eine spezielle Gruppe (z.B. M¨annlich / Weiblich).

Begriff Beispiel

Erhebungseinheit Pr¨uflinge Grundgesamtheit Alle Pr¨uflinge

Merkmal Punkte

(16)

Weitere Zusammenfassungen von Malte Jakob gibt es unter i-malte.jimdofree.com

Merkmalstyp Beschreibung Beispiel

Nominal Wertungsfreie Elemente, die durch Zahlen Codiert werden k¨onnen 1: Sony, 2: Phillips . . .

Ordinal Gewertete Codierung mit Zahlen 1: Sehr gut, 2: Gut . . .

Imperisch

Alles, was in Zahlen ausgedr¨uckt werden kann

Kontinuierlich (Stetig) Diskret

Alle Werte innerhalb eines Intervalls (z.B. 2,3) Nur ganze Werte Tabelle 5.2.: Merkmalstypen

(17)

6. Kennzahlen statistischer Verteilung

6.1. Arithmetisches Mittel

Das Arithmetische Mittel wird wie folgt berechnet:

x= PN

i=1xi

N =

k

X

i=1

P_i·x_i

WobeiP_idie relative H¨aufigkeit des entsprechenden Elements ist undkdie Anzahl an Merkmalsauspr¨agungen.

6.2. Geometrisches Mittel

pn

Πⁿ_i=1x_i

6.3. Median

Der Median eignet sich für einen ”Durchschnitt”, bei dem Ausreißer weniger stark berücksichtigt werden. hierbei werden alle Elemente aufsteigend sortiert. Ist die Anzahl der Elemente der Grundgesamtheit ungerade, so wird das Mittlere Element als Median ausgewählt. Ist sie gerade, so wird der Mittelwert aus den beiden mittleren Elementen als Median gewählt.

6.4. Modus

Der Modus w¨ahlt den Wert, der am h¨aufigsten in der Gesamtheit vorkommt.

6.5. Varianz (Streuung) und Standardabweichung

Varianz:

2

PN

i=1(x_i−x)² X^k ₂

(18)

6.6. Gini-Koeffizient

Der Gini-Koeffizient ist ein Wert, der eine Aussage ¨uber die Verteilung von Merkmalsauspr¨agungen in gewissen Merkmalsgruppen aussagt.

Hat jede Gruppe den selben Anteil, (z.B. Von 100 Personen hat jede Person 1e), so

ist der Gini-Koeffizient 0 – also eine perfekte Gleichverteilung. Sind alle Merkmalsauspr¨agungen auf eine Erhebungseinheit konzentriert, (z.B. Eine Person hat 100 e, der Rest 0) so

handelt ist der Gini-Koeffizient 1 – Hierbei handelt es sich dann um die maximale Konzentration Amax. Diese Konzentration wird wie folgt berechnet:

Amax= 1 2

1− 1

N

WobeiNdie Anzahl der Erhebungseinheiten ist (Achtung: nicht die Anzahl der Gruppen!).

Der Gini-Koeffizient wird daraufhin wie folgt berechnet:

G= Lorenzfl¨ache

1

2 1−_N¹

Die Lorenzfl¨ache ist hierbei die Fl¨ache, die zwischen der Kurve der Gleichverteilung und der Lorenzkurve liegt.

Die Lorenzkurve ist eine Kurve, die den kumulativen Anteil an den Merkmalsauspr¨agung mit dem kumulativen Anteil an der Grundgesamtheit in Verbindung bringt.

Diese Fläche lässt sich jedoch nicht so leicht berechnen. Die Fläche, die unter der Lorenzkurve liegt hingegen schon. Diese Fläche lässt sich in lauter rechtwinklige Dreiecke und Rechtecke aufteilen, deren Flächen sich leicht berechnen lassen. Die Summe dieser Flächen wird daraufhin von der Fläche abgezogen, die unter der Gleichverteilung liegt (= ¹₂); Das Ergebnis ist die Lorenzfläche.

(19)

7. Kenngr¨ oßen f¨ ur statistische Zusammenh¨ ange

Ein statistischer Zusammenhang liegt immer dann vor, wenn die Verteilung nicht der Erwartung entspricht, z.B. wenn 60% aller Studierenden weiblich sind, so sollte der Anteil an weiblichen Studierenden in jedem Studiengang ebenfalls bei 60% liegen – andernfalls liegt ein statistischer Zusammenhang zwischen Geschlecht und bevorzugten Studiengang vor.

Es gibt unterschiedliche Kenngr¨oßen f¨ur die unterschiedlichen Merkmalstypen. Treten in einer Betrachtung mehrere Typen auf, so gibt es eine Reihenfolge:

1. Metrisch 2. Ordinal 3. Nominal

Hierbei wird die Kenngr¨oße f¨ur den Merkmalstypen ausgewertet, der in dieser Anordnung am tiefsten liegt.

7.1. Nominale Kenngr¨ oßen

Bei obigem Beispiel waren beide Merkmale (Geschlecht und Studiengang) Nominal – also wertungsfreie Werte, die durch Zahlen codiert werden k¨onnen.

Das Zusammenhangsmaßχ²wird bei nominalen Merkmalstypen wie folgt berechnet:

χ²=N·

s

X

i=1





t

X

j=1

(p^b_ij−p^e_ij)² p^e_ij

!



Hierbei sindiundj die entsprechenden Merkmalsauspr¨agungen (hier Geschlecht und Studiengang), undsundtdie entsprechende Anzahl der Merkmalsauspr¨agungen (z.B.

2 Geschlechter und 5 Studiengänge→s= 2;t= 5).pêsteht für die erwartete relative Häufigkeit (bezogen auf die Grundgesamtheit) der jeweiligen Merkmalskombination, p^b steht für die tatsächlich beobachtete.

(20)

Weitere Zusammenfassungen von Malte Jakob gibt es unter i-malte.jimdofree.com Das Ergebnis reicht von 0 bis 1, wobei 0 bedeutet, dass es gar keinen Zusammenhang gibt und 1 weist auf einen nahezu statischen Zusammenhang hin. 0,5 macht dementsprechend keine Aussage.

7.2. Metrische Kenngr¨ oßen

Besteht eine Auswertung aus zwei metrischen Merkmalen, so kann ein Merkmal in Abh¨angigkeit des anderen in einem Koordinatensystem dargestellt werden (z.B. x- Achse = Alter, y-Achse = Einkommen).

Von diesen x und y Merkmalen wird nun der Mittelwert x und y berechnet. F¨ur jedes Merkmal wird nun ein Rechteck berechnet, das den Abstand zum Mittelwert in beiden Dimensionen darstellt. Aus allen Rechtecken wird daraufhin der Mittelwert gebildet und es entsteht die Kovarianz:

PN

i=1(xi−x)·(yi−y)

N =s_xy

Nun wird die Kovarianz noch durch die Standardabweichungen (Siehe Punkt 6.5) der einzelnen Merkmale geteilt, sodass der Korrelations- Koeffizient entsteht:

r= sxy

s_x·s_y Wobei

0<|r|<1

Je n¨aher|r| an 1 ist, desto st¨arker ist die Korrelation. Istr >0 so handelt es sich um einen aufsteigenden Zusammenhang, istr <0, ist es ein absteigender Zusammenhang.

EineRegressionsgerade mit der Gleichungy =mx+bist eine Gerade, die Versucht den Verlauf der Punkte bestmöglich anzunähern. Mathematisch ausgedrückt, ist es die gerade, bei der die Summe allerResiduen – die y-Abstände der Geraden an Stelle x zu den Punkten an der Stelle x – minimal ist. Die Koeffizienten werden wie folgt berechnet:

m= sxy

s²_x b=y−m·x

7.3. Ordinale Kenngr¨ oßen

Ordinale Merkmale werden anhand einer Skala bewertet (z.B. Schulnoten von 1 bis 6).

Meist werden allerdings nicht die selben Skalen verwendet. Ebenfalls beeinflusst selbst bei gleichen Skalen die Wahl der Skala das Ergebnis (z.B. statt Schulnoten 0 bis 199 Punkte). Um diese Störfaktoren zu beseitigen, werden die Merkmale von den Skalen in eindeutige Ränge übertragen. Gibt es z.B. mehrere Schüler mit Noten in einer Klausur und die beste Note ist 2, so bekommt der Schüler mit der besten Note den Rang 1 – selbst wenn es nicht die beste Note auf der angewandten Skala war – der zweitbeste den Rang 2 usw. Haben mehrere Schüler den selben Wert auf der Skala, so wird der

(21)

entsprechende Mittelwert berechnet. z.B. haben 3 Schüler die Note 2,1 (zweitbeste Note), also Belegen die Schüler die Ränge 2, 3 und 4 – der Mittelwert hieraus ist 3:

dieser Rang wird all diesen Schülern zugewiesen. Der nächste Schüler bekommt den Rang 4, dann 5 usw.

Ist dieses Einordnen in R¨ange bei beiden Merkmalen erfolgt, so kann die Methode aus 7.2 angewandt werden.

(22)

8. Kombinatorik

8.1. Permutationen

Wenn danach gefragt wird, in wie vielen verschiedenen ReihenfolgennObjekte angeordnet werden k¨onnen, dann fragt man nach der Anzahl der PermutationenPn =n!. F¨ur sehr großenkann dieStirlingsche Formel angewandt werden:

n→∞lim(n!) = lim

n→∞

√

2πn·nⁿ·e⁻ⁿ·

1 + 1

12n+ 1

288n² +· · ·

Wobei für große n der Ausdruck nach e⁻ⁿ vernachlässigt werden kann. Zudem gibt es noch eine gesonderte Formel für die zirkuläre Permutation (z.B. Anordnung von Gästen bei einem kreisrunden Tisch): (n−1)!.

Bei Permutationen, bei denen es mehrere Gleiche Elemente k1, . . . , kn gibt, gilt folgende Formel:

P_n^(k¹^,...,kⁿ⁾= n!

k1!· · · · ·kn!

8.2. Binomialkoeffizient

Sollen aus einer Gewissen Menge n nur eine gewisse Anzahl k entnommen werden (ohne Wiederholung), so ist die Anzahl der Kombinationen:

n k

:= n!

k!(n−k)!

F¨ur den Binomialkoeffizienten gelten folgende Rechenregeln:

0 0

= n

0

= n

n

= 1 n+ 1

k+ 1

= n

k

+ n

k+ 1

8.2.1. Kombinationen

Kombinationen zeichnen sich durch folgende Merkmale aus: ausn Elementen werden k Elemente ausgew¨ahlt und zusammengestellt. Die Reihenfolge ist hierbei egal.

Die Formel f¨ur eine Kombination, bei der es keine Wiederholungen gibt (z.B. Lotto), ist:

Cn,k= n

k

(23)

Ohne Wiederholung Mit Wiederholung Kombinationen

k-ter Ordnung C_n,k= n

k

Cn^(k)=

n+k−1 k

Ungeordnete Stichproben Variationen

k-ter Ordnung Vn,k= _(n−k)!^n! Vn^(k)=n^k Geordnete Stichproben Ohne zur¨ucklegen Mit zur¨ucklegen

Tabelle 8.1.: ¨Ubersicht der Formeln Alle Elemente angeordnet?

@

@ R

Ja Nein

Alle verschieden?

@

@ R

Ja Nein

Pn Pn^(k)

Reihenfolge wichtig?

@

@ R

Ja Nein

Wiederholungen? Wiederholungen?

@

@ R

Ja Nein @

@

@ R

Ja Nein

Vn^(k) Vn,k Cn^(k) Cn,k

Treten Wiederholungen auf (z.B. bei M¨unzw¨urfen), dann gilt folgende Formel:

C_n^(k)=

n+k−1 k

8.2.2. Variationen

Eine Variation ist wie eine Kombination. Der einzige Unterschied ist, dass hier die REihenfolge der Elemente wichtig ist.

Die Formel f¨ur eine Variation ohne Wiederholungen lautet:

Vn,k = n!

(n−k)!

Kommen Wiederholungen vor, so gilt:

(24)

9. Wahrscheinlichkeit

Bei der Wahrscheinlichkeitsrechnung gibt es eine Zufallsvariable X, die verschiedene Wertexiannehmen kann, wobei die Wahrscheinlichkeit / relative H¨aufigkeit des Auftretens dieses Wertes pi, mit 0≤pi≤1, entspricht.

F¨urpi gelten zudem noch folgendes:

Pn

i=1pi= 1 p_i= lim

N→∞

h_i N

Mith_i= absolute H¨aufigkeit des Wertes.

F¨ur die Wahrscheinlichkeit gilt zudem noch folgendes:

P(P(xi)∨P(xj) =P(xi) +P(xj)(=bP) P(P(xi)∧P(xj)) =P(xi)·P(xj)(=Π)b

9.1. Verteilung und Verteilungsfunktion

−4 −2 0 2 4

0.1 0.2 0.3 0.4

x_i P(xi)

Wahrscheinlichkeiten werden auch oft in Graphen wie diesem dargestellt. Die Wahrscheinlich- keitsverteilung gibt f¨ur einen gewissen Wert x_i dessen WahrscheinlichkeitP(x_i) an.

Die VerteilungsfunktionF(x_i) gibt die alle aufsummierten Wahrscheinlichkeiten bis inklusive die des Wertes an:F(x_k) =Pk

i=1P(x_i).

(25)

Zudem gilt:

P(a < X < b) =F(b)−F(a) P(a < X) = 1−F(a)

9.2. Kenngr¨ oßen

Die Kenngr¨oßen sind gleich wie in 6 beschrieben, jedoch gibt es andere Bezeichnungen:

Mittelwert: µ, oder E(x), wobei x ein beliebiger Ausdruck oder die Zufallsvariable sein kann. DasE steht f¨ur

”Erwartungswert“.

Varianz/Standardabweichung σ=sbzw.σ²=s²=v

Der Zusammenhang zwischen Mittelwert und Varianz ist wie folgt definiert:

σ²=E((X−µ)²) =E(X²)−µ²

Zudem gibt es die Schiefheit (Skewness), die angibt, wie viel die Wahrscheinlichkeit nach Links/rechts zur Mitte verschoben ist:

γ= Pn

i=1(xi−µ)³·P(xi) σ³

9.3. Binomialverteilung

Die Binomialverteilung ist ein Beispiel f¨ur eine diskrete Wahrscheinlichkeitsverteilung.

Voraussetzung hierf¨ur ist, dass die ZufallsvariableX nur zwei Werte annehmen kann:

Gew¨unschtes Ergebnis und nicht gew¨unschte Ergebnis. So giltP(1) =P(1) undP(2) = 1−P(1).

Gibt es nun eine ungeordnete Stichprobe mit zurücklegen, bei der es n Ziehungen gibt und man wissen möchte, wie groß die Wahrscheinlichkeit für k

”Treffer“ ist, so gilt die Formel:

p^k(1−p)^n−k· n

k

=P(X=k) =Bn,p(k) Wobeipdie Wahrscheinlichkeit f¨ur einen

”Treffer“ ist.

Die Verteilungsfunktion kumuliert auch hier die Wahrscheinlichkeiten auf.

9.4. Poisson- und exponentielle Verteilung

Wenn die Wahrscheinlichkeit f¨ur das Auftreten sehr gering ist (p→0) und die Anzahl

(26)

Weitere Zusammenfassungen von Malte Jakob gibt es unter i-malte.jimdofree.com Diese Approximation wird Poisson-Verteilung genannt. Oft wird diese Formel f¨ur Seltene Ereignisse ab n≥10∧p≤0,05 verwendet.

Werden über einen langen Zeitraum Versuche zu unwahrscheinlichen Ereignissen durchgeführt, bei denen die Wahrscheinlichkeiten gleich bleiben, so ist die Anzahl der Auftretenden Ergebnisse über die verschiedenen Experimente ebenfalls nach der Poisson-Verteilung verteilt. Der Abstand xzwischen zwei solcher Ereignisse ist dann nach derExponentiellen Verteilungverteilt, die einen Spezialfall derWeibull-Verteilung darstellt, wobeiλ=µ, also der Mittelwert der bisherigen Experimente:

f(x) = 1

1 λ

· x−0

1 λ

1−1

·e⁻

x−0 1 λ

1

=λ·e^−λx

Das Ergebnis ergibt einen Abstandx >0, zwischen zwei Ergebnissen in dem nicht mit der Poisson-Verteilung approximiert werden darf.

W¨ahlt man f¨ur die Weibull-Verteilung andere Parameter, so kann sie zurWigner- Verteilung vereinfacht werden:

f(x) =πx 2 ·e⁻^πx

2 4

9.5. Hypergeometrische Verteilung

Während die Binomialverteilung angewandt wird, wenn es Ziehungen mit Zurückliegen gibt, sollte beiZiehungen ohne zurücklegendieHypergeometrische Verteilungangewandt werden. Für große n Nähern sich die Verteilungen an, bei kleineren n ist es jedoch relevant, ob zurückgelegt wird oder nicht.

Wenn also wie z.B. bei einem Lottospiel eine Menge N aus zwei untermengen N1

und N2 besteht (hier:

”Gewinner-Zahlen“ und

”Verlierer-Zahlen“), aus denen ohne zur¨ucklegen jeweils eine gewisse Anzahl n1 und n2 gezogen werden soll (hier z.B. 6 richtige, 0 falsche), so lautet die Formel f¨ur die Hypergeometrische Verteilung wie folgt:

P(X =n1) =HN1,N2,n(n1) =

N1

n₁

· ^N_n²

2

N n

(27)

Teil III.

Lineare Optimierung

(28)

10. Lineare Optimierung

Bei der linearen Optimierung geht es um die Lösung eines linearen Ungleichungssystems, deren Zielfunktion von mehreren Variablen abhängt und für diese Variablen zusätzliche Nebenbedingungen existieren.

Eine Zielfunktion

F( x1, x2, . . . , xp

| {z }

Strukturvariablen

) =c1·x1+c2·x2+· · ·+cp·xp

soll maximiert werden. Dies kann z.B. Erl¨os des Verkaufs von p unterschiedlichen Produkten sein. Hierbei gibt es jedochmlineare Nebenbedingungen

a₁₁x₁+a₁₂x₂+· · ·+a_1px_p≤b₁ a₂₁x₁+a₂₂x₂+· · ·+a_2px_p≤b₂ ... + ... +. ..+ ... ≤ ... a_m1x₁+a_m2x₂+· · ·+a_mpx_p≤b_m

die erfüllt werden müssen. z.B. Begrenzungen in der Arbeitszeit oder in Rohstoffen zur Produktion. Zudem gibt es eine Positivitätsbedingung xi ≥ 0 i = 1, . . . , p, die Sicherstellt, dass alle Komponenten positiv sind (da man z.B. keine negative Anzahl an Produkten verkaufen kann).

Ein Vektor~x= (x₁, x₂, . . . , x_p) heißt

L¨osung, wenn er alle Nebenbedingungen erf¨ullt

zulässige Lösung, wenn er eine Lösung ist und die Positivitätsbedingung erfüllt optimale Lösung, wenn er eine zulässige Lösung ist, die die Zielfunktion optimiert.

10.1. Graphische L¨ osung

Ein solches lineares Problem kann graphisch gel¨ost werden, wenn die Zielfunktion lediglich von zwei Strukturvariablen abh¨angt.

In diesem Fall kann jede Nebenbedingung nachx2aufgel¨ost werden und die entsprechende Gerade in ein Koordinatensystem eingezeichnet werden, in dem x2 auf der y- undx1

auf der x-Achse liegt. Da die Form der Nebenbedingungen immer ≤entspricht, so ist jeder Punkt der links von / unter allen Geraden ist eine Lösung des Problems. Ist der Punkt für x1 undx2≥0, so ist er auch noch eine zulässige Lösung.

Nun wird die Zielfunktion (im unteren Graphen rot) ebenfalls nach x2 aufgel¨ost an den Ursprung gezeichnet und so lange nach rechts/oben verschoben, bis sie den

(29)

äußerst-möglichen Eckpunkt des Lösungsraumes (Simplex) erreicht hat. Dies ist das Optimum, da jede Erhöhung vonx₁ oderx₂dazu führen würde, dass es keine Lösung mehr ist und die werte somit an ihrem gemeinsamen Maximum angekommen sind.

0 20 40 60 80 100

0 20 40 60 80 100 120

x1

x2

10.2. Rechnerische L¨ osung

Werden jedoch mehr als zwei Strukturvariablen verwendet, so ist eine graphische L¨osung nicht mehr m¨oglich. So muss die Zielfunktion ummSchlupfvariablen erweitert werden. Da die eigentliche Funktion jedoch nicht beeinflusst werden darf, werden diese mit 0 multipliziert:

F(x1, x2, . . . , xp, xp+1, . . . , xp+m) =c1·x1+c2·x2+· · ·+cp·xp+ 0·xp+1+· · ·+ 0·xp+m

Zus¨atzlich werden die Nebenbedingungen mit den Schlupfvariablen erweitert:

a11x1+a12x2+· · ·+a1pxp +xp+1 ≤b1

a21x1+a22x2+· · ·+a2pxp +xp+2 ≤b2

... + ... +. ..+ ... ≤ ...

am1x1+am2x2+· · ·+ampxp +xp+m≤bm

Nun werden alleBasislösungenberechnet. Eine Basislösung ist eine Lösung der jeweiligen Nebenbedingungen, in der p Variablen = 0 gesetzt werden. Diese variablen werden

Basisvariablengenannt, die anderen heißenNichtbasisvariablen. Der Wert der Nichtbasisvariablen wird berechnet. Um alle Basislösungen zu erhalten müssen also alle Möglichkeiten der

(30)

10.3. Primaler Simplex-Algorithmus

Da die Berechnung aller Basislösungen sehr aufwändig sein kann, wurde ein Algorithmus entwickelt. Hierfür wird zuerst einSimplex-Tableauerstellt, in das eine zulässige Basislösung eingefügt wird (meist die, in der alle Strukturvariablen = 0 sind). Dies sieht dann wie folgt aus:

Nichtbasisvariable Basisvariablen (BV) x1 . . . xp xp+1 . . . xp+m bi

BV

xp+1 a11 . . . a1p 1 . . . 0 b1

... ... . .. ... . .. ...

xp+m am1 . . . amp 0 . . . 1 bm

F-Zeile −c1 . . . −cp 0 . . . 0 0

Dabei ist der Eintrag in der Zelle unten Rechts der aktuelle Wert der Zielfunktion.

Der Algorithmus folgt folgendem Verhaltensmuster:

1. Wahl der T-Spalte

Suche die Spalte mit den gr¨oßten Betragswert der negativen Zahlen in der F- Zeile. (Bei gleichen Werten darf frei zwischen diesen gew¨ahlt werden).

2. Wahl der zugeh¨origen S-Zeile

Falls in der Spalte nur Werte ≤ 0 sind, so kann die Berechnung abgebrochen werden und es gibt keine optimale L¨osung. Andernfalls ist die S-Zeile diejenige, bei der das Ergebnis der Rechnung _a^b^s

st f¨ura_st>0 minimal ist. Das Elementa_st heißtPivotelement.

3. Berechnung der neuen Basisl¨osung des neuen Simplex-Tableaus

a) Die bisherige Basisvariable der S-Zeile wird mit der Nichtbasisvariable der T-Spalte vertauscht

b) Die S-Zeile wird mit ast normiert, also jeder wert der Zeile durch das Pivotelement geteilt.

c) Alle Elemente ¨uber und unter dem Pivotelement (auch das der F-Zeile) werde mithilfe von Umformungen (Gauß-Verfahren) zu 0 gemacht.

4. Wiederholen

Schritte 1 bis 3 werden so lange wiederholt, bis alle Elemente der F-Zeile ≥0 sind.

Der Wert der Strukturvariablen kann aus dem End-Tableau herausgelesen werden.

Er steht in derbi-Zelle in der entsprechenden Zeile. Sollte eine Strukturvariable keine eigene Zeile haben, so ist sie 0.

(31)

10.4. Umwandlung von Aufgabenstellungen

Der primale Simplex-Algorithmus kann nur auf Maximierungsprobleme angewandt werden, bei dem alle Nebenbedingungen die Struktur

c₁·x₁+· · ·+c_p·x_p≤b_i aufweisen. Hat eine Nebenbedingung die Struktur

c₁·x₁+· · ·+c_p·x_p≥b_i

, so kann sie durch eine Multiplikation mit −1 umgewandelt werden:

−c1·x1+· · ·+−cp·xp≤ −bi

Entspricht die Struktur einer Nebenbedingung einer Gleichung c1·x1+· · ·+cp·xp=bi

, so kann diese in zwei nebenbedinungen umgewandelt werden:

c₁·x₁+· · ·+c_p·x_p≤b_i c₁·x₁+· · ·+c_p·x_p≥b_i

Hierbei muss die untere Ungleichung noch mit−1 multipliziert werden.

Handelt es sich bei dem linearen Problem um einMinimierungsproblem, so muss die ZielfunktionF(x1, . . . , xp) mit−1 multipliziert werden.

10.5. Verfahren zur Berechnung einer zul¨ assigen Basisl¨ osung

Der primale Simplex-Algorithmus funktioniert nur, wenn er mit einer zulässigen Basislösung beginnt. Sollte die eingesetzte Basislösung (meist werden alle Strukturvariablen auf 0 gesetzt) ungültig sein, was sich leicht erkennen lässt, da in diesem Fall die bi-Spalte mindestens einen negativen Wert beinhaltet, so muss zuerst eine zulässige Basislösung gefunden werden. Hierbei wird in folgenden Schritten verfahren:

1. Wahl der S-Zeile

Ist inb_i alles positiv, so ist die Basislösung bereits zulässig. Ansonsten wird die Zeile als S-Zeihle gewählt, bei derb_i am kleinsten ist.

2. Wahl der T-Spalte

Falls es in der gefundenen S-Zeile kein a < 0 gibt, gibt es keine zul¨assige

(32)

Weitere Zusammenfassungen von Malte Jakob gibt es unter i-malte.jimdofree.com 4. Wiederholen

Schritte 1 bis 3 werden so lange wiederholt, bis alleb_i≥0 sind. Ist dies der Fall, so kann nun mit dem Verfahren aus 10.3 begonnen werden.