• Keine Ergebnisse gefunden

Deskriptive Statistik

N/A
N/A
Protected

Academic year: 2022

Aktie "Deskriptive Statistik"

Copied!
36
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Deskriptive Statistik

Statistik (Biol./Pharm./HST) – FS 2015

(2)

Halbzeit !

(3)

Lernziele

Grundlagen:

- Wa.modell - Unabh.

- Bed. Wa.

- diskrete ZV - Verteilungen - Kennzahlen

Am Bsp vom Binomialtest:

- Test (Fehler 1. Art, Macht) - p-Wert

- Vertrauensintervall

2

Deskriptive Statistik:

- Zahlen

- Graphiken

Am Bsp vom t-Test:

- Test (Fehler 1. Art, Macht) - p-Wert

- Vertrauensintervall

Lineare Regression - einfach

- multiple

Gemacht To Do

(4)

Statistische Inferenz:

Drei Methoden

(5)

Statistische Inferenz:

Drei Methoden

Hypothesentest

(6)

Hypothesentest

(Input: Sign.niveau, Daten)

1. Modell

2. H0, HA

3. Teststatistik etc.

4. Sign.niveau

5. Verwerfungsbereich etc.

6. Testentscheid

+ Klares Prozedere + Klare Aussage über

Fehler 1./2. Art

- Wie deutlich wurde verworfen?

- Wie gross ist der

wahre Parameter?

(7)

Statistische Inferenz:

Drei Methoden

Hypothesentest

p-Wert

(8)

p-Wert

(Input: Daten)

Kleinstes Sign.niveau,

bei dem Test gerade noch verwirft

Gegeben H0;

wie plausibel ist die

Beobachtung oder etwas noch extremeres?

+ Klar, ob und wie deutlich verworfen wird

- Keine klare Aussage über Fehler 1./2. Art - Wie gross ist der

wahre Parameter?

(9)

Statistische Inferenz:

Drei Methoden

Hypothesentest p-Wert

Vertrauensintervall

(10)

95% - Vertrauensintervall

(Input: Sign.niveau, Daten)

Enthält wahren Parameter mit Wa. 95%

Enthält alle Parameter, bei denen ein Test auf dem

5% Niveau NICHT verwirft (= plausible Werte)

+ Klar, ob und wie deutlich verworfen wird

+ Klar, wie gross der wahre Parameter etwa ist

- Keine klare Aussage über Fehler 1./2. Art

(11)
(12)

„There are three kinds of lies:

lies,

damned lies, and statistics.“

Mark Twain zitiert britischen Premierminister Benjamin Disraeli

(13)

„It's easy to lie with statistics;

it is easier to lie without them.“

Frederick Mosteller

Gründer Statistik-Department, Harvard

(14)
(15)

Beschreibe mit einem Wort!

Pferde ?

Marc ? blau ?

(16)

Ohne Reduktion ist kein Überblick möglich

Bei jeder Datenreduktion kann wichtige Information

verloren gehen

(17)

Simpson's Paradox

(Bsp: Aufgenommene Studenten an der UC Berkeley in 1973)

Werden Frauen benachteiligt?

Bewerber Aufgenommen

Männer 8442 44%

Frauen 4321 35%

(18)

Simpson's Paradox

(Bsp: Aufgenommene Studenten an der UC Berkeley in 1973)

Dept Männer Frauen

Bew. Akz. Bew. Akz.

A 825 62% 108 82%

B 560 63% 25 68%

C 325 37% 593 34%

D 417 33% 375 35%

E 191 28% 393 24%

F 272 6% 341 7%

(19)

Simpson's Paradox

(Bsp: Aufgenommene Studenten an der UC Berkeley in 1973)

Dept Männer Frauen

Bew. Akz. Bew. Akz.

A 825 62% 108 82%

B 560 63% 25 68%

C 325 37% 593 34%

D 417 33% 375 35%

E 191 28% 393 24%

F 272 6% 341 7%

(20)

Simpson's Paradox

(Bsp: Aufgenommene Studenten an der UC Berkeley in 1973)

Nein: Frauen bewerben sich mehr bei „schwierigen“ Departments!

Dept Männer Frauen

Bew. Akz. Bew. Akz.

A 825 62% 108 82%

B 560 63% 25 68%

C 325 37% 593 34%

D 417 33% 375 35%

E 191 28% 393 24%

F 272 6% 341 7%

(21)

Arrow's Paradox: Demokratie

Einzelmeinungen

Wahlergebnis

(22)

Arrow's Paradox: A, B oder C?

17 Personen müssen zw. A, B oder C entscheiden.

Präferenzen:

5 A > B > C 2 A > C > B 2 C > A > B 4 C > B > A 4 B > C > A

Mehrheit (1,0,0):

A gewinnt

Platz 1 oder 2 (1,1,0):

B gewinnt

Borda Count (2,1,0):

C gewinnt

Paarweise:

A>B, B>C, C>A Unentschieden

?!

Wahlmethode entscheidend !

(23)

Finde gute Wahlmethode:

Anforderungen

Transitiv:

Wenn A > B, B > C dann A > C

Pareto effizient:

Wenn A > B für alle Wähler, dann muss A > B auch im Wahlentscheid sein

Independence of Irrelevant Alternative (IIA):

Wenn A > B > C und C stirbt, soll A > B bleiben

(24)

Arrow's Impossiblity Theorem

Falls 3 oder mehr Optionen:

Es gibt kein Wahlsystem, das alle drei

Anforderungen erfüllt.

(25)

Quantil - Bsp

Quelle: Kinderspital Zurich 24

(26)

Quantil - Intuition

25

1, 1, 3, 5, 7, 23, 1089

𝑞0.1 𝑞0.5 10%

50%

(27)

Quantil - Definition

𝑥𝑖 ist der i-kleinste Datenpunkt (𝑥(1) ≤ 𝑥 2 ≤ ⋯ ≤ 𝑥(𝑛))

Falls 𝛼 ∗ 𝑛 eine ganze Zahl ist:

𝑞𝛼 = 1

2 (𝑥 𝛼𝑛 + 𝑥 𝛼𝑛+1 )

Sonst

𝑞𝛼 = 𝑥(𝑘) 𝑚𝑖𝑡 𝑘 = 𝛼𝑛 + 1 2

Bsp: 1,1,3,5,7,23,1089; n = 7, 𝛼 = 0.5

→ 𝛼𝑛 = 3.5, 𝑘 = 3.5 + 1

2 = 4

→ 𝑞0.5 = 𝑥(4) = 5

26

(28)

Median und

arithmetisches Mittel

(29)

Einkommen von 7 Personen

Median

arithm. Mittel

(30)

Einkommen von 7 Personen

Median

arithm. Mittel

(31)

Einkommen von 7 Personen

Median

arithm. Mittel

Robust gegen Aussreisser

(32)

Korrelation

31

(33)

Histogramm

32

(34)

Empirische Verteilungsfunktion

(Empirical Cumulative Distribution Funtion – ECDF)

33

(35)

Boxplot

34

Median 75%-Quantil

25%-Quantil IQR

1.5*IQR oder bis

extremster Punkt

extreme Beobachtungen

(36)

Prüfung Wi10, A 4.2: Richtige Zuordnung?

35

A B C D E

1 2 3 4 5

Referenzen

ÄHNLICHE DOKUMENTE

Man nimmt an, dass man (im Prinzip auch vor der Erhebung) eine Menge M angeben kann, die alle vorstellbaren Merkmalswerte eines Merkmals enth¨alt. Das n-Tupel (x

I Verfahren f¨ur ordinalskalierte Merkmale k¨onnen nur dann eingesetzt werden, wenn beide Merkmale X und Y mindestens ordinalskaliert sind. I Verfahren f¨ur kardinalskalierte

Man nimmt an, dass man (im Prinzip auch vor der Erhebung) eine Menge M angeben kann, die alle vorstellbaren Merkmalswerte eines Merkmals enth¨alt. Das n-Tupel (x

I Verfahren f¨ur ordinalskalierte Merkmale k¨onnen nur dann eingesetzt werden, wenn beide Merkmale X und Y mindestens ordinalskaliert sind. I Verfahren f¨ur kardinalskalierte

Nein: Frauen bewerben sich mehr bei „schwierigen“ Departments. Dept Männer

Er sezt sich ans Fenster, schaut hinaus und ruft alle zwei Minuten: «Das grüne nach oben!» Der Kellner fragt ihn besorgt, ob es ihm nicht gut gehe.. Darauf der Gärtner:

Eigenschaften: Identität, Geordnetheit, Umkehrbarkeit (besser, schlechter) Ableitbare Interpretationen: Gleichheit, Größer-, Kleiner-Relationen

Schulklassen. Bestimmen Sie alle Lagemasse und vergleichen Sie. a) Wie lange benötigt er durchschnittlich? Berechnen Sie dazu den Median und den Mittelwert und vergleichen Sie