• Keine Ergebnisse gefunden

Anwendung nicht-parametrischer Statistik

N/A
N/A
Protected

Academic year: 2022

Aktie "Anwendung nicht-parametrischer Statistik"

Copied!
21
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Nicht-parametrische Statistik

Eine kleine Einführung

(2)

Überblick

• Anwendung nicht-parametrischer Statistik

• Behandelte Tests

Mann-Whitney U Test

Kolmogorov-Smirnov Test Wilcoxon Test

Binomialtest

Chi-squared Test Kruskal-Wallis Test

(3)

Anwendung nicht-parametrischer Statistik

• kleine Stichproben (bei Experimenten häufig zwischen n=6 und n=30)

• keine Annahmen über die Verteilung der Daten in der Grundgesamtheit

• ordinalskalierte und kategoriale Variablen können einfach ausgewertet werden

• Methoden ähnlich der Medizin, Biologie

(4)

Mann-Whitney U-test

Test, ob Daten aus zwei statistisch unabhängigen Stichproben (X und Y) aus derselben

Grundgesamtheit (hinsichtlich des Mittelwertes) stammen.

H0 : keine Mittelwertsunterschiede

H1 : Mittelwerte unterscheiden sich: X ≠ Y (zweiseitiger Test)

(Einseitiger Test wäre X > Y oder X < Y.)

(5)

Mann-Whitney U-test: Ein Beispiel

Ultimatum-Spiel mit VWlern vs. Nicht-VWLer:

Bringe die Beobachtungen in eine aufsteigende Reihenfolge und ordne aufsteigend Ränge zu

Angebote der VWLer 2 4 1 0.5 0.5

Angebote der Nicht-VWLer 3 2.5 5 5

offer 0.5 0.5 1 2 2.5 3 4 5 5

group V V V V NV NV V NV NV

rank 1.5 1.5 3 4 5 6 7 8.5 8.5

(6)

U-test: Ein Beispiel – Fortsetzung

Summiere die Ränge der kleineren Gruppe zu W (Testgröße) Im Beispiel: W(N) = 28 [maximaler Wert wäre W(N) = 30]

p = 0.063 (zweiseitig) (siehe Table J aus Siegel/Castellan) p = 0.048 (zweiseitig) (aus STATA)

Approximation durch Normalverteilung von W(N) für große n STATA: ranksum offer, by(study)

offer 0.5 0.5 1 2 2.5 3 4 5 5

group V V V V NV NV V NV NV

rank 1.5 1.5 3 4 5 6 7 8.5 8.5

(7)

Kolmogorov-Smirnov-Test

Test, ob Daten aus zwei statistisch unabhängigen Stichproben (X und Y) aus derselben

Grundgesamtheit (hinsichtlich der Verteilung der Beobachtungen, Mittelwert, Schiefe …) stammen.

H0 : Verteilungsgleichheit

H1 : Verteilungen sind signifikant unterschiedlich (zweiseitiger Test)

(8)

Kolmogorov-Smirnov-Test: Ein Beispiel

Ultimatum-Spiel mit VWLern vs. Nicht-VWLer:

Bestimme die kumulierten Häufigkeiten der Beobachtungen.

Angebote der VWLer 2 4 1 0.5 0.5 Angebote der Nicht-VWLer 3 2.5 5 5

offer 0.5 1 2 2.5 3 4 5

VWL 40% 60% 80% 80% 80% 100% 100%

N-VWL 0% 0% 0% 25% 50% 50% 100%

(9)

Kolmogorov-Smirnov-Test – Fortsetzung

Suche die größte (absolute) Differenz zwischen den kumulierten Häufigkeiten und bilde folgende Größen:

Dm,n = max |Sn (X) - Sm (X)|, wobei m(n) die Anzahl der Beobachtungen in beiden Stichproben ist und

Sm (X) = K/m, wobei K die Anzahl der Beobachtungen ist, die kleiner oder gleich X sind.

offer 0.5 1 2 2.5 3 4 5

VWL 40% 60% 80% 80% 80% 100% 100%

N-VWL 0% 0% 0% 25% 50% 50% 100%

Sn (X) - Sm (X) 40% 60% 80% 55% 30% 50% 0%

(10)

Kolmogorov-Smirnov-Test – Fortsetzung

Die Testgröße ist dann: m*n* Dm,n = 5*4*0.8 = 16

p = 0.10 (zweiseitig) (siehe Table LII aus Siegel/Castellan) p = 0.116 (zweiseitig) (aus STATA)

Approximation durch die χ² Verteilung für große n (mit df=2) STATA: ksmirnov offer, by(study)

Möglichkeit gegen eine theoretische Verteilung zu testen

offer 0.5 1 2 2.5 3 4 5

VWL 40% 60% 80% 80% 80% 100% 100%

N-VWL 0% 0% 0% 25% 50% 50% 100%

Sn (X) - Sm (X) 40% 60% 80% 55% 30% 50% 0%

(11)

Wilcoxon-Signed-Ranks Test

Test, ob zwischen zwei statistisch abhängigen Beobachtungen (X1 und X2) Unterschiede bestehen

H0 : keine Unterschiede (X1 = X2)

H1 : Beobachtungen unterscheiden sich: X1 ≠ X2 (zweiseitiger Test)

(Einseitiger Test wäre X1 > X2 oder X1 < X2.)

(12)

Wilcoxon Test: Ein Beispiel

Wiederholtes Ultimatum-Spiel

Bilde die Differenz zwischen den gepaarten Beobachtungen und ordne Ränge nach absoluter Differenz (versehen mit dem Vorzeichen der Differenz zu)

Subjekt 1 2 3 4 5 6 7 8 9

Runde 1 0.5 0.5 1 2 2.5 3 4 5 5

Runde 2 1.5 1.5 1 1.5 1 1 1 2 2.5

Subjekt 1 2 3 4 5 6 7 8 9

Runde 1 0.5 0.5 1 2 2.5 3 4 5 5

Runde 2 1.5 1.5 1 1.5 1 1 1 2 2.5

Differenz 1 1 0 -0.5 -1.5 -2 -3 -3 -2.5 Rang +2.5 +2.5 drop -1 -4 -5 -7.5 -7.5 -6

(13)

Wilcoxon Test: Ein Beispiel – Fortsetzung

T+ = Summe der Ränge mit positivem Vorzeichen (T+ = 5) T- = Summe der Ränge mit negativem Vorzeichen (T- = 31)

p = 0.078 (zweiseitig mit N=8 (!), siehe Table H aus S/C) p = 0.0745 (aus STATA)

Approximation durch Normalverteilung für große n STATA: signrank offer = offer[_n+1]

Sign-Test als Alternative (auch gegen feste Werte)

Subjekt 1 2 3 4 5 6 7 8 9

Runde 1 0.5 0.5 1 2 2.5 3 4 5 5

Runde 2 1.5 1.5 1 1.5 1 1 1 2 2.5

Differenz 1 1 0 -0.5 -1.5 -2 -3 -3 -2.5 Rang +2.5 +2.5 drop -1 -4 -5 -7.5 -7.5 -6

(14)

Binomial-Test

Zwei Merkmalsausprägungen [X=1 oder X=0] (z.B.

Kopf oder Zahl bei Münze; Budgetüber- oder – unterschreitung)

Wahrscheinlichkeit für X=1: p

Wahrscheinlichkeit für X=0: q = 1 – p H0 : p = p0

H1 : p ≠ p0

Test, ob die Verteilung der Merkmalsausprägungen aus einer Grundgesamtheit mit p = p0 stammen kann

(15)

Binomial-Test: Ein Beispiel

Münzwurf: Eine Münze werde 10 mal geworfen

Wahrscheinlichkeiten: p = q = 0.5 Y = Σ X = 2

Wahrscheinlichkeit, dass Y einen bestimmten Wert annimmt:

wobei

Wurf 1 2 3 4 5 6 7 8 9 10

Ergebnis K Z K K K K Z K K K

X 0 1 0 0 0 0 1 0 0 0

)!

(

!

! ]

[

k N

k

N k

N

q k p

k N Y

P k N k

= −

⎟⎠

⎜ ⎞

⎟⎠

⎜ ⎞

= ⎛

=

(16)

Binomial-Test: Ein Beispiel - Fortsetzung

Wahrscheinlichkeit, dass Y=2

Beim Binomialtest interessiert die kumulierte Wahrscheinlichkeit, dass Y ≤ r oder Y ≥ s

(siehe Table D) 043

. 0 5

. 2 0

10

* 5 9

. 0 5 .

!0 8

! 2

! 10 2

] 10 2

[ ⎟ 2 8 = 2 8 = 10 =

⎜ ⎞

= ⎛

= p q

Y P

i N k i

i

q i p

k N Y

P

=

⎜ ⎞

= ⎛

0

] [

055 .

0

] 2 [

] 1 [

] 0 [

] 2 [

2 0

∑ ⎟ =

⎜ ⎞

= ⎛

=

= +

= +

=

=

=

i N i i

q i p

N

Y P Y

P Y

P Y

P

(17)

Binomial-Test: Ein anderes Beispiel

Weichen Budgetvoranschlag und Budgetrealisierung für

Forschung und Wissenschaft systematisch voneinander ab?

Nein (16 Überschreitungen in den letzten 28 Jahren).

U n te rs c h ie d V o ra n s c h la g / Z a h lu n g e n (+ Ü b e rs c h re itu n g ) B ild u n g s s e k to r

-8 . 0 0 % -6 . 0 0 % -4 . 0 0 % -2 . 0 0 % 0 . 0 0 % 2 . 0 0 % 4 . 0 0 % 6 . 0 0 % 8 . 0 0 % 1 0 . 0 0 % 1 2 . 0 0 %

1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 2 1 2 2 2 3 2 4 2 5 2 6 2 7 2 8 2 9

J a h r

F o rs c h u n g u n d W is s e n s c h a ft

(18)

Chi-squared-test (χ²-test)

Test, ob Unterschiede in Verteilungen in zwei oder

mehreren Kategorien existieren (Mindestanzahl an Beobachtungen pro Zelle ca. 5).

Test möglich für den Vergleich zweier Beoabchtung und dem Vergleich zu einer theoretischen Verteilung.

Einfachste Anwendung: 2x2-Tabellen.

Teststatistik (mit Kontinuitätskorrektur):

χ² = N{|AD – BC| - N/2}² / {(A+B)(C+D)(A+C)(B+D)}

Reject, if χ² > 3.84 (p < 0.05).

A B C D

(19)

Chi-squared-test (χ²-test) - Beispiel

χ² = N{|AD – BC| - N/2}² / {(A+B)(C+D)(A+C)(B+D)} = 0.61

Nicht ablehnen, da χ² < 3.84 (p < 0.05)

Möglichkeit der Erweiterung auf r x k Beobachtungen

# offers unter 5 # offers über 5

VWLer 8 14

Nicht-VWLer 13 12

(20)

Kruskal-Wallis Test

Test, ob Daten aus k statistisch unabhängigen Stichproben (X, Y, Z, …) aus derselben Grundgesamtheit stammen.

Teststatistik H wird über die Varianzen gebildet und folgt einer χ² Verteilung mit df = k-1

H0 = mehrere Stichproben sind aus derselben Grundgesamtheit

H1 = Stichproben aus unterschiedlichen Grundgesamtheiten STATA: kwallis offer, by(age)

(21)

Übersicht der behandelten Tests

One sample Two samples N samples

Abhängige

Beobachtungen

Unabhängige Beobachtungen

Unabhängige Beobachtungen Nominale

oder

kategoriale Daten

Binomial Test

χ²-test (r x 2) χ²-test (r x k)

Ordinale Daten

Kolmogorov- Smirnov (one- sample)

Sign test

Wilcoxon signed ranks test

Mann-Whitney U test

Kolmogorov- Smirnov (two- sample)

Kruskal-Wallis test

Referenzen

ÄHNLICHE DOKUMENTE

should be solved at home and delivered at Wednesday, the 7th November, before the beginning of

Peter Becker Fachbereich Informatik Sommersemester

Achtung: Die Berechnung von 4 × 4-Determinanten funktioniert nicht v¨ ollig analog, hier egeben sich insgesamt 24 Summanden (mit einer nicht ganz so regelm¨ aßigen Struktur) mit je

Kontrolliere, ob diese drei Vektoren linear unabh¨ angig sind.. ~ u zeigt die Projektionsrichtung bei der Projektion auf

a.3 Wenn ein lineares Gleichungssystem mit n Gleichungen und n Variablen lösbar ist, dann ist die Lösung eindeutig.. a.4 Ein lineares Gleichungssystem mit mehr Gleichungen als