• Keine Ergebnisse gefunden

Effizienz eines Tests

N/A
N/A
Protected

Academic year: 2022

Aktie "Effizienz eines Tests"

Copied!
6
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Nichtparametrische Statistik Verteilungsfreie Statistik

Parametrische und Nichtparametrische Tests

Effizienz eines Tests

Parameterfreie Tests

& Rangsummen

& Bindungen

& Wilcoxon-Mann-Whitney Rangsummentest

& Kruskal-Wallis Rangvarianzanalyse

& Mood-Test

& Multiple Medianvergleiche nach Mood

Parametrische und Nichtparametrische Tests

Nichtparametrische Tests setzen keine Normalverteilung voraus und sind wesentlich robuster gegen Varianzheterogenität

parametrisch nichtparametrisch

t-, z-Test Vorzeichentest

Mittelwert Median

ARE = 2/% = 63.7%

t-, z-Test Wilcoxon Rangsummentest Mittelwertsvergleich

Mann-Whitney U-Test Medianvergleich ARE = 3/% = 95.5%

t-, z-Test Wilcoxon Vorzeichenrangtest verbundene Stichproben verbundene Stichproben

ARE = 3/% = 95.5%

einfaktorielle VA Rangvarianzanalyse Mittelwertsunterschiede

Kruskal-Wallis H-Test Medianunterschiede

ARE = 3/% = 95.5%

zweifaktorielle VA Friedman-Test (Blockanlage) Mittelwertsunterschiede Medianunterschiede

Tukey-Test Steel-, Mood-Test Mutiple Mittelwertsvergl. Multiple Medianvergl.

332-Test Kolmogorov-Smirnov-Test

Verteilung Verteilung

(2)

EABnA nB

AREABlim

nAEABlim

nA

nA nB

ARE3

%95.5%

Effizienz eines Tests

Effizienz eines Tests A im Vergleich zu Test B:

für gleiches und

Asymptotisch relative Effizienz:

Beispiel:

Asymptotisch relative Effizienz des Wilcoxon-Tests im Ver- gleich zum t-Test ist

,

d.h. beim t-Test braucht man etwa 95% des Stichproben- umfangs wie beim Wilcoxon-Test, um gleiches und zu garantieren, wenn Normalverteilung vorliegt.

Bei Nichtnormalverteilung kann die ARE des Wilcoxon- Tests erheblich ansteigen.

Rangsummen

kleinster Wert Rang 1, zweitkleinster Wert Rang 2, usw.

Bildung der Rangsummen innerhalb der Gruppen

xi yi

1.0 2.1 2.5 0.5 1.4 2.9

Rang 2 4 5 1 3 6

11 10

Test: n# (n + 1) / 2 = 6 # 7 / 2 = 21 = 11 + 10

Bindungen

Zuteilung eines mittleren Rangs bei gleichen Stichprobenwerten

xi yi

1 1 2 4 6 1 2 3 5

Rang 2 2 4.5 7 9 2 4.5 6 8

b = 2 Bindungen bei den Werten 1 und 2 Bindungslänge: l1 = 3, l2 = 2

(3)

K

nXnYM

b i1

(li3 li) 12n(n 1)

P(U<uX) <

P(U<uY) <

P(U<umin) </2

0 uX nXnY/20.5 nXnY(n1)/12 K

<

0 uY nXnY/20.5 nXnY(n1)/12 K

<

0 umin nXnY/20.5 nXnY(n1)/12 K

</2

Wilcoxon-Rangsummentest Mann-Whitney U-Test

Wilcoxon-Testgrößen: w : Rangsumme der x-Werte Mann-Whitney-Testgrößen: u = w n (n + 1) / 2

X

wY: Rangsumme der y-Werte

X X X X

uY = wYnY(nY + 1) / 2 umin = min(uX,uY)

Bindungskorrekturglied:

H0: x0.5 = y0.5 bzw. FX = FY

H1: Ablehnung von H0, wenn:

max(nX,nY) 10:

x0.5 < y0.5 bzw. FX > FY x0.5 > y0.5 bzw. FX < FY

x0.5gy0.5 bzw. FXgFY max(nX,nY) > 10:

x0.5 < y0.5 bzw. FX > FY

x0.5 > y0.5 bzw. FX < FY

x0.5gy0.5 bzw. FXgFY

Überlebenszeiten

Überlebenszeit [d] Rang

Rasse X Rasse Y Rasse X Rasse Y

43 04 15 03

07 42 06 14

10 11 09 10

12 06 11 05

09 08 08 07

16 02 12 01

20 03 13 02

05 04

74 46

Kontrolle: wX+wY = 74+46 = 120 = 15#16/2 = n#(n+1)/2 Hypothesen: H0: x0.5 = y0.5 H1: x0.5 > y0.5

H0: FX = FY H1: FX < FY

Test: uY = wYnY#(nY+1)/2 = 468#9/2 = 10 P(U<10) = 0.02 = 2%

Überlebenszeiten von Rasse X sind auf = 5%

signifikant höher als bei Rasse Y

MTB > Mann-Whitney 95.0 'Rasse X' 'Rasse Y' Mann-Whitney Confidence Interval and Test

Rasse X N = 7 Median = 12.00 Rasse Y N = 8 Median = 5.50 Point estimate for ETA1-ETA2 is 6.00 95.7 Percent CI for ETA1-ETA2 is (0.99;15.01) W = 74.0

Test of ETA1 = ETA2 vs ETA1 not= ETA2 is significant at 0.0428

(4)

0 1 2 3 4 5 6 7 8 9 0

2 4 6 8 10 12

Bonitur A

Anzahl

0 1 2 3 4 5 6 7 8 9

0 2 4 6 8 10 12

Bonitur B

Anzahl

Mehltaubonitur Mehltaubonitur

Vergleich t-Test / Wilcoxon Rangsummentest

t Test:

MTB > TwoSample 95.0 'A' 'B'

Two Sample T-Test and Confidence Interval

Two sample T for A vs B

N Mean StDev SE Mean A 30 2.07 1.76 0.32 B 25 3.00 2.06 0.41 95% CI for mu A - mu B: ( -1.99; 0.12) T-Test mu A = mu B (vs not=):

T = -1.79 P = 0.081 DF = 47

Wilcoxon-Mann-Whitney-Test:

MTB > Mann-Whitney 95.0 'A' 'B' Mann-Whitney Confidence Interval and Test

A N = 30 Median = 2.000 B N = 25 Median = 2.000 Point estimate for ETA1-ETA2 is -1.000 95.1 CI for ETA1-ETA2 is (-2.000;0.000) W = 723.5

Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.0499

Test is significant at 0.0430 adjusted for ties

(5)

H 12 n(n1)M

a i1

wi2

ni 3(n1) H 12a

n2(n1)M

a i1

wi2 3(n1) für nin a Hkorr H

1 M

b i1

li3 li n3 n

bei > 25% Bindungen

Rangvarianzanalyse Kruskal-Wallis H-Test

Testgrößen: wi: Rangsumme der i-ten Faktorstufe

H0: y0.5,i = y0.5,j bzw. Fi = Fj ~i,j igj H1: }igj y0.5,igy0.5,j bzw. FigFj a = 3, ni 5: H > H

a 4, ni 5: H > 3

> 25% Bindungen: H > 3

Ablehnung von H0, wenn:

p 2

a1;1 korr 2a1;1

Gesättigte Wasserleitfähigkeit

MTB > Print 'Kontr'-'Floral' Data Display

Row Kontr NPK NPK+ER Mist_300 Mist_600 Floral 1 76 240 3890 4786 123 1698 2 7762 65 81 2 5248 4 3 25 3890 166 2 56 1 4 30 3890 151 49 4786 1820 5 174 3631 18 17 398 3 6 25 14 2 51 112 1479 7 74 3548 204 17 1950 1950 8 22 2042 3802 21 50 49 9 513 112 4074 8 68 98 10 5888 275 2 8 8128 257 11 8 832 191 6 1 1230 12 14 2692 3 2818 68 148 MTB > Kruskal-Wallis 'Leitf.' 'Beh.'

Kruskal-Wallis Test

Kruskal-Wallis Test on Leitf.

Beh. N Median Ave Rank Z 1 12 52.00 34.1 -0.43 2 12 1437.00 48.8 2.24 3 12 158.50 35.7 -0.14 4 12 17.00 22.8 -2.49 5 12 117.50 41.9 0.98 6 12 202.50 35.7 -0.15 Overall 72 36.5

H = 10.34 DF = 5 P = 0.066

H = 10.35 DF = 5 P = 0.066 adjusted for ties

(6)

320M

a i1 M

2 j1

Bij2 Bi.#B.j 1

Mood Median-Test

Faktorstufe y0.5 > y0.5

1 B B B

2 i a

11 21 B

Bi1 B B

Ba1 B B

12 22

i2

a2

1.

B B 2.

i.

a.

B.1 B.2 B.. = n

Testgröße:

H0: y0.5,i = y0.5,j bzw. Fi = Fj ~i,j igj H1: }igj y0.5,igy0.5,j bzw. FigFj

Ablehnung von H0, wenn:

302 > 32a1;1

MTB > Mood 'Leitf.' 'Beh.' Mood Median Test

Chi-Square = 10.29 DF = 5 P = 0.068 Beh. N<= N> Median

1 8 4 52 2 3 9 1437 3 5 7 159 4 10 2 17 5 6 6 118 6 5 7 203 Overall median = 112

Multiple Medianvergleiche nach Mood

MTB > Mood 'Leitf.' 'Beh.';

SUBC> Pairwise 0.1.

Mood Median Test

Chi-Square = 10.29 DF = 5 P = 0.068 Overall median = 112

Pairwise comparisons at error rate 0.1000 Beh. N<= N> Median

4 10 2 44 1 8 4 52 5 6 6 118 3 5 7 159 6 5 7 203 2 3 9 1437 Joint confidence = 90.0%

Per comparison confidence = 99.3%

4 1 5 3 6 1 -507

29

5 -4780 -4764 -5 457

3 -3796 -3780 -3746 48 510 4783

6 -1692 -1676 -1642 -1695 47 509 4782 3798

2 -3625 -3609 -3575 -3628 -3627 -61 401 4674 3690 1586

Referenzen

ÄHNLICHE DOKUMENTE

•  Unit-Tests (Komponententests) für einzelne Komponenten der So0ware. •  Integra&lt;onstests für die Zusammenarbeit von

sein, um Intelligenz zu simulieren. „situatedness“) meint, dass sich ein Roboter aktiv in seiner Umwelt bewegen sollte; Verkörperung (engl. „embodiment“) bedeutet, dass

Most obvious difference to doctest: test cases are not defined inside of the module which has to be tested, but in a separate module just for testing. In that

• verfügen nur selten über Elemente, mit denen bei den Lernenden die Fähigkeit überprüft werden kann, das eigene Lernen zu kontrollieren. • werden entweder

Um die- ses Beispiel besser einordnen zu k¨onnen sind außerdem die beiden Extremf¨alle f¨ur die Verl¨aufe von empirischen ROC-Kurven dargestellt: besitzt das Verfahren

Testentscheid: Überprüfe, ob der beobachtete Wert der Teststatistik im Verwerfungsbereich liegt.... “Essentially, all models

Testentscheid: UberprÄ Ä ufe, ob der beobachtete Wert der Teststatistik im Verwerfungsbereich liegt.... Beispiel für guten

Die Quantifizierung hämatopoietischer Stammzellen (CD34-positive Stammzellen) bei Patienten im Stammzell-Transplantationsprogramm erfolgt aus dem peripheren Blut während