4 TESTEN VON HYPOTHESEN I
Lernziele:
1. Mit dem 1-Stichproben-t-Test entscheiden können, ob der Mittelwert einer normalverteilten Zufallsvariablen X von einem vorgegebenen Sollwert abweicht bzw. diesen unter- oder überschreitet.
2. Signifikante und nichtsignifikante Testergebnisse interpretieren können.
3. Die Normalverteilungsannahme mit dem Shapiro-Wilk-Test überprüfen können.
4. Mit dem Normal-QQ-Plot die Annahme normalverteilter Stichprobenwerte beurteilen können.
5. Mit dem Grubbs-Test einen Ausreißer in einer normalverteilten Zufallsstichprobe identifizieren können.
6. Mit dem Binomialtest prüfen können, ob eine unbekannte
Wahrscheinlichkeit von einem vorgegebenen Sollwert abweicht bzw.
diesen über- oder unterschreitet.
7. Mit dem χ2-Test prüfen können, ob die beobachteten Häufigkeiten einer mehrstufig skalierten Zufallsvariablen von einem vorgegebenen Verhältnis abweichen.
Lernziel 4.1:
Mit dem 1-Stichproben-t-Test entscheiden können, ob der Mittelwert einer normalverteilten Zufallsvariablen X von einem vorgegebenen Sollwert abweicht bzw. diesen unter- oder überschreitet.
Ablaufschema:
• Beobachtungsdaten und Modell:
Es liegen n Beobachtungswerte x1, x2,…, xn mit dem
arithmetischen Mittel x vor. Jedes xi ist die Realisierung einer N(µ, σ2)-verteilten Zufallsvariablen Xi (i=1,2,…,n), mit denen das Stichprobenmittel X sowie die Stichprobenvarianz S2 gebildet werden.
• Hypothesen und Testgröße:
Der Vergleich des Parameters µ mit einem vorgegebenen Sollwert µ0 erfolgt nach einer der folgenden Testvarianten:
- H0: µ = µ0 gegen H1 : µ≠ µ0 (Variante II, 2-seitiger Test) - H0: µ ≤ µ0 gegen H1 : µ > µ0 (Variante Ia, 1-seitiger Test auf
Überschreitung)
- H0: µ ≥ µ0 gegen H1 : µ < µ0 (Variante Ib, 1-seitiger Test auf Unterschreitung)
Als Testgröße wird das studentisierte Stichprobenmittel
n S TG X
/
µ
0= −
verwendet, das bei Gültigkeit von H0 (d.h. für µ=µ0) t-verteilt mit dem Freiheitsgrad f=n-1 ist. Ersetzt man X durch das
arithmetische Mittel x und S durch die empirische
Standardabweichung s, erhält man die Realisierung TGs der Testgröße.
• Entscheidung:
Entscheidungssituation beim 2-seitigen Test:
Testentscheidung mit dem P-Wert:
Bei vorgegebenem Signifikanzniveau α wird H0 abgelehnt, wenn der P-Wert kleiner als α ist. Die Berechnung des P-Wertes erfolgt für die Testvariante Ia mit der Formel P=1 - Fn-1(TGs),
für die Variante Ib mit der Formel P= Fn-1 (TGs), bzw.
für die zweiseitige Testvariante II mit P= 2 Fn-1(-|TGs|).
Fn-1 bezeichnet die Verteilungsfunktion der tn-1 -Verteilung
•
bestimmt werden. Im Falle der 2-seitigen Testvariante II ist α durch α/2 zu ersetzen. Bei Anwendung dieser Formeln muss ein
Schätzwert für σ zur Verfügung stehen. Die Formeln stimmen mit den entsprechenden Formeln beim Gauß-Test überein, ergeben aber auf Grund der Näherungen nur Richtwerte für den
erforderlichen Mindeststichprobenumfang.
• Gütefunktion des t-Tests:
Fehlerrisken beim Alternativtest:
Fehler 1. Art (α-Fehler, irrtümliche Ablehnung der Nullhypothese) Fehler 2. Art (β-Fehler, falsche Nullhypothese wird beibehalten) Die Wahrscheinlichkeiten für einen Fehler 1. und 2. Art werden in der Gütefunktion G zusammengefasst. Diese gibt - in
Abhängigkeit vom unbekannten Erwartungswert µ - die Wahrscheinlichkeit
G(µ) = P(Ablehnung von H0 | µ)
an, dass der Test auf Grund einer Zufallsstichprobe zu einer Entscheidung gegen H0 führt.
Durch die Testentscheidung (mit dem P-Wert) wird sicher gestellt, dass die Wahrscheinlichkeit eines Fehlers 1. Art höchstens gleich dem vorgegebenen α ist. Wenn z.B. das 1-seitige Testproblem H0: µ ≤ µ0 gegen H1 : µ > µ0 vorliegt und H0 zutrifft,
gilt also G(µ) ≤ α. Trifft dagegen H1 : µ > µ0 zu, so ist die Güte des Tests umso besser, je näher G(µ) bei 1 liegt, oder anders
ausgedrückt, je kleiner die Wahrscheinlichkeit β(µ) = 1-G(µ) eines Fehlers zweiter Art ist.
Die Gütefunktion ist streng monoton wachsend, geht für µ →−∞
asymptotisch gegen 0, für µ →+∞ asymptotisch gegen 1 und
nimmt an der Stelle µ=µ0 den Wert a an. Für µ ≤ µ0 ist also G(µ)≤α.
Für µ >µ0 gilt G(µ)>α und G(µ) wird in diesem Fall als Trennschärfe oder Power an der µ bezeichnet.
Abb. 4.1:
Gütefunktionen des 1- seitigen t-Tests H0: µ ≤ µ0 gegen H1 : µ > µ0 für die Stichprobenumfänge n=5, 10, 20 (obere Grafik) und des 2-seitigen t-Tests H0: µ = µ0 gegen H1 : µ ≠ µ0 für die Stichprobenumfänge n=10 und n=50 (untere Grafik). Horizontal ist die auf σ bezogene Abweichung δ=(µ-µ0)/σ des
Mittelwerts vom Sollwert µ0 aufgetragen, vertikal kann man die entsprechenden Gütefunktionswerte G*(δ)=G((µ-µ0)/σ) ablesen.
Beispiel 4.1:
In einem Experiment wurde die Selbstentladung von wiederaufladbaren NiMH-Gerätezellen mit einer Kapazität (in mAh) von 2000 überprüft.
Laut Hersteller soll die Kapazität X nach 12 Monaten 85% des
1560, 1610, 1670, 1450, 1690, 1710, 1670, 1810, 1580, 1560, 1680, 1730, 1680, 1550, 1760, 1750, 1530, 1540, 1690, 1730.
Es ist mit dem 2-seitigen t-Test zu zeigen, dass das arithmetische Mittel der Prüfstichprobe signifikant (α=5%) vom Sollwert µ0=1700 abweicht.
Lösung mit R:
> # a) Planung des Stichprobenumfangs
> mu0 <- 1700; sigma <- 100; Delta <- 60
> alpha <- 0.05; qa <- qnorm(1-alpha/2); beta <- 0.1; qb <- qnorm(1-beta)
> ns <- sigma^2/Delta^2*(qa+qb)^2
> print(cbind(mu0, Delta, sigma, qa, qb, ns)) mu0 Delta sigma qa qb ns [1,] 1700 60 100 1.959964 1.281552 29.18729
> # Lösung mit R-Funktion power.t.test()
> power.t.test(delta=Delta, sd=sigma, sig.level=0.05, power=0.9, + type="one.sample")
One-sample t test power calculation n = 31.17169
delta = 60 sd = 100 sig.level = 0.05 power = 0.9
alternative = two.sided
> #
> # b) 2-seitiger t-Test
> x <- c(1590, 1620, 1670, 1790, 1670, 1580, 1470, 1690, 1680, 1890, + 1560, 1610, 1670, 1450, 1690, 1710, 1670, 1810, 1580, 1560, + 1680, 1730, 1680, 1550, 1760, 1750, 1530, 1540, 1690, 1730)
> n <- length(x); xquer <- mean(x); s <- sd(x); mu0 <- 1700
> print(cbind(n, xquer, s)) n xquer s [1,] 30 1653.333 100.1837
> alpha <- 0.05; q <- qt(1-alpha/2, n-1)
> tgs <- (xquer-mu0)*sqrt(n)/s; P <- 2*pt(-abs(tgs), n-1)
> print(cbind(alpha, q, tgs, P))
alpha q tgs P [1,] 0.05 2.04523 -2.551351 0.01626606
> # Lösung mit R-Funktion t.test()
> t.test(x, mu=mu0, alternative="two.sided", type="one.sample", + conf.level=alpha)
One Sample t-test data: x
t = -2.5514, df = 29, p-value = 0.01627
alternative hypothesis: true mean is not equal to 1700 5 percent confidence interval:
1652.176 1654.490 sample estimates:
mean of x 1653.333
> # c) Berechnung der Power,
> # um Abweichung xquer-mu0 als signifikant zu erkennen
> # c1) mit der R-Funktion power.t.test()
> power.t.test(n, delta=xquer-mu0, sd=s, sig.level=0.05, type="one.sample") One-sample t test power calculation
n = 30
delta = 46.66667
sd = 100.1837 sig.level = 0.05 power = 0.693638 alternative = two.sided
> # c2) durch Simulation mit selbstdefinierter Funktion
> # ---
> # Funktionsprogramm-Eingabeparameter:
> # n=Umfang der Zufallsstichproben
> # B=Anzahl der Zufallsstichproben aus Grundgesamtheit
> # mu, sigma= Mittelwert bzw. Standardabweichung der Grundesamtheit
> # alpha=Testniveau
> # Rückgabeparameter:
> # power=berechnete Güte (Power)
> t2.power=function(n,B,mu,sigma,alpha){
+ Ps = replicate(B,t.test(rnorm(n,mu,sigma),mu=mu0)$p.value) + A <- sum(Ps < alpha); power <- A/B
+ return(power)}
> # ---
> t2.power(n,10000,xquer,s,0.05) # Funktionsaufruf [1] 0.6939
Lernziel 4.2:
Signifikante und nichtsignifikante Testergebnisse interpretieren können.
• Schlussweise der Signifikanzprüfung am Beispiel des 1-seitigen t- Tests auf Überschreitung:
Wenn H0 gilt, dann ist |TG| > z1-α/2 unwahrscheinlich.
Aus einer Zufallsstichprobe ergibt sich ein TGs mit |TGs| > z1-α/2. Daher: H0 gilt nicht (genauer: ist unwahrscheinlich).
Dieses Schema erinnert an die Beweisführung „reductio ad absurdum“ (Widerspruchsbeweis): Um eine Aussage A
indirekt zu beweisen, wird die Annahme gemacht, die Aussage ist falsch, und aus der Negation der Aussage etwas abgeleitet, was offensichtlich falsch ist. Es folgt, dass A richtig ist.
• Signifikante und nichtsignifikante Testergebnisse
Abb. 4.2:
Schema der Entscheidungsfindung beim Signifikanztest. Vorgegeben sind die Fehlerschranken α (z.B. 5%) und β (z.B. 10%). Ist der P-Wert kleiner als α, wird H0 abgelehnt, also für H1 entschieden. Andernfalls, d.h. für P ≥ α wird eine Poweranalyse (oder die Berechnung des Mindest-n) angeschlossen.
Wenn die Power größer oder gleich 1-β ist (oder der Mindest-n ≥ dem Umfang der verwendeten Zufallsstichprobe ist), wird H0 angenommen.
Lernziel 4.3:
Die Normalverteilungsannahme mit dem Shapiro-Wilk-Test prüfen können.
Der Shapiro-Wilk-Test wurde speziell zur Überprüfung der Annahme (=Nullhypothese) entwickelt, dass eine metrische Zufallsvariable X normalverteilt ist. Die Nullhypothese wird auf dem Niveau α abgelehnt, wenn der P-Wert kleiner als α ist.
Theoretischer Hintergrund:
Die Teststatistik W des Shapiro-Wilk-Tests ist als Quotient von zwei Schätzfunktionen für die Varianz σ2 der hypothetischen
Normalverteilung konstruiert. Die eine Schätzfunktion (im Nenner) ist die Stichprobenvarianz, die andere (im Zähler) hängt mit dem Anstieg der Orientierungsgeraden im QQ-Plot zusammen. Die Berechnung der Teststatistik ist aufwendig und praktisch nur mit einschlägiger Software zu bewältigen.
Beispiel 4.2:
Es soll gezeigt werden, dass die angegebenen Stichprobewerte mit der Annahme einer normalverteilten Grundgesamtheit X vereinbar sind.
Lösung mit R:
> x <- c(4.81, 5.16, 4.50, 4.85, 5.15, 5.21, 4.68, 4.80, 4.61, 5.17, + 4.82, 4.98, 5.06, 5.01, 5.12, 5.62, 4.95, 5.16, 5.20, 4.94, + 4.72, 5.32, 5.23, 4.85, 5.56, 4.51, 5.02, 4.72, 4.78, 5.27)
> # Hypothesen:
> # H0: X ist normalverteil gegen H1: X ist nicht normalverteilt
> shapiro.test(x)
Shapiro-Wilk normality test data: x
W = 0.9756, p-value = 0.7014
Wegen p-value = 70.14% ≥ 5% kann H0 (Stichprobenwerte nicht in Widerspruch zur Normalverteilungsannahme) nicht abgelehnt werden.
Lernziel 4.4:
Mit dem Normal-QQ-Plot die Annahme normalverteilter Stichprobenwerte beurteilen können.
Mit dem Normal-Quantil-Quantil-Diagramm (kurz Normal-QQ-Plot) kann man an Hand der Werte x1, x2, …, xn einer Zufallsstichprobe von X auf grafischem Wege beurteilen, ob die Daten gegen die Annahme „X ist normalverteilt“ sprechen (vgl. die Abb. rechts).
Theoretische Grundlage:
• Wenn X N(µ, σ2) – verteilt ist, besteht zwischen dem p-Quantil xp
von X und dem entsprechenden Quantil zp der N(0, 1)-verteilten Zufallsvariablen Z=(X-µ)/σ der lineare Zusammenhang
xp = σ zp + µ. Die Punkte P(zp, xp) mit den für verschiedene Werte von p (0 < p < 1) berechneten Quantilen von Z und X als
Koordinaten) liegen im (Z, X)-Koordinatensystem auf einer Geraden mit dem Anstieg σ und dem y-Achsenabschnitt µ.
Abb. 4.3:
Normal-QQ-Plots für zwei Zufallsstichproben (jeweils vom Umfang n=30). Die QQ-Plots enthalten auch die Orientierungsgeraden durch die den unteren und oberen Quartilen entsprechenden Punkte. Links sind die Dichtekurven der Grundgesamtheiten dargestellt, aus denen die Stichproben generiert wurden (oben: Normalverteilung mit µ=5 und σ=0.25, unten: logarithmische
Normalverteilung mit µ=-0.2 und σ=1). Man erkennt, dass im oberen QQ-Plot die Punkte angenähert entlang der Orientierungsgeraden angeordnet sind; die Abweichung von der Normalverteilung zeigt sich im unteren QQ-Plot in den (vor allem an den Enden) von der Orientierungsgeraden wegdriftenden Punkten. Bei kleineren Stichprobenumfängen kann es auch bei
normalverteilter Grundgesamtheit zu deutlichen Abweichungen von der Orientierungsgeraden kommen.
• Mit den unteren Quartilen z0.25 und x0.25 sowie den oberen Quartilen z0.75 und x0.75 von Z bzw. X können die Geradenparameter
ausgedrückt werden durch:
25 . 0 75 . 0
25 . 0 75 . 0 75 . 0 25 . 0 25
. 0 75 . 0
25 . 0 75 .
0 ,
z z
z x z
x z
z
x x
−
= −
−
= −
µ
σ
• Die (nach aufsteigender Größe angeordneten) Stichprobenwerte x(i) werden als (empirische) Quantile von X gedeutet, die
entsprechenden „Unterschreitungswahrscheinlichkeiten“ pi ermittelt und dazu die Quantile zpi=φ-1(pi) der N(0, 1)-Verteilung berechnet.
• Die R-Funktion qqnorm() aus dem Paket ''extRemes'' (Extreme Value Analysis) verwendet zur Erstellung von Normal-QQ-Plots für die pi die Schätzwerte pi*=(i-0.5)/n. Diese Funktion stellt zusätzlich simultane (d.h. für alle pi zugleich geltende) 95%ige
Konfidenzintervalle zur Verfügung.
• Auf der Grundlage eines derartigen Normal-QQ-Plots wird die Überprüfung der Normalverteilungsannahme folgendermaßen vorgenommen:
Zwischen den p-Quantilen xp einer normalverteilten
Grundgesamtheit X und den p-Quantilen der standardisiserten Größe Z=(X-µ)/σ besteht ein linearer Zusammenhang, den wir in der (Z, X)-Ebene durch die Gerade g dargestellt haben. Hat man eine Zufallsstichprobe x1, x2, …, xn aus X und zeichnet damit ein Normal-QQ-Plot, so werden die Punkte (zpi, xi) mehr oder weniger von der (unbekannten) Geraden g abweichen. Sind die
Abweichungen so groß, dass man in das mit den xi bestimmte 95%ige Konfidenzband keine Gerade einzeichnen kann, dann entscheiden wir uns gegen die Normalverteilungsannahme. Bei
diesem Entscheidungsverfahren hat man ein Risiko von 5%, irrtümlich gegen die Normalverteilungsannahme zu entscheiden.
Beispiel 4.3:
Dem Normal-QQ-Plot von Abb. 4.4 liegt die folgende Zufallsstichprobe von n=30 Realisierungen der mit µ=5 und σ=0.25 normalverteilten Zufallsvariablen X zugrunde:
4.50, 4.51, 4.61, 4.68, 4.72, 4.72,, 4.78, 4.80, 4.81, 4.82, 4.85, 4.85, 4.94, 4.95, 4.98, 5.01, 5.02, 5.06, 5.12, 5.15, 5.16, 5.16, 5.17, 5.20, 5.21, 5.23, 5.27, 5.32, 5.56, 5.62.
Man erzeuge das Normal-QQ-Plot mit R; ferner berechne man die
Koordinaten des ersten Punktes P1=(φ-1(p1), x(1)) und die Parameter der Orientierungsgeraden durch (z025, Q1) und (z075, Q3).
Lösung mit R:
> x <- c(4.81, 5.16, 4.50, 4.85, 5.15, 5.21, 4.68, 4.80, 4.61, 5.17, + 4.82, 4.98, 5.06, 5.01, 5.12, 5.62, 4.95, 5.16, 5.20, 4.94, + 4.72, 5.32, 5.23, 4.85, 5.56, 4.51, 5.02, 4.72, 4.78, 5.27)
> # Normal-QQ-Plot
> library(extRemes)
> qqnorm(x, xlab = "N(0,1)-Quantile", ylab = "empirische Quantile")
> qqline(x, probs = c(0.25, 0.75))
> # Berechnung der Koordinaten von P1:
> sort(x); n <- length(x)
[1] 4.50 4.51 4.61 4.68 4.72 4.72 4.78 4.80 4.81 4.82 4.85 4.85 4.94 4.95 4.98 [16] 5.01 5.02 5.06 5.12 5.15 5.16 5.16 5.17 5.20 5.21 5.23 5.27 5.32 5.56 5.62
> p1 <- (1-0.5)/30; (zp1 <- qnorm(p1)) # z-Koordinate zu x(1) [1] -2.128045
> # Orientierungsgerade durch (z025, Q1) und (z075, Q3)
> x025 <- quantile(x, 0.25); x025 <- x025[[1]]
> x075 <- quantile(x, 0.75); x075 <- x075[[1]]
> print(cbind(x025, x075)) x025 x075
[1,] 4.8025 5.1675
> z025 <- qnorm(0.25); z075 <- qnorm(0.75)
> print(cbind(z025, z075)) z025 z075 [1,] -0.6744898 0.6744898
> points(c(z025,z075),c(x025,x075), pch=3, lwd=2,cex=1.2)
> b1 <- (x075-x025)/(z075-z025); b0 <- (x025*z075-x075*z025)/(z075-z025)
> b1 <- b1[[1]]; b0 <- b0[[1]]; print(cbind(b1, b0)) b1 b0
[1,] 0.2705749 4.985
-2 -1 0 1 2
4.64.85.05.25.45.6
N(0,1)-Quantile
empirische Quantile
Lernziel 4.5*:
Mit dem Grubbs-Test einen Ausreißer in einer normalverteilten Zufallsstichprobe identifizieren können.
Theoretischer Grundlage:
• X ~ N(µ, σ2) P(X < µ-4σ)+P(X > µ+4σ)= 0.0063%
Tritt ein Wert außerhalb des 4-fachen Sigma-Bereichs auf, so steht er im Verdacht, dass er keine Realisierung von X ist, sondern z.B.
durch einen Datenfehler oder einen Störeinfluss bei der Messung zustande gekommen ist.
• Mutmaßliche Ausreißer sollten jedenfalls dokumentiert und nur dann aus der Stichprobe entfernt werden, wenn es dafür einen sachlogischen Grund gibt.
• Zur Identifizierung eines Stichprobenwerts als Ausreißer gibt es einfache Kriterien - z.B. die Unter- bzw. Überschreitung der mit dem Interquartilabstand IQR gebildeten robusten Grenzen Q1-1.5 IQR bzw. Q3+1.5 IQR (Boxplot!) - oder spezielle Testverfahren.
Grubbs-Test zur Identifizierung eines einzelnen Ausreißers:
• Voraussetzung: X ~ N(µ, σ2);
Überprüfung mit einem Normal-QQ-Plot
• Testentscheidung:
H0: „Der Wert mit dem größten Abstand vom arithmetischen Mittel ist kein Ausreißer“ wird auf dem Testniveau α abgelehnt, wenn
2 2 ,
,..., 1
2 max 1
c n
c n
g n s
x x
Gs i n i n
+
−
= −
− >
= = α
gilt; dabei ist c das α/(2n)-Quantil der t-Verteilung mit f=n-2 Freiheitsgraden.
Beispiel 4.4:
Durch einen Eingabefehler möge der zehnte Wert x10=5.17 der
Stichprobe im vorangehenden Beispiel auf 1.17 verfälscht. Man zeige, dass dieser Wert mit dem Grubbs-Test auf 5%igem Niveau als Ausreißer identifiziert werden kann.
Lösung mit R:
> options(digits=4)
> x <- c(4.81, 5.16, 4.50, 4.85, 5.15, 5.21, 4.68, 4.80, 4.61, 1.17, + 4.82, 4.98, 5.06, 5.01, 5.12, 5.62, 4.95, 5.16, 5.20, 4.94, + 4.72, 5.32, 5.23, 4.85, 5.56, 4.51, 5.02, 4.72, 4.78, 5.27)
> # Grubbs-Test:
> # H0: extremer Wert ist Ausreißer, wenn Gs > Gkrit
> n <- length(x) # Stichprobenumfang
> mw <- mean(x); s <- sd(x) # Schätzung der Verteilungsparameter
> print(cbind(mw, s)) mw s [1,] 4.859 0.7494
> Gs <- max(abs(x-mw))/s; Gs # Realisierung der Testgroesse [1] 4.923
> alpha <- 0.05; c <- qt(alpha/2/n, n-2); c [1] -3.479
> Gcrit <- (n-1)/sqrt(n)*sqrt(c^2/(n-2+c^2)); Gcrit # kritischer Wert [1] 2.908
Lernziel 4.6:
Mit dem Binomialtest prüfen können, ob eine unbekannte
und identisch verteilten Bernoulli-Variablen X1, X2, …, Xn nimmt mit der Wahrscheinlichkeit p den Wert 1 an. Konkret wurden h
Beobachtungen in der Klasse 1 gezählt.
• Hypothesen und Testgröße:
Der Vergleich des Parameters p mit einem vorgegebenen Sollwert p0 erfolgt nach einer der folgenden Testvarianten:
- H0: p=p0 gegen H1 : p ≠ p0 (Variante II, 2-seitiger Test) - H0: p≤ p0 gegen H1 : p > p0 (Variante Ia, 1-seitiger Test auf
Überschreitung)
- H0: p≥ p0 gegen H1 : p < p0 (Variante Ib, 1-seitiger Test auf Unterschreitung)
Testgröße: Anzahl TG=H=nX der Beobachtungen in der Klasse 1;
TG ~ Bn,p0 für p=p0.
Normalverteilungsapproximation (Voraussetzung: np0(1-p0)>9):
0 0
0 0
0 ~ (0,1) für H : )
1 (
* N p p
p np
np
TG H =
−
= −
Für die konkrete Beobachtungsreihe ist H=h.
• Entscheidung:
Testentscheidung mit dem P-Wert:
Bei vorgegebenem Signifikanzniveau α wird H0 abgelehnt, wenn der P-Wert kleiner als α ist.
Exakter Binomialtest:
Testvariante Ia: P=1 - FB(h-1) Testvariante Ib: P= FB(h) Testvariante II:
Die Bestimmung des P-Werts für das 2-seitige Testproblem ist komplizierter. Betrachtet man z.B. den Fall h > np0, sind jedenfalls die Testgrößenwerte h+1, h+2, …, n extremer als die beobachtete Realisierung h. Für jeden extremen Wert xr gilt Bn,p0(xr) <= Bn,p0(h).
Die Wahrscheinlichkeit dass die Testgröße einen Wert gleich oder größer als h annimmt, ist durch P(H >= h) =Bn,p0(h)+Bn,p0(h+1)+… + Bn,p0(n) gegeben. Bei der Berechnung des P-Werts sind aber auch extreme Testgrößenwerte links von np0 zu berücksichtigen. Wir bezeichnen einen links von np0 liegenden Wert xl als extrem, wenn wie bei den rechts liegenden Werten Bn,p0(x_l) <= Bn,p0(h) gilt.
Diese Überlegung führt dazu, den P-Wert des 2-seitigen
Binomialtests folgendermaßen zu bestimmen: Wir berechnen die
Wahrscheinlichkeiten P(H=x)=Bn, p0(x), dass die Testgröße H bei Gültigkeit von H0 : p=p0 die möglichen Werte x = 0, 1, …, n
annimmt. Die Summe der Binomialwahrscheinlichkeiten mit der Eigenschaft Bn,p0(x) <= Bn,p0(h) ist der gesuchte $P$-Wert.
Approximativer Binomialtest (mit Stetigkeitskorrektur) Testvariante Ia: P≈ 1-FN(h-0.5)
Testvariante Ib: P≈ FN(h+0.5)
Testvariante II: P≈ 2FN(np_0-d+0.5)
FN ist die Verteilungsfunktion der N(µ, σ2)-Verteilung mit µ=np0 und σ0
2=np0(1-p0); d=|h-np0| ist die Abweichung der beobachteten Anzahl vom Mittelwert1.
• Planung des Stichprobenumfangs
Um auf dem Niveau α mit der Sicherheit 1- β eine Entscheidung für H1 herbeizuführen, wenn p von p0 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht, kann im Falle der 1-seitigen Testvarianten Ia und Ib das erforderliche Mindest-n
näherungsweise aus
( )
(
2arcsin 2arcsin 0)
2 ;2 1 1
p p
z n z
−
≈ −α + −β
Bestimmt werden; im Falle der 2-seitigen Testvariante II ist z1-α
durch z1-α/2 zu ersetzen2. Beispiel 4.5:
Mit einer neuen Behandlungsmethode will man die Erfolgsrate
p (d.h. die Wahrscheinlichkeit, dass bei einer mit der neuen Methode behandelten Person eine Verbesserung eintritt) von mehr als p0=0.7 erreichen. In einer Studie mit 100 Probanden ist die neue Methode bei
Es ist a) zu zeigen, dass die Überschreitung auf 5%igem Niveau signifikant ist, und b) der erforderliche Mindeststichprobenumfang zu berechnen, damit der (approximative) Binomialtest mit 90%iger Sicherheit ein auf 5%igem Testniveau signifikantes Ergebnis liefert, wenn der Sollwert um den Betrag ∆=0.1 überschritten wird.
Lösung mit R:
> p0 <- 0.7; n <- 100; h <- 80; p <- h/n; alpha <- 0.05
> # a) Hypothesen H0: p=p0 gegen H1: p>p0
> # a1) Berechnung des P-Werts direkt aus der Definition
> Pexact <- 1-pbinom(h-1, n, p0)
> print(cbind(alpha, p0, n, p, Pexact), digits=4) alpha p0 n p Pexact
[1,] 0.05 0.7 100 0.8 0.01646
> # a2) P-Wert-Berechnung mit der R-Funktion binom.test()
> binom.test(h, n, p=p0, alternative="greater") Exact binomial test
data: h and n
number of successes = 80, number of trials = 100, p-value = 0.01646 alternative hypothesis: true probability of success is greater than 0.7 95 percent confidence interval:
0.7227998 1.0000000 sample estimates:
probability of success 0.8
> # a3) näherungsweise P-Wert-Berechnung durch Simulation
> B <- 10000; omega <- c(0,1); pp <- c(1-p0,p0)
> Hglh <- replicate(B, sum(sample(omega,n,replace=T, prob=pp))>=h)
> Ps <- sum(Hglh)/B; print(cbind(B, Ps)) B Ps
[1,] 10000 0.0167
> # a4) näherungsweise P-Wert-Berechnung mit prop.test()
> n*p0*(1-p0)>9 # Voraussetzung für Approximation [1] TRUE
> prop.test(h, n, p=p0, alternative="greater")
1-sample proportions test with continuity correction data: h out of n, null probability p0
X-squared = 4.2976, df = 1, p-value = 0.01908 alternative hypothesis: true p is greater than 0.7 95 percent confidence interval:
0.7212471 1.0000000 sample estimates:
p 0.8
> #
> # b) Mindest-n
> # b1) näherungsweise mit Faustformel
> beta <- 0.1; za <- qnorm(1-alpha); zb <- qnorm(1-beta)
> Delta <- 0.1; p <- p0+Delta
> ns <- (za+zb)^2/(2*asin(sqrt(p))-2*asin(sqrt(p0)))^2
> ns <- ceiling(ns)
> print(cbind(alpha, beta, p0, p, ns)) alpha beta p0 p ns
[1,] 0.05 0.1 0.7 0.8 160
> # b2) näherungsweise mit der R-Funktion pwr.p.test()
> library(pwr)
> ES <- 2*asin(sqrt(p))-2*asin(sqrt(p0))
> pwr.p.test(h = ES, sig.level = 0.05, power = 0.9, + alternative = "greater")
proportion power calculation for binomial distribution (arcsine transformation) h = 0.2319843
n = 159.1299 sig.level = 0.05 power = 0.9 alternative = greater
> #
> # ERGÄNZUNG: Berechnung des P-Werts für den 2-seitigen Binomialtest
> # mit R-Funktion binom.test()
> binom.test(h, n, p=p0) Exact binomial test data: h and n
number of successes = 80, number of trials = 100, p-value = 0.02896 alternative hypothesis: true probability of success is not equal to 0.7 95 percent confidence interval:
0.7081573 0.8733444 sample estimates:
probability of success 0.8
> # direkt aus Definition des P-Werts
> Bh <- dbinom(h, n, p0); Pc <- 0
> for (x in 0:n) {Bx <- dbinom(x, n, p0) + if (Bx>Bh) {Pc <- Pc+Bx}}
> P <- 1-Pc; print(cbind(Bh, P), digits=4) Bh P
[1,] 0.007576 0.02896
Lernziel 4.7*:
Mit dem χ2-Test prüfen können, ob die beobachteten Häufigkeiten einer mehrstufig skalierten Zufallsvariablen von einem vorgegebenen
Verhältnis abweichen.
• Beobachtungsdaten und Modell:
Es liegen n Beobachtungen einer k-stufig skalierten Variablen vor, d.h. einer (nicht notwendigerweise quantitativen) Variablen mit k>1 Ausprägungen (Klassen) a1, a2,…, ak. Die Ausprägung ai wird an oi
Untersuchungseinheiten beobachtet. Jede Beobachtung ist das Ergebnis eines Zufallsexperimentes, das n-mal wiederholt wird.
mit vorgegebenen Sollwerten p0i verglichen. Die Testentscheidung stützt sich auf die Chiquadrat-Summe (Goodness of Fit-Statistik)
( ) ∑ ( )
∑
= == −
= −
= k
i i
i i
k
i i
i i
np np O E
E GF O
TG
1 0
2 0 1
2
als Testgröße, die asymptotisch χ2-verteilt ist mit k-1
Freiheitsgraden. Ersetzt man die Oi durch die beobachteten Häufigkeiten oi, erhält man die Realisierung TGs der Testgröße.
• Entscheidung:
Bei vorgegebenem Signifikanzniveau α wird H0 abgelehnt, wenn der P-Wert kleiner als α ist. Mit der Verteilungsfunktion Fk-1 der χ2k-1-Verteilung erhält man aus P=1-Fk-1(TGs) eine Näherung für den P-Wert3.
Der Ablehnungsbereich ist näherungsweise durch das mit dem (1-α)-Quantil χ2k-1,α der χ2k-1-Verteilung gebildeten Intervall
TG = GF > χ2k-1,α gegeben. Die Näherung ist ausreichend genau, wenn alle erwarteten Häufigkeiten Ei>5 sind
Beispiel 4.6:
Bei einem seiner Kreuzungsversuche mit Erbsen erhielt Mendel 315 runde gelbe Samen, 108 runde grüne, 101 kantige gelbe und 32 kantige grüne. Sprechen die Beobachtungswerte gegen das theoretische
Aufspaltungsverhältnis 9 : 3 : 3 : 1 der Phänotypen? (a=5%) Lösung mit R:
> options(digits=4)
> klassen <- c("rund/gelb", "rund/grün", "kantig/gelb", "kantig/grün")
> observed <- c(315, 108, 101, 32)
> prob <- c(9, 3, 3, 1)/16
> tabelle <- data.frame(klassen, observed, prob)
> tabelle
klassen observed prob 1 rund/gelb 315 0.5625 2 rund/grün 108 0.1875 3 kantig/gelb 101 0.1875 4 kantig/grün 32 0.0625
> # Prüfung auf Abweichung von einem vorgegebenen Verhältnis
> # H0: Wahrscheinlichkeiten verhalten sich gemäß dem theoretischen Augfspaltungsverhältnis
> # H1: dies ist nicht der Fall
> chisq.test(observed, p=prob)
3Die Berechnung des (approximativen) P-Werts bei der Prüfung von Anzahlen auf ein vorgegebenes Verhältnis erfolgt in R mit der Funktion chisq.test().
Chi-squared test for given probabilities data: observed
X-squared = 0.47, df = 3, p-value = 0.9254
Wegen p-value = 92,54% ≥ 5% kann H0 (beobachtete Anzahlen
entsprechen dem Aufspaltungsverhältnis 9:3:3:1) auf dem 5%-Niveau nicht abgelehnt werden.
ÜBUNGSBEISPIELE
1. Es sei X eine N(µ, σ2)-verteilte Zufallsvariable mit der Varianz σ2=4. Man prüfe die Hypothesen H0: µ=15 gegen H1: µ ≠ 15 mit dem 2-seitigen Gauß-Test auf der Grundlage der Beobachtungsreihe
15.6, 17.3, 15.0, 13.7, 11.1, 15.2, 14.7, 13.4, 14.4, 11.9, 10.4, 14.5
und argumentiere die Testentscheidung sowohl mit dem P-Wert als auch mit dem Ablehnungsbereich. Als Signifikanzniveau sei α=5% vereinbart.
2. An Hand einer Stichprobe mit dem Umfang n=10 und dem arithmetischen Mittel x=0.827 soll mit dem Gauß-Test geprüft werden, ob der Mittelwert eines
N(µ, σ2)-verteilten Untersuchungsmerkmals X den Sollwert µ0=0.8 überschreitet.
Dabei sei σ=0.05 und α=1%. Ist die Überschreitung signifikant? Man bestimme ferner die Wahrscheinlichkeit einer Testentscheidung für H1, wenn die
Überschreitung ∆=0.027 beträgt.
3. Es soll die Abweichung einer Messgröße X von einem vorgegebenen Sollwert µ0=1.5 geprüft werden. Da X als normalverteilt angenommen werden kann und überdies ein genauer Schätzwert für die Standardabweichung, nämlich σˆ=0.3, bekannt ist, wird die Prüfung mit dem 2-seitigen Gauß-Test vorgenommen und dabei das Signifikanzniveau α=5% vereinbart. Wie groß ist der
Stichprobenumfang zu planen, damit man mit dem Test eine kritische Abweichung von 10% des Sollwerts mit 80%iger Sicherheit als signifikant erkennen kann.
4. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2- Konzentration der Luft in mg/m3) gemeldet: 32, 41, 33, 35, 34. a) Weicht die mittlere SO2-Konzentration signifikant vom Wert µ0=30 ab? Als Testniveau sei α=5%$ vereinbart. b) Welcher Mindeststichprobenumfang müsste geplant
6. Bei der Inbetriebnahme einer Anlage zur Abfüllung einer Lösung in Flaschen mit der Nennfüllmenge von 0.5l wurden in einem Probebetrieb die folgenden
Füllmengen X (in l) gemessen:
0.491, 0.488, 0.493, 0.538, 0.493, 0.478, 0.506, 0.459, 0.471, 0.480.
a) Kann man aus den Daten schließen, dass die Nennfüllmenge nicht erreicht wird? Das Testniveau sei mit α=0.01 festgelegt. b) Ist der Stichprobenumfang ausreichend groß, um eine Unterschreitung in der Höhe von 10ml mit einer Sicherheit von 90% feststellen zu können?
7. Die Verpackung einer bestimmten Zigarettensorte weist einen mittleren
Nikotingehalt von 15 mg pro Zigarette aus. Es wird eine Zufallsstichprobe von 100 Zigaretten getestet. Dabei ergaben sich ein mittlerer Nikotingehalt von 16.5 mg und eine Standardabweichung von 4 mg. Kann aus dem Ergebnis der Stichprobe auf 1%igem Signifikanzniveau der Schluss gezogen werden, dass der
tatsächliche Nikotingehalt im Mittel über 15 mg liegt? (Überschreitung sign.) 8. Es sei X eine normalverteilte Umweltmessgröße mit dem (unbekannten)
Mittelwert μ und der Standardabweichung σ=10. Mit Hilfe einer Stichprobe soll geprüft werden, ob eine Überschreitung des Grenzwertes K vorliegt, wobei das α- Risiko mit 5% vorgegeben ist und eine kritische Überschreitung von 6.5 mit 90%iger Sicherheit erkannt werden soll. Welcher Stichprobenumfang ist zu planen? (21)
9. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2- Konzentration der Luft in mg/m3) gemeldet: 32, 41, 33, 35, 34.
a) Weicht die mittlere SO2-Konzentration signifikant vom Wert µo=30 ab? (α=5%) b) Welcher Mindeststichprobenumfang müsste in 6 geplant werden, um mit dem Test eine Abweichung vom Referenzwert µo um 5% (des Referenzwertes) mit einer Sicherheit von 95% erkennen zu können? (sign. Abweichung; 73)
10. Es sei X eine normalverteilte Messgröße mit der Varianz 0,25; für X ist der Nennwert 1,75 vorgegeben. Zur Prüfung auf eine allfällige Abweichung vom Nennwert wird der t-Test eingesetzt; als Testniveau ist 5% vorgesehen. Wie groß muss der Stichprobenumfang geplant werden, um eine kritische Abweichung um 0,15 Einheiten mit 90%iger Sicherheit erkennen zu können? (117)
11. Die Messung der Ozonkonzentration während der Sommermonate ergab für eine Großstadt die in der folgenden Tabelle enthaltenen Werte (Angaben in 10-2 ppm).
a. Stehen die Daten in Widerspruch zur angenommenen Normalverteilung der Messgröße?
b. Liegt die mittlere Ozonkonzentration signifikant über dem Referenzwert µo=5? (α = 5%)
c. Wie groß ist die Wahrscheinlichkeit, die beobachtete Überschreitung des Referenzwertes mit dem auf 5%igem Niveau geführten t-Test als
signifikant zu erkennen?
d. Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine Überschreitung von µo um 10% mit einer Sicherheit von 90%
erkennen zu können?
2.5 3.0 5.6 4.7 6.5
6.7 1.7 5.3 4.6 7.4
5.4 4.1 5.1 5.6 5.4
6.1 7.6 6.2 6.0 5.5
5.8 8.2 3.1 5.8 2.6
12. In einer Studie wurde u.a. das Ges. Eiweiß i.S. am Beginn und am Ende einer Behandlung bestimmt. Bei 40 Probanden war eine Veränderung zu beobachten:
27 Probanden, bei denen der Eiweißwert vorher im Normbereich lag, wiesen nachher einen Wert außerhalb des Normbereichs auf; bei 13 Probanden lag der Eiweißwert vorher außerhalb und nachher im Normbereich.
a) Man prüfe auf 5%igem Niveau, ob der Anteil der Probanden, bei denen der Eiweißwert vorher außerhalb und nachher innerhalb des Normbereichs lag, signifikant von 0.5 abweicht.
b) Welcher Stichprobenumfang müsste geplant werden, damit der approximative) Binomialtest mit 90%iger Sicherheit ein signifikantes (a=5%) Ergebnis liefert, wenn p=p0+0.15 ist?
13. Im Rahmen einer Untersuchung des Ernährungsstatus von Schulkindern wurde u.a. das Gesamtcholesterin erfasst. In einer Stichprobe aus den Kindern der Volksschule einer bestimmten Region war der Cholesterinwert bei 45 von 75 Kindern im Normbereich.
a) Man prüfe auf 5%igem Niveau, ob der Anteil der Schulkinder im Normbereich signifikant über 50% liegt.
b) Man bestimme die Wahrscheinlichkeit (Power), mit dem Test eine Überschreitung von p0 um ∆=0.1 als signifikant zu erkennen.
14. Von einer Abfüllanlage sei bekannt, dass die abgefüllten Einheiten nur mit 5%iger Wahrscheinlichkeit nicht eine vorgegebene Mindestmenge aufweisen. Nach einer Neueinstellung der Anlage wurden im Probelauf 150 Packungen zufällig
ausgewählt und dabei festgestellt, dass in 4 Fällen die Mindestmenge nicht erreicht wurde. Die Frage ist, ob dieses Ergebnis eine signifikante
Unterschreitung des Sollwertes p0=5% anzeigt (α=5%).
15. Für eine Blumenzwiebelsorte wird eine Keimfähigkeit von mindestens 75%
garantiert. In einer Stichprobe von n=60 keimten 35 Zwiebeln. a) Liegt eine signifikante Abweichung vom garantierten Ergebnis vor? Man prüfe diese Frage auf dem Signifikanzniveau α=5%. b) Welche Fallzahl ist notwendig, um eine Unterschreitung des garantierten Anteils um 0.1 mit einer Sicherheit von 90%
Testgruppe und einer Kontrollgruppe darzustellen. Die Tabelle zeigt die (hypothetische) Vierfeldertafel einer Fall-Kontroll-Studie.
Testgruppe Kontrolle Raucher
Nichtraucher
87 60
78 45
a) Man prüfe für die Testgruppe, ob der Anteil der Raucher signifikant über p0=0,5 liegt. (α=5%)? (Überschr. sign.)
b) Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Binomialtest eine Überschreitung von p0 =0,5 um 0,05 Einheiten mit einer Sicherheit von 80% erkennen zu können? (700)
18. Bei seinen Kreuzungsversuchen mit Erbsen untersuchte Mendel unter anderem die Nachkommen von bezüglich zweier Merkmale mischerbigen Pflanzen. Bei den Merkmalen handelte es sich um die Samenform mit den Allelen A (runde Form) und a (kantige Form) sowie um die Samenfarbe mit den Allelen B (gelbe Färbung) und b (grüne Färbung). 15 Stammpflanzen des Genotyps AaBb gaben insgesamt 529 Samen, aus denen sich Pflanzen der Genotypen AABB, AAbb, aaBB, aabb, AABb, aaBb, AaBB, Aabb sowie AaBb mit den Häufigkeiten 38, 35, 28, 30, 65, 68, 60, 67 bzw. 138 entwickelten. Nach der Mendel'schen Theorie müssten sich die neun Genotypen im Verhältnis 1:1:1:1:2:2:2:2:4 aufspalten.
Kann die Theorie auf dem Testniveau α = 5% durch dieses Beobachtungsergebnis falsifiziert werden? (nein)
19. Ein symmetrischer Würfel sollte beim Ausspielen mit gleicher Wahrscheinlichkeit eine der sechs Augenzahlen zeigen. Zur Überprüfung wurde ein Würfel 1000 mal ausgespielt und dabei die folgenden Häufigkeiten der Augenzahlen erhalten:
Augenzahl/Häufigkeit: 1/172, 2/179, 3/173, 4/163, 5/171, 6/142.
Man prüfe mit dem χ2-Test, ob die Häufigkeiten, mit denen die Augenzahlen auftreten, signifikant von der Gleichverteilung, d.h. vom Verhältnis 1:1:1:1:1:1 abweichen. Als Signifikanzniveau wähle man α=5%.
20. Es soll gezeigt werden, dass die Stichprobewerte 210, 199, 195, 210, 217, 226, 220, 221, 182 mit der Annahme einer normalverteilten Grundgesamtheit X vereinbar sind. Man führe den Nachweis auf 5%igem Testniveau.
21. Von einer Pflanze erhielt Mendel (1866) insgesamt 62 Samen von denen 44 gelb und 18 grün gefärbt waren. Man zeige, dass das Verhältnis 44:18 der
beobachteten Anzahlen nicht "signifikant" vom theoretischen Aufspaltungsverhältnis 3:1 abweicht ( = 5%)?
22. In einer Studie mit 5 Probanden wurde eine bestimmte Zielgröße X am Studienbeginn (Xb) und – nach erfolgter Behandlung - am Studienende (Xe) gemessen.
a) Man erfasse die Wirkung der Behandlung durch die Differenz Y= Xe - Xb und prüfe, ob der Mittelwert von Y signifikant von Null abweicht (α=5%). (nein)
Xb 57 73 44 27 32 Xe 59 74 46 26 35
b) Was kann über die Versuchsplanung in a) gesagt werden? Welcher
Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine Abweichung von Null in der Höhe von 50% des Mittelwerts von Y mit einer Sicherheit von 90% als signifikant erkennen zu können? (50)
23. Die folgende Tabelle enthält Produktivitätsdaten von 60 Kohorten von je 15 weiblichen Tsetsefliegen. Als Produktivitätsmaß wird die Anzahl Y der Puparien verwendet, die in einer Kohorte bis zum 78ten Lebenstag abgelegt werden.
a) Man vergleiche den Mittelwert von Y mit dem Wert 55; liegt eine signifikante Abweichung vor? Liegt die Standardabweichung signifikant über dem Wert 10? (jeweils 5%-Testniveau) (Mittelwert: Abw. nicht sign.,
Standardabweichung: Überschr. sign.)
b) Welcher Stichprobenumfang müsste geplant werden, um eine Abweichung des Mittelwerts (vom Referenzwert) in der beobachteten Höhe mit 90%iger Sicherheit erkennen zu können? (162)
c) Man stelle fest, ob die Werte der Variablen Y im Einklang mit der Annahme
„H0: Y ist normalverteilt“ stehen (α = 5%).
24. Mit einem statistischen Test soll geprüft werden, ob die Alternativhypothese H1 (z.B. Messgröße überschreitet im Mittel einen vorgegebenen Grenzwert) zutrifft, also die Nullhypothese H0 abgelehnt werden kann. Als Testniveau sei 5%
vorgegeben, d.h. für die Wahrscheinlichkeit einer irrtümlichen Entscheidung gegen H0 soll gelten: P(Entscheidung für H1|H0) = 5%. Der Versuch wurde mit der Power P(Entscheidung für H1|H1) = 90% geplant. Wie groß ist die posteriori Wahrscheinlichkeit P(H1|Entscheidung für H1), wenn die a-priori
Wahrscheinlichkeit dafür, dass H1 zutrifft, gleich 5% ist? (48,6%)
Nr. Y Nr. Y Nr. Y Nr. Y Nr. Y Nr. Y
1 72 11 54 21 67 31 51 41 59 51 58
2 81 12 57 22 59 32 69 42 65 52 58
3 55 13 69 23 49 33 64 43 60 53 60
4 55 14 62 24 51 34 68 44 43 54 66
5 50 15 73 25 65 35 73 45 52 55 75
6 53 16 58 26 56 36 81 46 57 56 41
7 70 17 46 27 58 37 54 47 37 57 40
8 79 18 50 28 67 38 65 48 39 58 51
9 42 19 27 29 66 39 58 49 49 59 37
10 69 20 68 30 74 40 61 50 51 60 38
AQL=1% und ein Abnehmerrisiko von 10% an der Schlechtgrenze LQL = 2%
vereinbart. Man bestimme die Kennwerte n und k des entsprechenden Prüfplans bei bekannter und unbekannter Varianz! (84, 2.19; 286, 2.19)
27. Man bestimme die Wahrscheinlichkeit für die Zurückweisung eines Prüfloses bei der Prüfung auf fehlerhafte Einheiten, wenn die Fehlerrate 5% beträgt und mit einer Stichprobe vom Umfang n=48 und der Annahmezahl c=0 geprüft wird.
Welche Wahrscheinlichkeit ergibt sich für n=48 und c=2? (91,5%; 43,3%) 28. Zur Untersuchung der Frage, welchen Anteil die Skelettmasse an der
Körpermasse bei Vögeln bzw. Säugetieren hat, wurden für verschiedene Vögel und Säugetiere die Skelettmasse Y und die Körpermasse X (alle Angaben in kg) bestimmt. Jemand behauptet, dass die Skelettmasse 5% der Körpermasse ausmacht. Stehen die folgenden Daten in Widerspruch zu dieser Aussage? Man nehme eine Überprüfung auf 5%igem Niveau für Vögel und Säugetiere vor.
(Vögel: ja, Säugetiere: ja)
Vögel Säugetiere
Y X Y X
1,995 40,667 0,193 3,35
0,072 1,225 0,227 3,915
0,0054 0,163 0,0003 0,0063
0,203 2,504 0,039 0,79
0,043 0,701 0,027 0,82
0,027 0,416 0,244 4,836
0,186 2,379 0,002 0,03
0,0058 0,124 0,015 0,275
0,028 0,427 0,02 0,365
0,00174 0,031 0,0025 0,03
0,00182 0,029 0,0076 0,115
0,00102 0,02 1,146 22,7
0,024 0,383 0,748 11,95
0,00618 0,144 0,25 3,395
0,00184 0,038 0,107 2,46
0,00297 0,069 0,224 4,26
0,00183 0,045 0,233 4,21
0,00076 0,013 0,0173 0,35
0,00128 0,023 0,27 4,45
0,00049 0,0087 0,448 6,725
0,00062 0,0126 0,135 1,56