Statistik II f¨ ur Betriebswirte Vorlesung 1
Dr. Andreas W¨ unsche
TU Bergakademie Freiberg Institut f¨ur Stochastik
14. Oktober 2019
Organisatorisches
I
Vorlesung: Mo., 14:00-15:30, FOR-0270.
I
Ubungen: ¨
I Di., 11:00-12:30, MIB-1113, Herr Dipl.-Math. Markus Dietz,
I Do., 11:00-12:30, MET-2065, Herr Dr. Felix Ballani,
I Do., 11:00-12:30, MIB-1113, Frau Dr. Anna Chekhanova.
I
Selbststudium (Laut Modulbeschreibung zusammen f¨ ur beide Semester 120 h Pr¨ asenzzeit und 150 h Selbststudium.)
I
Information:
http://www.mathe.tu-freiberg.de/wiwistatI
Pr¨ ufung: Klausur 120 Minuten, zugelassen sind Taschenrechner,
B¨ ucher, Mitschriften; nicht zugelassen sind Laptops, Handys.
Themenkomplexe und geplanter Ablauf in diesem Semester
I
Statistische Tests (drei Vorlesungen)
I
Varianzanalyse (zwei Vorlesungen)
I
Korrelationsanalyse (zwei Vorlesungen)
I
Regressionsanalyse (zwei Vorlesungen)
I Weihnachtsvorlesung (16.12.19)
I
Regressionsanalyse (zwei Vorlesungen)
I
Statistische Qualit¨ atskontrolle (drei Vorlesungen)
Klausurergebnisse Statistik 1 f¨ ur Betriebswirte
Dr. Andreas W¨unsche Statistik II f¨ur Betriebswirte Vorlesung 1 Version: 16. September 2019 4
4. Grundlagen des statistischen Schließens II (Tests)
4.1 Einf¨uhrung in statistische Tests am Beispiel dest-Tests
Beispiel 4.1: Intelligenzquotient
I
Fragestellung (1): Haben (14-j¨ ahrige) Kinder aus Dresden einen Intelligenzquotienten, der ¨ uber 100 liegt?
I
Fragestellung (2): Haben (14-j¨ ahrige) Kinder aus Dresden einen Intelligenzquotienten, der unter 100 liegt?
I
Fragestellung (3): Ist der Intelligenzquotient von (14-j¨ ahrigen) Kindern aus Dresden von 100 verschieden?
Ist µ der (unbekannte) Erwartungswert des IQ der Gesamtpopulation der (14-j¨ ahrigen) Kinder aus Dresden, dann lassen sich die Fragestel- lungen (1) bis (3) wie folgt als Forschungshypothesen formulieren:
I
(1): µ > 100 (erwarteter IQ ist h¨ oher als 100)
I
(2): µ < 100 (erwarteter IQ ist niedriger als 100)
I
(3): µ 6= 100 (erwarteter IQ ist ungleich 100)
Grundlegende Schwierigkeit
I
Auf Basis einer repr¨ asentativen Stichprobe soll auf die Grundgesamtheit geschlossen werden.
−→
Fehler, Unsicherheiten sind m¨ oglich!
I
Beispiel: Es werden
” zuf¨ allig“ 10 hochbegabte Kinder (IQ≥ 130) f¨ ur die Stichprobe ausgew¨ ahlt. Vermutlich wird dadurch µ ¨ ubersch¨ atzt!
I
Ziel der schließenden Statistik:
Quantifizierung der Unsicherheit,
z.B. mit welcher Wahrscheinlichkeit macht ein statistischer Test einen Fehler.
I
Notwendig f¨ ur die Quantifizierung:
Mathematische Modellannahmen
I
Im Beispiel 4.1 gehen wir von der Modellannahme aus, dass der IQ der (14-j¨ ahrigen) Kinder in Dresden normalverteilt ist.
I
Diese Modellannahme sollte man stets rechtfertigen (wie man das
machen kann, sehen wir sp¨ ater).
Fortsetzung Beispiel 4.1: Intelligenztest
I
Der Intelligenzquotient
Xder 14-j¨ ahrigen Kinder in Dresden wird als normalverteilt angenommen.
(math.) Stichprobe:
Xiiid. mit
Xi ∼N(µ, σ2),
i= 1, . . . ,
n.I
Aus allen (14-j¨ ahrigen) Kindern in Dresden wurden zuf¨ allig und unabh¨ angig voneinander 10 Kinder ausgew¨ ahlt. Diese machten einen IQ-Test mit folgendem Ergebnis (Daten):
i
1 2 3 4 5
xi
112 108 97 100 107
i
6 7 8 9 10
xi
110 99 106 98 104
I
Die Punktsch¨ atzung f¨ ur den unbekannten Erwartungswert µ ist gleich
ˆ
µ =
x= 104.1
und damit gr¨ oßer als 100. Das bedeutet aber nicht, dass der
Erwartungswert µ mit Sicherheit gr¨ oßer als 100 ist.
Nullhypothese
I
Die Nullhypothese im Beispiel 4.1 lautet:
H0 : µ= 100(=µ0).
µ
0= 100 ist also der hypothetische Wert.
I
Aus der Annahme, dass der IQ normalverteilt ist, ergibt sich, dass die Teststatistik
T
=
X −µ
0 S√n
t-verteilt ist mit (n
−1)-Freiheitsgraden.
I
Damit l¨ asst sich die Wahrscheinlichkeit daf¨ ur kontrollieren, die Nullhypothese f¨ alschlicherweise abzulehnen.
I
Die Forschungshypothesen (1) bis (3) sind hier die m¨ oglichen
Alternativhypothesen
HA.
Aufstellen der Null- und der Alternativhypothese
I
Man formuliert 2 sich ausschließende (oft sogar komplement¨ are) Hypothesen, die
Nullhypothese H0und die
AlternativhypotheseHA(oft auch mit
H1bezeichnet)
z.B.
H0 : µ=µ0und
HA : µ > µ0oder
H0 : µ=µ0und
HA: µ < µ0oder
H0 : µ=µ0und
HA: µ6=µ0.
I
Die
Nullhypotheseist diejenige Hypothese, welche auf ihren Wahrheitsgehalt hin ¨ uberpr¨ uft werden soll. Die
Nullhypothesewird als Ausgangspunkt einer statistischen Untersuchung gesehen, den es zu widerlegen gilt.
I
Die
Alternativhypotheseist die eigentliche Forschungshypothese und
dr¨ uckt aus, was mittels der statistischen Untersuchung gezeigt
werden soll. Die Hypothese, die statistisch abgesichert werden soll,
sollte also als
Alternativhypotheseformuliert werden!
Testentscheidung, Fehler erster und zweiter Art
I
2 m¨ ogliche Entscheidungen beim Testen:
1. H0 wird verworfen, also abgelehnt undHA angenommen:Es gibt in der erhobenen Stichprobe starke Hinweise darauf, dassH0nicht gelten kann, alsoHA gelten muss. Diese Hinweise sind so stark, dass man eher nicht von einem zuf¨alligen Zustandekommen ausgehen kann.
2. H0 wird nicht verworfen, also angenommen:Man hat keine Hinweise gefunden, die gegenH0 sprechen. Alle aufgetretenen Effekte k¨onnten genauso gut zufallsbedingt sein.
I
in der Grundgesamtheit gilt
H0 HA
Entscheidung auf- richtige Fehler 2. Art grund der Stich-
H0Entscheidung (β-Fehler) probe zugunsten Fehler 1. Art richtige
von:
HA(α-Fehler) Entscheidung
Fehlerwahrscheinlichkeiten
I
Formal l¨ asst sich die Wahrscheinlichkeit f¨ ur den Fehler 1. Art (α-Fehler) als bedingte Wahrscheinlichkeit schreiben:
P
(Fehler 1. Art) =
P(H0ablehnen|
H0ist wahr) = α
I
Die Wahrscheinlichkeit f¨ ur den Fehler 2. Art (β-Fehler) kann auch als bedingte Wahrscheinlichkeit geschrieben werden:
P
(Fehler 2. Art) =
P(H
0nicht ablehnen|
HAist wahr) = β
I
Die Wahrscheinlichkeiten f¨ ur die Fehler erster und zweiter Art ver¨ andern sich gegenl¨ aufig.
I
Bei festem Stichprobenumfang wird nur der Fehler erster Art kontrolliert.
I
Bei fester Wahrscheinlichkeit f¨ ur den Fehler 1. Art kann die
Wahrscheinlichkeit f¨ ur den Fehler 2. Art durch Vergr¨ oßerung des
Stichprobenumfanges verkleinert werden.
Einfache und zusammengesetzte Hypothesen
I
W¨ ahlt man mit der Null- oder Alternativhypothese nur einen Wert aus allen m¨ oglichen Werten aus, dann nennt man eine solche Hypothese einfach.
I
Wird dagegen eine Menge von Werten zugelassen, spricht man von einer zusammengesetzten Hypothese.
I
So ist z.B. bei
H0: µ = µ
0gegen
HA: µ > µ
0 H0eine einfache und
HAeine zusammengesetzte Hypothese.
I
Hingegen sind bei
H0: µ
≤µ
0gegen
HA: µ > µ
0beide Hypothesen
H0und
HAzusammengesetzte Hypothesen.
I
F¨ ur eine einfache Nullhypothese ist die Bestimmung f¨ ur die Wahrscheinlichkeit f¨ ur den Fehler 1. Art eindeutig.
I
F¨ ur zusammengesetzte Nullhypothesen hingegen h¨ angt die Fehler-
wahrscheinlichkeit noch vom konkreten Wert der Nullhypothese,
welcher in der Grundgesamtheit angenommen wird, ab.
Niveau α
I
Ein Test heißt Test zum Niveau
α(Signifikanzniveau
α), falls dieWahrscheinlichkeit f¨ ur den Fehler 1. Art h¨ ochstens α ist.
I
Ubliche Werte f¨ ¨ ur das Signifikanzniveau α sind 0.05 oder 0.01.
I
F¨ ur einfache Nullhypothesen kann man Tests oft so bestimmen, dass die Wahrscheinlichkeit f¨ ur den Fehler 1. Art genau α ist.
I
Bei zusammengesetzten Nullhypothesen sind Tests oft so konstru- iert, dass die Wahrscheinlichkeit f¨ ur den Fehler 1. Art genau α f¨ ur den Wert der Nullhypothese ist, welcher am n¨ achsten zu den Werten der Alternativhypothese liegt. F¨ ur alle anderen Werte der Nullhypo- these ist dann die Wahrscheinlichkeit f¨ ur den Fehler 1. Art kleiner als α.
I
Im achten Kapitel, welches zugleich das letzte Kapitel ist, betrachten
wir die Wahrscheinlichkeiten f¨ ur den Fehler 1. Art und 2. Art noch
ausf¨ uhrlicher im Rahmen der statistischen Qualit¨ atskontrolle. Die
G¨ utefunktion des Testes wird dabei eine wichtige Rolle spielen.
Kritischer Bereich
Der kritische Bereich ist der Ablehnungsbereich der Nullhypothese.
Liegt die Realisierung
tder Teststatistik
Tim kritischen Bereich, dann wird die Nullhypothese
H0zugunsten der Alternativhypothese
HAabgelehnt.
Einstichproben-t-Test
Voraussetzung:
Xiiid. mit
Xi ∼N(µ, σ2),
i= 1, . . . ,
n.Ist
H0 :µ=µ0wahr, dann gilt f¨ ur die Testgr¨ oße
T:
T
=
X −µ
0 S√n∼tn−1
.
Kritische Bereiche (je nach Alternative) beim Signifikanzniveau α:
I
(1)
HA : µ > µ0 K=
t|t >tn−1,1−α
I
(2)
HA : µ < µ0 K=
t|t <−tn−1,1−α
I
(3)
HA : µ6=µ0 K=
nt| |t|>tn−1,1−α 2
o
Einstichproben-t -Test f¨ ur rechtsseitige Hypothesen
I H0: µ=µ0
gegen
HA : µ > µ0(oder oft auch so:
H0: µ≤µ0
gegen
HA : µ > µ0).
I
Im Beispiel 4.1 ist
n= 10,
x= 104.1 und
s2= 28.3222, damit ergibt sich
t
= 104.1
−100
√
28.3222
√
10 = 2.44
I
Das Signifikanzniveau w¨ ahlen wir mit α = 0.05 und der Stichproben- umfang ist
n= 10 und damit gilt
tn−1,1−α=
t9,0.95= 1.83.
K
=
t|t
>
tn−1,1−α=
{t|t> 1.83}
I
Testentscheidung:
t= 2.44 > 1.83 =
⇒ t∈K=
⇒H0wird abgelehnt (H
Awird angenommen).
I
Testergebnis: Der erwartete IQ der 14-j¨ ahrigen Kinder in Dresden ist
signifikant gr¨ oßer als 100, beim Signifikanzniveau von 5%.
−4 −2 0 2 4
0.00.10.20.30.4
Dichtefunktion der t9−Verteilung
α=5%
t9,0.95=1.83
t=2.44
Einstichproben-t -Test f¨ ur linksseitige Hypothesen
I H0: µ=µ0
gegen
HA : µ < µ0(oder oft auch so:
H0: µ≥µ0
gegen
HA : µ < µ0).
I
Im Beispiel 4.1 ist
t= 2.44.
I
Als Signifikanzniveau w¨ ahlen wir wieder α = 0.05 und damit wird auch hier
tn−1,1−α=
t9,0.95= 1.83 f¨ ur den kritischen Bereich ben¨ otigt.
K
=
t|t
<
−tn−1,1−α=
{t|t<
−1.83}I
Testentscheidung:
t= 2.44
6<−1.83 =⇒t 6∈K=
⇒ H0wird angenommen.
I
Testergebnis: Der erwartete IQ der 14-j¨ ahrigen Kinder in Dresden ist
nicht signifikant kleiner als 100.
−4 −2 0 2 4
0.00.10.20.30.4
Dichtefunktion der t9−Verteilung
α=5%
−t9,0.95=−1.83
t=2.44
Einstichproben-t -Test f¨ ur zweiseitige Hypothesen
I H0: µ=µ0
gegen
HA : µ6=µ0 IIm Beispiel 4.1 ist
t= 2.44.
I
Als Signifikanzniveau w¨ ahlen wir wieder α = 0.05 =
⇒ α2= 0.025
=
⇒1
−α2= 0.975 und damit ist hier das f¨ ur den kritischen Bereich ben¨ otigte t-Quantil
tn−1,1−α2
=
t9,0.975= 2.26.
K
=
nt| |t|
>
tn−1,1−α 2o
=
{t| |t|> 2.26}
I
Testentscheidung:
|t|= 2.44 > 2.26 =
⇒ t∈K=
⇒ H0wird abgelehnt (H
Awird angenommen).
I
Testergebnis: Der erwartete IQ der 14-j¨ ahrigen Kinder in Dresden ist
signifikant von 100 verschieden.
−4 −2 0 2 4
0.00.10.20.30.4
Dichtefunktion der t9−Verteilung
α 2=2.5%
2.5%=α 2
−t9,0.975=−2.26 t9,0.975=2.26
t=2.44
Statistik-Software, p-value (p-Wert), Statgraphics
I
Die Statistik-Software berechnet den p-Wert (p-value).
I
Testentscheidung mit dem p-Wert:
p≤
α =
⇒ H0wird abgelehnt.
p
> α =
⇒ H0wird angenommen.
I
Im Beispiel 4.1:
H0: µ=µ0gegen
HA : µ > µ0Statgraphics
I p
= 0.018798 < 0.05 = α =
⇒ H0wird abgelehnt.
Dr. Andreas W¨unsche Statistik II f¨ur Betriebswirte Vorlesung 1 Version: 16. September 2019 21
−4 −2 0 2 4
0.00.10.20.30.4
Dichtefunktion der
x
t9−Verteilung
α=0.05
p=0.019
t9,0.95=1.83
t=2.44
Statgraphics, Alternative:
” kleiner“
I
Im Beispiel 4.1:
H0: µ=µ0gegen
HA : µ < µ0Statgraphics
I p
= 0.981202 > 0.05 = α =
⇒ H0wird angenommen.
−4 −2 0 2 4
0.00.10.20.30.4
Dichtefunktion der
x
t9−Verteilung
p=0.981
α=0.05
−t9,0.95=−1.83
t=2.44
Statgraphics, Alternative:
” ungleich“
I
Im Beispiel 4.1:
H0: µ=µ0gegen
HA : µ6=µ0Statgraphics
I p
= 0.0375961 < 0.05 = α =
⇒ H0wird abgelehnt.
Zusammenfassung
I
Beim Testen wird (erst einmal) nur die Wahrscheinlichkeit f¨ ur den Fehler 1. Art kontrolliert, d.h.
P
(H
0ablehnen
|H0wahr)
≤α .
I
Wenn also
H0tats¨ achlich gilt, wird man sich nur (im Mittel) in α
·100% der F¨ alle f¨ ur
HAentscheiden.
I
Die Entscheidung f¨ ur
HAist in diesem Sinn statistisch abgesichert.
I
Bei einer Entscheidung gegen
H0und damit f¨ ur
HAspricht man von einem signifikanten Ergebnis.
I
Die Wahrscheinlichkeit f¨ ur den Fehler 2. Art wird erst einmal nicht kontrolliert.
⇒
Eine Entscheidung
H0beizubehalten, ist nicht statistisch abgesichert.
⇒
Kann man
H0nicht verwerfen, bedeutet das daher nicht, dass man
sich aktiv“ f¨ ur
H0entscheidet; es spricht nur nichts gegen
H0.
4.2. Tests f¨ ur eine Stichprobe
Eine Stichprobe:
X1, . . . ,
Xniid..
I
Test f¨ ur die Lage bzw. zentrale Tendenz
I Stichprobe ist normalverteilt
I Varianzσ2ist bekannt:Einstichproben z-Test (Gauß-Test)
I Varianzσ2ist unbekannt:Einstichproben-t-Test
I Bei der Stichprobe liegt eine stetige Verteilung vor:Vorzeichentest
I
Test f¨ ur die Streuung (Varianz)
I Stichprobe ist normalverteilt:χ2-Test
I
Test f¨ ur eine (unbekannte) Wahrscheinlichkeit
pI Binomialtest
Einstichproben z-Test (Gauß-Test)
I
Annahme:
Xi ∼N(µ, σ2), iid.,
i= 1, . . . ,
n,σ
2bekannt.
I
Zweiseitiger Test
I Hypothesen: H0 :µ=µ0, HA :µ6=µ0.
I UnterH0 gilt: X ∼N µ0,σn2
.
I Testgr¨oße: T = X−µ0
σ
√nH∼0N(0,1) .
I Kritischer Bereich:K ={t ∈R : |t|>z1−α/2}.
I
Einseitige Tests
I Im Fall von H0 :µ≥µ0, HA :µ < µ0 gilt K ={t∈R : t<zα=−z1−α}.
I Im Fall von H0 :µ≤µ0, HA :µ > µ0 gilt K ={t ∈R : t >z1−α}.
I
Die Tests sind f¨ ur große Werte
n(n
≥30) auch ohne
Normalverteilungsvoraussetzung anwendbar.
Einstichproben-t -Test
I
Annahme:
Xi ∼N(µ, σ2), iid.,
i= 1, . . . ,
n,σ
2unbekannt.
I
Zweiseitiger Test
I Hypothesen: H0 :µ=µ0, HA :µ6=µ0.
I Testgr¨oße: T = X−µ0 S
√nH∼0tn−1 (t−Verteilung mitn−1
Freiheitsgraden).
I Kritischer Bereich: K ={t ∈R : |t|>tn−1;1−α/2}.
I
Einseitige Tests
I Im Fall von H0 :µ≥µ0, HA :µ < µ0 gilt
K ={t∈R : t<tn−1;α=−tn−1;1−α}.
I Im Fall von H0 :µ≤µ0, HA :µ > µ0 gilt K ={t∈R : t>tn−1;1−α}.
I
Die Tests sind f¨ ur große Werte
n(n
≥30) auch ohne
Normalverteilungsvoraussetzung anwendbar.
χ
2-Test Streuungstest
I
Annahme:
Xi ∼N(µ, σ2) ,iid.,
i= 1, . . . ,
n,µ unbekannt.
I
Zweiseitiger Test
I Hypothesen: H0 :σ2=σ20, HA :σ26=σ02.
I Testgr¨oße: T = (n−1)S2 σ02
H0
∼χ2n−1 (χ2-Verteilung mitn−1 Freiheitsgraden).
I Kritischer Bereich:
K ={t ∈R : t < χ2n−1;α/2} ∪ {t∈R : t> χ2n−1;1−α/2}
I
Einseitige Tests
I Im Fall von H0 :σ2≥σ20, HA :σ2< σ02 gilt K ={t ∈R : t < χ2n−1;α}.
I Im Fall von H0 :σ2≤σ20, HA :σ2> σ02 gilt K ={t∈R : t> χ2n−1;1−α}.