• Keine Ergebnisse gefunden

3. ¨ Ubungsblatt 506.556 Statistik, WS 2007/2008

N/A
N/A
Protected

Academic year: 2021

Aktie "3. ¨ Ubungsblatt 506.556 Statistik, WS 2007/2008"

Copied!
3
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

3. ¨ Ubungsblatt 506.556 Statistik, WS 2007/2008

1

Univ.-Prof. DI Dr. Ernst Stadlober

1.) [T] χ2-Verteilung, Student-t-Verteilung.

(a) Man beweise Satz A1:

Sind die Zufallsvariablen X1, X2, . . . , Xn iid∼ N(0,1)–verteilt, dann ist Y =

n

X

i=1

Xi2 χ2n–verteilt.

Das heißt, die Zufallsvariable Y hat die Dichte hn(x) =

1

2n/2Γ(n/2)xn/2−1e−x/2 x>0

0 x <0 .

(b) Man beweise Satz A.2:

Falls X und Y unabh¨angige Zufallsvariable mit X ∼N(0,1) und Y ∼ χ2n, dann hat die Zufallsvariable

T = X

pY /n

die Dichte

tn(t) = Γ((n+ 1)/2) Γ(n/2)√

nπ 1 +t2/n−(n+1)/2

, −∞< t <∞ .

2.) [P] Konfidenzintervalle f¨ur µ und σ2.

Eine Stichprobe aus einer Normalverteilung vom Umfang n = 10 sei gegeben durch 11.3 10.2 9.5 10.4 9.8 11.0 10.2 10.9 9.9 9.8

(a) Wie lautet das zweiseitige 95%–Konfidenzintervall f¨urµ?

(b) Es kommen zwei weitere Messwerte 10.3 dazu. Wird dadurch das Konfidenz- intervall l¨anger oder k¨urzer?

(c) Geben Sie aufgrund der 10 Messwerte ein einseitiges 95%–Konfidenzintervall f¨ur σ2 an.

3.) [P] Gauß-Test f¨ur µ.

Das Gewicht G[ing] von Semmeln sei N(µ,6) verteilt. F¨ur n= 81 Semmeln ergab sich das Durchschnittsgewicht von x= 37g.

(a) Man ¨uberpr¨ufe mittels eines zweiseitigen Tests, ob die Daten mit der Hypothese H00 = 38g vereinbar sind (α= 0.05).

(b) Sei µ1 = 37g der wahre Wert von µ. Wie groß ist dann der Fehler 2. Art beim Test in (a)?

(2)

3. ¨ Ubungsblatt 506.556 Statistik, WS 2007/2008

2

(c) Wie groß muss der Stichprobenumfang n mindestens gew¨ahlt werden, damit der Fehler 2. Art des Tests H00 = 38g gegen H11 = 37g kleiner gleich 0.05 wird?

4.) [P] Konfidenzintervalle und Tests f¨ur Anteil p.

(a) Bei der Produktion von bestimmten Bauteilen f¨ur elektronische Ger¨ate entste- hen mit einer (unbekannten) Wahrscheinlichkeit p defekte St¨ucke. Um Auf- schluß ¨uber die Wahrscheinlichkeit p zu bekommen, wird bei laufender Pro- duktion eine Stichprobe von n Bauteilen entnommen, die auf ihre Funkti- onst¨uchtigkeit ¨uberpr¨uft werden. Unter geeigneten Annahmen

i. bestimme man f¨ur n = 600 ein konkretes Konfidenzintervall zum (ap- proximativen) Konfidenzniveau 0.95 f¨ur p, wenn 69 der 600 ¨uberpr¨uften Bauteile defekt sind.

ii. Der Ausschußanteil x sei wie in i. Welchen Stichprobenumfang n ben¨otigt man mindestens, damit die L¨ange des 95%–Konfidenzintervalls f¨ur p klei- ner gleich 0.05 wird?

iii. Wie groß muß n gem¨aß Fragestellung ii. mindestens sein, wenn der Aus- schußanteil x beliebig ist?

(b) Ein Unternehmen bezieht seit langem von einem bestimmten Lieferanten einen Massenartikel, wobei der Ausschussanteil 5% betr¨agt. Ein Konkurrenzangebot verspricht bei gleichem Preis einen Ausschussanteilunter5%. Unter 100 zuf¨allig ausgew¨ahlten Artikeln des Konkurrenzangebotes waren 2 Ausschussst¨ucke.

i. Formulieren Sie einen statistischen Test als Entscheidungsgrundlage. Dabei wird die Umstellung auf ein schlechteres Konkurrenzangebot als schwer- wiegender erachtet. Bestimmen Sie dann den kritischen Bereich des Tests zum Niveau α= 0.05; wie ist zu entscheiden?

ii. Skizzieren Sie die Operationscharakteristik (OC) des Tests. Bestimmen Sie die Wahrscheinlichkeit f¨ur den Fehler 2. Art 1−β, falls der tats¨achliche Ausschuss anteil des Konkurrenzartikels 3% ist.

iii. Welchen Test schlagen Sie bei einem Stichprobenumfang von n = 500 vor?

Wie ist bei 10 Ausschussst¨ucken zu entscheiden?

5.) [C] Konfidenzintervalle und Tests bei Lungenfunktionsdatenaimu 1985.sav aus Bsp. 3 [R 2.6.0].

(a) Analysieren Sie die Variablen fev1,fvc mit Hilfe von Stengel-Blatt-Diagram- men, Box-Plots, Fehlerbalken und Q-Q-Plots. Was liefert der t-Test bzgl. der Nullhypothesen µf vc= 5.4 und µf ev1 = 4.5?

(b) Man definiere die kategorische Variable jung alt(1,2) (16–30 Jahre, 31–59 Jahre) und f¨uhre eine explorative Analyse der Variablen fvc bzgl. der Ka- tegorien region und jung alt durch, indem man Stengel-Blatt-Diagramme, Box-Plots, Fehlerbalken und Q-Q-Plots erzeuge.

(3)

3. ¨ Ubungsblatt 506.556 Statistik, WS 2007/2008

3

(c) Was liefern der Welch-Test und der t-Test beim Vergleich der beiden Alters- gruppen bzw. beim Vergleich der beiden Regionen?

(d) Was liefert der F-Test als Test auf gleichheit der Varianzen? (h¨andische Be- rechnung)?

(e) Testen Sie die Gleichheit des Lokationsparameters f¨ur fvc bzgl. der Regionen und bzgl. der Altersgruppen mit Hilfe des Mann-Whitney-U-Tests

(f) Fassen Sie die Ergebnisse in Form eines Dokuments (max. 4 Seiten) zusammen.

6.) [P] Konfidenzintervalle und Tests bei zwei unabh¨angigen Stichproben.

Der Prozentsatz von K¨orperfett ist ein guter Indikator f¨ur den metabolischen Ener- giestatus und den allgemeinen Gesundheitszustand eines Menschen. Es wurden 2 Gruppen von gesunden Studenten untersucht und deren Prozentsatz an K¨orperfett festgestellt. Gruppe A bestand ausn = 80 Studenten aus st¨adtischen Regionen und Gruppe B setzte sich aus m = 60 Studenten aus l¨andlichen Gegenden zusammen.

Es ergaben sich die folgenden Stichprobenwerte. x = 12.07 [%], sX = 3.04 [%], y = 11.04 [%], sY = 2.63 [%]. Die Meßwerte seien Realisierungen von unabh¨angigen Stichprobenvariablen Xi ∼N(µX, σX), Yj ∼N(µY, σY).

(a) Man bestimmte ein 95%–Konfidenzintervall f¨ur die Differenz µDX −µY. L¨aßt sich ein signifikanter Unterschied zwischen den mittleren Prozents¨atzen µX und µY zum Niveau α= 0.05 nachweisen?

(b) Wie lautet das 95%–Konfidenzintervall f¨ur θ = σX2Y2? Ist H0 : θ = 1 zum Niveau von α = 0.05 zu verwerfen?

7.) [CS, optional] Simulation von Konfidenzintervallen [R 2.6.0]

(a) Man erzeuge m = 50 Stichprobenvektoren (X1, . . . , Xn) der L¨ange n = 20 mit Xi iid∼ N(µ= 0, σ= 1).

(b) Man berechne f¨ur jeden Vektor das arithmetische Mittel X und je ein 95%–

Konfidenzinterall f¨ur den Erwartungswert µ bei bekanntem σ = 1 und f¨ur unbekanntes σ.

(c) Stellen Sie diese Konfidenzintervalle graphisch in Form von Tabellen und Lini- enplots dar. Wie oft wird der wahre Parameter µ= 0 durch die Konfidenzin- tervalle ¨uberdeckt?

Hinweis:

Speichern Sie Ihre ¨Ubungsaufgaben (mit entsprechenden Kommentaren) unter folgenden File–Namen ab: Statistik Nachname1aufgabenr.* z.B. Statistik schiefer31.pdf und ¨ubermitteln Sie die Files per e-mail mit dem Betreffstat an statistik@tugraz.at.

Transfer der Files bis sp¨ atestens: Di. 11. 12. 2007, 10.00 Uhr

Besprechungstermin: Mi. 12. 12. 2007, 16.15–17.45, HS BE01

Referenzen

ÄHNLICHE DOKUMENTE

(b) Beim Vergleich von zwei Waschmitteln hat man folgende H¨ aufigkeiten f¨ ur die Einstufung in drei Qualit¨ atsklassen erhalten:..

(b) An einer Klinik werden die Erfolge und Misserfolge zweier verschiedener Ope- rationstechniken registriert..

(b) Man erzeuge Box-Plot-Serien und Fehlerbalken f¨ur die Merkmale fvc l und fe l gemeinsam, aber getrennt nach den Kategorien jung alt und gr kl.. (2 Serien; Op- tionen:

Man benutze da- zu das Men¨ u Analysieren (Analyze) −→ Regression −→ Linear mit den Einstellun- gen Abh¨ angige Variable (Dependent) d syst, unabh¨ angige Variable (Independent)

(a) Erstellen Sie einen Scatterplot der beiden Variablen und versuchen Sie, die Abh¨angigkeit der beiden Variablen durch eine Regressionsanalyse zu beschreiben.. (b) ¨ Uberpr¨ ufen

(b) Stellen Sie ein (lineares) Regressionsmodell f¨ ur Zeit in Abh¨angigkeit von Dosis und Druck auf. Erstellen Sie Residuenplots und beurteilen Sie die Resultate. Teil) grazluft;

(d) Aufruf des Men¨ us Analysieren −→ Nichtparametrische Tests −→ K unabh¨ ang- ige Stichproben Tests: Kruskal-Wallis-H Optionen Deskriptive Statistik, Quar- tile.. (e)

(b) F¨ uhren Sie eine einfache Varianzanalyse in R mit den Befehlen gem¨ aß Hand- Out durch?. (c) Welche Parametrisierung liefert der Aufruf