• Keine Ergebnisse gefunden

ZufallsvariablenundWahrscheinlichkeitsverteilungen AusdemTierreich Arbeitslosenstatistiken Arbeitenmitqplotundggplot2 InstallationvonR

N/A
N/A
Protected

Academic year: 2022

Aktie "ZufallsvariablenundWahrscheinlichkeitsverteilungen AusdemTierreich Arbeitslosenstatistiken Arbeitenmitqplotundggplot2 InstallationvonR"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Dr. Annette Bieniusa, Jan St¨arz Sommersemester 2013 Vorlesung: Programmieren in Anwendungen

Ubungsblatt 4¨

http://softech.informatik.uni-kl.de/Homepage/PIA_SS13

Installation von R

Auf der Websitehttp://www.r-project.orgerhalten Sie Information und Material zur Statis- tiksoftware R.

1. Laden Sie die neueste Version f ¨ur Ihr Betriebssystem herunter und installieren Sie es.

2. Installieren Sie die Libararyggplot2 inklusive aller abh¨angigen Pakete.

Arbeiten mit qplot und ggplot2

Arbeitslosenstatistiken

• Schauen Sie sich die Struktur des Datensatzeseconomics an.

• Erstellen Sie ein Liniendiagramm mit Hilfe vonqplot(), welches die Zahl der Arbeitslosen

¨uber die Jahre zeigt. F ¨uhren Sie eine Liniengl¨attung durch, sodass ein Trend sichtbar wird.

• L ¨osen Sie die Aufgabe erneut unter Verwendung vonggplot().

Aus dem Tierreich

• Lesen Sie sich in die Struktur des Datensatzesmsleep ein.

• Erstellen Sie einen Scatterplot mitggplot(). Auf der X-Achse soll das K ¨orpergewicht und auf der Y-Achse die Gesamtschlafdauer aufgetragen werden.

• Um das Diagramm anschaulicher zu machen, verwenden Sie f ¨ur die X-Achse eine log- arithmische Skala, f¨arben Sie die Punkte nach Fressverhalten (Fleisch-, Pflanzen- oder Allesfresser) und beschriften Sie die Achsen sinnvoll.

• Angenommen, Sie wollen jetzt noch eine weitere Eigenschaft, wie z.B. die REM-Dauer in das Diagramm einfließen lassen. Ist dies m ¨oglich? Wenn ja, wie?

• Spalten Sie das Diagramm in mehrere Facetten, die die Tiere nach ihrem Erhaltungs- /Schutzzustand gruppieren.

Zufallsvariablen und Wahrscheinlichkeitsverteilungen

1. Erstellen Sie Plots f ¨ur die Dichtefunktion der Normalverteilung mit verschiedenen Pa- rametern. Wie ver¨andern sich die Graphen bei verschiedenen Mittelwerten, wie bei verschiedenen Varianzen?

2. Erzeugen Sie Stichproben der Gr ¨oße 10, 100, 1000, und 1000 f ¨ur die Standardnor- malverteilung. Berechnen Sie f ¨ur den jeweiligen Stichprobenumfang Punktsch¨atzer f ¨ur den Mittelwert und die Varianz sowie Intervallsch¨atzer f ¨ur den Mittelwert. Wie ver¨andern sich diese Sch¨atzwerte bei steigender Stichprobengr ¨oße?

(2)

Hypothesentests

Der PISA-Test

DasProgramme for International Student Assessment, kurz PISA, ist eine im dreij¨ahrigen Turnus durchgef ¨uhrte, standardisierte Bewertung von (15-j¨ahrigen) Sch ¨ulern der OECD Staaten. Auf der Homepage der Vorlesung finden Sie den Datensatz PISA.csv mit den Ergebnissen einiger ausgw¨ahlter Staaten, getrennt nach dem Geschlecht (Variable sex : 1 Female, 2 Male, Perc Sex gibt den Anteil an). Die weiteren Eintr¨age sind:

R00 - R06 : Mittlerer Score zur Lesekompetenz im Jahr 2000 bzw. 2006

M00 - M06 : Mittlerer Score zur Kompetenz in der Mathematik im Jahr 2000 bzw. 2006 S00 - S06 : Mittlerer Score in den Naturwissenschaften (science) im Jahr 2000 bzw. 2006

• Lesen Sie die Daten in R ein und verschaffen Sie sich einen ¨Uberblick.

• Visualisieren Sie die Daten.

• Untersuchen Sie mit einem geeigneten Test, ob sich die PISA-Bewertungen im Laufe der Jahre signifikant ver¨andert haben. Stellen Sie dazu zun¨achst die passende Hypothese auf.

Arzneimittelstudie

Gegeben seien die folgenden Daten aus einer klinischen Studie zur Wirksamkeit zweier Medikamente.

Medikament A Medikament B

Behandlungserfolg 6 4

kein Behandlungserfolg 12 9

1. Erstellen Sie eine vollst¨andige Kontingenztabelle f ¨ur die Medikamentenstudie.

2. Verfassen Sie eine formale Hypothese, um zu testen, ob Medikament A besser wirkt als Medikament B.

3. Warum ist derχ2-Unabh¨angigkeitstest nicht anwendbar? Welche Alternativen gibt es?

4. Verwenden Sie den Fisher-Test, um die Hypothese zu testen. Zu welchem Ergebnis kommen Sie?

Referenzen

ÄHNLICHE DOKUMENTE

[r]

Restrukturierung nach der Top-Down-Strategie sorgt nicht f¨ ur eine bessere Laufzeit, sondern erleichtert die Synchronisation, wenn mehrere Prozesse gleichzeitig auf einen (a,

Februar 2001 Fakult¨ at f¨ ur Mathematik. Mathematik III f¨ ur Wirtschaftsinformatiker

Was k¨ onnen Sie hiermit ¨ uber die zweiten Ableitungen in Punkt (0, 0) schließen?.

Man bestimme durch Extrapolation eines geeigneten Differenzenquotienten m¨ oglichst gute N¨ aherungen zum Ableitungswert f 0 (0.6) = 0, 63665358..

L¨ osen Sie das System numerisch mit dem Forward Euler-Verfahren und einer Zeitschrittweite von 0.1 ms, einer Simulationsdauer von T = 50 ms und jeweils den Parametern τ = 10 und τ =

[r]

[r]