• Keine Ergebnisse gefunden

Verwenden Sie den Befehlstr, um eine ¨Ubersicht ¨uber die Daten zu erhal- ten

N/A
N/A
Protected

Academic year: 2022

Aktie "Verwenden Sie den Befehlstr, um eine ¨Ubersicht ¨uber die Daten zu erhal- ten"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Methoden der Datenrepr¨asentation und Klassifikation Aufgabenblatt 3: Daten, deskriptive Statistik und Abst¨ande

Checkliste Lernziele:

• Wie ¨offnet man Daten mitR?

• Wie ruft man bestimmte inR geladene Daten auf (bspw. bestimmte Va- riablen) und wie kann man diese ver¨andern?

• Wie lassen sich Daten mitReinfach beschreiben?

• Wie lassen sich einfache Abst¨ande zwischen Beobachtungen bzw. Vertei- lungen berechnen?

Aufgaben:

1. Schauen Sie sich die Hilfe zum Befehlread.tablean und versuchen Sie, die Dateiklaus1.datzu laden (Box 2.2-1 im Skript).

2. Verwenden Sie den Befehlstr, um eine ¨Ubersicht ¨uber die Daten zu erhal- ten. Welche Informationen liefert der Output? Vergleichen Sie diese mit den Angaben im Skript!

3. Lassen Sie sich f¨ur alle Variablen einfache deskriptive Kennwerte ausgeben (bspw. ¨uber den Befehlsummary). Welche Probleme weisen die einzelnen Kennwerte auf? Lassen sich die Ergebnisse f¨ur die einzelnen Variablen vergleichen?

4. Schauen Sie sich die Hilfe f¨ur den Befehl dist an. Berechnen Sie Ab- standsmatrizen sowohl mit dem euklidischen Abstand, als auch mit der City-Block-Metrik. Vergleichen Sie die Ergebnisse mittels der Befehlestr, table, summaryund plot. Wie unterscheiden sich die beiden Abstands- maße?

5. Verwenden Sie den Befehl unique, um mehrfach auftretende Datenzeilen auszuschließen. Worauf m¨ussen Sie dabei achten?

6. Wiederholen Sie Aufgabe 4 mit dem eingegrenzten Datensatz. Welche Un- terschiede zeigen sich?

7. Verwenden Sie den Befehl corum Tabelle 2.2-2 zu replizieren. Benutzen Sie dabei wieder den urspr¨unglichen Datensatz.

8. Versuchen Sie, die Matrix (2.1) zu reproduzieren. Hierf¨ur m¨ussen zun¨achst die vorhandenen Daten rekodiert werden. Anschließend sind die Befehle rbind und tabulate n¨utzlich. Verwenden Sie anschließend die Matrix, um die Ergebnisse aus Tabelle 2.3-5 zu berechnen. Wie lassen sich diese interpretieren?

9. Laden Sie den Datensatz bs1.dat. Benennen Sie die Variablen wie im Skript (S. 26) und verwenden Sie den Befehlxtabsum Tabelle 2.3-1 zu reproduzieren.

10. Tabelle 2.3-3 l¨asst sich wie folgt reproduzieren. Versuchen Sie die entspre- chenden Befehle nachzuvollziehen:

tab1 <- xtabs(h~., dat) tab2 <- prop.table(tab1,1)

tab3 <- ftable(tab2, row.vars=c("Y","Z"),col.vars="X")[]

tab4 <- t(tab3)

dist(tab4,method="manhattan")/2

Referenzen

ÄHNLICHE DOKUMENTE

Ein digitales Bild kann entweder durch Umwandlung eines analogen Bildes (typisch einer photographischen Aufnahme) erzeugt werden oder aber ein Objekt wird

genz auf der ganzen Oberfläche, wenn die Kugel K2 die Brennpunkte (die singulären Punkte der analytischen Fortsetzung) in ihrem Inneren enthält, also die Kugel K0

Da man ;iber eine jede Kurve innerhalb mäßiger Grenzen durch eine· solche darstellen kann,.. allgemein als ein�

¨ uberlegt werden, wie eine solche Ungleichheit erfasst werden kann. Der Wert dieses Index kann n¨aherungs- weise als die Wahrscheinlichkeit interpretiert werden, dass zwei

Lassen Sie sich f¨ ur alle Variablen einfache deskriptive Kennwerte ausgeben (¨ uber den Befehl summary)3. Lassen sich die Ergebnisse f¨ ur die einzelnen

Laden Sie das Paket MASS und verwenden Sie den Befehl isoMDS() um eine nicht-metrische MDS durchzuf¨ uhren.. Benutzen Sie den Befehl Shepard(), um zu einer Einsch¨atzung

2: Rupture point versus variety and fertilising level - storage time 120 days (penetrometer test 1999). Bild 4: Einfluss von Sorten und Düngestufen auf den QE-Modul - Lagerdau- er

Bei allen anderen Studien kann das Ergebnis durch konfundierende Faktoren verf¨ alscht werden, die sowohl das beobachtete Resultat als auch die Unterteilung in SG und KG