• Keine Ergebnisse gefunden

Betrachten Sie die Hilfe zum Befehl rnorm

N/A
N/A
Protected

Academic year: 2022

Aktie "Betrachten Sie die Hilfe zum Befehl rnorm"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Methoden der Datenrepr¨asentation und Klassifikation Aufgabenblatt 5: Bildung von Partitionen

Checkliste Lernziele:

• Wie kann man mitR

”zuf¨allige“ Zahlen erzeugen?

• Wie l¨asst sich einek-means Clusteranalyse durchf¨uhren?

• Wie lassen sich die Vor- und Nachteile von Verfahren durch k¨unstliche Daten verdeutlichen?

Erinnerung: Die Normalverteilung folgt der Dichtefunktion

f(x) = 1 σ√

2πexp −1 2

x−µ σ

2!

wobei µder Erwartungswert und σdie Standardabweichung ist. Ist µ= 0 und σ = 1 spricht man von einer Standardnormalverteilung. Um anzuzeigen, dass eine Zufallsvariable X einer Normalverteilung mit Parameternµ und σ folgt, verwenden wir die SchreibweiseX∼ N(µ, σ).

Aufgaben:

1. Betrachten Sie die Hilfe zum Befehl rnorm. Verwenden Sie diesen Befehl um einen Datensatz zu erstellen, der aus insgesamt 100 F¨allen besteht, die in zwei Gruppen zu jeweils 50 F¨allen aufgeteilt sind; erzeugen Sie f¨ur jeden Fall zwei Werte zweier normalverteilter ZufallsvariablenX und Y, wobei f¨ur die erste GruppeX ∼ N(3,1) undY ∼ N(3,1) und f¨ur die zweite GruppeX∼ N(6,1) undY ∼ N(5,1) gelten soll. Weitere n¨utzliche Befehle hierf¨ur sindcbind,rbindundas.data.frame.

2. Stellen Sie die in der vorherigen Aufgabe erstellten

”Zufallsvariablen“ gra- fisch dar. Ver¨andern Sie die Parameter der Verteilungen und betrachten Sie die Effekte.

3. Verwenden Sie den Befehlkmeans, um eine 2-Cluster-L¨osung f¨ur die k¨unst- lich erzeugten Daten aus Aufgabe 1 zu berechnen. Stellen Sie dieses Er- gebnis grafisch dar.

4. Erzeugen Sie zudem L¨osungen mit 3, 4 und 5 Clustern. Nutzen Sie eine grafische Darstellung, um die Ergebnisse zu vergleichen.

5. Ver¨andern Sie Ihre Daten so, dass f¨unf F¨alle ”klare Ausreißer“sind. Be- rechnen Sie erneut eine 2-Cluster-L¨osung. Interpretieren Sie das Ergebnis!

6. Erzeugen Sie einen neuen Datensatz, der aus 100 F¨allen und zwei standard- normalverteilten Zufallsvariablen besteht. Berechnen Sie L¨osungen mithil- fe deskmeans-Befehls f¨ur 2, 3, 4 und 5 Cluster.

7. Erstellen Sie f¨ur die Daten aus der letzten Aufgabe abermals 2-Cluster- L¨osungen mittelskmeans. Variieren Sie hierbei den Parameternstartmit Werten von 1 bis 5. Stellen Sie die Ergebnisse grafisch dar. Interpretieren Sie die Ergenisse!

8. Laden Sie den Datensatzbs1.datund erstellen Sie aus diesem die (trans- ponierte) Tabelle 2.3-2.

9. Benutzen Sie die Datenmatrix aus der letzten Aufgabe, um mittelskmeans Partitionen der Gr¨oßen 2, 3 und 4 zu bilden. Vergleichen Sie Ihre Ergeb- nisse mit den im Skript in Abschnitt 5.2.5 angegebenen Resultaten.

10. Benutzen Sie den Befehlpam aus dem Paketcluster um das k-medoids Verfahren auf die Abstandsmatrix aus der Dateiauto.dat anzuwenden.

Die Zahl der Cluster k¨onnen Sie frei w¨ahlen. Begr¨unden Sie Ihre Entschei- dung!

Referenzen

ÄHNLICHE DOKUMENTE

Um das Quadrat etwas einfacher zu programmieren, so dass ihr nicht alles vier mal programmieren müsst, gibt es den Befehl „Wiederhole x mal“.. Diesen findet ihr unter Kontrolle,

[r]

lenz uge unter der H ullkurve propagieren niht relativ zur H ullkurve: Phasengeshwindigkeit

Um das Magnetfeld im Inneren der beiden Spulen zu berechnen, legen wir ein Rechteck auf die y − z Ebene, dessen zwei Seiten parallel zur x-Achse verlaufen.. Eine dieser Seiten

Laden Sie das Paket MASS und verwenden Sie den Befehl isoMDS() um eine nicht-metrische MDS durchzuf¨ uhren4. Benutzen Sie den Befehl Shepard(), um zu einer Einsch¨atzung

Verwenden Sie den Befehl hclust, um eine hierarchische Klassifikation mittels der Single Link Methode zu berechnen?. Verwenden Sie die Befehle plot, cutree und rect.clust, um ein

Laden Sie das Paket MASS und verwenden Sie den Befehl isoMDS() um eine nicht-metrische MDS durchzuf¨ uhren.. Benutzen Sie den Befehl Shepard(), um zu einer Einsch¨atzung

LinearSolve liefert nur eine Lösung, wenn auch unendlich viele Lösungen vorhanden sind:. ausgeführt an