Statistische Verfahren SS 2016 - ¨ Ubungsblatt 8
Wir betrachten den Datensatz
”mietspiegel99.csv“.
W¨ahlen Sie sowohl f¨ur die absolute Miete (miete) als auch f¨ur den Quadratmeter- preis (mieteqm) 5 sinnvolle Kandidatenmodelle. (Interaktionen und Transformatio- nen von Einflußgr¨oßen sind zugelassen, jedoch sollen miete und mieteqm nicht als Pr¨adiktoren f¨ur die jeweils andere Gr¨oße verwendet werden.)
• Verwenden Sie 10-fache Kreuzvalidierung, um unter ihren Kandidatenmodellen jeweils das geeignetste auszuw¨ahlen.
• Wiederholen Sie die Kreuzvalidierung f¨ur einen verkleinerten Datensatz, der nur die ersten 300 Zeilen des urspr¨unglichen Datensatzes enth¨alt.
(F¨ur das Modell mit dem kleinsten gesch¨atzten erwarteten Prognosefehler gibt es einen ¨Uberraschungspreis. Vergessen Sie nicht, den Zufallszahlengenerator zu initia- lisieren, damit die Ergebnisse reproduzierbar sind.)