Gero Szepannek, Felix Jungermann Abgabe:bis 19.06.,23.59 Uhr an
jungermals8.s.uni-
dortmund.de
Ubungen zur Vorlesung
Wissensentdekung in Datenbanken
Sommersemester 2007
Blatt 10
Aufgabe 10.1
InderVorlesungwurdezurOptimierungderSVM-ParameterdasVerfahrenSMOvorgestellt.
(a) WarumoptimiertmanhierbeinihtalleParametergleihzeitig,undwievieleParameter
werden statt dessen gleihzeitigoptimiertund wieso?
(b) GehenSiedavonaus,dass C =0;1ist.WelhenWertkann
2
mindestensund welhen
Wert maximal annehmen? Losen Sie diese Aufgabe zeihnerish, und leiten Sie Ihre
Losung daraus ab. GehenSie einmalvony
1
=y
2
und dann von y
1 6=y
2 aus.
Aufgabe 10.2
Sie haben auerdem die strukturelle Risikominimierung kennengelernt (Folien-SVM2, Folie
31.), diedazu dient, dieAusdruksstarke von Modellklassenzu messen. Siebasiertauf der
in Folien als notierten VCDimension.
(a) DasempirisheRisikozweierjeweilsbesterModelleausuntershiedlihenModellklassen
seiidentish,dieerste Modellklassebesitze endlihe, diezweite unendlihe VC Dimen-
sion. Welhes Modell empehlt sih hinsihtlih der strukturellen Risikominimierung
und warum?
(b) WiegroistdieVCDimensionderModellklasseunbeshrankttieferEntsheidungsbau-
mefurbinareKlassikationsproblemebeimindestenseinemkontinuierlihenMerkmal?
Begrunden Siebitte IhreAnsiht.
() WirbetrahtendieModellklassederKreiseimR 2
(furZweiklassenprobleme).DieKlasse
besitzt dieParameter\Mittelpunkt"und\Radius".Jedes Modellklassiziertgenau die
Punkte innerhalb des Kreises als positiv. Beweisen Sie, zum Beispiel graphish, dass
diese Hypothesenklasse eine VC Dimension von mindestens3 besitzt.
Aufgabe 10.3
DieRegressions-SVMwurdefurZeitreihenvorgestellt.BeiZeitreihenkanneszuTrendsoder
Zyklenkommen,diezu beahten sind. Geben Siezusatzlihzu den inder Vorlesungund auf
den Folien vorgestellten Zeitreihen drei Beispiele fur Datenreihen, die Zyklen oder Trends