2.4 Nutzenfunktionen
4.1.2 Algorithmus
In Tabelle 4.1 ist der GSSAlgorithmus angegeben. Es kann bewiesen werden, dass der
Algorithmus terminiertunddasapproximativk-besteHypothesen Problemlöst [25 ℄.An
drei Stellenwerdendie im vorangegangenen Abshnitt eingeführten Kondenzintervalle
berehnet,dieebensowiedieAufteilungvon
δ
undǫ
einernäherenErläuterungbedürfen.In Shritt 2 des Algorithmus wird die maximale Beispielanzahl M berehnet, nah der
siher ist, dass die Abweihung des geshätzten empirishen Nutzens jeder Hypothese
h ∈ H
inbeideRihtungenhöhstens2 ǫ
beträgt.MbezeihnetzugleihdiemaximaleAn-zahlvonShleifendurhläufeninShritt3.WirddiemaximaleBeispielanzahlMerreiht,
steht mit gewünshter Kondenz fest,dass der wahre Nutzen derHypothesen maximal
ǫ
2
umdengeshätztenNutzenshwankt.Eskönnen danninShritt4diek-bestenHypo-thesen ausgegeben werden, da selbst imshlehtesten Fall der maximal zulässigeFehler
Eingabe:
X, T, k, q, δ, ǫ
Ausgabe: Die approximativ k-besten Hypothesen mit Maximalfehler
ǫ
und Kondenz1 − δ
1. Initialisierung.
a) Erzeuge H,dieMenge allerHypothesen für den InstanzenraumX.
b) Setzei=1 (Shleifenzähler).
) Sei
Q 0 = ∅
.2. Berehne diekleinsteZahlM, sodass
E(M, 2 | δ H | ) ≤ 2 ǫ ist.
3. do
a) Ziehe zufällig mit Zurüklegen eine Instanz
x i aus T und füge sie Q i hinzu:
Q i = Q i − 1 ∪ x i.
b) Aktualisiere den empirishen Nutzen
q(h, Q ˆ i )
aller verbliebenen Hypothesenh ∈ H
.) BestimmedieMenge
H ∗ derHypothesenh ∈ H
,diedengröÿtenempirishen
Nutzen
q(h, Q ˆ i )
haben.d) for(
h ∈ H
)doi. if (
q(h, Q ˆ i ) − E h (i, 2M δ
| H | ) ≥ max h ′
∈ H \ H ∗
n q(h ˆ ′ , Q i ) + E h ′ (i, 2M δ
| H | ) o − ǫ
und
h ∈ H ∗)
•
Ausgabeh.•
Entferne hausH.•
Setze k=k-1.•
BerehneH ∗ neu.
ii. if (
q(h, Q ˆ i ) + E h (i, 2M δ | H | ) ≤ min h ′
∈ H ∗
n q(h ˆ ′ , Q i ) − E h ′ (i, 2M δ | H | ) o
)•
Entferne hausH.e) Setzei=i+1.
while(
k 6 = 0
und| H | 6 = k
undE(i, 2 | δ H | ) > 2 ǫ)
4. Gib dieverbliebenen kHypothesenin
H ∗ aus.
Abbildung 4.1:Der GeneriSequential SamplingAlgorithmus
0 0.2 0.4 0.6 0.8 1
h4 h3
h2 h1
Nutzen
Hypothesen
ε 4 Hypothesen
k=2
keine Ausgabe!
Verwerfen!
untere Schranke der k-besten Hypothesen obere Schranke der restlichen Hypothesen
0 0.2 0.4 0.6 0.8 1
h4 h3
h2 h1
Nutzen
Hypothesen
ε 4 Hypothesen
k=2
Ausgabe!
untere Schranke der k-besten Hypothesen obere Schranke der restlichen Hypothesen
Abbildung 4.2:Funktionsweise desGSSAlgorithmus inShritt 3d
ǫ
niht übershritten wird. Dieser Fall tritt ein, wenn der wahre Nutzen der shlehtes-tenausgegebenen Hypotheseumǫ
2
nah untenabweiht,währendder wahreNutzenderbesten Hypothese, dieniht ausgegeben wurde,um
ǫ
2
nahoben abweiht.VonderzurVerfügungstehenden Irrtumswahrsheinlihkeit
δ
wirdjeweilsδ 2
für dieBe-rehnungderKondenzintervalle inderAbbruhbedingungder Shleife inShritt 3 und
innerhalb der Shleife (Shritt 3d) benutzt. Trit die Abbruhbedingung der Shleife
zu,wurde für jede verbliebene Hypothese einKondenzintervall berehnet. Daher istes
nötig, dieIrrtumswahrsheinlihkeit auf alle verbliebenen Hypothesen zu verteilen. Der
wahreNutzen einer Hypothese liegtdann nur mit einer Wahrsheinlihkeit von
δ 2 | H |
au-ÿerhalb des Kondenzintervalles um ihren geshätzten Nutzen. Es bleibt zu klären, ob
dadurh dieIrrtumswahrsheinlihkeit von
δ
2
eingehalten wird.Der Fall,dass derwahre Nutzen einer Hypothese auÿerhalb desKondenzintervalles liegt, wird alsnegativesEr-eignisbezeihnet. Dasnegative Ereignis trittfür jedeHypothesemit Wahrsheinlihkeit
δ
2 | H |
ein. Es ergibt sih eineMenge von Ereignissen, die alle diegleihe W ahrsheinlih-keit haben. Die Booleshe Ungleihung (Union Bound)besagt,dass für eineMenge vonEreignissen die Wahrsheinlihkeit, dass mindestens eines dieser Ereignis eintritt, niht
gröÿer ist als die Summe der Wahrsheinlihkeiten aller Ereignisse. Damit wird
insge-samtdieIrrtumswahrsheinlihkeitvon
δ
2
eingehalten.InShritt3ddesGSSAlgorithmus wirdmit deranderen Hälfte derIrrtumswahrsheinlihkeit injedem Shleifendurhlaufein Kondenzintervall für alle verbliebenen Hypothesen berehnet. Da die Shleife im
shlehtesten FallM-maldurhlaufenwird,mussdieseHälfte der
Irrtumswahrsheinlih-keit zusätzlih durh M geteilt werden. Die Einhaltung der Irrtumswahrsheinlihkeit
folgt wieder aus der booleshen Ungleihung. Das Vorgehen des Algorithmus in Shritt
3d wird inAbbildung 4.2verdeutliht. Exemplarish sind Nutzen und die
Kondenzin-tervalle vonvierHypothesen dargestellt. GroÿeKondenzintervalle bedeuten, dassniht
viel über die Qualität der Hypothese bekannt ist und der wahre Nutzen stark von der
Shätzungabweihen kann.Wihtigistzumeinendiedurhdieshlehteste derkbesten
Hypothesen und deren Kondenzintervall festgelegte untere Shranke. Jede Hypothese,
die für den Fall, dass ihr wahrer Nutzen am oberen Ende der durh ihren geshätzten
Nutzenund Kondenzintervall festgelegtenReihweite liegt, shlehterist alsdieuntere
Shranke, kann verworfenwerden. Es istfür diegewünshte Kondenzsiher,dass noh
kbessereHypothesenvorhanden sind.Zum anderenist diedurh(k+1)-beste
Hypothe-se, deren Kondenzintervall und
ǫ
festgelegte obere Shranke von Bedeutung. Gilt für einederk-bestenHypothesen,dass ihrNutzenauhim shlehtesten FallnohüberderShranke liegt,kannsieausgegeben werden. Esist siher, dasssiefürdiegegebene
Kon-denz
1 − δ
unddenmaximalenFehlerǫ
gut genugist,umzudenapproximativk-besten Hypothesenzu gehören.Dasfrühzeitige Ausgebenbzw. VerwerfenvonHypothesenkanndazu führen, dass der Algorithmus terminiert bevor die maximale nötige Anzahl von
Beispielen gezogen wurde, wenn vorher shon alle k Lösungen gefunden wurden.In der
Praxis kommt dieses häug vor und ist essentiellfür eine guteLaufzeit. Der Vorteildes
Tests inShritt 3d beginnt sih auszuwirken, sobalddie erste Hypothese ausH gelösht
wird.MitjedergelöshtenHypothesewird|H|kleiner und
δ
mussaufwenigerHypothe-sen verteilt werden, wodurh dieberehneten Kondenzintervalle besserwerden. Dieses
mahtdeutlih,dasskomplexe(groÿe)Hypothesenräume fürdenAlgorithmus
problema-tishsind. InderPraxismussdieKomplexität beshränktwerden. Insbesondere müssen
numerisheAttributediskretisiertwerden,daessonstnihtmöglihist,den
Hypothesen-raumkomplettaufzuzählen. EinweiteresProblemfürdieLaufzeit istdieAufteilungder
Irrtumswahrsheinlihkeit auf alle MShleifendurhläufe. Der Wertvon M kann
abhän-gigvombetrahteten HypothesenraumundgegebenerNutzenfunktionsehrgroÿwerden
(Kapitel4.1.3). Es bietet sih an,Shritt 3d niht injedem Shleifendurhlauf
durhzu-führenundMentsprehend zuverkleinern.DadurhwerdenkleinereKondenzintervalle
möglihundesmüssennihtinjedemShleifendurhlaufalleBerehnungen durhgeführt
werden. Diese und andere Verbesserungen des GSS Algorithmus werden inKapitel 5.1
beshrieben. Fürvershiedene Nutzenfunktionenergebensihvershiedene
Kondenzin-tervalle und starkuntershiedlihe Wertefür M.