• Keine Ergebnisse gefunden

Experiment 5: Auswirkungen von Mutation und Crossover und genetische Diversität11

2. Die Experimente

2.6. Experiment 5: Auswirkungen von Mutation und Crossover und genetische Diversität11

Am Ende jeder Generation muss für das verwendete „Truncation Selection“ eine Fitness-Rangliste der Individuen erstellt werden, bei einer Populationsgröße von 20 also die Plätze 1 bis 20. Um die Auswirkungen von Mutation und Selektion auf die Platzierung des Indivi-duums zu untersuchen, zeichnete ich für jede Generation und jeden Platz 2 zusätzliche C&M-Bits (Crossover&Mutations-C&M-Bits) auf:

C&M-Bits des Platzes P

Bedeutung:

Genotyp des Individuums auf Platz P ist …

00 ... weder Ergebnis einer Selektion noch einer Mutation 10 ... Ergebnis eines Crossovers

01 ... Ergebnis einer Mutation

11 ... Ergebnis eines Crossovers und einer Mutation

Dazu kommt in jeder Generation G noch ein Wert der Genetischen Diversität gendiv(G). Ist M die Menge aller möglichen Paare (u, v) von Genotypen der Generation G (bei 20 Individu-en ergebIndividu-en sich 19+18+…+1=190 Paare) und h(u, v) der Hamming-Abstand der GIndividu-enotypIndividu-en u und v, so berechnet sich gendiv(G) wie folgt:

Daneben entschied ich mich die im Experiment 3 eingeführte Strategie „10 Sekunden Frei-zeit“ zu erweitern und die 10 Sekunden in 10 Abschnitte à eine Sekunde einzuteilen. Zu Be-ginn jedes Abschnittes werden Zufallswerte für die beiden Servos bestimmt und dann eine Sekunde beibehalten. Diese Strategie hilft folgendes Problem zu umgehen: Innerhalb des Par-cours können Plätze existieren, in denen die Individuen durch ein nicht gewünschtes Verhal-ten sehr hohe Fitnesswerte erreichen – bspw. eine hervorstehende Ecke gegen die der Roboter so fährt, dass beide Infrarotsensoren hohe Abstände signalisieren. Auch wenn diese Plätze mit einer sehr niedrigen Wahrscheinlichkeit getroffen werden können, so kann dies im schlimms-ten Fall zu einem kompletschlimms-ten Stillstand der Evolution führen.

Das Experiment ging über 13 Generationen mit einer Laufzeit von ca. 5 Stunden (13⋅20⋅(60sec+10sec)).

0 200 400 600 800 1000 1200

1 2 3 4 5 6 7 8 9 10 11 12 13 Generation

Fitness und Genetische Diversität (max 1000)

BestValues WorstValues AverageValues GeneticDiversity

Generation C&M-Bits der Plätze 1..20 (durch Leerzeichen getrennt) 1 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 2 00 01 11 01 11 01 01 01 01 01 01 00 00 01 10 11 11 01 01 11 3 01 01 01 01 00 11 01 11 01 01 00 01 01 01 11 00 11 00 11 11 4 00 01 00 00 01 01 01 00 01 01 01 11 11 01 10 01 01 11 01 00 5 11 01 11 01 01 01 00 01 00 00 01 01 01 01 01 00 11 01 11 01 6 10 00 11 00 01 01 00 01 00 01 01 01 01 00 01 01 01 01 01 00 7 11 01 01 11 01 01 01 10 01 11 01 01 01 01 00 01 01 01 01 01 8 01 01 01 01 01 01 01 01 01 01 01 11 11 01 00 01 00 01 00 01 9 01 01 00 00 00 01 01 01 01 00 11 01 01 01 01 01 01 01 11 01 10 01 00 01 01 01 00 00 01 01 01 01 01 00 01 11 11 01 01 01 01 11 01 01 01 01 00 01 11 01 00 01 10 01 01 11 01 01 01 11 01 01 12 11 01 01 00 01 00 01 01 01 01 11 11 11 01 01 11 01 11 01 01 13 01 01 01 01 01 01 01 10 01 00 01 10 11 01 10 01 01 01 01 01

Gekreuzte und nicht gekreuzte Individuen finden sich auf fast allen Platzierungen und die größten Sprünge in der maximalen Fitness gehen sogar aus gekreuzten Individuen hervor (siehe Generation 7 und 12). Das Crossover ist hier also ein wichtiger Faktor, der die Evoluti-on begünstigt.

Mutationen gibt es wie zu erwarten auf jeder Platzierung, da eine ungerichtete Veränderung des Genotyps auch Veränderungen der Fitness in jeder Richtung zulässt.

Ist P(i) die Wahrscheinlichkeit, dass genau i Individuen der Generation nicht mutiert sind, PInd

die Wahrscheinlichkeit, dass ein einzelnes Individuum nicht mutiert ist und PMutationsrate=3%

die Wahrscheinlichkeit, dass ein einzelnes Gen mutiert ist, so ergibt sich bei einer Genomlän-ge von 64Bit der Erwartungswert E(ξ) von nicht mutierten Individuen pro Generation:

8

Dieser Wert deckt sich mit den C&M-Bits.

Die Genetische Diversität kann ein Parameter sein, um zu beobachten, ob die Evolution in eine Sackgasse gelaufen ist. Ihre Entwicklung in diesem Lauf überrascht nicht bzw. verhält sich sogar gewünscht in dem Sinne, dass mit ihrer Abnahme auch eine Steigerung der durch-schnittlichen Fitness verbunden ist. Um das Absinken unter ein gewünschtes Maß zu verhin-dern, gibt es Ansätze wie Inzestverbot oder Ausselektieren von Duplikaten [Gerdes2004].

2.7. Experiment 6: Inkrementelle Evolution oder doch nicht?

Der sechste Lauf sollte als Ausgangspunkt einer inkrementellen Evolution dienen. D.h. die besten Individuen, die aus diesem Lauf hervorgehen, sollten als Generation Null in einen schwierigeren Parcours starten und die Evolution unter diesen veränderten Rahmenbedingun-gen fortsetzen. Nicht das erste Mal lief die Evolution aber anders als erwartet ab. Der Lauf ging über 30 Generationen mit einer Gesamtzeit von 6 Stunden und 40 Minuten.

0

Fitness und Genetische Diversität (max 1000)

BestValues WorstValues AverageValues GeneticDiversity

Was zu sehen ist, ist das Beispiel einer vorzeitigen Konvergenz (zum Einbruch der durch-schnittlichen Fitness siehe Experiment 4). Die Evolution hat eine Richtung eingeschlagen, die ihr schnelle Fitnesserfolge im Maximum wie im Durchschnitt einbrachte, sich aber langfristig als genetische Sackgasse entpuppte.

Das verwendete Selektionsverfahren „Truncation Selection“ ist ein diskriminierendes Elite-verfahren. Das bedeutet, dass die besten Individuen immer überleben und die

Überlebens-wahrscheinlichkeit von schlechteren Individuen gleich Null ist. Hiermit verbunden sind ein starker Selektionsdruck und eine hohe Wahrscheinlichkeit einer vorzeitigen Konvergenz.

Um dagegen zu steuern implementierte ich für das nächste Experiment eine andere Selekti-onsstrategie. Zunächst behielt ich die Rangliste der Individuen bei, d.h. vom Fitnesswert wird nur beim Erstellen der Rangliste Gebrauch gemacht. Jedem Platz i der Rangliste wird eine Selektionswahrscheinlichkeit p(i) zugewiesen. Alle p(i) sind dann Ausgangspunkt für ein Se-lektionsverfahren namens „Stochastic Universal Sampling“ (SUS). Bei diesem Verfahren stellt man sich die Selektionswahrscheinlichkeiten wie beim Roulette-Rad-Verfahren[Gerdes2004-2] als Abschnitte eines Kreises A mit dem Umfang Eins vor. Jedem Abschnitt ist eine Platzierung i (und somit ein Individuum) zugeordnet und die Länge eines Abschnittes entspricht dabei der Selektionswahrscheinlichkeit p(i). Beim SUS gibt es einen zweiten Kreis B auf dem N Punkte äquidistant auf den Umfang Eins verteilt sind (wobei N die Populationsgröße ist). Das Rad B wird nun um einen Zufallswinkel gedreht und über das Rad A gelegt. Jeder Punkt des Kreises B befindet sich nun in einem Abschnitt des Kreises A und für jeden Punkt wird das entsprechende Individuum einmal in die nächste Generation über-nommen (welches dann ggf. noch gekreuzt und mutiert wird). Das Verfahren garantiert, dass die Anzahl der Kopien eines Individuums des Platzes i zwischen ⎣p(i)⋅N⎦ und ⎡p(i)N⎤ liegt (⎣⎦

Abrundung bzw. ⎡⎤ Aufrundung auf ganzzahligen Wert) [Gerdes2004-3]. SUS ist also ein nichtdiskriminierendes Eliteverfahren. Dies garantiert auf der einen Seite, dass das beste Indi-viduum nicht durch den Selektionsprozess verloren geht, was bei der kleinen Populationsgrö-ße (also einem kleinen Suchfenster) wichtig ist. Auf der anderen Seite haben alle Individuen mit p(i)>0 die Möglichkeit in die Folgegeneration kopiert zu werden.

Die Bestimmung der p(i) über die Rangliste bedeutet zunächst einmal, dass die Informationen der Fitnesswerte nicht voll ausgeschöpft werden. Die Abstraktion enthält aber die Möglichkeit über die p(i) einen über die Generationen konstanten Selektionsdruck festzulegen, der unab-hängig von den tatsächlich erreichten Fitnesswerten und somit auch von der Zielstellung des Experimentes ist. Die Funktion p(i) muss die Bedingungen 0≤p(i)≤1 und ∑p(i)=1 erfüllen. Ich wählte ein „Exponentielles Ranking“[YaoXin]:

)

Die Selektionswahrscheinlichkeit nimmt also mit schlechterer Platzierung exponentiell ab.

Der erste Bruch dient der Normierung und über α lässt sich der Selektionsdruck regeln.

0 0,05 0,1 0,15 0,2 0,25 0,3

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Platz i

p(i)

Alpha = 0.1 Alpha = 0.2 Alpha = 0.3

Im folgenden Experiment ist α=0.2.

2.8. Experiment 7: „Stochastic Universal Sampling“ und