Problemlösungsstrategien - Algorithmen und Hardwarearchitekturen zur optimierten Aufzählung von

Hintergrund

2.5 Problemlösungsstrategien

bei Einsatz der eben erwähnten Wegfindung, die eine sichtbare Effizienzsteigerung er-bringt.

Einen anderen Ansatz wählt [MSPPU02] mit der selbstlernenden Methode namens State-Observation-State, bei der für jeden Folgezustand eine Auswahlbewertung vorhan-den ist. Der Folgezustand in Abhängigkeit von aktuellem Zustand und Eingabewert aus der Umgebung, der den meisten Erfolg verspricht, wird ausgewählt. Lernen bedeutet eine Veränderung der Auswahlbewertung, die in diesem Fall auf der Bewertung des Erfolgs von zwei Zustandsübergängen beruht. Mit einem solchen Automaten ist es dann z. B.

möglich, einen Irrgarten zu durchlaufen. Das Lernverfahren hat einen hohen Rechenauf-wand zur Folge, ist also für einen minimalistischen Ansatz nicht geeignet, wohl aber der dadurch entstehende Automat. Allerdings kann mit diesem Mechanismus nach eigener Aussage nicht immer eine Lösung garantiert werden und der Erfolg ist im Wesentlichen von den richtigen Einstellungen der Parameter der Bewertungsfunktion abhängig.

Auch die Komplexität von Algorithmen generell ist nicht außer Acht zu lassen, so dass ein effizienter Programmablauf auch bei steigender Problemgröße gewährleistet ist.

Dabei gibt es eine Problemklasse, beschrieben in [Kar72], die möglicherweise nicht mit polynomialen Algorithmen zu lösen ist. Dazu zählt auch die Routenplanung, die für ein Abschreiten eines Gebietes notwendig ist.

2.5.3 Schwarm: Verhalten einer Gruppe

In Kooperation Aufgaben leichter lösen ist das Ziel eines Schwarms in der Natur. Der Artikel [Kla06] zieht eine Analogie eines Fischschwarms ohne sichtbaren Anführer mit dem Verkehrsfluss auf einer vollen Autobahn. Von außen betrachtet scheint es Verhal-tensregeln zu geben, an die sich alle halten, die aber so nicht offensichtlich sind. Auch das Verhalten von Ameisenkolonien zur Nahrungssuche gehorcht Regeln, die sich aber bei z. B. doppelter Bevölkerung mehr als doppelt effizient auswirken. Für einen Schwarm sind die Regeln

• Kollision vermeiden,

• in der Gruppe bleiben,

• Bewegungsrichtung ist denen in der näheren Umgebung anzupassen

ausreichend. So zeigt sich für zehn Heuschrecken noch eine zufällige, zusammenhängen-de Verhaltensweise, aber bereits bei einer Gruppengröße von 30 agiert zusammenhängen-der Schwarm als ein Lebewesen.

Um einen Schwarm zu lenken, reichen etwa fünf Prozent als Experten aus, um den Schwarm zu beeinflussen, ohne das der Schwarm weiß oder mitbekommt, wer diese Ex-perten sind, wie Versuche aus [CKFL05] gezeigt haben. Dort sind auch Formeln für den erforderlichen Abstand aufgeführt.

Einen anderen Herdenantrieb untersucht [HFV00] mit dem Fluchtverhalten eines Menschenschwarms. Hier kommt es eher auf die Geschwindigkeit eines Einzelnen und auf die Gestaltung der Hindernisse an, die teilweise ein Schwarmverhalten aufzeigen. Ein zellulares Automatenmodell hierfür mit den erforderlichen Regeln stellt [BA00] auf, die das tatsächliche Verhalten von Fußgängern mit unterschiedlichen maximalen Geschwin-digkeiten in bestimmten Situationen abbilden.

Ist erst einmal das Grundverhalten von Lebewesen – bzw. künstlichen Kreaturen – erkannt bzw. festgelegt, so ist ein mehr oder weniger kooperativer Umgang unter Nutzung

2.5 Problemlösungsstrategien von Regeln eines Schwarms für Experimente interessant, um so ein optimales Verhalten künstlicher Kreaturen in der Gruppe mit einfachen Mitteln erreichen zu können.

2.5.4 Optimierung durch naturnahe Berechnung

Eine Variante für die Suche nach dem optimalen Weg bieten Ameisenalgorithmen, vor-gestellt und angewendet in [Foc06]. Der Algorithmus arbeitet nach dem Prinzip, dass Ameisen Pheromone ausschütten, die zur Wegorientierung aller Ameisen dienen. Je öf-ter ein Weg benutzt wird, um so mehr Pheromone befinden sich darauf. Je kürzer ein Weg ist, um so mehr Ameisenüberquerungen finden darauf statt. Von daher ist die Suche nach einem günstigen Weg gegeben.

Ein Problem dabei ist die Generierung eines Wegenetzes bzw. eines Graphen, auf dem die Ameisen agieren. Hier sind die verschiedenen Einflussfaktoren zu berücksichti-gen, die in der Natur Hindernissen und Weglängen entsprechen. In [Foc06, Seiten 186ff.]

sind die vier Parameter der Problemstellung auf 19 Arten unterschiedlich gewichtet auf-geführt, die allesamt Eingang in die Lösung gefunden haben. Allein mit der Auswahl eines Algorithmus ist demnach ein Problem noch nicht gelöst, aber der Lösungsweg ist aufgezeichnet.

Der Ameisenalgorithmus ist bei der Suche nach Entscheidungen hilfreich, es ist aber eine feste Vorgabe der Wege oder eine entsprechende Vorauswahl z. B. mit Hilfe eines anderen heuristischen Verfahrens erforderlich.

Einen ganz anderen Weg geht die organische Methode der Marching Pixels. Für eine schnelle optische Erkennung konzipiert, z. B. zur Erkennung des Schwerpunktes eines Werkstückes, beschreiten Pixel nach einem konfigurierbaren Verfahren eine Ebene, das in diesem Fall aus einem Schwarz-Weiß-Bild einer CMOS-Kamera stammt.

Gemäß [FS05b] bewegen sich die Pixel nach einer Initialisierungsphase, um die Kan-ten des Bildes zu finden, z. B. erst in der horizontalen Richtung. Treffen verschiedene Pixel aufeinander, ändert sich ab einen gewissen Schwellwert das Bewegungsmuster in die Vertikale, wobei sich die Anzahl der sich bewegenden Pixel verändern kann. Kom-men danach an anderer Stelle weitere Pixel zusamKom-men, so ist der Schwerpunkt gefunden.

Weiterentwicklungen sind in [FS05a] und [KF07] enthalten, unter anderen ist ein indus-trieller Einsatz mit einer Zeitbeschränkung von nur 10 ms pro Bild, also 32 ns pro Pixel für eine eigens entwickelte Hardware beschrieben.

Die Regeln zur Steuerung der Pixel sind manuell oder durch ein genetisches Aus-wahlverfahren gestaltet und der Problemstellung angepasst. Zwar kamen verschiedene Algorithmen zum Einsatz, es ist jedoch nicht sichergestellt, dass der gewählte Algorith-mus ein Optimum darstellt. Eine Abhilfe schafft der systematische Durchlauf, wie im Kapitel 5 dieser Arbeit beschrieben.

2.5.5 Künstliche Intelligenz

Auch ein Agent, der aufgrund von Eingaben entsprechende Ausgaben erzeugt, könnte z. B. die Aufgabe der Wegsuche erledigen. Dieser lässt sich auch mit Hilfe der künstli-chen Intelligenz konstruieren. Die Möglichkeiten, die sich durch dieses Forschungsgebiet ergeben, zeigt die nachfolgende Übersicht auf, die sich an [RN03] orientiert.

Bei der Erstellung eines solchen Agenten ist eine Bewertung über den Erfolg erfor-derlich. Hierzu sind genaue Eingrenzungen erforderlich, wie ein Beispiel aus [RN03, Kapitel 2] verdeutlicht: Ein Agent in Form einer Person sieht, als er in Paris die Champs

Élysées entlanggeht, einen alten Freund auf der anderen Straßenseite. Da kein Verkehr in der Nähe ist und er Zeit hat, beschließt er, die Straße zu überqueren. Währenddessen, in 33 000 Fuß Höhe, verliert ein Flugzeug eine Frachtraumtür, wie es nach einem Bericht der Washington Post am 24. August 1989 von N. Henderson mit dem Titel „New door latches urged for Boing 747 jumbo jets“ bereits vorgekommen ist. Bevor der Agent die Straße überqueren kann, wird er von dieser Tür getroffen. War es nun irrational, die Stra-ße zu überqueren? Wenn also eine Bewertung einen unerwünschten Eventualfall nicht enthält, die jedoch von einem Agenten „ausgenutzt“ wird, so ist auch die Frage zu stel-len, ob es im Rahmen der Bewertung nicht doch ein gültiges Verhalten darstellt.

Bei der Entwicklung eines Agenten stellt sich die Frage, in welcher Form dies ge-schehen soll. Ein tabellengesteuerter Agent, der auf alle Vorkommnisse eine Antwort gespeichert hat, verbraucht neben viel Speicherplatz auch Arbeitszeit, diese Tabelle zu er-stellen. Aber allein schon für einen Schachcomputer sind 10¹⁵⁰Einträge erforderlich, die Anzahl der Atome im bekannten Universum beträgt aber nur etwa 10⁷⁸gemäß [BBW99].

Von daher sind algorithmische Beschreibungen vorzuziehen. Aber auch hier gibt es ver-schiedene Beschreibungsformen. Eine einfache Variante ist die Angabe von Verhaltens-regeln (simple reflex agents), die unter Zuhilfenahme von Zuständen und damit Zustands-übergängen sowie Ausgabeverhalten erweitert werden kann (model-based reflex agents).

Eine weitere Zielorientierung ist die Einbindung von Planung, in der ein Agent mehre-re zukünftige Schritte vorausbemehre-rechnet und bewertet, bevor es zur Ausführung kommt (goal-based agents). Um den Agenten erfolgreicher zu gestalten, ist es erforderlich, dass der Agent unmittelbar über den Erfolg seiner Handlung erfährt, um entsprechend selbst in sein zukünftiges Verhalten eingreifen zu können. Dies könnte mit dem Streben nach

„Glücklichsein“ beschrieben werden (oder mehr wissenschaftlich mit funktionell, utility bezeichnet). Erreichen lässt sich dies durch Einbindung einer zusätzlichen Stufe zwi-schen Planung und Ausführung (model-based, utility-based agent).

Bei einem zu Anfang nicht statisch festgelegten Verhalten kann der Agent hinlernen. Dies erlaubt dem Agenten, sich in einer anfangs unbekannten Umgebung zu-rechtzufinden und Kompetenz zu seinem ursprünglichen Wissen aufzubauen. Dazu muss der Agent Kritik relativ zu festgelegten Ausführungsstandards von außen entgegenneh-men können und diese als Feedback in einem Lerneleentgegenneh-ment verwerten. Dieses ist mit einem Ausführungselement gekoppelt, das die Auswertung der Sensoren (Umgebungs-erfassung) zu einer Ausführung (auf die Umgebung) übernimmt; die Anbindung erfolgt über Änderung des Verhaltens und Einbindung von Wissen. Des weiteren ist ein Problem Generator notwendig, damit kurzfristige Misserfolge, die aber zu einem langfristigen Erfolg führen, aufgrund des Lernziels trotzdem insgesamt als positiv bewertet werden können. Demnach ist auch eine Rückmeldung zusammenfassend für einen längeren Zeit-raum unabdingbar.

Je nach Problemstellung gibt es verschiedene Möglichkeiten, zu einer Lösung zu ge-langen, die eine Handlungsreihenfolge von Aktionen darstellt. Eine Variante ist die Su-che nach einer optimalen Lösung durch sequentielles Ausprobieren aller Möglichkeiten in einer so genannten Ausführungsphase. Dies führt offensichtlich zum Ziel, jedoch ist der Untersuchungszeitbedarf nicht optimal.

Eine Einschränkung kann man in der Herangehensweise machen, indem zuerst Teil-probleme in Angriff genommen werden, die zu einer optimalen Lösung führen, und dann darauf aufbauend weiter arbeitet. Dazu muss allerdings auch die Problemstellung geeig-net sein.

Bekannte Probleme, die mit einem solchen Verfahren bearbeitet werden können, sind:

2.5 Problemlösungsstrategien

• Schiebe-Puzzle (nx·ny-Feld mit nx·ny−1 durchnummerierten Steinen, die in einer beliebigen Anfangskonfiguration sortiert werden sollen, wobei nur ein dem freien Feld benachbarter Stein auf dieses freie Feld verschoben werden darf);

• 8-Damen-Problem (auf einem Schachbrett sind 8 Damen derart zu platzieren, so dass diese sich nicht schlagen können, d. h. keine andere Damenfigur in einer waa-gerechten, senkrechten oder diagonalen steht);

• Traveling Salesman Problem (ein Handlungsreisender soll bestimmte Städte auf möglichst kurzem Wege besuchen);

• VLSI-Design (Platzierung von Bauelementen auf einem Chip und Verlegung von Verbindungsleitungen, wobei einige Eigenschaften zu berücksichtigen sind, z. B.

kurze Laufzeiten und minimal entstehende Kapazitäten);

• Internet-Suche durch so genannte Roboter für Suchmaschinen;

• Roboter- oder Automobilnavigation.

Es wird deutlich, dass eine gute Suchstrategie erforderlich ist, um schnell zu einem Erfolg zu kommen, insbesondere bei Realzeitproblemen. Die einzelnen möglichen Lö-sungsschritte können in einer Baumstruktur dargestellt werden. Mit den bekannten Ver-fahren lässt sich dann dieser Baum abschreiten, um zu einer Lösung zu gelangen. Die Komplexität für Zeit und Platzbedarf variieren je nach Verfahren, die Vor- und Nachteile und damit die Wahl des Suchverfahrens hängen von den Parametern des Problems ab.

2.5.6 Zufallszahlenvorhersage für Roulette

Bei Roulette gibt es verschiedene Möglichkeiten, zu einem Gewinn zu gelangen. Dieses Glücksspiel ermöglicht, konkrete Zahlen wie bei einer Lotterie vorherzusagen, als auch bestimmte Bereiche zu erraten, z. B. ob die gezogene Zahl gerade oder ungerade wird.

Die Ziehung dieser Zahl erfolgt mit einer Kugel, die in einem sich rotierenden Kessel in eines von 37 Fächern fällt. Diese Fächer sind alle gleich beschaffen, so dass keine der Zahlen von 0 bis 36 gegenüber einer anderen bevorzugt wird. Viele Roulette-Spieler wünschen eine verlässliche Vorhersage, um so zu einer Gewinnmaximierung zu gelan-gen.

Für die Ziehung einer Zahl selbst gibt es verschiedene Einflussfaktoren. In [Bas87]

sind unter anderem Kesselschieflagen, Ballistik der Kugel sowie schwankender Wurfwei-tenschwerpunkt aufgeführt und untersucht. Es lassen sich die verschiedenen Einflussfak-toren Drehgeschwindigkeit des Kessels und Einwurfpunkt der Kugel in Relation zum Kessel, aber auch die daraus resultierenden Laufweiten und Kollisionsparameter der Ku-gel optisch beobachten oder akustisch wahrnehmen. Aus den verschiedenen Messungen eines Wurfs ergeben sich somit verschiedene Eingangsparameter, die Einfluss in eine Vorhersage finden müssen.

Von daher ist es nahezu unmöglich, alle Faktoren zu bestimmen, um sie für eine – vielleicht dann einfache – Vorhersage zu verwenden. Ähnlich ist es auch bei einer Wettervorhersage, bei der zahlreiche Einflussfaktoren vorliegen. Je mehr Messungen be-rücksichtigt werden, um so präziser ist die Vorhersage. Bei der Wettervorhersage hat das vorher Gewesene jedoch Einfluss auf die Zukunft.

Bei Roulette startet jeder Wurf nicht nur durch Austausch von Kugel oder Croupier erneut ohne vorherige Einflussfaktoren. Es gibt Ausnahmen, z. B. durch immer gleichen

Einwurf der Kugel an gleicher Kesselposition mit konstanten Geschwindigkeiten. Mit Ausnahme dieser Sonderfälle ist eine gezielte Vorhersage mittels eines Automaten nicht möglich. Genauso gut könnte hier ein auf einer Rauschvorrichtung basierender Zufalls-zahlengenerator Verwendung finden. Hierzu sei [Bas87, Seite 241] zitiert:

„Jede Strategie im Roulette, ob sie mehr oder weniger spitzfindig ist, ob sie mehr oder weniger Geschicklichkeit erfordert, ob sie wissenschaftlich tatsächlich funktionieren könnte oder nicht, kann daher stets nur eine Spiel-anregung ohne Erfolgsgarantie sein.“

Ausgehend von in Spielbanken üblichen Roulette-Tischen mit homogener Wahr-scheinlichkeit für alle Zahlen stehen als alternative Methode verschiedene Spielstrategi-en zur Verfügung. Hierbei geht es wSpielstrategi-eniger um konkrete VorhersagSpielstrategi-en der GewinnzahlSpielstrategi-en, sondern um das Setzen mit variablen Einsatzhöhen, die lediglich durch Limits der Spiel-bank begrenzt sein können. Die Durchführung der Gewinnstrategien erfordert lediglich ausreichend Startkapital, Zeit und die Durchführungsrichtlinien. Details und der damit verbundene Ertrag ist dem Buch [Kok93] zu entnehmen; die dort beschrieben Resulta-te der Verfahren basieren auf CompuResulta-tersimulationen. Gemäß der Tabelle 26, [Kok93, Seite 112], ergeben sich für die unterschiedlichen Spielprogressionsarten lediglich unter-schiedliche Verlustraten, jedoch kein Gewinn. Von daher gibt es keine Aussicht, einen beliebigen Automaten als Ersatz für eine Durchführungsregel konstruieren zu können, um so eine erfolgreiche Gewinnstrategie zu erhalten.

Kapitel 3

Im Dokument Algorithmen und Hardwarearchitekturen zur optimierten Aufzählung von Automaten und deren Einsatz bei der Simulation künstlicher Kreaturen (Seite 39-45)