• Keine Ergebnisse gefunden

3 Die IBR-Sequenz

N/A
N/A
Protected

Academic year: 2022

Aktie "3 Die IBR-Sequenz"

Copied!
14
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Das erweiterte IBR-Modell

Roland Mühlenbernd 31. Oktober 2008

1 Formale Denition

In dem erweiterten IBR-Modell ist die formale Denition eines Nachrichten- spielsG=hT, M, A, V al, US, UR, Cx, P r, Costi mit den folgenden Mengen:

ˆ Zustände der Welt t∈T

ˆ Nachrichten m∈M

ˆ Aktionen a∈A

ˆ Kontexte c∈Cx

Weiterhin gibt es die folgenden Funktionen:

ˆ Bedeutungsfunktion der Nachrichten V al:M → P(T)

ˆ Wahrscheinlichkeitsverteilung über Zustände P r∈∆(T)

ˆ Kostenfunktion Cost:M →R

ˆ Nutzwertfunktionen US,R:Cx×M×A×T →R

Zusätzlich möchte ich, um die Modellbeschreibung im Folgenden einfach zu halten, kontextbezogene NutzwertfunktionenUS,Rc einführen1:

ˆ ∀c∈Cx:US,Rc (m, a, t) =US,R(c, m, a, t)

Weiterhin gilt für ein Spiel unseres Modell, dass die Auszahlung lediglich da- von abhängt, welche Aktionain welchem Zustandtgespielt wird. Der einzige Einuss der Nachricht auf eine Auszahlung ist iht Kostenwert, welcher nur Auswirkugen auf den Sender hat. Wenn also solche Auszahlungszuordnungen VS,R(t, a) gegeben sind, dann gilt folgendes:

1Hierzu möchte ich folgenden Hinweis geben: Die Erweiterung des Modells auf mehrere Kontexte dient in erster Linie der Vergleichsmöglichkeit mit Jägers Modell. Die einzel- nen IBR-Berechnungsschritte laufen parallel für jeden Kontext ab, d.h. im formalen Be- rechnungsprozess der Strategien spielt der Kontext keine Rolle, er untescheidet sich nur hinsichtlich der Zielmenge der Nutzwertfunktionen

(2)

ˆ USc(m, a, t) =VS(t, a)−Cost(m)

ˆ URc(m, a, t) =VR(t, a) 2

2 Berechnung der Strategien

Für das Spiel ist die Senderstrategie eine Funktion σ ∈ S = (∆(M))T und die Empfängerstrategie dementsprechend eine Funktion ρ ∈R = (∆(A))M. Jeder der Partizipenten berechnet seine Strategie über die Einschätzung der Gegnerstrategie und seiner Nutzwertfunktion, indem er versucht, sei- nen Nutzwert zu maximieren. Die Einschätzung des Senders ΠS = R, sie entspricht also exakt der Empfängerstrategie. Die Einschätzung des Empfän- gersΠRdagegen muss durch Bayesisches Update über die SenderstrategieS berechnet werden, all das wird im Folgenden erklärt.

2.1 Die Focal Meaning Assumption für den Sender

Zuerst widme ich mich der Frage, wie ein Sender sich verhalten soll, wenn seine Strategie keinen Einuss auf den Empfänger hat. Das ist der Fall, wenn der Sender zu der Einschätzung gekommen ist, dass sich der Empfänger, un- abhängig von der Nachricht, die er erhält, immer gleich verhält. Ausserdem ist das in den Spielen, in denen der Sender beginnt, im allerersten Zug der Fall. Im weiteren werde ich diese Einschätzung mit Focal Meaning Assumpti- on bezeichnen. Im Falle einer FMA sind für die Strategie, welche der Sender dann verfolgt, drei Varianten vorgesehen:

Für die erste Variante möchte ich eine Hilfsfunktion cred einführen, die für einen Zustand die Menge der Nachrichten zurückgibt, die in diesem Zu- stand wahr sind, die also folgendermaÿen deniert ist:

∀t∈T :cred(t) ={m∈M|t∈V al(m)}

Die Senderstrategie im Falle einer FMA nenne ichσ0. In meiner ersten Vari- ante werden alle im vermuteten Zustand wahren Nachrichten mit der gleichen Wahrscheinlichkeit verschickt, es gilt dann für alle t∈T undm∈M:

σ0(t, m) =

1

|cred(t)|, m∈cred(t)

0, sonst (1)

Für die zweite Variante möchte ich eine weitere Hilfsfunktion einführen, die für einen Zustand die Menge der Nachrichten zurückgibt, die in diesem Zu- stand wahr sind und zusätzlich die niedrigsten Kosten verursachen. Diese Funktioncac(credible and cheap) ist folgendermaÿen deniert:

∀t∈T :cac(t) ={m∈cred(t)|Cost(m)≤Cost(m0)∀m0 ∈cred(t)}

2Für die Auszahlung des Empfängers spielt die Nachricht keine Rolle.

(3)

Entsprechend zur ersten Variante werden nun alle im vermuteten Zustand wahren und kostengünstigsten Nachrichten mit gleicher Wahrscheinlichkeit verschickt, nun gilt also für allet∈T und m∈M:

σ0(t, m) = 1

|cac(t)|, m∈cac(t)

0, sonst (2)

In der dritten Variante werden wie bereits in Variante 1 alle für den gege- benen Zustand wahren Nachrichten verschickt, allerdings nicht mit gleicher Wahrscheinlichkeit, sondern mit einer Wahrscheinlichkeit, die antiproportio- nal zu den Kosten der Nachricht ist. Dies wird durch die folgende Denition realisiert. Hier gilt für alle t∈T undm∈M:

σ0(t, m) =

( 2−Cost(m)

Pm0∈cred(t)2−Cost(m0), m∈cred(t)

0, sonst (3)

2.2 Die beste Senderstrategie

Wenn nun aber der Sender die Strategie des Empfängers kennt und durch die Wahl seiner Nachricht einen Einuss auf seinen Nutzwert hat, so ist die beste Strategie natürlich die, mit der er diesen maximieren kann. Für jeden Zustand gibt es also eine Menge von Nachrichten, die unter Berücksichti- gung der Empfängerstrategie ρ(m, a) und der NutzwertfunktionUSc(m, a, t) im gegebenen Kontextc die erwartete Auszahlung des Senders maximieren.

Ich nenne diese Menge Mρt, die dann für alle t ∈ T und einer gegebenen Empfängerstrategieρ wie folgt deniert ist:

Mρt={m∈M|m∈arg max

m0∈M

X

a∈A

ρ(m0, a)×USc(m0, a, t)} (4) Die beste Strategie des Senders ist es, die Nachricht zu verschicken, die ihm den maximalen Nutzwert bringt. Bei mehreren solcher Nachrichten ver- schickt er jede Nachricht mit gleicher Wahrscheinlichkeit. Seine Strategie ist also für allet∈T und m∈M folgendermaÿen deniert:

σ(t, m) = ( 1

|Mρt|, m∈Mρt

0, sonst (5)

2.3 Die Angfangsstrategie der Empfängers

Mein erweitertes Modell soll auch die Möglichkeit enthalten, dass das Spiel mit dem Empfäger beginnt. Da dieser zu Beginn keine Informationen über mögliche Senderstrategien hat, muss es eine andere Möglichkeit geben, abzu- schätzen, welche Aktion die beste Antwort auf eine gegebene Nachricht ist.

Und das passiert folgendermaÿen: Der Empfänger betrachtet für eine gegebe- ne Nachrichtmalle wahren Zuständet∈V al(m)und entscheidet sich unter

(4)

Berücksichtigung von P r(t) für die Aktion, die ihm den gröÿten Nutzwert verspricht. Ich führe auch hier eine Hilfsfunktionguess(m) ein, die für einen gegebene Nachricht unter Berücksichtigung der oben genannten Punkte sol- che Aktionen zurückgibt. Sie ist so deniert:

∀m∈M :guess(m) ={a∈A|a∈argmax

a0∈A

X

t∈V al(m)

P r(t)×URc(m, a0, t)}

Sollte es mehrere solcher besten Aktionen geben, so spielt der Empfänger diese jeweils mit gleicher Wahrscheinlichkeit. Die Startstrategie ρ0 ist dann so deniert:

ρ0(m, a) =

1

|guess(m)|, a∈guess(m)

0, sonst (6)

2.4 Die Einschätzung des Empfängers

Wie wir gesehen haben, benötigt der Empfänger für seine Anfangsstrategie die InformationP r(t), also die Information, mit welcher Wahrscheinlichkeit er sich in Zustand t bendet. Wenn der Empfänger nun die Strategie des Senders kennt, muss er daraus ableiten können, mit welcher Wahrscheinlich- keit er sich im Zustand t bendet, nachdem er Nachricht m erhalten hat.

Dies geschieht über ein Bayesisches Update über die Funktion πR, die wie folgt deniert ist:

πR(m, t) = P r(t)×σ(t, m) P

t0∈TP r(t0)×σ(t0, m) (7) Hier kann es nun aber zu einem Problem kommen, wenn der Sender in seiner Strategie eine bestimmte Nachricht m in keinem Zustand verschickt, denn dann gilt∀t0 ∈T :σ(t0, m) = 0, wodurch der Nenner der Gleichung den Wert 0 annimmt. Dieser Fall muss also ausgeschlossen werden und der Empfänger kann für solche Nachrichten keine Abschätzung auf Basis der Gegnerstrategie machen.

2.5 Umgang mit unerwarteten Nachrichten

Eine Nachricht, die in der Senderstrategie, die der Empfänger vermutet, nicht vorgesehen ist, will ich im Folgenden als unerwartete Nachricht bezeichnen.

Die Einschätzung für unerwartete Nachrichten sollen nun über eine Funktion πX berechnet werden. Für diesen Fall habe ich vier Varianten vorgesehen. In der ersten Variante hält der Empfänger alle Nachrichten für absolut unwahr- scheinlich und hält für solche Nachrichten auch jeden Zustand für unwahr- scheinlich. In der zweiten Variante werden einfach alle Zuständet∈T gemäÿ

(5)

ihrer BasiswahrscheinlichkeitP r(t)angenommen, in der dritten Variante al- le wahren Zustände t∈ V al(m) gemäÿ P r(t). Und in der dritten Variante verwendet der Empfänger seine Einschätzung, die er einen Iterarionsschritt zuvor hatte 3 und die ich hier πRk−1 nenne. Hier also die vier Varianten für unerwartete Nachrichtem:

πx(m, t) = 0 (8)

πx(m, t) =P r(t) (9)

πx(m, t) =

( P r(t)

P

t∈V al(m)P r(t), t∈V al(m)

0, sonst (10)

πx(m, t) =πk−1R (m, t) (11) 2.6 Die beste Empfängerstrategie

Nun kann der Empfänger also für jede Nachricht eine Einschätzung über den Zustand machen, in dem er sich bendet. Ich lege fest, dass für den Fall einer unerwarteten Nachricht πR(m, t) = πx(m, t) gilt. So kann nun unter Berücksichtigung dieser Einschätzung πR(m, t) und der Nutzwertfunktion URc(m, a, t)die Menge aller Aktionen ermittelt werden, die für eine gegebene Nachricht die erwartete Auszahlung maximieren. Ich möchte diese Menge Amσ nennen, die für alle Nachrichten m ∈ M und einer Einschätzung πR, berechnet über die Senderstrategirσ, wie folgt deniert ist:

Amσ ={a∈A|a∈argmax

a0∈A

X

t∈T

πR(m, t)×URc(m, a0, t)} (12) Weiterhin möchte ich hier festlegen, dass im Folgenden die Menge der besten unerwarteten Nachrichten mit Amx bezeichnen wird. Da es für eine gegebe- ne Nachricht mehrere Aktionen geben kann, die eine maximale Auszahlung bringen, spielt der Empfänger all solche Akrionen mit gleicher Wahrschein- lichkeit. Die beste Empfängerstrategieρ(m, a)ist dann für alle m∈M und a∈A wie folgt deniert:

ρ(m, a) = 1

|Amσ|, a∈Amσ

0, sonst (13)

Die Strategie für unerwartete Nachrichten nenne ich entsprechendρx(m, a) und sie ist so deniert:

ρx(m, a) = 1

|Amx|, a∈Amx

0, sonst (14)

3darauf werde ich im folgenden Kapitel noch eingehen.

(6)

3 Die IBR-Sequenz

Ich will im Folgenden beschreiben, wie eine solche IBR-Sequenz einses Spiels abläuft. Vorweg müssen noch einige Notationen fesgelegt werden. In unserem Spiel wird schrittweise das Level erhöht, auf dem sich Sender und Empfänger benden. Die Level-Tiefe drückt die Tiefe von Argumentationsschritten aus, die die beiden Partizipenten durchlaufen haben. Zu Beginn sind beide Level- 0-Spieler, wobei sich das Level schrittweise und wechselseitig unter jeweiliger Berücksichtigung der aktuellen Strategie des Gegenspielers erhöht.

Die Wahrscheinlichkeitsverteilung von Strategien des Senders auf Levelk möchte ich mitSkbezeichnen, welche dann die Funktionσk(t, m)zurückgibt.

Die besten Strategien bei Nachricht t und Level k enthält die Menge Mρtk. Ebenso gibt es auch einen Level-k-Empfänger, der sich durch die Verteilung der Startegien Rk und der dazugehörigen Funktion ρk(m, a) auszeichnet.

Diese wird über seine Einschätzung πRk und seiner Menge bester Aktionen für eine bestimmte NachrichtAmσk berechnet.

Wie bereits erwähnt, soll mit dem Modell eine Sequenz realisierbar sein, die sowohl mit Sender wie auch mit Empfänger beginnen kann. Also werde ich beide Fälle seperat betrachten, obwohl sie sich prinzipiell nur in der Start-Strategie und in der Zuodnung des Bezugslevels 4 unterscheiden.

3.1 Der Sender beginnt

Der Sender spielt zu Beginn nach der FMA. Durch die Funktionσ0(t, m)wird die Sender-Strategie auf Level 0 berechnet, die wirS0nennen. Nun berechnet der Empfänger seine Einschätzung bezüglich der Strategie des Senders. Dies tut er über die Funktion πR0(m, t). Das Spiel muss allerdings so formuliert sein, dass es keinen sinnlosen Nachrichten gilt, also für die V al(m) = {}

ist. Das stellt sicher, dass beiS0 jede Nachricht geschickt wird, es also keine unerwarteten Nachrichten gibt, da für diese die vierte Variante auf Level 0 nicht funktioniert. Wir können also für alle Nachrichten eine Einschätzung berechnen, mit welcher sich nun für jede gegebene Nachrichtmdie Menge an besten AktionenAmσ0 berechnen lässt, anhand dieser nun die entsprechende Empfängerstrategieρ0(m, a)∈R0 ermittelt werden kann.

Nun ist im nächsten Schritt wieder der Sender an der Reihe. Er muss vorerst überprüfen, ob die Strategie des Empfängers überhaupt beeinuss- bar ist. Sie ist es nicht, falls der Empfänger für alle Nachrichten die gleiche Strategie spielt, also falls folgendes gilt: ∀mi, mj ∈ M : Amσki = Amσkj. Soll- te das der Fall sein, spielt der Sender die FMA-Strategie, es gilt dann also σ1(t, m) =σ0(t, m). Ist das nicht der Fall, berechnet der Sender anhand der Strategie des Empfängers für jeden Zustand t die besten Nachrichten über Mρt0 und darüber seine Strategieσ1(t, m)∈S1.

4Beginnt der Sender, bezieht er sich im levelk >0immer auf die Empfängerstrategie im Levelk1. Beginnt der Empfänger, gilt das genau andersherum.

(7)

Nun berechnet der Empfänger seine Strategie R1 wie schon bereits eine Runde zuvor. Jetzt ist es aber durchaus möglich, dass der Empfänger uner- wartete Nachrichten verarbeiten muss. Für solche Nachrichten spielt er eine der vier vorgeschlagenen Strategien für unerwartete Nachrichten. Die vier- te Variante ist jetzt möglich. In diesem Fall würde er für eine unerwartete Nachricht m die Einschätzung π1(m, t) = π0(m, t) annehmen. Formal gilt für eine IBR-Sequenz mit dem Sender als Starter für jedesk≥0:

σk(t, m) =

σ0(t, m), k= 0∨Amσk−1i =Amσk−1j ∀mi, mj ∈M

σk(t, m), ∀m∈Mρtk−1 (15)

ρk(m, a) =

ρx(m, a), ∀m:m∈M∧m /∈Mρtk−1∀t∈T ρk(m, a), ∀a∈Amσ

k

(16) In beiden Funktionen ist der erste Fall jeweils der Ausnahmefall. Das ist für die Senderstrategie das Auftreten einer FMA, für die Empfängerstrategie der Erhalten von unerwarteten Nachrichten. Im Normalfall , also der jeweils zweite Fall, reagiert der Sender auf die Level-k−1-Strategie des Empfängers (deshalb erfolgt die Berechnung über Mρtk−1), und der Empfänger auf die Level-k-Strategie des Senders (deshalb erfolgt hier die Berechnung überAmσk).

Wir werden sehen, dass sich dieser Bezug in Spielen, in denen der Empfänger beginnt, genau umdreht.

3.2 Der Empfänger beginnt

Nun beginnt der Empfänger nach der bereits eingeführten Anfangsstrate- gieρ0(m, a) (2.3). Nun folgt das gleiche Prozedere wie im vorangegangenen Abschnitt. Nun ist es allerdings so, dass der Sender auf Strategien des Emp- fängers gleichen Levels reagiert, während der Empfänger die Strategien des Senders ein Level tiefer betrachtet. Formal ändert sich also, dass sich für den Empfänger für k= 0 ein zusätzlicher Fall ergibt und dass sich die gegensei- tigen Bezugslevel verschieben. Ausserdem gilt die FMA nicht mehr für den Sender beik= 0. Also gilt dann für alle k≥0:

σk(t, m) =

σ0(t, m), Amσk−1i =Amσk−1j ∀mi, mj ∈M

σk(t, m) über Mρtk (17)

ρk(m, a) =

ρ0(m, a), k= 0

ρx(m, a), ∀m:m∈M∧m /∈Mρtk−1∀t∈T ρk(m, a), über Amσk−1

(18)

(8)

3.3 Verschiedene Kontexte

Für jeden Kontext läuft je eine IBR-Sequenz ab, jeweils Level-parallel. In- nerhalb einer IBR-Sequenz spielt also der Kontext keine Rolle. Mehrere Kontexte bedeutet also nichts anderes, als mehrere parallel ablaufende IBR- Sequenzen, die sich lediglich in der Zielmenge den Nutzwertfunktionen US und UR unterscheiden (die Werte der Auszahlung). Allerdings haben die Kontexte einen Einuss darauf, wann einen stabile Strategie erreicht wird.

4 Beispiele für Spielabläufe

4.1 Ein detailiertes Beispiel

Ich möchte den Zusammenhang der Parameter eines Spiels explizit anhand eines detailierten Beispieles verdeutlichen. Ausserdem soll die Berechnung der Strategien über die einzelnen Funktionen ersichtlich sein. Ich habe mit dem folgenden SpielG1 ein Beispiel ausgewählt, in dem Ausnahmefälle wie FMA und unerwartete Nachrichten involviert sind:

ˆ G1=hT, M, A, V al, US, UR, Cx, P r, Costi

ˆ T ={t1, t2, t3}

ˆ M ={f1, f2, f3}

ˆ A={a1, a2, a3}

ˆ Cx ={c1}

ˆ V al(f1) =V al(f2) =V al(f3) =T

ˆ P r(t1) = 0.6;P r(t2) = 0.3;P r(t3) = 0.1;

ˆ Cost(f1) = 0.5;Cost(f2) = 1.0;Cost(f3) = 1.5;

ˆ VS(t, a) =VR(t, a) =hh5,0,0i,h0,5,0i,h0,0,5ii

Weiterhin lege ich die folgenden Spielvarianten fest: Das Spiel beginnt mit dem Empfänger, unerwartete Nachrichten werden nach der Variante 1 ge- spielt, für diese wird also jeder Zustand mit Wahrscheinlichkeit 0 angenom- men, und schliesslich wird bei einer FMA die zweite Variante gespielt, es werden also nur die kostengünstigsten Nachrichten verschickt.

Die RundeR0:Nun beginnt das Spiel, und zwar mit dem EmpfängerR0. Das bedeutet, dass dieser die Anfangsstrategieρ0 spielt. Da jede Nachricht in allen Zuständen wahr ist, gilt ∀f ∈ M :V al(f) = T. Dies bedeutet für die Berechnung von guess(f), dass die Funktion V al(f) keine Rolle spielt.

Ausserdem ist die Summe des Auszahlung für jede Aktion über alle Zustände

(9)

gleich hoch, immer jeweils 5, so dass die Funktion P r(f) den entscheiden- den Einuss für die Berechnung der Anfangsstrategie des Empfängers hat.

Und da diese für t1 am höchsten ist, und in t1 die Aktion a1 die höchste Auszahlung liefert, spielt R0 bei jeder Nachricht Aktion a1. Somit erhalten wir:

ˆ ∀f ∈M :guess(f) ={a1}

ˆ ∀f ∈M :ρ0(f, a1) = 1, ρ0(f, a2) =ρ0(f, a3) = 0

Kurz gesagt: Der Empfänger spielt für jede Nachricht f ∈M die Aktion a1

mit voller Wahrscheinlichkeit.

Die Runde S0 : Nun sieht sich S0 direkt einer Situation entgegen, in der er die Strategie der Empfängers nicht beeinussen kann, da dieser für jede Nachricht die gleiche Aktion a1 spielt. Der Sender S0 wird also nun nach der FMA-Strategie spielen. Da in unserem Spiel jede Nachricht in allen Zuständen wahr ist, ist auch jeder Zustand für alle Nachrichten glaubhaft.

Es gilt also ∀t∈T :cred(t) =M. Da wir die FMA-Variante 2 spielen, wird S0 nun also nur die kostengünstigste(n) Nachricht(en) senden, und das ist die Nachrichtf1. Somit erhalten wir nun:

ˆ ∀t∈T :cac(t) ={f1}

ˆ ∀t∈T :σ0(t, f1) = 1, σ0(t, f2) =σ0(t, f3) = 0

Der SenderS0 spielt also in jedem Zustand die Nachrichtf1.

Die Runde R1 : Der Empfänger R1 weiÿ also nun, dass er in jedem Zustand die Nachrichtf1 erhält und spielt dann natürlich die Aktiona1, da diese ihm den maximalen Payo von 5 verspricht. Es gilt also:

ˆ Afσ10 ={a1}

ˆ ρ1(f1, a1) = 1, ρ1(f1, a2) =ρ1(f1, a3) = 0

Doch wie reagiert er auf die Nachrichten f2 und f3. Da beide nicht vom SenderS0 verschickt werden, fallen sie in die Kategorie unerwartete Nachri- chen. Für diese wurde die Strategie 1 vorgesehen, es werden also für solche Nachrichten alle Zustände mit der Wahrscheinlichkeit 0 eingeschätzt. Damit kann die Auszahlung die Entscheidung nicht beeinussen, der diese, egal wie hoch, immer jeweils mit einer Einschätzung von 0 multipliziert wird. Es gilt also:

ˆ ∀t∈T :πx(f2, t) =πx(f3, t) = 0

ˆ Afσ20 =Afσ30 ={a1, a2, a3}

ˆ ∀a6=a1 ∈A:ρ1(f2, a) =ρ1(f3, a) = 1/3

(10)

Zusammenfassend gesagt:R1spielt bei Nachrichtf1Aktiona1und bei Nach- richtf2 und f3 jede mögliche Aktion mit gleicher Wahrscheinlichkeit.

Die RundeS1 : Nun hatS1 zum ersten mal die Möglichkeit, die Strategie vonR1 zu beeinussen, da dieser nicht auf jede Nachrichr identisch reagiert.

Der Sender kann für den Zustandt1seine Auszahlung maximieren, wennR1

Aktiona1 spielt, und das tut er sicher nach erhalt der Nachrichtf1. Also ist es für S1 am protabelsten, in Zustand t1 die Nachricht f1 zu schicken:

ˆ Mρt11 ={f1}

ˆ σ1(t1, f1) = 1, σ1(t1, f2) =σ1(t1, f3) = 0

In den Zuständen t2 und t3 wäre es dagegen nicht sinnvoll, Nachricht f1

zu schicken, da man damit Aktiona1 auslöst und einen Payo von 0 erhält.

DochS1kann nun aber über Nachrichtf2oderf3das Verhalten vonR1nicht beeinussen, da dieser in beiden Fällen die gleiche Strategie spielt. Also ist es für S1 vorraussichtlich protabler, in beiden Fällen die kostengünstigere Nachrichtf2 zu schicken:

ˆ Mρt21 =Mρt31 ={f2}

ˆ σ1(t2, f2) =σ1(t3, f2) = 1,∀f 6=f2∈M :σ1(t2, f) =σ1(t3, f) = 0 So verhält sich nun also Sender S1: Er schickt in Zustand t1 Nachricht f1 und int2 undt3 die Nachrichtf2.

Ich möchte an dieser Stelle die detailierte Beschreibung des Beispielab- laufs beenden, da ich alle möglichen Fälle dargestellt habe, und den gesamten Spielablauf in verkürzter Schreibweise dartellen:

ˆ R0 =

f1/f2/f3 → a1

ˆ S0=

t1/t2/t3 → f1

ˆ R1 =

f1 → a1 f2/f3 → a1/a2/a3

ˆ S1=

t1 → f1

t2/t3 → f2

ˆ R2 =

f1 → a1 f2 → a2

f3 → a1/a2/a3

ˆ S2=

t1 → f1 t2 → f2 t3 → f3

(11)

ˆ R3 =

f1 → a1 f2 → a2 f3 → a3

Warum ist das Spiel bei R3 beendet? Der Grund ist, dass nun eine stabi- le Strategie erreicht wurde. Das bedeutet, dass Strategie S3 identisch zur Strategie S2 sein wird und sich demzufolge alle folgenden Strategien von Sender und Empfänger nicht mehr verändern werden, die Strategien haben also einen stabilen Zustand erreicht.

Allgemein gesagt ist ein Spiel dann beendet, wenn sich eine Strategie ir- gendwann im Spielverlauf wiederholt. Wenn diese Wiederholung wie im ge- zeigten Besipiel direkt in aufeinanderfolgenden Leveln erfolgt, ist eine stabile Strategie erreicht. Liegen diese Wiedeholungen allerdings weiter auseinander, gibt es eine Schleife von wiederholenden Abfolgen und es kann nie eine sta- bile Strategie erreicht werden. Solch ein Beispiel werden wir auch noch im diesem Kapitel sehen.

Da wir in unserem Beispiel lediglich einen Kontext hatten, spielte dieser keine Rolle und wurde bei der verkürzten Schreibweise ignoriert. Ich werde aber im folgenden Kapitel noch Beispiele mit mehreren Kontexten vorstellen.

Bevor ich weitere Beispiele vorstelle, möchte ich kurz auf den Einuss der verschiedenen Spielvarianten für die Wahl des Startspielers, für die FMA- Strategie und für den Umgang mit unerwarteten Nachrichten eingehen. In unserem Spiel G1 würde sich am Spielverlauf im Grunde nichts verändern, sollte man mit dem Sender als Startspieler beginnen, denn dieser spielt ja dann die FMA, die S0 ja auch in der gezeigten Variante spielt. Allerdings ändern die beiden anderen Parametereinstellungen den Spielverlauf. Spielen wir statt der FMA-Variante 2 die Variante 1 oder 3, ergibt sich der folgende Spielverlauf:

ˆ R0 =

f1/f2/f3 → a1

ˆ S0=

w1/w2/w3 → f1/f2/f3

Und hier endet auch schon das Spiel, daR1die gleiche Strategie wieR0spielt.

Der entscheidende Unterschied ist, dass S0 nur durch die FMA-Variante 2 dazu gezwungen ist, die kostengünstigste Nachrichtf1 zu schicken.

Nun, wie sieht es aus, wenn wir eine andere Variante für unerwartete Nachrichten spielen? Wenn wir statt der ersten Variante eine der anderen spielen, ergibt sich der folgende Spielverlauf:

ˆ R0 =

f1/f2/f3 → a1

ˆ S0=

w1/w2/w3 → f1

Und auch hier ist das Spiel schon beendet, denn R1 entspricht wieder R0. Das hat folgenden Grund: In Variante 2 und 3 wird die Vorwahrscheinlichkeit

(12)

P r(t) mit in die Rechnung einbezogen, die für Zustandw1 am höchsten ist und für diesen zustand ist a1 maximal. So wird R1 natürlich für f2 und f3

Aktion a1 spielen, für f1 spielt er das sowieso. Also spielt er wieder genau Strategie R0. Nach Variante 4 verhält sich der Empfänger bei unerwarteten Nachrichten gemäÿ seiner Strategie im Vorlevel, also gemäÿR0.

Wie man hier shön sehen kann, treten gewisse pragmatische Phänomene, die gezeigt werden wollten, nur bei bestimmter Wahl dieser Varianten auf.

Doch kommen wir nun zu weiteren Beispielen.

4.2 Ein Beispiel mit Schleife

Als erstes möchte ich ein Beispiel für ein SpielG2 vorstellen, das eine Schleife erzeugt. In diesem Beispiel sind die Preferenzen beider Spieler genau entge- gengerichtet. Dies sind die Parameter:

ˆ G2=hT, M, A, V al, US, UR, Cx, P r, Costi

ˆ T ={t1, t2}

ˆ M ={m1, m2, m12}

ˆ A={a1, a2, a3}

ˆ Cx ={c1}

ˆ V al(m1) ={t1};V al(m2) ={t2};V al(m12) =T

ˆ ∀t∈T :P r(t) = 1/3;

ˆ ∀m∈M :Cost(m) = 0.0

ˆ VS(t, a) =hh1,−1i,h−1,1ii;VR(t, a) =hh−1,1i,h1,−1ii

Das Spiel soll wieder mir dem Empfänger beginnen. Welche FMA-Variante für dieses Spiel gewählt wird, spielt keine Rolle, da sich alle drei Varianten exakt gleich verhalten, wenn alle Kosten 0 sind. Auch spielt hier keine Rolle, welche Variante im Umgang mit unerwarteten Nachrichten gespielt wird, da sich auch hier bei allen Varianten ein gleicher Spielverlauf entwickelt. Einen gewissen Einuss daran hat die Tatsache, dass alle Vorwahrscheinlichkeiten P r(t)für alle Zustände tgleich sind. Unabhängig dieser einstellbaren Para- meter erhalten wir für das SpielG2 den folgenden Spielverlauf:

ˆ R0 =

m1 → a2 m2 → a1

m12 → a1/a2

ˆ S0=

t1 → m2 t2 → m1

(13)

ˆ R1 =

m1 → a1 m2 → a2 m12 → a1/a2

ˆ S1=

t1 → m1 t2 → m2

ˆ R2 =R0

Die Strategie des EmpfängersR2 entspricht der vonR0, d.h. ab hier wieder- holt sich der gesamte Spielverlauf. Die Schleife wiederholt sich immer wieder, es kommt also zu keiner stabilen Strategie.

4.3 Ein Beispiel mit mehreren Kontexten

Das folgende Spiel G3 enthält drei Kontexte. Die einzelnen Auszahlungszu- ordnungenVSundVRwerden für die einzelnen Kontexte expliztit angegeben.

ˆ G3=hT, M, A, V al, US, UR, Cx, P r, Costi

ˆ T ={t1, t2}

ˆ M ={m1, m2, m12}

ˆ A={a1, a2, a3}

ˆ Cx ={c1, c2, c3}

ˆ V al(m1) ={t1};V al(m2) ={t2};V al(m12) =T

ˆ P r(t1) = 0.75;P r(t2) = 0.25

ˆ Cost(m1) =Cost(m2) = 5.0;Cost(m12) = 0.0

ˆ VS(c1, t, a) =VR(c1, t, a) =hh28,0,22i,h0,28,22ii

ˆ VS(c2, t, a) =VR(c2, t, a) =hh28,0,25i,h0,28,25ii

ˆ VS(c3, t, a) =VR(c3, t, a) =hh28,0,10i,h0,28,10ii

Es wird die zweite FMA-Variante gespielt, also es werden lediglich die kosten- gündtigsten Nachrichten verschickt. Für unerwartete Nachrichten wird eben- falls die zweite Variante gespielt, d.h. die Einschätzung des Zustandes erfolgt gemäÿ seiner GrundwahrscheinlichkeitP r(t). Wieder beginnt das Spiel mit dem Empfänger.

Wie bereits in vorigen Kapiteln erwähnt, entwickeln sich für die verschie- denen Kontexte verschiedene Berechnungsabläufe, die parallel und unabhän- gig voneinander ablaufen. Somit ergeben sich verschiedene Spielverläufe, die getrennt voneinander ablaufen und die man demzufolge seperat darstellen kann. Dies sind die verschiedenen Spielverläufe für die Kontexte c1,c2 und c3:

(14)

ˆ R0 =

(c1, m1) → a1 (c1, m2) → a2 (c1, m12) → a3

(c2, m1) → a1 (c2, m2) → a2 (c2, m12) → a3

(c3, m1) → a1 (c3, m2) → a2 (c3, m12) → a1

ˆ S0=

(c1, w1) → m1

(c1, w2) → m2

(c2, w1) → m12

(c2, w2) → m12

(c3, w1) → m12

(c3, w2) → m2

ˆ R1 =R0

Für alle drei Kontexte ist bereits beiR0 eine stabile Strategie erreicht. Somit erreicht das gesamte Spiel an R0 eine stabile Strategie. Zusammengefasst erhalten wir den folgenden Spielverlauf:

ˆ R0 =

(c1, m1)/(c2, m1)/(c3, m1)/(c3, m12) → a1 (c1, m2)/(c2, m2)/(c3, m2) → a2

(c1, m12)/(c2, m12) → a3

ˆ S0=

(c3, w1) → m1

(c1, w2)/(c3, w2) → m2

(c2, w1)/(c2, w2)/(c3, w1) → m12

ˆ R1 =R0

Der Einuss der verschiedener Kontexte auf das Gesamtspiel ist die Bestim- mung einer stabilen Strategie bzw. einer Schleife. Wenn ein Spiel zum Beispiel für Kontext c1 eine stabile Strategie erreicht hat, dies aber noch nicht für einen weiteren Kontext gilt, so wird das Spiel weiter laufen. Und zwar so lange, bis ein Level erreicht wird, welches für alle Kontexten identisch zu einem früheren Level ist.

Referenzen

ÄHNLICHE DOKUMENTE

(Windmühle) Manche Werke der impuristischen Literatur sind nur teilweise oder gar nicht mit der herkömmlichen Methode der Interpretation zu erklären und zu verstehen, wohl aber

Die Gefechtskraft der Infanterie wird jedoch durch die Verminderung um 20,000 Gewehre trotz Einführung des leichten Maschinengewehres und dadurch bedingte Erhöhung der

Bereits Jahre bevor die Ludologie den Begriff der Simulation als das zentrale Konzept für das wissenschaftliche Verständnis des Computerspiels definierte, erklärte der Philosoph

Frage „Wie denkt der andere wirklich über mich?" können wir nicht mehr selber beantworten4. Dazu brauchen wir einen Partner und die Antwort

Diese Variante kann man des Weiteren auch sehr schön wieder als Wettkampfspiel bespielen.. Bei dieser Spielvariante nutzt man wieder

Der Fantasie für weitere Anweisungen sind kaum Grenzen gesetzt. Spielvariante 1: Es sind Gegenstände an bestimmte Plätze

Vater oder Mutter geben dem Kind folgende Anweisungen oder stellen folgende Fragen:?. - Streichele mich unter meinem

[r]