• Keine Ergebnisse gefunden

Wahrscheinlichkeit einer Partitionierung z gegeben F

6.1 Idee und Überblick

6.2.3 Wahrscheinlichkeit einer Partitionierung z gegeben F

Die verbleibende Frage ist nun, mit welchem jeweiligen Gewicht die eben abgeleiteten, einzelnen bedingten Zielinferenzen zur Gesamtinferenz aggregiert werden (siehe dazu Gleichung 25 auf Seite 122). Dazu muss für jede mögliche Partitionierung die A-posteriori-Wahrscheinlichkeit gegeben der beobachteten Merkmale bestimmt werden. Dies erfolgt im ersten Schritt einfach durch An-wendung der Bayes-Formel:

(27) Die Wahrscheinlichkeit einer Partitionierung z gegeben der Merkmale F ist demnach proportional zum Likelihood der Merkmale gegeben der Partitionie-rung gewichtet mit deren A-priori-Wahrscheinlichkeit.

Die A-priori-Wahrscheinlichkeit lässt sich dabei als Chinese-Restaurant-Prozess (CRP) beschreiben (siehe Pitman, 2002; Kemp et al., 2007).

Ein CRP ordnet jeder Partitionierung z von n Objekten eine Wahrscheinlichkeit dahingehend zu52, dass Partitionierungen, die nur wenige, große Cluster enthal-ten, deutlich wahrscheinlicher sind, als Partitionierungen, die aus vielen kleinen Clustern bestehen. Dies soll eine A-priori-Tendenz ausdrücken, die Objekte in der Umwelt möglichst sparsam, also in wenigen Kategorien zu organisieren.

Für die Partitionierungen der Effekte in Abbildung 36 (siehe auch Abbildung 37) gilt damit folgende A-priori-Tendenz – also sofern die Merkmale ignoriert

werden: . Das heißt, ohne Beachtung der

Merkmale ist die Partitionierung, die nur einen großen Cluster enthält, aufgrund des CRP-Priors viel wahrscheinlicher, als die Partitionierung, die fünf kleine Clus-ter enthält. Die Partitionierungen in den Teilabbildungen (b) und (c) sind a priori gleich wahrscheinlich, da sie je zwei Cluster gleicher Größe enthalten.

Abbildung 37. Die vier in Abbildung 36 dargestellten Beispiele für mögliche Parti-tionierungen von fünf Effekten ergänzt mit einer binären Eigenschaft (gelb vs.

grün) zur Illustration des Einflusses von Eigenschaftsausprägungen auf die Wahr-scheinlichkeit einer bestimmten Partitionierung. Die Effekte E1 und E2 sind grün, die Effekte E3, E4 und E5 gelb.

Das Likelihood einer Merkmalskonfiguration F gegeben einer bestimmten Partitionierung z lässt sich unter der vereinfachten Annahme nur eines binären Merkmals (mit den Ausprägungen A und B) leicht als Beta-Binomial-Modell be-schreiben, in welchem jedem Cluster zj eine Wahrscheinlichkeit zugeordnet wird, mit der dieser Cluster die Merkmalsausprägung A hervorbringt (also z.B.

52 Es gibt auch CRP-Varianten, die freie Parameter haben. Diese wurden derzeit in den in der Literatur bereits verwendeten Modellen jedoch nicht eingesetzt; daher soll auch hier aus Grün-den der Einfachheit darauf verzichtet werGrün-den. Der CRP ist verwandt zur Ewens-Verteilung, die u.a. in der Biodiversitäts-Forschung eingesetzt wird.

gelb zu sein). Entsprechend beschreibt die Gegenwahrscheinlichkeit die Wahrscheinlichkeit, mit der der Cluster die Merkmalsausprägung B, also z.B. grün zu sein, hervorbringt. Da die Wahrscheinlichkeit unbekannt ist, definieren wir für diese eine A-priori-Verteilung, und zwar unter der Annahme, dass Cluster von den Merkmalsausprägungen her homogen sind, also entweder nahe 0 oder nahe 1 liegt (hierfür bietet sich eine Beta-Verteilung mit sehr kleinen Parametern an)53. Seien nun die Merkmalsausprägungen der Effekte, die dem Cluster zj

zugeordnet sind. Dann ergibt sich unter der Annahme, dass die Cluster hinsicht-lich der Merkmale unabhängig voneinander sind und sich damit das Gesamtlikelihood als Produkt der Likelihoods über die Cluster darstellt:

(28) mit

(29) als Binomial-Modell und

(30) als Beta-Prior.

Innerhalb eines Clusters zj bestimmt sich damit das Likelihood des beo-bachteten Merkmals entsprechend der Binomial-Verteilung: Ist – wie oben be-schrieben – die Wahrscheinlichkeit der Merkmalsausprägung A gleich und entsprechend die Wahrscheinlichkeit der Merkmalsausprägung B gleich , dann ist das Likelihood genau [ ]-mal die Ausprägung A und [ ]-mal die Ausprägung B zu beobachten, proportional zu Gleichung 29.

Betrachtet man diesbezüglich nun Abbildung 37, dann sieht man, dass die in den Teilabbildungen (c) und (d) dargestellten Partitionierungen im Hinblick auf das betrachtete Merkmal der Effekte eine sehr hohe Wahrscheinlichkeit haben, da alle enthaltenen Cluster perfekt homogen sind, d.h. die zu wählenden θs

53 Zum Beispiel eine -Verteilung, die umgekehrt u-förmig ist und viel Wahrscheinlich-keitsgewicht nahe 0 und nahe 1 hat.

weder 0 oder 1 sind. Die in den Teilabbildungen (a) und (b) dargestellten Parti-tionierungen haben jedoch ein deutlich geringeres Likelihood, da die Cluster nicht bzw. zum Teil nicht homogen sind.

Nimmt man nun die A-Priori-Wahrscheinlichkeit einer Partitionierung und deren Likelihood zusammen, sieht man z.B. für die in Abbildung 37c dargestellte Partitionierung, dass diese wahrscheinlich das höchste Gewicht erhalten wird.

Zwar haben Partitionierung (c) und (d) das gleiche Likelihood, (c) ist aber a priori viel wahrscheinlicher. Genauso sind (b) und (c) a priori gleich wahrscheinlich, (c) hat aber das höhere Likelihood.

6.2.4 Modellvorhersagen

Die Modellvorhersage selbst ergibt sich wie in Abschnitt 6.2.1 beschrieben als gewichteter Mittelwert aller Zielinferenzen über alle möglichen Partitionierun-gen. Welche Vorhersage ergibt sich nun für die Wahrscheinlichkeit der Anwe-senheit des Zieleffekts gegeben des Status der Ursache, des Status der weiteren Effekte und deren Features? Betrachten wir hierfür eine Common-Cause-Struktur mit fünf Effekten, die je eine binäre Eigenschaft haben, wie sie in Abbildung 36 und Abbildung 37 dargestellt ist. In einer solchen Struktur kann nun nach den Herleitungen in den vorangehenden Abschnitten qualitativ erwartet werden, das die Inferenz über die Anwesenheit eines unbeobachteten Zieleffekts, z.B. E5, um-so stärker vom Status eines anderen Effekts abhängig ist, je ähnlicher dieser dem Zieleffekt ist. Eine Einschätzung bezüglich der Anwesenheit des Effekts E5 sollte mithin also – entsprechende Annahmen über die zugrundeliegenden Kausalpro-zesse vorausgesetzt – stark vom Status der Effekte E3 und E4, aber weniger stark – weil eine andere Merkmalsausprägung aufweisend – von den Effekten E1 und E2 abhängig sein.

Für eine konkrete Vorhersage müssen wieder Annahmen über die zugrun-deliegenden Parameter getroffen werden. Für die kausalen Zielinferenzen, wie sie für eine beliebig gegebene Partitionierung z in Abschnitt 6.2.2 abgeleitet wurden, können einfach die Parameterverteilungen verwendet werden, wie sie bereits für die Vorhersagen des Basismodells in Abschnitt 4.3 genutzt wurden.

Dabei soll sich im Folgenden allerdings auf die Entsprechung zur „Sending“-Bedingung beschränkt werden, also ein Fall mit einer bzw. bei mehreren Clustern

entsprechend mit mehreren starken gemeinsamen Fehlerquellen [ ]. Dies erscheint deshalb sinnvoll, weil eine starke Abhängig-keit vom Status ähnlicher Effekte ja voraussetzt, dass die Annahmen über die zugrunde liegenden Kausalprozesse eine solche starke Abhängigkeit implizieren, wie dies in der „Sending“-Bedingung der Fall war, denn nur dann kann auch eine substantielle Abnahme dieser Abhängigkeit mit steigender Unähnlichkeit der Effekte erwartet werden.

Für die A-priori-Verteilung der möglichen Partitionierungen kommt wie oben beschrieben ein Chinese-Restaurant-Prozess zum Einsatz (Tendenz zu we-nigen großen Clustern); die cluster-spezifischen Merkmalswahrscheinlichkeiten

werden aus einer gezogen (Tendenz zu homogenen Clus-tern bezüglich der Verteilung des Features).

In Abbildung 38 ist die Vorhersage des Modells dargestellt, wie sie aus ei-ner Monte-Carlo-Simulation mit 100 000 Durchgängen gewonnen wurde. Zur besseren Darstellung sind die Vorhersagen über die Zustände der Effekte der jeweils anderen Kategorie gemittelt abgetragen. (Die ungemittelten Vorhersagen finden sich in Anhang L.)

Die gestrichelte, gelbe Linie stellt dabei die Zielinferenz über den Zieleffekt in Abhängigkeit von der Anzahl der als anwesend beobachteten Effekte mit der gleichen Farbe dar (der Zieleffekt sei einmal ebenfalls gelb). Man sieht, dass die Wahrscheinlichkeit deutlich mit steigender Anzahl ansteigt, wenn die gemeinsa-me Ursache C anwesend ist. Die durchgezogene, grüne Linie zeigt die Abhängig-keit der Zielinferenz von der Anzahl der als anwesend beobachteten Effekte der anderen Kategorie (grün). Deutlich zu erkennen ist – wie bereits qualitativ vor-hergesagt – eine merklich geringere Abhängigkeit.

Abbildung 38. Modellvorhersage auf der Basis einer Monte-Carlo-Simulation mit 100 000 Durchgängen in einem Common-Cause-Modell mit einer Ursache C und fünf Effekten. Die Parameter des kausalen Systems wurden hierfür aus den glei-chen Verteilungen gezogen, die für die „Sending“-Bedingung im Basismodell Verwendung fanden. Der Parameter für die cluster-spezifischen Merkmalswahr-scheinlichkeiten wurde aus einer -Verteilung gezogen. Die A-priori-Wahrscheinlichkeiten der möglichen Partitionen entstammen einem Chi-nese-Restaurant-Prozess (CRP).