In den vorhergehenden Abschnitten dieses Kapitels 3 wurde die zielfunk-tionsbasierte possibilistische Fuzzy-Clusteranalyse betrachtet. Eine Erwei-terung der zielfunktionsbasierten Fuzzy-Clusteranalyse ist das
”Alternating Cluster Estimation“. Bei diesem Ansatz werden die Ausdr¨ucke zur Be-rechnung der Clusterprototypen bzw. der Zugeh¨origkeitsgrade
”gesch¨atzt“.
Sie m¨ussen keine notwendigen Kriterien zur Optimierung der Zielfunktion sein. Bei der possibilistischen Version des
”Alternating Cluster Estimation“
werden possibilistische Zugeh¨origkeitsgrade verwendet. Die Berechnung der Clusterprototypen erfolgt durch entsprechend motivierte Ausdr¨ucke. Eine formale Herleitung ist nicht erforderlich.
Bei dem in den vorhergehenden Abschnitten vorgestellten Ansatz wer-den iwer-dentische Cluster verhindert, indem bei der Zielfunktion die Abst¨ande zwischen den Clustern ber¨ucksichtigt werden. Bei einer Modellierung durch Pc
k=1,k6=i 1
ζd2(β~i,~βj) f¨uhrt dies bei dem Fuzzy-C-Means-Algorithmus f¨ur die Berechnung der Clusterzentren zu
~zi= Pn
j=1umi,j~xj−γζiPc k=1,k6=i
1 d4(~zk,~zi)~zk
Pn
j=1umi,j−γζiPc k=1,k6=i
1 d4(~zk,~zi)
.
Dieser Ausdruck kann so interpretiert werden, daß ein Teil der Anziehung durch die Daten durch die Abstoßung der Clusterzentren benachbarter Clu-ster aufgehoben wird. Dieser Ausdruck kann auch bei der possibilistischen
Abbildung 3.3: Clusteranalyse des Irisdatensatzes mit dem probabilisti-schen Fuzzy-C-Means-Algorithmus.
Attribute
”petal length“ und
”petal width“.
Abbildung 3.4: Clusteranalyse des Irisdatensatzes mit dem possibilisti-schen Fuzzy-C-Means-Algorithmus.
Attribute
”petal length“ und
”petal width“.
Abbildung 3.5: Clusteranalyse des Irisdatensatzes mit dem in diesem Abschnitt vorgestellten Ansatz ba-sierend auf der Zielfunktion (3.3).
γ = 0.00001, Attribute
”petal length“ und
”petal width“.
Abbildung 3.6: Clusteranalyse des Irisdatensatzes mit dem in diesem Abschnitt vorgestellten Ansatz ba-sierend auf der Zielfunktion (3.3).
γ= 0.0001, Attribute
”petal length“
und”petal width“.
Abbildung 3.7: Clusteranalyse des Irisdatensatzes mit dem in diesem Abschnitt vorgestellten Ansatz ba-sierend auf der Zielfunktion (3.3).
γ = 0.001, Attribute
”petal length“
und”petal width“.
Abbildung 3.8: Clusteranalyse des Irisdatensatzes mit dem in diesem Abschnitt vorgestellten Ansatz ba-sierend auf der Zielfunktion (3.3).
γ = 0.01, Attribute
”petal length“
und”petal width“.
Abbildung 3.9: Clusteranalyse des Irisdatensatzes mit dem in diesem Abschnitt vorgestellten Ansatz ba-sierend auf der Zielfunktion (3.3).
γ = 0.1, Attribute
”petal length“
und”petal width“.
Abbildung 3.10: Clusteranalyse des Irisdatensatzes mit dem in diesem Abschnitt vorgestellten Ansatz ba-sierend auf der Zielfunktion (3.3).
γ = 0.5, Attribute
”petal length“
und”petal width“.
Abbildung 3.11: Clusteranalyse des Irisdatensatzes mit dem in diesem Abschnitt vorgestellten Ansatz ba-sierend auf der Zielfunktion (3.4).
γ = 0.01, Attribute
”petal length“
und”petal width“.
Abbildung 3.12: Clusteranalyse des Irisdatensatzes mit dem in diesem Abschnitt vorgestellten Ansatz ba-sierend auf der Zielfunktion (3.4).
γ = 0.1, Attribute
”petal length“
und”petal width“.
Abbildung 3.13: Clusteranalyse des Irisdatensatzes mit dem in diesem Abschnitt vorgestellten Ansatz ba-sierend auf der Zielfunktion (3.4).
γ= 1, Attribute
”petal length“ und
”petal width“.
Abbildung 3.14: Clusteranalyse des Irisdatensatzes mit dem in diesem Abschnitt vorgestellten Ansatz ba-sierend auf der Zielfunktion (3.4).
γ= 4, Attribute
”petal length“ und
”petal width“.
Version des
”Alternating Cluster Estimation“ verwendet werden. Etwas an-schaulicher als die Abstoßung durch
”Aufhebung der Anziehung durch Da-ten“ bei diesem Ausdruck ist jedoch die Abstoßung durch Anziehung aus der entgegengesetzten Richtung. Diese Idee wird im folgenden n¨aher betrachtet.
Die Idee ist, die Abstoßung durch ein Clusterzentrum durch die Anzie-hung durch einen fiktiven Punkt zu ersetzen. Die Lage des Punktes erh¨alt man durch Spiegelung des abstoßenden Clusterzentrums~zk an dem Cluster-zentrum~zi, auf das die abstoßende Kraft wirkt. Um die St¨arke der Absto-ßung und die Richtung der abstoßenden Kraft getrennt zu modellieren, soll der fiktive Punkt von dem Clusterzentrum~zi einen Abstand von 1 haben.
Der fiktive Punkt wird berechnet durch
~zi−||~~zzk−~zi
k−~zi||
. Dieser Punkt wird mit dem Abstoßungsgrad bzw. Einflußgrad des Clustersβ~k auf den Cluster β~i gewichtet. Mit dieser Modellierung werden die Clusterzentren durch
~ zi=
Pn
j=1umi,j~xj+γiPc
k=1,k6=iu(i,kβ~i)
~
zi−||~~zzk−~zi
k−~zi||
Pn
j=1umi,j+γiPc
k=1,k6=iu(i,kβ~i)
berechnet.γigewichtet die Abstoßung durch die anderen Cluster zu der An-ziehung durch die dem Cluster zugeordneten Daten. Die Abstoßung durch die Cluster wird damit durch
γi c
X
k=1,k6=i
u(i,k~βi)
~
zi− ~zk−~zi
||~zk−~zi||
modelliert.
Der Abstoßungsgradu(i,kβ~i)des Clustersβ~kauf den Clusterβ~ikann analog zu den Betrachtungen der vorhergehenden Abschnitte z.B. als
u(i,kβ~i)= 1
ζd2(~zk, ~zi), (3.18) oder
u(i,k~βi)=e−ζd2(~zk,~zi) (3.19) definiert werden.3 Der Parameter γi ist in Abh¨angigkeit von der Modellie-rung des Einflußgrades u(i,k~βi) und ggf. der Summe der Zugeh¨origkeitsgrade der dem Cluster zugeordneten Daten zu w¨ahlen.
3Die Modellierung der Abstoßung durch 1
d2(~βi,~βj) in der Zielfunktion f¨uhrt bei der Berechnung der Zugeh¨origkeitsgrade zu einem Abstoßungsgrad von d4(~z1
k,~zi), vgl.3.6.
Die abstoßende Wirkung der Clusterzentren nimmt daher mit zunehmendem Abstand st¨arker ab.
F¨ur die Berechnung weiterer Parameter der Clusterprototypen bei an-deren Fuzzy-Clusteringverfahren, wie z.B. der Kovarianzmatrix bzw. Norm-matrix bei dem Gustafson–Kessel-Algorithmus, sind analoge ¨Uberlegungen hinsichtlich einer
”korrekten“ bzw.
”richtigen“ Berechnung der Parameter erforderlich.4 Die Kovarianzmatrix kann z.B. berechnet werden, indem sie in Richtung nah benachbarter Cluster gestaucht wird, so daß die Cluster sich weniger stark ¨uberlappen. Der Nachteil ist jedoch, daß hierdurch die Form der Cluster nicht mehr allein von den dem Cluster zugeordneten Da-ten abh¨angt. Bei dicht benachbarten Clustern hebt die Abstoßung durch die Cluster den Einfluß der Daten aus dem Gebiet dieses Clusters zumindest teilweise auf. In dem ¨uberlappenden Bereich der beiden Cluster kann dies als eine Partitionierung der Daten aufgefaßt werden.
Alternativ kann die Berechnung der Kovarianzmatrix auch ohne Ber¨ uck-sichtigung benachbarter Cluster erfolgen. Die Form der Cluster basiert nur auf den dem Cluster zugeordneten Daten. Hierdurch werden auch bei nah benachbarten Clustern die Cluster m¨oglichst pr¨azise beschrieben. Durch die Abstoßung benachbarter Clusterzentren wird dabei sichergestellt, daß die Cluster nicht identisch sind. Diese Vorgehensweise wird bei den Beispielen im folgenden Abschnitt verwendet.