• Keine Ergebnisse gefunden

3.4 Das Transientensystem

3.4.1 Aufbau des Transientensystems

3.4.1.1 Arbeitsweise und Eigenschaften der Bewegungsdetektoren

Entsprechend den zeitlichen Eigenschaften der Y-Ganglienzellen (s. Kap. 3.2) besteht die erste Stufe des Transientensystems aus der Detektion transienter Signalanteile in den Ein-gangsbildern, also lokaler zeitlicher Grauwert¨anderungen. Dies entspricht qualitativ der Bildung einer partiellen Zeitableitung an jedem Punkt der Eingangsbildfolge. Da jede Be-wegung von Bildteilen mit solchen zeitlichen ¨Anderungen verbunden ist, kann das Ergeb-nis dieser Transientendetektion zur Bewegungsanalyse herangezogen werden. Umgekehrt zeigt allerdings nicht jedes transiente Ereignis auch eine Bewegung an. Beispielsweise ist der eingeschaltete Blinker eines stehenden Autos eine st¨andige Quelle schneller Hellig-keits¨anderungen, ohne daß eine Bewegung stattfindet. F¨ur eine Bewegungsanalyse ist die Einbeziehung der r¨aumlichen Komponente zwingend erforderlich. Ein einfaches Modell f¨ur einen neuronalen Mechanismus, der eine Bewegungssch¨atzung auf der Grundlage raum-zeitlicher Integration leistet, wurde 1957 von Reichardtgegeben. Seine Arbeitsweise ist in Abb. 3.17 dargestellt.

Der Reichardt-Detektor nutzt die Tatsache aus, daß eine Kontrastkante, die sich ¨uber den Sichtbereich bewegt, nacheinander an in Bewegungsrichtung gegeneinander versetz-ten Punkversetz-ten eine gleichsinnige ¨Anderung der lokalen Helligkeit hervorruft. Der Quotient aus zeitlichem und r¨aumlichem Abstand kann dann zur Sch¨atzung der Geschwindigkeit herangezogen werden.

vReichardtest = ∆x

∆t (3.11)

Es ist klar, daß f¨ur derartige bilokale Detektoren die oben erw¨ahnte Einschr¨ankung gilt, daß zwar bewegte Kontrastkanten immer systematische transiente Ereignisse hervorrufen, die Beobachtung solcher Ereignisse jedoch keinen eindeutigen R¨uckschluß auf eine Bewe-gung im Bild erlaubt. Beispielsweise kann eine Kontrastkante an einem Ort verschwinden und nach der Zeit ∆tan einem um ∆xversetzten Ort eine andere, gleichartige Kante auf-tauchen. F¨ur den bilokal arbeitenden Bewegungsdetektor besteht keine M¨oglichkeit, diesen Vorgang von einer echten Bewegung zu unterscheiden. Diese Einschr¨ankung ist prinzipi-eller Natur und nur durch Einbeziehung weiterer Informationen (etwa von benachbarten Detektoren) aufzul¨osen. Bezeichnenderweise unterliegen auch menschliche Beobachter die-ser T¨auschung; auch ein Mensch hat ohne zu¨atzliche Information keine M¨oglichkeit, eine solche scheinbare Bewegung (apparent motion) von einer echten zu unterscheiden.

Das hier angesprochene Problem wird auch als Korrespondenzproblem bezeichnet, da es von der Unklarheit herr¨uhrt, welches Pixel in einem Kamerabild mit welchem ande-ren Pixel im folgenden Kamerabild korrespondiert. Die Pixel zweier aufeinanderfolgender Kamerabilder sind ununterscheidbar; es kann lediglich eine Sch¨atzung erfolgen.

Das Korrespondenzproblem an sich tritt bereits bei der eindimensionalen Bewegungs-sch¨atzung auf, d.h. wenn bei bekannter Bewegungsrichtung lediglich der Betrag der Ge-schwindigkeit zu sch¨atzen ist. Beim Versuch, mit lokal arbeitenden Detektoren Bewegung in zwei Dimensionen aus Bildfolgen zu extrahieren, st¨oßt man auf eine weitere Auspr¨agung des Korrespondenzproblems, die als Aperturproblem bekannt ist [Wallach, 1935]:

Be-t t1 t2 t t1 t2

x

1

x

2

u(x t)

1,

RF(x) RF(x)

u(x t)

2,

I(x,t )

1

t

v

+

-Output

D D

D x

M M

- +

Abbildung 3.17: : Arbeitsweise des Reichardt-Detektors. Eine als Helligkeitsprofil I(x) dargestellte Kon-trastkante, die sich mit der Geschwindigkeitv bewegt, ¨uberstreicht in der Zeit ∆tzwei Neurone mit dem aumlichen Abstand ∆x. Nach der Faltung mit dem RF der Neurone wird deren Ausgangsaktivit¨at mit einer Verz¨ogerung ∆ mit der Antwort des jeweils anderen Neurons multipliziert. Die beiden Verz¨ oge-rungsrichtungen entsprechen zwei entegegengesetzten Bewegungsrichtungen; die Ergebnisse der beiden Multiplikationen werden deshalb noch subtrahiert, um die Gesamtantwort des Detektors zu erhalten.

Die st¨arkste positive Anwort entsteht, wenn eine in positiverx-Richtung bewegte Kante genau die Zeit

∆t ben¨otigt, um beide Neurone zu ¨uberstreichen, also ∆ = ∆t ist. Je nach Ausdehnung der beteiligten RFs wird auch eine Antwort hervorgerufen, wenn dieses Kriterium nicht exakt erf¨ullt ist; diese ist dann allerdings schw¨acher. Im Endeffekt entsteht so ein Detektor mit einem kontinuierlichen Tuning f¨ur den Betrag der Geschwindigkeit inx-Richtung. (Nach: [Reichardt, 1957])

obachtet man eine sich bewegende gerade Kante durch eine runde Apertur, so ist die Bewegungsrichtung nicht eindeutig festzustellen; die wahrgenommene Bewegungsrichtung kann in um bis zu 90 nach oben oder unten von der tats¨achlichen Richtung abweichen (s. Abb. 3.18).

Das visuelle System des Menschen erzeugt hier allerdings immer eine eindeutige Dar-stellung: Die Bewegungsrichtung wird als rechtwinklig zur Kante wahrgenommen.

3.4.1.2 M¨oglichkeiten zur L¨osung des Korrespondenzproblems

Wie bereits angedeutet, l¨aßt sich das Korrespondenzproblem nicht im strengen Sinn l¨osen.

Allerdings kann die Wahrscheinlichkeit falscher Bewegungssch¨atzungen durch die Einbe-ziehung zus¨atzlicher Informationen stark reduziert werden. Dabei ist grunds¨atzlich zu unterscheiden, ob die zus¨atzliche Information lediglich aus den bisher diskutierten fr¨uhen visuellen Verarbeitungsstufen kommt, oder ob Objektwissen aus h¨oheren Stufen der Verar-beitung herangezogen werden kann. Letzere Strategie spielt bei der Bewegungssch¨atzung durch menschliche Beobachter mit Sicherheit eine große Rolle; f¨ur die vorliegende Arbeit kommt jedoch nur die Auswertung von Low-Level-Informationen in Frage. ¨Ahnlich wie bei der Implementation der Gestaltgesetze f¨ur das Zusammenbinden von Konturen werden dabei m¨oglichst wenige, grundlegende Annahmen ¨uber die zu detektierenden Objekte zu-grundegelegt und implementiert. Im Fall der Bewegungssch¨atzung ist dies in erster Linie die Tr¨agheitsannahme und dieAnnahme von der Objektkonstanz.

Die Tr¨agheitsannahme besagt, daß physikalische Objekte aufgrund ihrer Massentr¨agheit ihre Bewegungsrichtung und -geschwindigkeit nur selten abrupt ¨andern, sondern daß die-se ¨Anderungen i.a. stetig erfolgen. Voraussetzung f¨ur eine erfolgreiche Anwendung dieses Prinzips ist selbstverst¨andlich eine ausreichend schnelle, an die jeweilige dynamische Szene angepaßte, zeitliche Abtastung der Eingangsbilder.

Die Annahme von der Objektkonstanz ist die Grundlage f¨ur die gegenseitige

Zuord-t

2

t

1

Abbildung 3.18: Das Aperturproblem. Wird die Beobachtung einer bewegten Kante durch eine Apertur eingeschr¨ankt, so ist eine zweifelsfreie Zuordnung der Pixel durch eine ¨ubergeordnete Objektwahrnehmung nicht mehr m¨oglich. Ein menschlicher Beobachter sieht jedoch immer eine Bewegung senkrecht zur Kante.

(Aus: [Schott, 1999]).

nung (Korrespondenz) gleichartiger Pixel in aufeinanderfolgenden Eingangsbildern: Man geht davon aus, daß Objekteigenschaften (hier der Kantenkontrast) sich zwischen zwei Kamerabildern nur so wenig ¨andern, daß der Bewegungsdetektor die beiden aufeinan-derfolgenden Signale als gleichartig erkennt. Ist dies nicht gew¨ahrleistet (etwa wenn ein Auto aus einem hell beleuchteten Bildbereich in einen dunklen Schatten hineinf¨ahrt), so tritt das Korrespondenzproblem in einer wesentlich versch¨arften Form auf, weil dann eine Zuordnung der Pixel anhand ihrer Helligkeit bzw. ihres Helligkeitskontrastes nicht mehr m¨oglich ist.

Einen Ansatz zur Minimierung des Korrespondenzproblems, der kein Objektwissen verlangt, stellt die Erweiterung des bilokalen Reichardt-Detektors auf einen multilokalen Detektor mit gr¨oßerem r¨aumlichem und zeitlichem Integrationsbereich dar, wie sie z.B.

von Fenske et al. [1995] vorgeschlagen wurde. Da in diesem Modell mehrere Eing¨ange in einer faktischen UND-Verkn¨upfung ausgewertet werden, ist hier die Signifikanz einer Detektorantwort deutlich gr¨oßer als beim bilokalen Detektor. Ein Nachteil dieses Ansatzes liegt in der notwendigen Bereitstellung relativ langer Verz¨ogerungszeiten (Fenske et al.

vergleichen bis zu 7 Kameraframes, also 280 ms).

F¨ur diese Arbeit wurde das – vom Ansatz her vergleichbare – Modell von Schott [1999] ¨ubernommen. Hier werden mehrere, als bilokale Bewegungsdetektoren geschalte-te Marburger Modellneurone, ¨uber modulatorische Linking-Verbindungen miteinander gekoppelt. Rechtwinklig zur Vorzugsrichtung des Detektors erfolgt die Kopplung un-verz¨ogert; dadurch wird das Gestaltgesetz des gemeinsamen Schicksals unterst¨utzt. In der gesch¨atzten Bewegungsrichtung hingegen erh¨alt die Kopplung eine Verz¨ogerung τ, die genau der Zeit entspricht, die das Objekt bei der Vorzugsgeschwindigkeit des De-tektors br¨auchte, um die Distanz zum n¨achsten in Bewegungsrichtung liegenden Detektor zur¨uckzulegen (delayed linking). Durch diese Kopplung erh¨alt der folgende Detektor genau die Vorinformation (in Form einer Voraktivierung), die bei Zutreffen der Tr¨ agheitsannah-me mit der tats¨achlich zu erwartenden Aktivierung ¨ubereinstimmt. Er kann so schneller reagieren; außerdem k¨onnen durch Rauschen oder ungleichm¨aßige Beleuchtung verursach-te Schwankungen in der Aktivierung bis zu einem gewissen Grad ausgeglichen werden.

Die in Kap. 6 zur Kopplung von Kantendetektoren angestellten ¨Uberlegungen gelten hier sinngem¨aß.

Abb. 3.19 zeigt das Transientensystem im ¨Uberblick.

temporal transient

2

contour motion

5b

INPUT

intensity contrast

1 concentric 3

4

5a motion of

terminations bends and

OUTPUT

motion contrast

6

terminations contour bends and

contour orientation

Abbildung 3.19: Aufbau des Transientensystems. Die von den Y-Zellen der Vorverarbeitung detektier-ten lokalen Transiendetektier-ten werden von den Bewegungsdetektoren getrennt f¨ur den ON- und OFF-Pfad ausgewertet. Diese haben ein ¨uberlappendes Geschwindigkeitstuning in drei Aufl¨osungsstufen, so daß insgesamt ein breiter Geschwindigkeitsbereich abgedeckt werden kann. F¨ur jede der sechs Hauptrichtun-gen des pseudohexagonalen Gitters und jede Aufl¨osungsstufe ist eine vollst¨andige retinotope Karte von Bewegungsdetektoren vorhanden. Die so ermittelten Geschwindigkeitsfelder werden nochmals auf lokale Kontraste hin untersucht: Das Ergebnis ist in denGeschwindigkeitskontrast-Schichten repr¨asentiert. (Aus:

[Schott, 1999])