• Keine Ergebnisse gefunden

Die Node Structure Theory

Im Dokument Das "Tip of the Tongue"-Phänomen (Seite 111-117)

3.1 Mögliche Ursachen von TOTS

3.1.3 Die Node Structure Theory

Bei dem Modell von Burke et al.73 handelt es sich um ein sogenanntes interactive activation model 74, welches dem bekannten Sprachproduktionsmodell von Dell75,

73 Burke, D. & MacKay, D. & Worthley, J. & Wade, E. (1991). On the Tip of the Tongue: What Causes Word Finding Failures in Young and Older Adults? Journal of Memory and Cognition 30.

Seiten 543-579.

74 Eine formal präzise ausgearbeitete Version eines interactive activation models findet sich bei:

Rumelhart, D.E. & McClelland, J.L. (1986). Parallel Distributed Processing Volume 1.

Dieses mehrbändige Werk nimmt eine herausragende Stellung unter den zahlreichen Büchern über konnektionistische Modelle ein, da ein lauffähiges Programm (inklusive des gesamten C-Source-Codes) und ein Übungsbuch mitgeliefert wird, so daß es möglich ist, jeden Schritt des Modells exakt nachzuvollziehen. Dies ist bei keinem anderen Beitrag zu solchen Aktivierungsmodellen der Fall, weshalb es häufig nahezu unmöglich ist, allein aufgrund der allgemeinen Beschreibungen in den jeweiligen Aufsätzen herauszufinden, was die Modelle im einzelnen vorhersagen und inwieweit sie konsistent ausgearbeitet sind.

75 Siehe z.B. Dell, G.S. (1986). Oder auch: Dell, G.S. (1988). The retrieval of phonological forms in

das die Diskussion um die Entstehung von Versprechern stark beeinflußt hat, in seinen wesentlichen Punkten ähnelt, jedoch auch einige Besonderheiten aufweist.

Das Modell beruht auf der Node-Structure-Theory (kurz NST), die eine spezielle Ausprägung eines interactive activation models darstellt und ursprünglich von MacKay76 als allgemeine Theorie kognitiver Fähigkeiten entwickelt wurde. Die grundlegende Idee der NST besteht darin, daß es eine große Anzahl von Prozessierungseinheiten gibt, welche auch Knoten genannt werden. Diese Knoten sind untereinander auf bestimmte Art und Weise verbunden, so daß ein Netzwerk aus Knoten und Verbindungen mit einer spezifischen Topologie (auch Netz-Architektur genannt) entsteht. Die verschiedenen Topologien unterscheiden sich u.a. in der Anzahl der Knoten, der Konnektivität, d.h. der Anzahl der Verbindungen zwischen den Knoten, sowie in der Funktionalität der Knoten und Verbindungen und vor allem in der Anordnung der Elemente, da über die Anordnung der Elemente untereinander die Funktionalität des Gesamtnetzwerkes gesteuert werden kann. Im Falle der NST liegt eine hierarchische Gliederung des Netzwerkes vor, bei der die Verbindungen symmetrisch aufgebaut sind, d.h. der Aktivierungsfluß in beide Richtungen laufen kann. Die Aktivierungen können dynamisch verändert werden, indem jeder Verbindung ein variabler, numerischer Wert zugewiesen wird. Bei den Verbindungen in interactive activation models gibt es zwei prinzipielle Möglichkeiten ihrer Funktion. Sie können entweder aktivierend oder hemmend auf die Folgeknoten, auf welche sie zulaufen, wirken. Entsprechend werden die numerischen Werte i.d.R. aus dem Intervall [-1;1] gewählt, wobei negative Werte hemmende und positive Werte aktivierende Wirkungen darstellen. Eine Besonderheit der NST ist, daß sie nur aktivierende, also keine hemmenden Verbindungen annimmt.

Bei den Knoten gibt es eine Fülle von Variationsmöglichkeiten. Ihre Grundfunktion besteht darin, die über die Verbindungen einlaufenden Aktivierungen zu summieren

production: Tests of predictions from a connectionist model. In: Journal of Memory and Language 27. Seiten 124-142.

76 MacKay, D.G. (1987). The organization of perception and action: A theory for language and other cognitive skills. Die Theorie von MacKay wurde u.a. zu einem Modell des Lernens bei älteren Personen erweitert. Siehe dazu MacKay, D.G. & Burke, D.M. (1990). Cognition and Aging: A theory of new learning and the use of old connections. In Hess, T. (Hrsg). Aging and Cognition:

Knowledge organization and utilization. Seiten 213-263.

und bei Überschreitung eines gesetzten Schwellenwertes s die Aktivierung über die ausgehenden Verbindungen des Knotens an andere Knoten weiterzuleiten.

Die Vorstellung, daß sich die Knoten im Netzwerk gegenseitig aktivieren können, hat zu dem Oberbegriff interactive activation model geführt, wobei erhebliche Unterschiede in der konkreten Ausformulierung der Netztopologie und den dazugehörigen Funktionen bestehen.77 Ihnen allen ist jedoch der symbolverarbeitende Charakter gemein, d.h., daß davon ausgegangen wird, daß die Knoten des Netzwerkes Symbole darstellen, die den jeweils beteiligten Elementen der Sprachprozessierung entsprechen sollen. Ein Gegenentwurf zu diesem symbolischen Ansatz stellt der subsymbolische Ansatz dar, bei dem die Prozessierungseinheiten an dem symbolverarbeitenden Prozeß teilhaben, jedoch selbst keine Symbole repräsentieren. Ein solcher Ansatz, der für die vorliegende Arbeit präferiert wurde, wird in Kapitel 5 ausführlich diskutiert.

Die Sprachprozessierung in der NST besteht in der systematischen Manipulation der Werte der entsprechenden Verbindungen zwischen bestimmten Prozessierungseinheiten, wodurch wiederum indirekt auch die Aktivierbarkeit der einzelnen Knoten manipuliert werden kann. Symbole können dabei z.B. für Phoneme, Phonemcluster, Silben, Morpheme, Lexeme oder auch ganze Propositionen stehen. In dem Modell von Burke et al. werden sieben Typen von Symbolen unterschieden, die verschiedenen Ebenen der Sprachprozessierung zugeordnet sind.78 Das folgende Flußdiagramm illustriert diese hierarchische Anordnung von symbolischen Prozessierungseinheiten:

77 Siehe dazu: Schade, U. (1992). Seite 31-43.

78 Da in dem Aufsatz von Burke et al. nur wenige Angaben zu ihrem Modell zu finden sind und von einem Netzwerkausschnitt gesprochen wird, kann davon ausgegangen werden, daß das tatsächlich implementierte Modell komplexer ist als die abgebildete Skizze vermuten läßt. Darüber kann jedoch nur spekuliert werden. Leider finden sich auch keine präzisen Definitionen der beteiligten Funktionen und Algorithmen.

Abbildung 4: Netzwerkausschnitt nach Burke et al. On the Tip of the Tongue – What Causes Word Finding Failures in Young and Older Adults? Seite 544.

SEMANTIC

Die verschiedenen Knoten des Netzwerkausschnittes sollen die mentalen Repräsentationen der jeweiligen Entitäten symbolisch darstellen. Die Aktivierung der Wortform frisbee und deren Artikulation läuft nach diesem Modell top down über propositionale Knoten im semantischen System und über verschiedene Ebenen des phonologischen Systems zum Muskelbewegungssystem. Bei diesem Fluß von Informationen durch das Netzwerk sind vor allem zwei Prozesse beteiligt:

The model postulates two fundamentally different processes, priming and activation, and differences between these two processes are important for explaining TOTS.79

Die Aktivierung von Knoten wurde bereits beschrieben. Unter priming verstehen Burke et al. eine unterschwellige Aktivierung, die die Aktivierung der betroffenen Knoten heraufsetzt, ohne jedoch den Schwellenwert zu überschreiten:

Priming or subthreshold excitation prepares a node for possible activation and an activated node primes all nodes connected to it."80

Die Implementation eines Priming-Mechanismus in die NST ist jedoch nicht allein technisch motiviert, um den Informationsfluß des Netzes zu optimieren. Vielmehr spielt das Konzept des priming eine zentrale Rolle in der Kognitionspsychologie und insbesondere auch in der kognitiven Linguistik. Dort werden priming-Verfahren verwendet, um nachzuweisen, daß unterschwellig präsentierte, d.h. unter der Wahrnehmungsgrenze liegende Stimuli bestimmte Effekte hervorrufen können.81 Den Nachweis, daß priming-Effekte auch bei TOT-Untersuchungen registriert werden können, haben Rastle & Burke82 geführt, nachdem schon Koriat

& Lieblich 1974 vermutet hatten, daß solche unterschwelligen Präaktivierungen eine Rolle für TOTS spielen:

79 Burke et al. Seite 543.

80 Ebd. Seite 543.

81 Siehe dazu: Meyer, D.E. & Schvaneveldt, R.W. (1971). Facilitation in recognizing pairs of words:

Evidence of a dependence between retrieval operations. In: Journal of Experimental Psychology 90.

Seiten 227-234.

82 Rastle, K.G. & Burke, D.M. (1996). Priming the Tip of the Tongue: Effects of Prior Processing on Word Retrieval in Young and Older Adults. In: Journal of Memory and Language 35. Seiten 586-605.

[...] in the normal retrieval process of a word which is not readily accessible to recall, the ability to make initial bets regarding formal features of the solicited word on the basis of information concerning class characteristics aids in narrowing the search for the missing word and in "priming" it when it is indeed available in memory store.83

Rastle & Burke konnten in drei Untersuchungen zeigen:

[...] that recent pronunciation of a word increased its retrieval in response to a general knowledge question and reduced its vulnerability to a TOT state."84

Details dieser Untersuchung werden weiter unten diskutiert. An dieser Stelle soll zunächst das Modell von Burke et al. weiter beschrieben werden. Festzuhalten bleibt, daß es eine starke Analogie zwischen dem beobachtbaren Phänomen des priming von Zielwörtern, so wie es aus psycholinguistischen Untersuchungen bekannt ist, und dem priming von Knoten in einem Netzwerk, wie es in der NST verwendet wird, gibt. Um die Wirkungsweise des priming im Netzwerk verdeutlichen zu können, muß zunächst die NST und der Erklärungsansatz für TOTS, der von Burke et al. vorgeschlagen wird, weiter skizziert werden.

Neben activation und priming gibt es noch einen dritten wichtigen Mechanismus in der NST, eine Zerfallsrate. Die Zerfallsrate, auch decay-factor genannt, sorgt dafür, daß die Aktivierung im Netz über die Zeit nachläßt. Damit wird ein sogenanntes net-overheating verhindert, d.h., es wird verhindert, daß immer mehr und mehr Knoten aktiviert werden, wodurch es zu einem völlig chaotischen Aktivierungsfluß käme.

Damit wären die Grundkonzepte des Modells von Burke et al. umrissen. Die Frage ist nun zum einen, wie systematisch Informationen in ein solches Netz eingespeist werden können, d.h. die Gewichtungen der Verbindung so manipuliert werden können, daß auf einen bestimmten Input immer ein bestimmter Output erfolgt, und zum anderen, wie sich daraufhin TOTS simulieren lassen. Da der Aufsatz von Burke et al. keine Auskunft darüber gibt, auf welchen Algorithmen das von ihnen benutzte Netz letztendlich basiert, soll an dieser Stelle auch nicht darüber spekuliert

83 Koriat, A. & Lieblich, I. (1974). Seite 655.

84 Rastle, K.G. & Burke, D.M. (1996). Seite 600.

werden. Allerdings werden in Kapitel 5 die Algorithmen, die bei den Simulationen für die vorliegende Arbeit verwendet wurden, detailliert wiedergegeben, wobei deutlich werden wird, wie das "Lernen" in Künstlichen Neuronalen Netzen funktioniert. Im folgenden wird aus den genannten Gründen also einfach vorausgesetzt, daß das Netzwerk auf einen semantischen Input mit dem richtigen phonologischen Output reagiert. Das heißt konkret für das oben angeführte Beispiel frisbee, daß die Aktivierung der lexikalischen Knoten, die das Nomen frisbee symbolisieren, die Aktivierung der entsprechenden Knoten im muscle movement system zur Folge hat, womit eine einfache Simulation der Sprachproduktion erreicht wäre. Die mathematischen Beweise, daß Künstliche Neuronale Netze solche assoziativen Verbindungen lernen können, finden sich u.a. bei Rumelhart &

McClelland.85 Wie sich unter diesen Voraussetzungen TOTS simulieren lassen, zeigt der nächste Abschnitt.

Im Dokument Das "Tip of the Tongue"-Phänomen (Seite 111-117)