• Keine Ergebnisse gefunden

Rating-Vorstudie: Verben im affektiven Raum

II. METHODEN

II.1 Rating-Vorstudie: Verben im affektiven Raum

An der Rating-Vorstudie nahmen 41 Studenten (32 Frauen, 9 Männer) der Universität Konstanz teil, die zum Zeitpunkt der Untersuchung zwischen 18 und 37 Jahren alt waren. Das Durchschnittsalter betrug 21.2 Jahre. Alle Probanden hatten Deutsch als Muttersprache gelernt. Die Versuchsteilnehmer wurden mit einer halben Versuchspersonstunde im Rahmen ihres Psychologie-Studiums oder 5 DM entlohnt.

Material

Als Reizmaterial wurden im Verlaufe dreier verschiedener Ratings insgesamt 140 Verben verwendet, die sich nach Erwartung der Versuchsleiter zu gleichen Anteilen in die

Valenzdimensionen neutral, angenehm und unangenehm einordnen lassen sollten. Die Ratings wurden mit Hilfe einer Papier-und-Bleistift-Version des Self-Assessment-Manikins (SAM) von Bradley und Lang (1994) durchgeführt. Das SAM stellt Werte der Arousal- und Valenzdimension auf einer kontinuierlichen neunstufigen Skala als graphische Symbole in Form von kleinen Männchen dar (siehe Abbildung 2): Die Valenzdimension wird

veranschaulicht durch Figuren, die lächeln (angenehm), beziehungsweise unglücklich

aussehen (unangenehm), die Arousal-Dimension durch aufgeregte Figuren mit aufgerissenen Augen (erregend), beziehungsweise schläfrige Figuren mit geschlossenen Augen (ruhig). Die piktoriale Skala lässt sich sinnvoll quantifizieren und kodieren, indem den Extrema die Werte 1 und 9 zugewiesen werden (Valenz-Skala: 1 = unangenehm, 9 = angenehm; Arousal-Skala: 1

= niedrigerregend, 9 = hocherregend).

Abbildung 2. Valenz-Skala (oben) und Arousal-Skala (unten) des Self-Assessment-Manikins (SAM) von Bradley und Lang (1994).

Prozedur

Um am Ende ein Set an Verben zu erhalten, das sich reliabel in die Kategorien angenehm hocherregend, neutral niedrigerregend und unangenehm hocherregend einordnen lässt, wurde das Reizmaterial nach Erreichen einer bestimmten Stichprobengröße durch Hinzufügen neuer Verben beziehungsweise Ausschluss von Verben zweimal modifiziert. Manche Verben wurden somit während aller drei Ratings beurteilt, während andere nur bei einem oder zwei Durchgängen eingestuft wurden, so dass sich für unterschiedliche Verben am Ende eine unterschiedliche Stichprobengröße ergab. Für jede Version des Ratings war der Ablauf jedoch identisch: Die Probanden führten das Rating in der Versuchskammer des

psychophysiologischen Labors durch und wurden in die Verwendung des SAM mündlich eingewiesen. Die Untersuchung dauerte je nach Geschwindigkeit der Versuchsperson zwischen 15 und 30 Minuten.

Tabelle 1 gibt die Stichprobengröße und die Anzahl der gerateten Verben für jedes der drei Ratings wieder.

N Anzahl der gerateten Verben

Rating 1 17 60

Rating 2 12 90

Rating 3 12 90

Ergebnisse der Rating-Vorstudie

Die Verben zeigten ähnlich wie affektive Bilder und affektive akustische Reize (Bradley &

Lang, 2000) eine hohe Variationsbreite des durchschnittlichen Ratings sowohl auf der Valenz-Dimension als auch auf der Arousal-Dimension. Der Range reichte bei der Valenz von 1.04 („vergewaltigen“) bis zu 8.33 („verlieben“); beim Arousal reichte er von 1.67 („blättern“) bis 8.67 („vergewaltigen“). Wenn man die SAM-Ratings in einem durch die Dimensionen Valenz und Arousal aufgespannten Koordinatensystem eintrug (siehe

Abbildung 3), ließ sich die typische bumerang-artige Form des affektiven Raumes erkennen, die für piktoriale und akustische Reize bereits mehrfach nachgewiesen werden konnte (z.B.

Bradley & Lang, 2000).

Eine polynominale Regression der Arousal-Werte aufgrund der Valenz-Werte offenbarte zudem eine signifikante quadratische Beziehung zwischen beiden Parametern mit einem

Tabelle 1. Stichprobengröße (N) und Anzahl der Verben pro Rating.

Determinationskoeffizienten von .67, beziehungsweise einer Varianzaufklärung von 67 % (F(2,137) = 139.0; p < 0.01).

Wesentlich für das AB-Experiment war die Tatsache, dass die Quadranten angenehm hocherregend, neutral niedrigerregend und unangenehm hocherregend eine ausreichend hohe Besetzung aufwiesen, auf deren Basis eine Selektion des Reizmaterials erfolgen konnte.

II.2 Behaviorale Attentional-Blink-Studie Versuchspersonen

An der Studie zum AB nahmen 19 Personen (11 Frauen, 8 Männer) teil, die mittels eines Aushanges an der Universität Konstanz angeworben worden waren. Das Durchschnittsalter der Probanden betrug zum Zeitpunkt der Untersuchung 22.7 Jahre; die jüngste

Versuchsperson war 19 Jahre alt, der älteste Proband 28 Jahre. Alle Versuchsteilnehmer hatten Deutsch als Muttersprache gelernt und wiesen normales oder normal-korrigiertes Sehvermögen auf. Für die Teilnahme am Experiment erhielten die Probanden wahlweise Versuchspersonenstunden für ihr Psychologie-Studium oder 7 Euro 50.

Abbildung 3. Affektiver Raum für 140 deutsche Verben, definiert durch ihre durchschnittlichen Arousal- und Valenz-Werte im SAM-Rating. Die graue Linie gibt die quadratische Regression der Arousal-Ratings aufgrund der Valenz-Ratings wieder.

Material

Mit Hilfe der Ergebnisse aus der Rating-Vorstudie wurden für das AB-Experiment 30 hocherregend angenehme, 30 hocherregend unangenehme und 30 niedrigerregend neutrale Verben ausgewählt, die später als zweiter Target-Reiz (T2) fungieren sollten. Eine Liste aller 90 verwendeten T2-Verben sowie der als Target 1 (T1) verwendeten Verben findet sich im Anhang.

Abgesehen von der Berücksichtigung des Arousal- und Valenz-Parameters jedes Verbes basierte die Auswahl vor allem auf den linguistischen Kriterien Wortfrequenz und Wortlänge.

Um Effekte dieser Variablen auf die Identifikationsgenauigkeit ausschließen zu können, wurden die drei Kategorien nach durchschnittlicher Buchstabenanzahl, Silbenanzahl und Worthäufigkeit gematcht. Für die Bestimmung der Wortfrequenz wurde der Mannheimer Corpus des Celex-Verzeichnisses (Baayen, Piepenbrock, & Gulikers, 1995) herangezogen.

Außerdem wurde auf eine ähnliche Anzahl von Affixierungen in jeder Kategorie geachtet. Da gemäß der Hypothesen (siehe Kapitel A.2.2) Vergleiche vor allem zwischen den drei

Valenzkategorien der T2-Reize vorgenommen werden sollten, bedurfte es für eine Vermeidung von Konfundierungseffekten mit linguistischen Variablen eine besonders sorgsame Selektion dieser Verben.

Zusätzlich wurde ein Set von 30 neutralen Verben definiert, die innerhalb des Paradigmas als erster Target-Reiz (T1) zum Einsatz kommen sollten. Für dieses Set wurden einerseits geratete Verben aus der Vorstudie verwendet, andererseits aber auch neue Verben, die bisher noch nicht beurteilt worden waren. Der fünfte Pool von Wörtern bestand aus 50 neutralen ungerateten Verben, welche als Distraktoren vor, zwischen und nach den Target-Reizen eingesetzt werden sollten.

Obgleich das Matching vor allem auf eine Vergleichbarkeit der drei T2-Valenzkategorien abzielte, wurde auch bei der Auswahl der T1-Reize und Distraktoren auf eine Anpassung an zumindest ähnliche Wortlängen- und Wortfrequenz-Werte, wie sie für die T2-Reize ermittelt wurden, geachtet.

∅ Buchstaben

Alle Wörter erschienen als Großbuchstaben in 26-Punkt-Helvetica-Schrift und in zentraler Ausrichtung auf dem computer-kontrollierten Monitor. Die Wörter spannten einen vertikalen Sehwinkel von 0.82° auf. Mit Ausnahme der Target-Reize wurden alle Wörter in weißer Schrift auf schwarzem Bildschirmhintergrund dargeboten. Die Target-Reize erschienen in grüner Schrift

Die Stimulus Onset Asynchrony (SOA) zwischen den Reizen betrug 115 ms (46 ms Wortdarbietung, 69 ms leerer Bildschirm). Im Sinne eines Rapid-Serial-Visual-Presentation-Paradigmas resultierte daraus eine Darbietungsgeschwindigkeit von 8.7 Wörtern pro Sekunde (8.7 Hertz).

Prozedur

Das Experiment wurde in einer abgedunkelten und schallgedämpften Versuchskammer durchgeführt. Dort saßen die Probanden ungefähr 70 cm von einem 19-Zoll-Monitor entfernt, auf dem die Reize präsentiert wurden. Mit Hilfe einer Kinnstütze wurde die Entfernung zum Bildschirm während der Untersuchung und zwischen Versuchspersonen konstant gehalten.

Die Probanden lasen vor Beginn des Experiments eine schriftliche Instruktion; zusätzlich führten sie zusammen mit dem Versuchsleiter mindestens vier Probedurchgänge durch.

Hierbei wurden andere Stimuli als in den Experimentaldurchgängen verwendet.

Das Experiment gliederte sich in zwei Blöcke von jeweils ungefähr 25 Minuten Dauer.

Zwischen den beiden Blöcken konnten die Probanden eine längere Pause einlegen.

Aufgabe der Versuchspersonen war es laut Instruktion, innerhalb einer Serie von Wörtern in weißer Schrift alle grün geschriebenen Wörter zu identifizieren. Im Anschluss an jeden Durchgang wurden die Probanden mit Hilfe von zwei Eingabemasken aufgefordert, jeweils den ersten Buchstaben dieser grünen Wörter einzugeben, beziehungsweise die Leertaste zu

Tabelle 2. Arousal- und Valenz-Werte der T2-Kategorien aufgrund der Vorstudien-Ergebnisse und Matching der Stimulus-Klassen nach mittlerer Buchstabenanzahl, Silbenanzahl und Worthäufigkeit sowie nach der Anzahl der Affixierungen.

drücken, falls sie kein grünes Wort identifiziert hatten. Die Reihenfolge der Eingabe der grünen Wörter konnte laut Anweisung frei bestimmt werden.

Sobald in der zweiten Eingabemaske ein Tastendruck erfolgte, wurde mit einem blank-screen-Vorlauf von 1000 ms der nächste Durchgang gestartet – auf diese Weise konnten die Probanden die Geschwindigkeit des Gesamtexperimentes selbst bestimmen.

Um die Aufgabenstrategie, während der Darbietung ausschließlich auf den ersten Buchstaben zu achten, von vornherein auszuschließen, wurden die Probanden zusätzlich instruiert, vor der Buchstabeneingabe das Wort laut auszusprechen. Ein Mikrofon, das gut sichtbar neben der Tastatur platziert wurde, sollte die Versuchspersonen dazu motivieren, dieser Instruktion nachzukommen. Auch wenn de facto keine Aufzeichnung vorgenommen wurde, erschien diese Aufforderung Garantie genug, dass die Wörter als Ganzes verarbeitet wurden und somit der experimentellen Affektmanipulation tatsächlich unterliegen konnten.

Im Anschluss an die Untersuchung wurden die Versuchspersonen über die experimentelle Täuschung aufgeklärt.

Angesichts der hohen Aufgabenschwierigkeit bei einer Darbietungsgeschwindigkeit von 8.7 Hz umfasste die schriftliche und mündliche Instruktion auch die mentale Vorbereitung der Versuchsperson auf mögliche Frustrationen, die infolge geringer Identifikationsraten vor allem zu Beginn des Experiments entstehen konnten.

SAM-Rating nach dem AB-Experiment

Jede Versuchsperson bekam im Anschluss an das Aufmerksamkeitsexperiment eine Papier-und-Bleistift-Version des Self-Assessment-Manikins (SAM) von Bradley und Lang (1994) ausgehändigt. Mit diesem unter Kapitel B.1 genauer beschriebenen Rating-Instrument sollten die Probanden alle 90 T2-Verben und alle 30 T1-Verben auf einer neunstufigen Skala nach den Dimensionen Valenz und Arousal beurteilen. Die Probanden konnten selbst

entscheiden, ob sie das Rating sofort in der Versuchskammer durchführten oder den

Fragebogen mit nach Hause nahmen, um dort die Einstufung vorzunehmen. In letzterem Falle wurde ausdrücklich darauf hingewiesen, dass die Probanden den Fragebogen in Ruhe und bei voller Konzentration bearbeiten sollten. Das Rating der 120 Verben dauerte je nach

Geschwindigkeit der Versuchsperson 15 bis 20 Minuten.

Design des AB-Experimentes

Das gesamte AB-Experiment umfasste 270 Trials, die in zwei Blöcke von je 135 Trials unterteilt wurden. Innerhalb eines Trials erschien der grüne T1-Reiz jeweils nach einer randomisierten Anzahl von 5 bis 25 weißen Distraktor-Wörtern. Diese

Baseline-Randomisierung, die in der Zeitdomäne mit einem Intervall von 575 bis 2875 ms Länge korrespondiert, sollte Erwartungseffekte der Probanden hinsichtlich des zeitlichen Erscheinens der Zielreize minimieren.

Die Position des T2-Reizes wurde dreistufig variiert und orientierte sich an der in der aktuellen Literatur berichteten Länge des AB zwischen 180 bis 500 ms nach Onset des T1-Reizes (z.B. Deacon & Shelley-Tremblay, 2000): (1) In der Lag 1-Bedingung wurde zwischen T1 und T2 genau ein Distraktor-Wort präsentiert (dies entspricht einer SOA von 230 ms zwischen T1 und T2 ); (2) in der Lag 2-Bedingung erschienen 3 Distraktor-Reize zwischen T1 und T2 (460 ms SOA); (3) in der Lag 3-Bedingung folgte T2 nach 5 intervenierenden Distraktor-Reizen (690 ms SOA).

Je nach Position von T2 wurden anschließend weitere 13 (bei Lag 3) bis 17 (bei Lag 1) Distraktor-Reize gezeigt. Daraus resultierte je nach Basline-Randomisierung eine Gesamtzahl von 25 bis 45 Wörter pro Durchgang, beziehungsweise eine Triallänge von 2875 ms bis 5175 ms.

Die zweite experimentelle Manipulation neben der T1-T2-Distanz betraf die affektive Kategorie von T2 im Sinne der Rating-Ergebnisse aus der Vorstudie als (1) angenehmes, (2) neutrales oder (3) unangenehmes Wort. Aus der Kombination von 3 (Lags) x 3 (Kategorien) Stufen pro Faktor resultierten somit 9 verschiedene Bedingungen mit jeweils 30 Trials pro Bedingung. Das faktorielle Design des Experiments wird in Abbildung 3 illustriert.

Jede der drei Lag-Bedingungen wurde mit jedem T2-Set (jeweils 30 Wörter) permutiert, wodurch jedes affektive Wort in den insgesamt 270 Trials dreimal wiederholt wurde. Für die 30 T1-Wörter ergaben sich entsprechend 9 Wiederholungen während des Experimentes. Die Reihenfolge der Bedingungen wurde über die Gesamtblocklänge frei randomisiert.

Datenanalyse

Das Ausmaß des AB und seiner affektiven Modulation wurde über die

Identifikationsgenauigkeit der Target-Wörter operationalisiert. Als wichtigste abhängige Variable wurde getrennt nach T1- und T2-Reizen für jede Versuchsperson und pro Bedingung der Prozentsatz richtig eingegebener Wörter definiert.

Abbildung 4. Bedingungen und zeitlicher Verlauf des Attentional-Blink-Experimentes.

Um die unter Kapitel A.2.2 dargestellten Hypothesen zu testen, erschien es angebracht, in einer ANOVA mit Messwiederholung und dem within-subject-Faktor TARGET-POSITION (T1 versus T2) zunächst die globale Effektivität des AB entsprechend Hypothese (1a) zu überprüfen. Diese sollte sich in einem signifikanten Haupteffekt TARGET-POSITION niederschlagen.

Zur Überprüfung der weiteren Hypothesen wurden anschließend separat für die T1- und T2-Identifikationsgenauigkeit zweifaktorielle Meßwiederholungs-ANOVAS mit den beiden within-subject-Faktoren LAG (Lag 1, Lag 2, Lag 3) und KATEGORIE (angenehm, neutral, unangenehm) durchgeführt.

Insbesondere sollte sich entsprechend Hypothese (2) das typische AB-Muster in der ANOVA für die T2-Maße in einem signifikanten Haupteffekt LAG widerspiegeln. In einem Trendtest sollte sich die Zunahme der Wiedergabeleistung mit wachsender T1-T2-Distanz in einem linearen Trend zeigen.

Die affektiven Modulation innerhalb der frühen AB-Periode aus Hypothese (3) sollte sich in der ANOVA für die T2-Maße zunächst in einer signifikanten LAG x KATEGORIE-Interaktion niederschlagen. In der Lag 1 -Bedingung sollte sich dann ein signifikant quadratischer Trend zeigen, wohingegen sich in den späteren Lags kein solcher Trend

manifestieren sollte. Die einzelnen Stufen des Faktors LAG sollten sich somit über Trendtests diskriminieren lassen.

Zur Kontrolle wurde für die T1- und T2-Maße in separaten ANOVAs zusätzlich der between-subject-Faktor GESCHLECHT getestet. Auch die bereits vorhandene Erfahrung mit affektiven Wörter aus einer früheren Untersuchung der Arbeitsgruppe ging als Faktor

LEXDEC-TEILNAHME mit in die statistische Analyse ein. Es wurde erwartet, dass diese Faktoren zu keinen signifikanten Effekten und Interaktionen führen sollten.

In Bezug auf die postexperimentellen SAM-Ratings sollte die Affektmanipulation aus Hypothese (4) durch eine ANOVA mit den für die einzelnen Versuchspersonen pro Kategorie gemittelten Arousal- und Valenz-Scores und dem Faktor KATEGORIE (angenehm, neutral, unangenehm) überprüft werden. Hierbei sollte als between-subject-Faktor zusätzlich das Geschlecht einfließen. Zum anderen sollte getestet werden, ob sich die Arousal-Mittelwerte für jedes Verb mittels einer quadratischen Regression auf Basis der Valenz-Mittelwerte predizieren lassen. Eine signifikante quadratische Beziehung zwischen beiden Parametern würde den Rückschluss auf das Vorhandensein der oben erwähnten drei Cluster von Verben und eine valide Materialselektion zulassen.

II.3 Studie zur Elektrophysiologie des Attentional Blink und seiner Modulation

Versuchspersonen und Prozedur

Am EEG-Experiment nahmen vier Versuchspersonen teil (3 Frauen, 1 Mann). Das Durchschnittsalter der Probanden betrug zum Zeitpunkt der Untersuchung 24.5 Jahre.

Abgesehen davon, dass die Probanden während der Durchführung eine EEG-Kappe trugen, waren Stimuli, Prozedur und Design identisch mit dem behavioralen AB-Experiment.

Elektrophysiologische Aufnahmen

Zur Aufzeichnung der elektrokortikalen Signale wurde ein EGI 128-Kanal-System (1998) benutzt. Als Referenz wurde der Vertex (recording site Cz) verwendet. Impedanzen wurden niedriger als 50 kΩ gehalten. Die Daten wurden mit einer Sampling-Rate von 250 Hz

aufgezeichnet. Alle Kanäle wurden während der Aufzeichnung mit 0.1 Hz high-pass und mit 100 Hz low-pass vorgefiltert. Die weitere Verarbeitung der Daten wurde off-line

durchgeführt.

Datenreduktion und -analyse

Zur Analyse der Steady-State-Signale wurden Epochen mit einer Länge von 1700 ms gebildet (500 ms vor und 1200 ms nach T1-Onset). Artefakte innerhalb dieser Epochen wurden mit Hilfe der SCADS-Methode (statistical correction of artifacts in dense array studies) von Junghöfer, Elbert, Tucker und Rockstroh (2000) korrigiert. Auf Basis der Average-Referenz benutzt diese Methode zunächst die Verteilung von statistischen

Parametern der Trials (z.B. maximale Amplitude, Standardabweichung und Gradient), um die Qualität der Daten an den einzelnen Sensoren zu dokumentieren. Sensoren, die Artefakte aufweisen, werden dann innerhalb jedes einzelnen Trials durch statistisch gewichtete Interpolation ersetzt, wobei die Interpolation auf Basis des kompletten Sensor-Sets und der Average-Referenz erfolgt. Bei der Auswertung der vorliegenden Daten wurde darauf

geachtet, dass Trials, bei denen mehr als 20 Sensoren artefaktkontaminiert waren und deshalb interpoliert werden mussten, nicht in die Mittelung eingingen. Die Artefaktkorrektur ergab für die anschließende Mittelung schließlich folgende (über Versuchspersonen gemittelte)

Trialanzahlen pro Bedingung: Lag 1-Angenehm: 19.2 gemittelte Trials; Lag 2-Angenehm:

20.7; Lag 3-Angenehm: 19.8; Lag 1-Neutral: 20.5; Lag 2-Neutral: 21.5; Lag 3-Neutral: 20.5;

Lag 1-Unangenehm: 19.6; Lag 2-Unangenehm: 18.9; Lag 3-Unangenehm: 19.3. Um Offsets

an den einzelnen Kanälen zu korrigieren, wurde der Mittelwert einer Baseline (500 ms bis 0 ms vor T1) abgezogen.

Zur Untersuchung des Zeitverlaufs der 8.7-Hertz-SSR-Amplitude in der Frequenzdomäne wurden die für jede Bedingung gemittelten Epochen mit einem an die SSR-Frequenz

angepassten Wavelet konvolutiert (vergleiche Müller et al., 1998). Die Konvolution mit einem Morlet-Wavelet nach Bertrand, Bohorquez und Pernier (1994) wurde über die gesamte Epochenlänge hinweg durchgeführt. Auch hier wurde anschließend eine Baseline-Korrektur vorgenommen (348 bis 100 ms vor T1). Nach dieser Prozedur konnte als abhängige Variable die Amplitude der SSR und ihre Veränderung über die Zeit zwischen den Bedingungen verglichen werden.