• Keine Ergebnisse gefunden

Empirie

6.2 Versuchsplanung

Bild und Text in einem kongruenten Informationsverhältnis zueinander stehen.

Fragestellung 3: Welchen Einfluss haben das Informationsverhältnis und die Reihenfolge von Text und Bild auf die Verarbeitungszeiten der einzelnen For-mate?

3.1 Kapazitätshypothese: Die Verarbeitungszeit für den Text nimmt zu, wenn zuvor ein Bild betrachtet wurde. Dieser Zusammenhang gilt auch dann, wenn Bild und Text in einem komplementären Informationsverhältnis zueinander stehen.

3.2 Interferenzhypothese: Die Verarbeitungszeit für den Text nimmt ab, wenn zuvor ein Bild betrachtet wurde. Dieser Zusammenhang gilt nur, wenn Bild und Text in einem kongruenten Informationsverhältnis zueinander stehen.

Abbildung 6.1:Untersuchungsdesign der ersten Studie

Maß für die Effektstärke an, doch konnte diese anhand von F-Werten und Freiheitsgra-den rekonstruiert werFreiheitsgra-den. So war es möglich, mit einer Formel, die B. Rasch, Friese, Hofmann und Naumann (2010) vorschlagen,Chohen’s f zu bestimmen, wobei die ermit-telten Werte je nach Experiment variierten. Die einzelnen Angaben schwankten zwischen einer mittleren Effektstärke von f=0.25(η¯part2 ≈0.06), und einem starken Zusammenhang von f=0.42(η¯2part≈0.15).

Für die weitere Planung wurde mit f =0.34 (η¯part2 ≈0.11) die durchschnitlliche Effekt-größe berechnet. Da aber die Lernzeit als abhängige Variable erfasst werden sollte und nicht mehr unmittelbar einer experimentellen Kontrolle unterlag, war damit zu rechnen, dass der Einfluss der Verabeitungskontrolle unter Umständen etwas geringer ausfallen könnte. Aus diesem Grund wurde bei den Überlegungen zur benötigten Stichprobengrö-ße eine Effektsärke von f=0.31(η¯part2 ≈0.087)zugrunde gelegt. Das Signifikanzniveaus und die angestrebte Teststärke orientierte sich an dem in den Sozialwissenschaften üb-lichen Verhältnis von 1 zu 4 (vgl. Bortz & Döring, 2006). Hinzu kam, dass aus ökonomi-schen Gründen die Stichprobe und damit den Aufwand überschaubar gehalten werden sollte, weshalb mit einemα-Fehlerniveau von 5% und einemβ-Fehlern von 20% geplant wurde. Damit waren letztlich alle Parameter vorhanden, um den optimalen Stichproben-umfang mithilfe des Software G*3 (Faul, Erdfelder, Lang & Buchner, 2007) zu berechnen, was eine Gesamteilnehmerzahl von 84 Personen ergab.

Die abhängigen Variablen, auf die sich die einzelnen Hypothesen und Fragestellun-gen bezoFragestellun-gen, waren derLernerfolg, diekognitive Belastung und schließlich dieLernzeit.

Zusätzlich wurden eine Reihe von Kontrollvariablen erfasst, deren statistische Berück-sichtigung mögliche Stichprobeneffekte neutralisieren sollte. Zwar war vorgesehen, die Versuchspersonen den Bedingungen randomisiert zuzuweisen, was letztlich die beste Kontrolle darstellt (Bortz & Döring, 2006), doch bei einem Stichprobenumfang von 84 Teilnehmern können mögliche Verzerrung nicht gänzlich ausgeschlossen werden. Aus diesem Grund wurden das Interesse für Geologie/Geographie, die Erdkundenote, das Vorwissen, dieaktuelle Motivation, dieräumliche und verbale Intelligenz sowie der Lern-stil erhoben. Alle Instrumente, mit denen diese Personenemerkmale gemessen werden sollten, sind in Kapitel 5.2 ausführlich beschrieben.

6.2.2 Stichprobe

Die Untersuchung fand in den Räumen der Universität Koblenz-Landau / Campus Landau statt, so dass es nahe lag, die Versuchspersonen unter den Studierenden zu rekrutieren.

Da zu dieser Zeit mehrere wissenschaftliche Untersuchungen um Probanden konkurrier-ten, war es nicht möglich, ausschließlich Teilnehmer des Studiengangs Psychologie für das Experiment zu gewinnen. Die Rekrutierungsprobleme führten letztlich auch dazu, dass sich die Durchführung der Studie über einen Zeitraum von fünfeinhalb Wochen hin-zog. Doch trotz dieser Schwierigkeiten konnten letztlich 84 Personen davon überzeugt werden, an der Untersuchung teilzunehmen, so dass der geplante Stichprobenumfang verwirklicht werden konnte. Die meisten Teilnehmer (≈62%) hatten sich in den Studien-gang Psychologie eingeschrieben, während der Rest Lehramt (≈ 24%), Pädagogik (≈

8%) oder Sonstiges (≈6%) studierte.

Obwohl die überwiegende Mehrheit (≈ 79%) vier oder weniger Semester aufweisen konnte, handelte es sich bei rund 21% um eher erfahrenere Studierende. Dementspre-chend betrug der Altersdurchschnitt etwa 23 Jahre (M=23.3,SD=4) mit einem Minimum von 18 und einem Maximum von 39 Jahren. Hinsichtlich des Geschlechts dominierten eindeutig die Frauen (79%), da männliche Studierende mit 21.4% in der Minderheit wa-ren. Um eine Teilnahme möglichst reizvoll zu gestalten, wurden im Vorfeld der Studie mit verschiedenen Anreizen geworben. Während die Psychologiestudenten zwischen der Gutschrift von zwei Versuchspersonenstunden und 10,- C als Belohnung wählen konn-ten, erhielten die Studierenden anderer Fachrichtungen am Ende der Sitzung gleich das Geld.

Für eine abschließende Beurteilung der Stichprobe bieten sich mit der Homogenität und der Repräsentativität vor allem zwei Kriterien an. Demnach kann die Stichprobe auf den ersten Blick als relativ homogen angesehen werden, wenn man berücksichtigt, dass alle Teilnehmer Studenten waren und damit die Hochschulreife besaßen. Eine Einschrän-kung stellte jedoch die Tatsache dar, dass nicht ausschließlich Psychologiestudenten teil-nahmen, da die verschiedenen Zulassungsvoraussetzungen der einzelnen Studiengänge eine Art Vorselektion bedeuteten. Ebenso dürfte es um die Motivation der Studierenden sehr unterschiedlich bestellt gewesen sein, denn ein Teil der Studierenden des Faches Psychologie musste quasi bei der Untersuchung mitmachen, um genügend Versuchs-personenstunden zu sammeln. In diesem Zusammenhang schien es durchaus ange-bracht zu sein, eine Reihe von Kontrollvariablen zu erheben, um möglichen Verzerrungen durch zufällige Effekte vorzubeugen. Hinsichtlich der Repräsentativität lässt sich festhal-ten, dass diese als eingeschränkt betrachtet werden musste. Die TeilnehemerInnen wa-ren mehrheitlich junge, weibliche Studenten der Sozial- oder Erziehungswissenschaften, was beim Versuch einer Verallgemeinerung der Ergebnisse bedacht werden musste.

6.2.3 Ablauf und Durchführung der Untersuchung

Alle experimentellen Sitzungen wurden am Campus Landau der Universität Koblenz-Landau durchgeführt. Dem Versuchsleiter standen zu diesem Zweck zwei Räume zur Verfügung, die mit 8 bzw. mit 6 PCs ausgestattet waren. Jeder dieser Rechner besaß einen Zugang zum Internet, so dass über einen Browser die Texte und Bilder, die als HTML-Seiten vorlagen, präsentiert werden konnten. Um das Prinzip der Randomisierung zu verwirklichen, war im Vorfeld der Untersuchung eine Liste erstellt worden, mit deren Hilfe es möglich sein sollte, die Teilnehmer einer der Bedingungen zuzuweisen. Diese Liste bestand aus einer zufälligen Anordnung der Zahlen 1 bis 4, wobei jede Ziffer ei-ne Experimentalgruppen repräsentierte und genau 21 mal enthalten war. Die Teilei-nehmer wurden dann nach der Reihenfolge ihres Erscheinens den einzelnen Versuchsbedingun-gen zugeordnet.

Die eigentliche Testsitzung begann, wenn alle Versuchspersonen, die sich angemeldet hatten, erschienen waren oder nach einer kurzen Wartezeit von 5 Minuten, so dass auch Nachzügler noch teilnehmen konnten. Nachdem der Versuchsleiter die Tür zum Unter-suchungsraum geschlossen hatte, wies er den Teilnehmern einen Computerarbeitsplatz zu. Anschließend wurde den Studierenden mitgeteilt, was sie in der Sitzung zu erwarten hätten und dass ihre Daten vertraulich bzw. anonym behandelt würden. Bestanden keine weiteren Fragen, sollten die Versuchsteilnehmer den ersten Abschnitt des Fragebogens ausfüllen, der zuvor ausgeteilt worden war. Dabei ging es um Angaben zur Person, aber auch um Lerngewohnheiten, das Interesse für Geologie und die Erdkunde- bzw. Geogra-phienote. Die Beantwortung der Fragen nahm in der Regel nicht mehr als fünf Minuten in Anspruch.

Im Anschluss erhielten die Studierenden die Untertest Satzergänzung (SE) aus dem IST 2000 R (Liepmann et al., 2007), zu dessen Bearbeitung 6 Minuten zur Verfügung standen (siehe 5.2.5). Zuvor hatte der Versuchsleiter, die im Manual angeführten Instruk-tionen verlesen und den Teilnehmern die Möglichkeit gegeben, alle bestehenden Unklar-heiten zu klären. Die Bearbeitungszeit wurde mit einer Stoppuhr gemessen, wobei die meisten Versuchspersonen jedoch in der Regel keine 6 Minuten benötigten, um die 20 Items zu beantworten. Die restliche Zeit konnten die Teilnehmer dazu nutzen, ihre Ant-worten noch einmal zu überprüfen. Erst nachdem genau 6 Minuten verstrichen waren, wurden die Studierenden dazu aufgfordert, ihre Stifte beiseite zu legen. Anschließend gab es eine kurze Pause, bevor der Versuchsleiter die Anweisungen für die zweite Test-skala aus dem IST 2000 R verlas. Diese bestand wiederum aus 20 Items, bei denen allerdings Würfel mental rotiert werden mussten, um eine Übereinstimmung zu erkennen (siehe Abbildung 5.13 auf Seite 125). Offenbar stellte die Bearbeitung der Würfelaufga-ben (WÜ)eine sehr viel größere Herausforderung dar, denn in den meisten Fällen reichte die Bearbeitungszeit von 9 Minuten nicht aus, um alle Items zu lösen.

Nach der Erfassung der räumlichen Fähigkeiten, wurde erneut ein kurze Pause einge-legt, in der sich die Teilnehmer etwas erholen konnten, bevor es mit dem Vorwissenstest weiterging (siehe Abschnitt 5.2.3). Anders als bei den Skalen aus dem IST-2000R gab

es für die Bearbeitung des Vorwissenstests keine zeitliche Vorgabe. Allerdings wurden die Studierenden gebeten, nur dann eine der beiden Antwortmögichkeiten anzukreuzen, wenn sie sich einigermaßen sicher waren. Items, bei denen die Teilnehmer die Antwort wirklich nicht wussten, sollten lieber ausgelassen werden. Durch diese Instruktion sollte verhindert werden, dass die Teilnehmer die Antworten errieten, was letztlich zu einer Ver-zerrung der Ergebnisse geführt hätte. Der letzte Vortest bestand schließlich aus zwei Ska-len einer überarbeiteten Fassung des Verbalizer-Visualizer-Questionaires (siehe Kirby et al. (1988) bzw. Abschnitt 5.14), der zur Erfassung verbaler bzw. visueller Verarbeitungs-präferenzen vorgelegt wurde. Auch hier gab es keine zeitliche Begrenzung, doch sollten die Teilnehmer laut Instruktion möglichst rasch und ohne langes Nachdenken antworten.

Nachdem auch dieser Vortest abgeschlossen war, wurden die Fragebögen eingesammelt und das Experiment konnte beginnen.

Dabei war die experimentelle Intervention nicht viel mehr als eine Lernphase, bei der die Studierenden mit Hilfe von instruktionalen Bildern und Texten neues Wissen erwerben sollten. Allerdings unterlag der Prozess des Wissenserwerbs gewissen Einschränkungen, über die der Versuchsleiter die Teilnehmenden im Vorfeld aufgeklärt hatte. So wurden die betreffenden Bilder und Texte auf Computermonitoren präsentiert, die jeweils so einge-stellt waren, dass beide Formate genau auf eine Bildschirmseite passten. Auf diese Wei-se waren die Studierenden nicht dazu gezwungen, zu scrollen, da alle Informationen auf einen Blick erfasst bzw. gelesen werden konnten. Die Teilnehmer mussten die zur Ver-fügung stehende Maus nur dann verwenden, wenn sie alle Informationen aufgenommen hatten und bereit waren, mit dem nächsten Bild bzw. Text fortzufahren. Dazu konnten sie auf einen kleinenVorwärtspfeil klicken, der sich in der rechten Ecke des Bildschirms befand.

Das Lehr-Lernmaterial, dessen Eigenschaften bereits in Abschnitt 5.1.4 ausführlich dargestellt wurden, umfasste jeweils einen Text und ein Bild zu insgesamt vier themati-schen Bereichen aus der Geologie. Die einzelnen Abschnitte bauten aufeinander auf, so dass unter allen experimentellen Bedingungen inhaltlich immer die selbe Reihenfolge ein-gehalten wurde. Jede Lernpahse begann mit derTheorie der Plattentektonik, dann folgte eine Ausführung über die Plattengrenzen, anschließend die Messungen im Erdinneren, bevor sie mit Bildern und Texten zu denMechanismen der Plattenbewegung endete. Ne-ben dem Informationsverhältnis wurde lediglich die Sequenz variiert, in der die Teilnehmer Text und Bild präsentiert bekamen. Die Personen in der einen Gruppe lasen immer zuerst den Text, bevor sie das Bild betrachten konnten. Die Studierenden der anderen Gruppe betrachteten immer zuerst das Bild und lasen dann den Text. Dabei konnten die Teil-nehmer selbständig bestimmen, wie lange sie auf den einzelnen HTML-Seite verweilen wollten. Somit gab es zwar keine Lernzeitbeschränkung, doch hatte sich die Versuchs-person entschieden, fortzufahren und den entsprechenden Vorwärtspfeil angeklickt, gab es kein Zurück mehr. Die Verarbeitungsreihenfolge war streng linear, so dass jeder Text und jedes Bild immer nur ein einziges Mal aufgerufen werden konnte.

Da das Lernmaterial rechnergestützt präsentiert wurde, stellte es kein großes Problem dar, die Lernzeit zu erheben. Zu diesem Zweck bot es sich an, die Verweildauer auf den

Seiten heranzuziehen, die sich aus der zeitlichen Differenz zwischen dem Aufruf und dem Verlassen der Seite bestimmen ließ. Hatten die Studierenden alle 8 HTML-Seiten betrachtet bzw. gelesen, erschien eine letzte Seite, die den Teilnehmenden dazu auffor-derte sich an den Versuchsleiter zu wenden. Dieser gab dann einen zweiten Fragebogen aus, der neben Items zur aktuellen Motivation (Abschnitt 5.2.4) und der kognitiven Belas-tung (Abschnitt 5.2.2) vor allem den Test enthielt, mit dem der Erfolg des Wissenserwebs evaluiert werden sollte (siehe Kapitel 5.2.1). Aufgrund der unreglementierten Lernzeit, beendeten die Versuchspersonen die experimentelle Phase nicht gleichzeitig, so dass die Instruktionen in der Regel jedem Teilnehmer einzeln gegeben werden mussten. Wäh-rend die Fragen zur aktuellen Motivation und der kognitiven Belastung keiner speziellen Anweisungen bedurften, wurden beim Lerntest erneut darum gebeten, die Antworten der multiple choice-Items möglichst nicht zu raten. Für die Bearbeitung des Abschlussfrage-bogens gab es keine zeitliche Beschränkungen, so dass die Teilnehmer alle Items ohne Druck beantworten konnten. Nachdem die Studierenden fertig waren, kamen sie einzeln zum Versuchsleiter und gaben den ausgefüllten Fragebogen ab. Zum Dank für ihre Teil-nahme erhielten sie dann entweder eine Bestätigung über 2 Versuchspersonenstunden oder aber 10,- C, womit die Testsitzung beendet war.

6.2.4 Statistische Auswertung

Die Prüfung der Forschungshypothesen erfolgte anhand von varianzanalytischen Verfah-ren, die mit der Software SPSS 17.0 durchgeführt wurden. Da inferenzstatistische Be-rechnungen immer nur unter bestimmten Bedingungen gültige Schlüsse zulassen, wur-den vor jeder Analyse zuerst die Voraussetzungen getestet. Dies betraf insbesondere die Annahme varianzhomogener Populationen und die Normalverteilung der abhängi-gen Variablen, was mit einem Test von (Levene, 1960) bzw. dem Kolmogorow-Smirnow-Anpassungstest überprüft wurde (vgl. Goodman, 1954). Vor der Verwendung multivariater Verfahren wurde zudem mit einem Verfahren nach Box (1949) getestet, ob die Kovarianz-matritzen zwischen den experimentellen Gruppen vergleichbar waren. Da der Box-Test gleichzeitig sehr sensibel auf die Verletzung der multivariaten Normalverteilung reagiert (Bortz, 1999), konnte bei einem nicht signifikanten Ergebnis auch diese Annahme als erfüllt gelten.

Allen Unterschiedshypothesen wurde ein Signifikanzniveau von α =.05 zugrundege-legt, wobei die Angaben zu den empirischen Wahrscheinlichkeitenpimmer einer zweisei-tigen Testung entsprechen. Manche Fragestellungen machten es jedoch erforderlich, sta-tistisch die Gültigkeit der Nullhypothese (H0) abzusichern. Solche Äquivalenztests erfor-derten jedoch ein besonderes Vorgehen, das teilweise von den Überlegungen der sonst üblichen Testprozedur abweicht. Während bei einernormalenTestung mit der Festlegung der Irrtumswahrscheinlichkeitα vor allem der Fehler erster Art kontrolliert wird, findet der β-Fehler oft nur nachträglich im Rahmen von (post-hoc) Poweranalysen Beachtung. Für die Prüfung der Gültigkeit derH0ist es jedoch zwingend erforderlich, die Wahrscheinlich-keit für einen β-Fehler abzusenken bzw. die Teststärke (1−β) zu steigern, da bei der

vorliegenden Fragestellung das Risiko einer fälschlichen Beibehaltung der Nullhypothese minimiert werden muss. Zur Kontrolle desβ-Fehlers gibt es mehrere Möglichkeiten (Diehl

& Arbinger, 1990), wobei die einfachste Methode darin besteht, das Signifikanzniveauα zu erhöhen. So empfehlen Bortz und Döring (2006) für die Testung von Äquivalenzan-nahmen einα von0.20, um die Teststärke auf ein vertretbares Niveau zu heben. Dieser Vorschlag wurde übernommen, wobei auch hier die Angaben zu den empirischen Wahr-scheinlichkeiten pimmer einer zweiseitigen Testung entsprachen.

Neben den üblichen Kennzahlen, wie den Prüfgrößen und den Freiheitsgraden, schien es angebracht zu sein, ein Maß für die praktische Bedeutsamkeit der gefundenen Zu-sammenhänge zu berichten. Um die Stärke der Effekte zu veranschaulichen, wurde η¯2 gewählt, da dessen Berechnung keine besonderen Voraussetzungen erfordert und relativ leicht zu interpretieren ist (vgl. Diehl & Arbinger, 1990).