Ergebnisse - Experiment 1: Eingreifen vs. Beobachten

4 Experimentelle Untersuchungen zum Einfluß von Systemmerkma-

4.1 Experiment 1: Eingreifen vs. Beobachten

4.1.2 Ergebnisse

Hypothesenprüfung. Wenn man das Pfadmodell aus Abb. 4.1 in die Sprache der Re-gressionsanalyse übersetzen will, um es einer statistischen Prüfung unterziehen zu können, müssen die bisher noch ungenau spezifizierten Effekte präziser formuliert werden.

Aus einer ersten Datenanalyse für N=20 Pbn ergab sich der Hinweis, daß die Ver-suchsdauer sich möglicherweise negativ auf GdS auswirkt. So wurde die Variable

“Zeit” als weiterer Prädiktor in das Pfadmodell aufgenommen. Die erhobenen Kon-trollvariablen (APM-Wert, PLF-Werte, Alter, Geschlecht und Vorerfahrung der Pbn) erbrachten im Zusammenhang mit der hier vorgestellten Pfadanalyse keine zusätzli-chen Aufschlüsse und bleiben daher im weiteren unerwähnt (vgl. dazu genauer MÜL -LER et al., 1987).

Die beiden unabhängigen Variablen Eingriffs- und Prognosebedingung wurden als Dummy-Variablen E und P kodiert. Das Systemwissen wurde mit der oben beschrie-benen Variablen GdK erfaßt. Da GdS-Werte Abweichungen von einem Optimalwert darstellen, wir jedoch von Güte-Maßen sprechen, wurden alle Werte von GdS für die statistische Auswertung mit negativen Vorzeichen versehen, so daß Abbildungen und Tabellen leichter verständlich werden. – Der Datensatz ist vollständig, so daß sich Probleme bei der Behandlung fehlender Werte von vornherein nicht stellten.

Ergebnisse der Pfadanalyse. Die numerischen Ergebnisse der Pfadanalyse sind in Tabelle 4.1 dargestellt. Im Unterschied zu früheren Auswertungen (z.B. FUNKE &

MÜLLER, 1988) werden hier wie auch nachfolgend die Ergebnisse für die gemäß Ka-pitel 3.4.6 revidierten GdK-Maße mitgeteilt. – In Abb. 4.2 sind die Ergebnisse der Pfadanalyse in grafischer Form veranschaulicht.

Wie aus der Ergebnisdarstellung hervorgeht, muß das hypothetisch angenommene Pfadmodell aus Abb. 4.1 angesichts der Befunde verworfen werden. Die nach dem Pfadmodell formulierte Hypothese (vgl. Abb. 4.1), wonach die Prognosebedingung einen positiven Effekt auf das Systemwissen hat, wurde nicht bestätigt: bezüglich GdK zeigt sich im Gegenteil ein starker negativer Effekt. Die Eingriffsbedingung er-weist sich nicht wie erwartet als signifikanter Prädiktor von GdK. Das Gewicht für die Wirkung der Bearbeitungszeit auf GdS wird nicht signifikant. Konform mit unseren Annahmen zeigt sich, daß GdK4 ein starker Prädiktor von GdK5 ist. Der standardi-sierte Pfadkoeffizient ß beträgt 0.81 und ist damit mit Abstand der höchste Gewich-tungsfaktor in unserem Modell. Weiter finden wir den für unser Experiment zentralen Eingriffseffekt auf GdS bestätigt. Auch das Regressionsgewicht für die Wirkung von GdK4 auf GdS ist hypothesenkonform deutlich positiv von 0 verschieden.

Damit finden wir unser hypothetisches Pfadmodell nicht bestätigt: auf GdK scheint das Treatment “Prognoseforderung” gegenüber unseren Erwartungen umgekehrt zu wirken. Wir werden in der Diskussion eine plausible Interpretation dieses überra-schenden Ergebnisses zu geben versuchen.

Der Vergleich experimenteller Zwillinge. Wie oben dargelegt realisierten wir unsere UV Eingriffsmöglichkeit so, daß zu jedem Eingreifer genau ein Beobachter existiert, also für jeden objektiven Systemverlauf der ersten vier Durchgänge zwei suchspersonen vorliegen, denen exakt gleiche Informationen über das System zur Ver-fügung standen. Für diese beiden Vpn verwenden wir den Begriff “Zwillinge”, so daß bei 32 Vpn 16 Zwillingspaare vorliegen. Wir gehen davon aus, daß der objektive Sy-stemverlauf und damit auch Eingriffsstrategien für den Wissenserwerb von Relevanz sind – eine Ansicht, die wohl von den meisten Autoren geteilt wird. Z.B. sollte es

ge-Prognose- bedingung

Eingriffs- bedingung

GdK GdS

0.54 -.47 0.29

GdK 0.81

Abb. 4.2: Ergebnisse der pfadanalytischen Auswertung von Experiment 1.

schickte und weniger geschickte, informationsträchtige und redundante Eingriffe ge-ben, es sollte schwer zu analysierende Systemverläufe – z.B. bei zufälligen Eingriffen – und leicht zu analysierende Systemverläufe geben.

Da die Zwillinge nun während der ersten vier Durchgänge genau die gleiche Se-quenz von Eingriffen und Systemzuständen als Informationsgrundlage besaßen, verfügen wir in unserem Experiment über einen direkten Weg, die Annahme zu überprüfen, daß Strategien einen Einfluß auf den Wissenserwerb haben: Wir können Zwillinge mit Nicht-Zwillingen hinsichtlich verschiedener Maße vergleichen und erwarten, daß sich die Zwillinge ähnlicher sind als die Nicht-Zwillinge, da sie auf einer identischen Sequenz von Eingriffen und Zuständen beruhen.

Eine zunächst naheliegende Möglichkeit des Vergleichs besteht darin, die Korrela-tion zwischen den oben bereits verwendeten drei Güte-Maßen GdV, GdK und GdS unter den Zwillingen zu berechnen, wobei wir annehmen, daß ein gutes Kausal-diagramm des Eingreifers ein gutes KausalKausal-diagramm des Beobachters nach sich ziehen sollte und das Analoge für GdV und GdS gilt. Da bei diesem Vergleich Werte innerhalb eines Zwillingspaares verglichen werden, schrumpft unser N auf 16 Zwillingspaare bei 32 Pbn. Wir errechneten die in Tabelle 4.2 wiedergegebenen Korrelationen.

Von den Korrelationen in Tabelle 4.2 ist lediglich die Korrelation zwischen GdK des Eingreifers und GdS des Beobachters auf dem 10%-Niveau signifikant. Da wir vorher keine entsprechende Hypothese formuliert hatten und es bei neun berechneten Korre-lationen und einem α-Risiko von 0.10 recht wahrscheinlich ist, daß eine dieser Korre-lationen “zufällig” signifikant wird, wird auf eine Interpretation dieses Befundes ver-zichtet.

Bezüglich unserer vorher formulierten drei Hypothesen, wonach die Diagonalele-mente in Tabelle 4.2 signifikant positiv von 0 verschieden sein sollten, können wir zunächst festhalten, daß die entsprechenden Korrelationen nicht signifikant sind; an-dererseits sind sie nicht klein genug, um die H0 annehmen zu können, die besagen würde, daß diese Korrelationen in der Population 0 betragen. Immerhin sind alle drei Korrelationen positiv und haben damit das erwartete Vorzeichen. Insbesondere die Korrelationen von 0.26 zwischen GdS des Eingreifers und GdS des Beobachters könnte durchaus “substantiell” sein und nur wegen des kleinen N nicht signifikant werden. So liefert uns die durchgeführte Korrelationsanalyse wenig befriedigende Tabelle 4.2: Korrelationen der Güte-Maße GdV, GdK und GdS zwischen den experimentellen Zwillingen (N=16 Pbn-Paare von jeweils einem Eingreifer und dem zugehörigen Beobachter).

Gütemaß des Beobachters

GdV GdK GdS

Gütemaß GdV 0.24 0.03 0.01

des GdK 0.21 0.10 0.46*

Eingreifers GdS 0.02 0.35 0.26

* p

Resultate: mit Hilfe dieser Methode kann weder für noch gegen Ähnlichkeit zwischen den Zwillingen entschieden werden.

Aufgrund dieser Überlegungen führten wir eine Reihe von weiteren statistischen Analysen durch, in denen wir prüften, ob die Kausaldiagramme in ihrer Struktur bei Zwillingspaaren ähnlicher ausfallen als bei anderen Paarungen. Die genaue Beschrei-bung unseres Vorgehens würde an dieser Stelle zu viel Platz einnehmen, so daß wir hier nur darauf verweisen möchten, daß auch diese Analysen keinen Beleg für eine

“Zwillings-Ähnlichkeit” erbrachten (vgl. dazu genauer MÜLLER et al., 1987).

Analyse des Wissenserwerbs auf verschiedenen Stufen. Der aufmerksame Leser wird sich fragen, warum im Verlauf der bisherigen Analysen nur das Gesamtmaß für die Güte des Strukturwissens (GdKsum) berücksichtigt wurde, nicht aber die Teilkomponenten GdKrel, GdKvor und GdKnum, die in Kapitel 3.4.6 dargestellt wurden. Wir haben jede der Teilkomponenten isoliert in die oben durchgeführten Tabelle 4.3: Korrelation der drei drei Komponenten untereinander und mit dem

Summenmaß (Daten aus Experiment 1, N=32).

Correlation Matrix for Variables:

1 .672 1

.672 .809 1

.836 .913 .946 1

rel vor num sum

0 .05 .1 .15 .2 .25 .3 .35 .4 .45

1 2 3 4 5

Durchgang Exp. 1: Wissenserwerb Relationen

GdKrel

Abb. 4.3: Wissenserwerb auf Relationsebene über fünf Durchgänge (N=160 Kausaldiagramme aus Experiment 1).

Regressionsanalysen eingesetzt und in keinem Fall signifikante Ergebnisse erhalten.

Ein solcher Befund hätte auch gegen die Verwendung des summarischen Maßes gesprochen: wenn eine oder mehrere Teilkomponenten den gleichen oder einen annähernden Prädiktionswert besitzen, wäre die Verwendung eines mehrstufigen Maßes sachlogisch nicht gerechtfertigt. Tabelle 4.3 zeigt die Pearson-Korrelationen der drei Komponenten untereinander sowie mit dem Summenmaß.

Um den Verlauf des Wissenserwerbs wenigstens exemplarisch zu belegen, wird in den drei Abb. 4.3, 4.4 und 4.5 der Zuwachs der drei Teilkomponenten über den Ver-lauf von fünf Durchgängen aus Experiment 1 gezeigt.

-.05 0 .05

.1 .15

.2 .25

.3 .35

.4 Exp. 1: Wissenserwerb Vorzeichen

1 2 3 4

Durchgang

GdKvor

Abb. 4.4: Wissenserwerb auf Vorzeichenebene über fünf Durch-gänge (N=160 Kausaldiagramme aus Experiment 1).

Abb. 4.5: Wissenserwerb auf Numerikebene über fünf Durchgänge (N=160 Kau-saldiagramme aus Experiment 1).

0 .1 .2 .3 .4 .5

.6 Exp. 1: Wissenserwerb Numerik

1 2 3 4

Durchgang

GdKnum

Auf allen drei Ebenen findet ein allmählicher Zuwachs statt, der jedoch mit hohen Streuungen einhergeht (vgl. die in den Abb. 4.3 bis 4.5 eingezeichneten senkrechten Linien). Solange es um die generellen Fragen der Auswirkungen experimenteller Treatments auf die Güte des Wissenserwerbs geht, scheint daher die Verwendung des summarischen GdK-Maßes (aus dem vierten bzw. fünften Durchgang) sinnvoll zu sein.

Im Dokument Wissen über dynamische Systeme. Erwerb, Repräsentation und Anwendung (Seite 108-113)