• Keine Ergebnisse gefunden

Diskussion der bisherigen Resultate

Im Dokument Verständnis für fremde Kulturen (Seite 91-95)

Treatment- gruppe

7. Diskussion der bisherigen Resultate

Vor einer zusammenfassenden Diskussion der bisherigen Ergebnisse muss zunächst auf zwei bisher ausgeklammerte Probleme eingegangen werden.

7.1. Das Problem der Unabhängigkeit der Probanden

Angesichts des Erhebungsschemas kann nicht von der für den t-Test erforderlichen Unabhängigkeit der einzelnen Versuchspersonen ausgegangen werden. Zumindest auf Klassenebene scheinen die Antworten stark „verklumpt“ zu sein. Angesichts dieser positiven Abhängigkeit dürfte die für die obigen Tests benutzte Stichprobengröße zu hoch angesetzt sein. Es ist allerdings nicht leicht, hier Korrekturen anzubringen. Da die gefundenen Effekte aber allesamt sehr deutlich ausfallen, kann man die Antworten auf Klassenebene nochmals durch Mittelwertbildung zusammenfassen. D.h., man geht von den in Tabelle 6 aufgelisteten Mittelwerten als Ausgangsdaten aus. Die Untersuchungseinheiten sind dann nicht die einzelnen Probanden, sondern die Schulklassen. Der Effekt „Schule“ stellt kein Problem mehr dar, da er als Klasseneffekt gerade im Zufallsfehler aufgeht. Für diese Ausgangsdaten ist Unabhängigkeit einigermaßen plausibel. Auch die Normalverteilungsannahme erscheint unproblematisch. Zugleich ist die inhaltliche Interpretation des Versuchs einleuchtend: Der Gesamtwert für die Klasse soll abgesenkt werden.

Die folgende Tabelle fasst die zu den obigen Testes parallelen Rechnungen für die, aggregierten Daten zusammen:

Test p-Wert für t-Test p-Wert für Wilcoxon-Test Konfidenzintervall Längsschnittvergleich (Treat)

Auch auf dieser Ebene - und somit unbeeinträchtigt von Bedenken hinsichtlich der Unabhängigkeit der Einzelpersonen - ergeben sich also im Wesentlichen die gleichen Resultate. Hinsichtlich der Folgerungen bzgl. Signifikanz (oder Nichtsignifikanz) kann man sich auf den jeweils vorsichtigeren der beiden Ansätze berufen.

7.2. Das Problem des multiplen Testens

Einige der bereits durchgeführten Tests gehen davon aus, dass es sich um unabhängige Stichproben handelt, wie zum Beispiel die erwähnten Längsschnittvergleiche zu den unterschiedlichen Zeitpunkten. Andere Tests benutzen jedoch ganz oder teilweise dieselben Stichproben und sind insofern abhängig. Trotzdem erscheint es sinnvoll und richtig, die nominalen p-Werte (vgl. oben) anzugeben. Dies geschieht auch im Sinne eines mehr deskriptiven Verständnisses bzw. unterschiedlicher Testinteressen. Bei den sehr deutlichen Ergebnissen lässt sich leicht eine Bonferoni-Korrektur vornehmen. Ein Blick auf die oben angegebenen Werte lässt jedoch leicht erkennen, dass sich an den inhaltlichen Schlussfolgerungen dadurch nichts ändert.

7.3. Bisherige Schlussfolgerungen

Die Resultate der bisherigen Untersuchungen lassen sich sehr anschaulich in einem Profildiagramm darstellen:

Abbildung 12: Querschnittvergleiche der Mittelwerte zum Zeitpunkt t1 und t2 (korrigierte Mittelwerte)

Aus diesem Diagramm erkennt man in Verbindung mit den Abschnitten II.4. bis II.6. und unter Beachtung der oben angesprochenen Probleme folgende Phänomene:

- Zu Beginn der Untersuchung lassen sich keine Unterschiede zwischen der Treatmentgruppe und der Kontrollgruppe nachweisen.

- Die Treatmentgruppe weist am Ende einen signifikant niedrigeren Wert auf; die Kontrollgruppe hingegen einen signifikant höheren Wert als zu Beginn.

- Am Ende der Untersuchung unterscheiden sich Treatmentgruppe und Kontrollgruppe signifikant.

- Die Veränderungen in der Treatment- und Kontrollgruppe sind signifikant voneinander verschieden.

Diese Beobachtungen kann man auch in der Ausgangtabelle 5 und der Abbildung 12 illustriert finden. Folgende Schlüsse lassen sich daraus ziehen:

- Eine Absenkung der Werte durch die Unterrichtsreihe ist somit sowohl im Longitudinalvergleich als auch im Vergleich mit der Kontrollgruppe eindeutig nachgewiesen.

Die Unterrichtsreihe hat also mit Blick auf die gemessene Größe die intendierte Wirkung. Es muss offen bleiben, inwieweit es sich hierbei um eine tatsächliche Persönlichkeitsbildung bzw. Einstellungsänderung oder um ein geändertes Antwortverhalten handelt.

Normalerweise kann davon ausgegangen werden, dass sich eine tatsächliche Persönlichkeitsbildung erst nach mehrmaligem Wiederholen einstellt, bzw. von mehreren Faktoren abhängig ist. Auch kann nicht davon ausgegangen werden, dass sich, bezugnehmend auf TRIANDIS (1975), die Verhaltenskomponente geändert hat. Dies konnte im Rahmen dieser Untersuchung nicht überprüft werden. Es ist zudem sinnvoll zu untersuchen, welche Aspekte des Unterrichts besonderen Einfluss auf die Änderung hatten.

Dies soll im nächsten Kapitel anhand der Betrachtung der einzelnen Items und in Zusammenhang mit den schriftlichen Kommentaren zum Unterricht und den aufgezeichneten Gesprächen mit Schülern und Lehrern nach dem Unterricht erfolgen.

- Auch im Zeitverlauf ändern sich die Antwortwerte signifikant, was in der Treatmentgruppe durchaus erwünscht war, in der Kontrollgruppe jedoch nicht erwartet war. Anhand der Daten lässt sich jedoch nicht klären, ob es sich dabei um eher zufällige Schwankungen oder eher feste (alle betreffende) Grundströmungen handelt. Im ersteren Fall wäre die Steigung in der Kontrollgruppe vielleicht nur zufällig. Das heißt, die Antworten in der Kontrollgruppe wären nicht „schlechter“ geworden. Geht man allerdings davon aus, dass bei vielen der Items eine von der Gesellschaft erwartete Antwort gegeben werden kann, so könnte man vielleicht unterstellen, dass diese Antworten beim ersten Mal dahingehend noch stärker geprüft worden sind, während sie beim zweiten Mal schneller und auch ehrlicher ausgefüllt worden sind. So gesehen müsste also auch beim Zeitpunkt t1 von vornherein ein höherer Wert gelten. Da man davon ausgehen kann, dass dies dann auch bei der Treatmentgruppe der Fall ist, wäre der Treatmenteffekt sogar noch größer.

Setzt man aber voraus, die Steigerung innerhalb der Kontrollgruppe ist nicht zufällig, sondern ist als gegenläufige Grundströmung zu interpretieren, so wäre hier der Treatmenteffekt stärker ausgefallen als im einfachen „vorher“ - „nachher“ - Vergleich, weil eben durch das Treatment zugleich noch die gegenläufige Grundströmung kompensiert worden wäre.

Im Dokument Verständnis für fremde Kulturen (Seite 91-95)