• Keine Ergebnisse gefunden

5.3 Probabilistische Testtheorie

6.1.4 Konstruktvalidität

Bewerten, Entscheiden und Reflektieren und Schulalter

Tabelle 6.3:Mittelwerte hinsichtlich der WLE-Schätzer für Bewerten, Entscheiden und Reflektierenhinsichtlich der einzelnen Subgruppen. Die Mittelwerte sind auch in Abbildung 6.1 dargestellt.

Subgruppe Mittelwertθgem. Standardabweichung

Klasse 6 -0,81 0,87

Klasse 8 0,04 0,80

Klasse 10 0,31 0,76

Oberstufe 0,53 0,73

Gesamt 0,00 0,94

Die Ergebnisse der Datenanalyse zeigen einen eindeutigen Zusammenhang von Schulalter eindeutiger Zusammen-hang undBewerten, Entscheiden und Reflektieren. Zur Überprüfung auf signifikante Mittel-wertunterschiede in den einzelnen Altersklassen wurde eine einfaktorielle Varianzanalyse (ANOVA) mit geplanten Kontrasten (jeweils zwischen den Klassen 6 und 8, 8 und 10, 10 und Oberstufe) durchgeführt. Die Varianzen können über die Altersgruppen hinweg als ho-mogen angesehen werden1. Weitere paarweise Tests auf Varianzhomogenität zwischen den jeweils an den geplanten Kontrasten beteiligten Subgruppen unterstützen diese Aussage.

Wie in Tabelle6.4 ersichtlich, können für alle Kontraste signifikante Unterschiede in den jeweiligen Altersgruppen festgestellt werden: Schülerinnen und Schüler der jeweils höheren Altersgruppe erreichen signifikant bessere Ergebnisse als Schülerinnen und Schüler der jeweils niedrigeren Altersstufe.

Tabelle 6.4:Kontraste hinsichtlich des WLE-Schätzers fürBewerten, Entscheiden und Reflektierenin den verschiedenen Altersgruppen.

Kontrast Kontrastwerta Standardfehler Signifikanz

Klasse 6 zu 8 +0,84 0,08 p<.001

Klasse 8 zu 10 +0,28 0,07 p<.001

Klasse 10 zu Oberstufe +0,22 0,08 p=.005

aDifferenz der Mittelwerte in den jeweiligen Gruppen

Die ebenfalls durchgeführte Berechnung einer Korrelation2zwischen den Variablen „Schulal-ter“ und „WLE-Schätzer“ liefert eine alternative Angabe dieses Zusammenhangsr= 0,51**

1 Der Levene-Test ergibt F=1,27 bei df1=3 und df2=846 bei der gesamten Stichprobe und bleibt damit deutlich unter dem kritischen F-Wert von 2,61 für F(3,∞), ab dem von inhomogenen Varianzen auszugehen ist. Analoge Formulierung: Der Levene-Test wird nicht signifikant (p=0.28).

2 Spearman-Korrelation für ordinalskalierte Daten

80 6 Ergebnisse

Abbildung 6.1: Vergleich der Verteilungen fürBewerten, Entscheiden und Reflektieren innerhalb der verschiedenen Jahrgangsgruppen, die sich hinsichtlich ihres Mittelwerts signifi-kant unterscheiden (siehe Tabelle6.4).

und weist damit einen starken Einfluss (r2= 0,26) des Schulalters auf Bewerten, Entschei-den und Reflektieren aus.

Bewerten, Entscheiden und Reflektieren und Schulnoten

Zu den erhobenen Schulnoten für die Unterrichtsfächer Biologie, Deutsch, Englisch, Erd-Zusammenhang

mit manchen Schulnoten

kunde, Mathematik, Physik und Politik wurden Korrelationen zu Bewerten, Entscheiden und Reflektieren berechnet und damit Rückschlüsse auf die Konstruktvalidität des Testin-struments gezogen. Die Korrelationen wurden dabei sowohl einzeln für jeden Jahrgang als auch aggregiert für die Klassen 6 bis 10 berechnet. Die SubgruppeOberstufewurde in diese Korrelation nicht mit eingerechnet, da im Kurssystem der Oberstufe Wahleffekte auftreten können, wie man unter anderem an den unterschiedlichen Fallzahlen in Tabelle 6.5 sieht.

Das Unterrichtsfach Physik ist kein Pflichtfach mehr und es ist nicht auszuschließen, dass

6.1 Forschungsfrage I – Messbarkeit vonBewerten, Entscheiden und Reflektieren 81

es nur von interessierten Schülerinnen und Schülern angewählt wird. Zudem sind die Stundenanzahlen der Fächer nicht mehr miteinander zu vergleichen, da sie je nach Wahl der Schülerinnen und Schüler zwei- oder vierstündig unterrichtet werden.

Tabelle 6.5:Korrelationen vonBewerten, Entscheiden und Reflektierenmit ausgewählten Schulnoten.

Korrelationen von Bewerten, Entscheiden und Reflektieren mit ausgewählten Schulnoten

Klasse 6 Klasse 8 Klasse 10 Oberstufe Z(Klassen 6-10)a

Schulfach rb N rb N rb N rb N rb N

Biologie 0,24*** 189 0,18** 213 0,12 212 0,19* 147 0,21*** 614

Deutsch 0,09 199 0,29*** 221 0,26*** 216 0,10 169 0,28*** 636

Englisch 0,10 201 0,32*** 218 0,13 217 0,09 163 0,22*** 636

Erdkunde 0,17* 196 0,27*** 214 0,11 211 0,00 91 0,23*** 621

Mathematik 0,11 201 0,31*** 220 0,27*** 217 0,04 172 0,22*** 638

Physik 0,01 183 0,23** 217 0,14* 218 0,32** 95 0,15** 618

Politik 0,78 4 0,24 12 0,14* 212 0,09 156 0,16* 228

ajeweils jahrgangsweise z-standardisiert

bSpearman-Korrelation für Ordinalskalierung. Signifikanzniveaus: *α=0,05 **α=0,01 ***α=0,001

Die berechneten Korrelationen sind in Tabelle6.5zusammengestellt. Grundsätzlich sollten nur die signifikanten Korrelationen betrachtet und ausgewertet werden (gekennzeichnet durch mindestens ein Sternchen). Bei der Analyse der berechneten Zusammenhänge lässt sich feststellen, dass insgesamt nur geringe Korrelationen zu Schulnoten auftreten. Unter ihnen befinden sich die höchsten Korrelationen in der 8. Klasse, sie gehen in den höheren Jahrgängen wieder zurück. In der Klasse 10, die mit dem Sekundarabschluss I endet und somit hinsichtlich der entworfenen Bildungsstandards besonders interessant ist, sind nur Korrelationen zur Deutsch-, Mathematik-, Physik- und Politiknote signifikant. Für die Oberstufe sind höhere Korrelationen im Hinblick auf die Biologie- und Physiknote festzustellen, alle anderen Korrelationen fallen niedriger aus und sind damit auch nicht mehr signifikant.

Betrachtet man alle Klassen der Sekundarstufe I (Klasse 6 bis 10) aggregiert, so lassen sich aufgrund der höheren Fallzahlen wieder signifikante Korrelationen angeben (siehe Tabelle 6.5, rechts). Dazu wurden die Schulnoten jahrgangsweise z-standardisiert und mit den ebenfalls jahrgangsweise z-standardisierten WLE-Personenfähigkeiten korreliert, um den gegeneinander verschobenen Verteilungskurven in den verschiedenen Jahrgängen gerecht zu werden. Die Korrelationen zu allen Schulfächern werden signifikant und lassen sich damit untereinander vergleichen. Die größte Korrelation ergibt sich mitr = 0,28*** zur Deutschnote, die geringste Korrelation mitr= 0,15** zur Physiknote.

82 6 Ergebnisse

Zusammenhang von Bewerten, Entscheiden und Reflektieren mit Leseverständnis und -geschwindigkeit

Nicht unwichtig ist, inwieweit das gemessene Testergebnis durch Lesekompetenz beeinflusst wird. Um Bewerten, Entscheiden und Reflektierenim Hinblick auf Lesekompetenz abzu-grenzen, wurde diese begleitend mittels des Lesegeschwindigkeits- und -verständnistests (LGVT) (Schneider et al. 2007) erhoben. Die in diesem Test erzielten Rohpunkte der TeilskalenLesegeschwindigkeit undLeseverständnis der Probanden können mit dem Test-ergebnis für Bewerten, Entscheiden und Reflektieren in Beziehung gesetzt werden. Dabei wird das „Alter“ der Schülerinnen und Schüler (erhoben als Klassenstufe der Probanden) als Kontrollvariable durch die Verwendung einer partiellen Korrelation herausgerechnet (Zöfel 2003: S. 164ff), da dieses einen Zusammenhang mit Bewerten, Entscheiden und Reflektieren aufweist (siehe Kapitel6.1.4).

Für den Zusammenhang zwischen Lesegeschwindigkeit und Personenfähigkeit fürBewerten, Entscheiden und Reflektieren wurde eine (partielle) Korrelation von r <0,01 (p=0,90) gefunden. Der Zusammenhang zwischen Leseverständnis und Personenfähigkeit fällt mit einer (partiellen) Korrelation signifikant aus, ist aber mit r = 0,12*** immer noch sehr gering (siehe Tabelle 6.6).

Tabelle 6.6:Korrelationen von Bewerten, Entscheiden und Reflektierenmit Lesegeschwin-digkeit und Leseverständnis in den einzelnen Jahrgangsstufen.

Subgruppe Lesegeschwindigkeit Leseverständnis N

r p-Werta r p-Wert

Klasse 6 0,02 0,75 0,14 0,04 219

Klasse 8 -0,12 0,06 0,05 0,44 229

Klasse 10 0,06 0,39 0,12 0,09 222

Oberstufe 0,10 0,19 0,12 0,10 180

Gesamta <0,01 0,90 0,12 <0,001 850

ahier als partielle Korrelation unter der KontrollvariableSchulalter