• Keine Ergebnisse gefunden

Die Auswertung untergliedert sich in zwei Abschnitte. Zunächst werden die Einflüsse der oben beschriebenen Variablen auf die Ergebnisse im Test un-tersucht, anschließend wird unun-tersucht, welchen Einfluss die Variablen und zusätzlich das Testergebnis auf Klausurergebnisse nach dem ersten Semester besitzen.

Für die Auswertungen der Testergebnisse werden die Mittelwerte der ver-schiedenen Gruppen mit Hilfe von Varianzanalysen (ANOVA) und linearen Regressionen (Backhaus, Erichson, Plinke & Weiber, 2015) untersucht. Im Fall von nur zwei Ausprägungen der unabhängigen Variablen geht diese in einen t-Test über und die Ergebnisse werden in diesem Rahmen berichtet.

Die Auswertungen der Klausuren orientiert sich an einer Untersuchung zu

5Die weitere Möglichkeit, die "Differential- und Integralrechnung 1" über das Sommer-studium zu besuchen, wird nicht berücksichtigt.

Klausurergebnissen in Physik (Sorge et al., 2016).

Varianzanalysen besitzen als Voraussetzung eine Normalverteilung der Mess-werte in den untersuchten Gruppen. Allerdings haben sich Varianzanalysen als sehr robust gegenüber, auch starken, Verletzungen (Schmider, Ziegler, Danay, Beyer & Bühner, 2010) erwiesen. In Bezug auf die verwendeten Teil-tests ist die Normalverteilungsannahme der Varianzanalyse nicht immer ge-geben, diese werden allerdings dennoch aufgrund der Robustheit dennoch durchgeführt. Die Verwendung von nichtparametrischen Alternativen ginge mit einem Verlust an Teststärke einher.

Die zweite Voraussetzung der Varianzhomogenität wird mit Hilfe des Levene-Test überprüft. Da bei ungleich besetzten Gruppengrößen die Varianzanalyse nicht robust gegenüber dieser Verletzung ist, wird bei einer Verletzung die-ser Annahmen als Alternative zur regulären ANOVA ein Welch-Test (Welch, 1947) berechnet, welcher die Varianzhomogenität nicht als Voraussetzung be-sitzt6.

Für die Post-hoc-Gruppenvergleiche bei einem signifikanten Einfluss eines Prädiktors werde für die paarweisen Gruppenvergleiche Korrekturen der Feh-ler 1. Art nach Hochberg (Benjamini & Hochberg, 1995) durchgeführt. Diese Korrekturen ergeben eine höhere Teststärke als oft verwendete Korrekturen nach Bonferroni, die als sehr konservativ einzuschätzen sind. Entsprechend werden bei signifikanter Varianzheterogenität Post-Hoc-Tests nach Games-Howell verwendet (Ruxton & Beauchamp, 2008).

Für die gemeinsame Betrachtung von Variableneinflüssen werden gemeinsa-me gemeinsa-mehrfaktorielle Varianzanalysen für die gegenseitige Kontrolle der ver-schiedenen Einflussfaktoren durchgeführt. Dabei werden in Analysen mit al-len Einflussvariabal-len nur Haupteffekte betrachtet. In Fälal-len mit nur zwei der Einflussvariablen hingegen werden auch die Interaktionseffekte erster Ord-nung betrachtet.

Als Maß der Effektstärke der einzelnen Varianzanalysen wird globalη2 ver-wendet (Cohen, 1973), welches sich als erklärter Varianzanteil interpretieren lässt. Für den Einfluss der verschiedenen Variablen in einer gemeinsamen Analyse werden partielleη2 angegeben (Levine & Hullett, 2002).

Für die Post-hoc-Gruppenvergleiche dient Cohensdals Maß der Effektstärke und der Einfluss wird nach Cohens Klassifikation (Cohen, 1992) berichtet.

Aufgrund der unbalancierten Gruppengrößen wird als Schätzer für die Vari-anz die gepoolte VariVari-anz (Hartung, Knapp & Sinha, 2011) verwendet. Für die Einschätzungen der Effektstärke ist zu beachten, dass aus empirischer Sicht diese Klassifikation sehr streng ist (Gignac & Szodorai, 2016; Hem-phill, 2003) und in wenigen Fällen außerhalb von Experimentaldesigns hohe Effektstärken festgestellt werden entsprechend werden die Effektstärken in

6Da bei Verwendung der Welch-Tests nicht-ganzzahlige Freiheitsgrade auftreten, wer-den bei Verteilungen mit zwei Parametern diese durchgängig durch Semikola getrennt, und so von den Dezimalzahlen unterschieden.

der Diskussion eingeordnet.

Werden auch metrische Variablen als Prädiktoren in den Analysen verwen-det, werden zunächst die bivariaten Korrelationen berechnet. Anschließend werden unter Verwendung, sowohl der metrischen als auch der nicht me-trischen, Variablen gleichzeitig, multiple lineare Regressionen (Backhaus et al., 2015) durchgeführt. Dabei werden die nichtmetrischen Variablen jeweils durch einzelne Dummy-Variablen ersetzt. Entsprechend der Reihenfolge in Abschnitt 5.5 werden die jeweils ersten Kategorien als Referenzkategorien verwendet. Die Aufnahme der Prädiktorvariablen in das Regressionsmodell geschieht dabei schrittweise.

Das Bestimmtheitsmaß R2 als Verallgemeinerung des Korrelationsquadrats für die linearen Regressionen dient der Beschreibung der Modellgüten der linearen Regressionen und lässt sich wiederum als aufgeklärte Varianz des Modells interpretieren. Auch hier werden Stärken nach Cohen berichtet.

Für die Betrachtung der dichotomen Variable des Klausurbestehens werden logistische Regressionen durchgeführt. Auch hier werden die Prädiktorva-riablen schrittweise hinzugefügt. Für die Güte werden hier Mc Faddens R2 berichtet (Menard, 2000), sowie die Anzahl der korrekt zugeordneten Fälle durch das Regressionsmodell. Für den Vergleich nicht-geschachtelter Modelle dient weiterhin das Informationskriterium AIC (Akaike, 1998). Die Bedeu-tung der einzelnen Prädiktorvariablen wird aufgrund der unstandardisierten Koeffizienten berichtet.

Im Umgang mit fehlenden Werten werden jeweils die Personen ausgeschlos-sen, sodass die einzelnen Untersuchungen sich jeweils auf verschiedene Grup-pengrößen beziehen.

6 Deskriptive Beschreibung der Stichprobe

Die gesamte Stichprobe besteht aus N = 1014 Teilnehmenden, davon sind NStud= 890Studienanfängerinnen und -anfänger sowieNSuS = 124 Schüler-innen und Schüler. Die Studierenden verteilen sich auf vier Jahrgänge, wäh-rend die Schülerinnen und Schüler zu einem Zeitpunkt erhoben wurden und von acht verschiedenen Schulen jeweils aus einem Kurs mit erhöhtem An-forderungsniveau stammen. Zu den Schülerinnen und Schülern wurden keine weiteren Hintergrundvariablen erhoben. Im Folgenden werden nun die erho-benen Daten für die Studierenden im Bezug auf die verschiedenen Variablen, welche als unabhängige Variablen für die Analysen verwendet werden, be-schrieben. Als Erstes werden der Anteil der Stichproben an allen Studieren-den der untersuchten Studiengänge sowie die Verteilung auf die Jahrgänge dargestellt.

6.1 Einordnung in die Gesamtanfängerzahlen

Im Folgenden soll die erhobene Stichprobe im Propädeutikum in das Ver-hältnis zu allen Studienanfängerinnen und -anfängern gesetzt werden. Die Anzahl der Anfängerinnen und Anfänger sowie der Anteil der Stichprobe für jeden Studiengang sind in Tabelle 3 dargestellt (Georg-August-Universität Göttingen, 2018).

Anfangsjahr Mathematik Physik ang. Informatik LA Mathe

2013 69 186 75 72

39,1 % 53,2 % 38,7 % 45,8 %

2014 84 195 102 110

35,7% 50,3 % 34,3 % 28,2 %

2015 115 193 164 107

33,0% 49,7 % 34,1 % 35,5 %

2016 126 158 165 94

46,0% 43,7 % 21,2 % 33,0 %

Σ 394 732 506 383

38,8 % 49,5 % 30,6 % 34,7 %

Tabelle 3: Anteil der Propädeutikumsteilnehmenden an allen Studienanfän-gerinnen und -anfängern nach Studiengang

Insgesamt erfasst die erhobene Stichprobe ungefähr 30 % bis 50 % aller Stu-dienanfängerinnen und Anfänger. Dieser Anteil unterscheidet sich zwischen den vier Studiengängen deutlich. Ebenso ergeben sich zwischen den Erhe-bungsjahren deutliche Unterschiede für die einzelnen Studiengänge. Dabei ergibt sich bei den Schwankungen über die Jahre kein einheitliches Bild zwi-schen den Studiengängen.