• Keine Ergebnisse gefunden

3.2 U NTERSUCHUNGSABLAUF UND V ERFAHREN

3.2.2 Internalisierung von Verhaltensregeln

In dem folgenden Abschnitt wird zunächst das Verfahren zur Erfassung der Internali-sierung von Verhaltensregeln, der My Child-Fragebogen (Kochanska et al., 1994), be-schrieben. Daraufhin folgt die Darstellung der Datenaufbereitung (d. h. Analyse fehlender Werte). Schließlich werden die Ergebnisse der Reliabilitätsanalysen sowie der durchge-führten Faktorenanalysen zur Prüfung der psychometerischen Äquivalenz der Skalen be-richtet.

Skalen des My Child-Fragebogens

Zu Erhebung der Internalisierung von Verhaltensregeln der Kinder beantworteten die Mütter Items aus dem Fragebogen Maternal Reports of Conscience Development (Kochanska et al., 1994; auch My Child-Fragebogen, siehe z. B. Thompson et al., 2006).

Der My Child-Fragebogen enthält Aussagen über das Verhalten von Kindern in alltägli-chen Situationen. In seiner ursprünglialltägli-chen Fassung umfasst das Verfahren 100 Items, die sich auf Basis faktorenanalytischer Untersuchung zu zwei Hauptdimensionen zusammen-fassen lassen, affective discomfort und active moral regulation. Diese beiden Faktoren bil-den eine emotionale Komponente und eine Verhaltenskomponente moralischen Handelns im Vorschulalter ab (z. B. Kochanska & Aksan, 2006; Kochanska et al., 1994; vgl. auch

Abschnitt 2.2.2). Die affektive Komponente (d. h. affective discomfort) erfasst in erster Linie, inwieweit ein Kind moralische Emotionen (z. B. Schuld) in Bezug auf das eigene Fehlverhalten zum Ausdruck bringt. Die Verhaltenskomponente (d. h. active moral regula-tion) bildet dagegen ab, inwieweit ein Kind Verhaltensregeln internalisiert hat und die Be-reitschaft und Fähigkeit zeigt, diese in Abwesenheit von Bezugspersonen zu befolgen.

In der vorliegenden Studie haben die Mütter auf einer 7-stufigen Likert-Skala (von 1 = sehr unzutreffend bis 7 = sehr zutreffend) das Verhalten ihrer Kinder zur Erfassung der Internalisierung von Verhaltensregeln beurteilt. Hierzu schätzten die Mütter das Verhalten ihrer Kinder anhand der Items der vier Skalen Internalisierte Verhaltenssteuerung (Internalized Conduct), Betroffenheit aufgrund des Fehlverhaltens anderer Personen (Concern/Corrections Occasioned by Others’ Transgressions), Schuldeingeständnis (Confession) und Wiedergutmachung (Reparation) des My Child-Fragebogens ein. Die Skala Verhaltenssteuerung erfasst die Bereitschaft und Fähigkeit eines Kindes, eigenstän-dig (d. h. in Abwesenheit von Bezugspersonen) soziale Verhaltensregeln einzuhalten (20 Items, z. B. „Mein Kind wiederholt selten ein vorher verbotenes Verhalten, selbst wenn keine Erwachsenen anwesend sind.“). Die Skala Betroffenheit bezieht sich auf Reaktionen eines Kindes, wenn es ein Fehlverhalten anderer Personen bemerkt (7 Items, z. B. „Mein Kind regt sich auf, wenn ein Gast eine Hausregel bricht.“). Die Bereitschaft und Fähigkeit eines Kindes, eigenes Fehlverhalten freiwillig zuzugeben wird durch die Items der Skala Schuldeingeständnis erfasst (7 Items, z. B. „Mein Kind wird spontan seine Schuld oder ein Fehlverhalten zugeben.“). Die Skala Wiedergutmachung beschreibt Verhaltensweisen ei-nes Kindes, die darauf abzielen, das eigene Fehlverhalten wieder gut zu machen (9 Items, z. B. „Mein Kind möchte es unbedingt wieder gut machen, wenn es unartig war.“).

Kochanska et al. (1994, Studie 1) berichteten in ihrer Studie, die mit 171 Müttern und ihren Kindern im Alter zwischen 2 und 6 Jahren durchgeführt wurde, dass die vier Skalen auf einem Faktor luden (Hauptkomponentenanalyse mit Varimax-Rotation), der inhaltlich als active moral regulation interpretiert wurde. Reliabilitätsanalysen ergaben in der Studie von Kochanska et al. Werte für Cronbachs Alpha, die zwischen .69 für die Skala Schuld-eingeständnis und .90 für die Skala Internalisierte Verhaltensteuerung lagen. Zur Verbes-serung der Reliabilität wurden zusätzliche Items in den Fragebogen aufgenommen und die Reliabilität an einer weiteren Stichprobe von 102 Müttern mit Kindern im Alter von 2 bis 4 Jahren erneut geprüft. Für die in der vorliegenden Untersuchung verwendeten Skalen be-richteten Kochanska et al. (1994, Studie 2) Werte für Cronbachs Alpha in Höhe von .86 für die Skala Internalisierte Verhaltenssteuerung, .86 für Betroffenheit, .74 für

Schuldeinge-ständnis und .78 für Wiedergutmachung. Weiterführende Analysen ergaben moderate aber signifikante Korrelationen (zwischen .30 und .35) zwischen der Einschätzung des Verhal-tens der Kinder durch die Mütter mit dem My Child-Fragebogen (d. h. Skalen des Faktors active moral regulation) und mittels Verhaltensbeobachtung im Labor erfassten Bereit-schaft und Fähigkeit zur Verhaltenssteuerung der Kinder (Kochanska et al., 1994, Studie 2).

Analyse fehlender Werte

Fehlende Werte in den Fragebogendaten wurden auf Basis einer sogenannten EM Schätzung ersetzt. Hierbei handelt sich um ein iteratives Verfahren, das auf dem EM-Algorithmus basiert. Dieses Verfahren beinhaltet ein schrittweises Vorgehen bei dem die Schätzung von fehlenden Werten durch eine näherungsweise Bestimmung der Parameter optimiert wird. In einem ersten Schritt (Expectation Step oder E-Step) werden Erwar-tungswerte für die fehlenden Werte aufgrund der beobachteten Verteilung berechnet. In einem zweiten Schritt (Maximization Step oder M-Step) erfolgt eine Schätzung der fehlen-den Werte mittels Maximum-Likelihood-Methode auf Basis der im ersten Schritt aufge-füllten Verteilung (Graham, 2009). Diese beiden Schritte werden so oft wiederholt bis kei-ne bedeutsamen Veränderungen in den geschätzten Parametern auftreten. Hierzu wurde die Funktion EM des Moduls Missing Value Analysis (MVA) des Programms PASW®

Statistics 18 verwendet (siehe Graham, 2012).

Ergebnisse der Reliabilitäts- und Faktorenanalysen sowie der Äquivalenzprüfung Zur Prüfung der internen Konsistenz der Skalen wurde zunächst Cronbachs Alpha für die Stichproben der vorliegenden Arbeit berechnet. Die Ergebnisse der Reliabilitätsanaly-sen der vier Skalen sind für die deutsche und indische Stichprobe in Tabelle 2 zusammen-gefasst. In der deutschen Stichprobe wiesen alle Skalen zufriedenstellende bis ausreichen-de Reliabilitäten auf, die zwischen .74 für die Skala Wieausreichen-dergutmachung und .86 für die Skala Verhaltenssteuerung lagen. Die Skala Verhaltenssteuerung erreichte in beiden Kul-turen ausreichende Reliabilitäten über .70. Hingegen lagen die Reliabilitäten für die Skalen Schuldeingeständnis, Wiedergutmachung und Betroffenheit in der indischen Stichprobe zwischen .27 und .47.

Tabelle 2 Psychometrische Charakteristika des My Child-Fragebogens in Deutschland und Indien

Anmerkung. aFür eine Übersicht der Items siehe Anhang Tabelle A-1. bZwei Items gelöscht. cEin Item ge-löscht. d Keine Items gelöscht, da Cronbachs Alpha zufriedenstellende Werte erzielte. eF-Statistik für die Nullhypothese, dass die Koeffizienten für Cronbachs Alpha in der deutschen und indischen Stichprobe gleich groß sind. F =

vgl. van de Vijver & Leung, 1997a, S. 60.

In der Literatur berichtete Faktorenanalysen (z. B. Kochanska et al., 1994) wurden bisher ausschließlich auf Skalenebene durchgeführt. Explorative Faktorenanalysen ergaben in diesen Studien, dass die Skalenmittelwerte der theoretisch angenommenen Dimensionen internalisierte Verhaltenssteuerung, Betroffenheit, Schuldeingeständnis und Wiedergutma-chung auf einem Faktor luden, den die Autoren inhaltlich als Verhaltenskomponente der Internalisierung von Verhaltensregeln interpretierten (active moral regulation; Kochanska et al., 1994).

Zur Prüfung der kulturübergreifenden Äquivalenz der Faktorenstruktur wurde in der vorliegenden Arbeit eine so genannte Target Rotation durchgeführt. Hierzu wurden zu-nächst explorative Faktorenanalysen (Hauptkomponentenanalysen mit Varimax-Rotation) separat für die deutsche und die indische Stichprobe auf Itemebene unter Vorgabe von vier Faktoren durchgeführt. Die Matrizen der Faktorenladungen wurden schließlich jeweils aufeinander rotiert, um die Übereinstimmung zwischen den Gruppen zu optimieren. Zur Beurteilung der Äquivalenz der Faktorenstrukturen wurde ein Proportionalitätskoeffizient (d. h. Tucker’s Phi) berechnet. In der Literatur werden unterschiedliche Grenzwerte zur Beurteilung der Äquivalenz genannt (siehe Lorenzo-Seva & ten Berge, 2006). Nach van de Vijver und Leung (1997a, b) deuten zum Beispiel Werte kleiner als .90 darauf hin, dass die Faktorenstrukturen nur eine unzureichende Übereinstimmung zwischen den Gruppen

auf-weisen. Bei Werten über .95 kann hingegen von einer kulturübergreifenden Äquivalenz der Faktorenstruktur ausgegangen werden. Lorenzo-Seva und ten Berge (2006) schlagen für die Interpretation von Tucker’s Phi vor, dass eine ausreichende Ähnlichkeit zwischen zwei Faktoren angenommen werden kann, wenn die Werte im Bereich zwischen .85 und .94 liegen. Bei Werten höher als .95 kann die Äquivalenz zweier Faktoren als gegeben ange-nommen werden. Zur Durchführung der Target Rotation und Berechnung des Proportiona-litätskoeffizienten (d. h. Tucker’s Phi) wurde der SPSS-Syntax von van de Vijver und Le-ung (1997a) verwendet.

Getrennte Faktorenanalysen, die für alle 43 Items des My Child-Fragebogens durchge-führt wurden, ergaben Werte für Tucker’s Phi in Höhe von .62, .50, .69 und .42. Aufgrund der niedrigen Werte für Tucker’s Phi (< .85) muss angenommen werden, dass die mehrdi-mensionale Faktorenstruktur für die deutsche und indische Stichprobe nicht äquivalent war. In der deutschen Stichprobe luden auf dem ersten Faktor in erster Linie Items der Di-mension Betroffenheit. Die Faktoren 2 und 3 wiesen überwiegend hohe Ladungen der Items auf, die konzeptuell der Dimension internalisierte Verhaltenssteuerng zuzuordnen waren. Auf Faktor 2 waren dies vor allem Items, die das Einhalten von Verboten zum In-halt hatten (z. B. „Mein Kind wiederholt selten ein vorher verbotenes VerIn-halten“). Auf Faktor 3 luden vor allem Items, die das Erledigen von Aufgaben thematisierten (z. B.

„Mein Kind erledigt eine lästige Aufgabe ohne weitere Beaufsichtigung, wenn man es da-zu auffordert“). Auf Faktor 4 wiesen hauptsächlich Items positive Ladungen auf, die in der Literatur der Dimension Schuldeingeständnis zugeordnet waren. In der indischen Stichpro-be entfielen auf Faktor 1 vor allem Items der Dimension internalisierte Verhaltenssteue-rung. Items der Dimension Wiedergutmachung wiesen sowohl auf den Faktoren 2 und 3 hohe Ladungen auf. Auf Faktor 4 luden vor allem Items der Dimension Schuldeingeständ-nis (siehe Anhang Tabelle A-1 und Tabelle A-2).

Die Ergebnisse der Scree-Tests zur Bestimmung der Anzahl relevanter Hauptkompo-nenten waren in beiden Stichproben uneindeutig. Aufgrund des Scree-Tests ließen sich für die deutsche Stichprobe bis zu vier Faktoren und für die indische Stichprobe bis zu drei Faktoren annehmen (siehe Anhang Abbildung A-1). Da in der indischen Stichprobe teil-weise nur wenige Items pro Faktor (< 10) substantielle Faktorladungen (> .40) aufwiesen

und aufgrund der nicht ausreichend großen Stichprobe (< 300) wurde von einer weiterge-henden inhaltlichen Interpretation der Faktorenstrukturen abgesehen.6

Zusammenfassend lässt sich an dieser Stelle daher festhalten, dass die Faktorenstruk-tur keine akzeptable Äquivalenz zwischen den beiden Stichproben aufwies. Ferner ließ sich die von Kochanska et al. (1994, Studie 1) theoretisch angenommene 4-Faktorenstruktur mit den Dimensionen internalisierte Verhaltenssteuerung, Betroffenheit, Schuldeingeständnis und Wiedergutmachung weder in der deutschen noch in der indischen Studie auf Itemebene replizieren. Aufgrund der Stichprobengröße waren eine inhaltliche Interpretation der Faktorenlösungen und eine weitergehende Exploration der Faktoren-struktur nicht ratsam. Daher wurden die theoretisch angenommenen Dimensionen beibe-halten.

Mittels Reliabilitätsanalysen wurde geprüft, ob die interne Konsistenz der Skalen in der indischen Stichprobe verbessert werden kann. Items wurden für die einzelnen Skalen schrittweise gelöscht, wenn sich dadurch der Wert für Cronbachs Alpha um mindestens .05 erhöht hat. Aufgrund der sehr niedrigen Reliabilitäten in der indischen Stichprobe wurden für die Skalen Betroffenheit und Schuldeingeständnis jeweils zwei Items und für die Skala Wiedergutmachung ein Item weggelassen. Aus Gründen der Äquivalenz wurden die betref-fenden Items für die weitere statistische Datenanalyse in beiden Stichproben für die Be-rechnung der jeweiligen Skalenmittelwerte nicht berücksichtigt. Die Skalen erreichten da-durch in der indischen Stichprobe weiterhin niedrige Reliabilitäten zwischen .49 und .58.

Die Reliabilitäten für die betreffenden Skalen wiesen dagegen in der deutschen Stichprobe nachwievor zufriedenstellende bis ausreichend gute interne Konsistenzen auf. Für alle Ska-len fieSka-len die Reliabilitäten in der indischen Stichprobe deutlich niedriger aus als in der deutschen Stichprobe. Eine statistische Prüfung ergab, dass sich die internen Konsistenzen (d. h. Cronbachs Alpha) für alle vier Skalen zwischen den beiden Stichproben statistisch signifikant unterschieden. Die Reliabilitäten für die gekürzten Skalen (d. h. nach Löschen einzelner Items) waren für alle vier Dimensionen (d. h. internalisierte Verhaltenssteue-rung, Betroffenheit, Schuldeingeständnis, Wiedergutmachung) in der indischen Stichprobe signifikant niedriger als in der deutschen Stichprobe (siehe Tabelle 2).

6 Eine inhaltliche Interpretation der Faktorenstruktur ist unter den folgenden Voraussetzungen empfehlens-wert: (a) auf jede theoretisch angenommene Dimension sollten bereits bei der Konstruktion der Skala min-destens 10 Items entfallen und die Stichprobe sollte minmin-destens 120 Fälle umfassen; (b) jeder relevante Fak-tor sollte entweder mindestens 4 Items mit FakFak-torladungen größer als .60 oder 10 bis 12 Items mit Faktorladungen größer als .40 aufweisen; (c) der Umfang (N) der Stichprobe sollte größer als 300 sein, wenn Faktoren vorliegen, auf denen weniger als 10 Items eine Ladung über .40 aufweisen (Bortz, 2005, S. 523, S.

551).

Um abschließend zu prüfen, inwieweit die einzelnen Skalen in der deutschen und in-dischen Stichprobe äquivalent sind, wurde für jede theoretisch definierte Skala eine explorative Faktorenanalyse (Hauptkomponentenanalyse mit Varimax-Rotation) unter Vorgabe eines Faktors durchgeführt. Die mittels Target Rotation pro Skala durchgeführte Äquivalenzprüfung ergab Werte für Tucker’s Phi in Höhe von .94 für die Skala Schuldein-geständnis, .93 für Wiedergutmachung, .86 für internalisierte Verhaltenssteuerung und .98 für Betroffenheit. Da alle Werte über dem Grenzwert von .85 lagen, konnte eine ausrei-chende Äquivalenz für die Itemstruktur der einzelnen Skalen angenommen werden.