• Keine Ergebnisse gefunden

Zur Belastbarkeit der gewonnenen Ergebnisse

5 Lange Arbeitszeiten und Beeinträchtigungen der sozialen Teilhabe

6.5 Zur Belastbarkeit der gewonnenen Ergebnisse

Nach DIN EN ISO 10075-3 (2004) sollten Messverfahren die Gütekriterien Objektivität, Reliabilität, Validität, Diagnostizität, Sensitivität und Generalisierbarkeit erfüllen. Die Einhaltung dieser Kriterien bei den verwendeten Befragungen kann an dieser Stelle nicht umfassend geprüft werden, dennoch soll, soweit möglich, eine Bewertung der Belastbarkeit vorgenommen werden.

Die Objektivität der Datenerhebungen kann nach Einsicht in die Feldberichte der durchführenden Institute als recht gut betrachtet werden. Es wurden in allen Fällen standardisierte Fragebögen verwendet, wobei im Fall von persönlichen oder Telefon-interviews vorab Interviewerschulungen durchgeführt wurden. In GA 2004 wurde eine schriftliche Befragung vorgenommen, die mögliche Verzerrungen durch Interviewer oder die Interviewsituation ausschließt. Es lagen durch die Standardisierung in allen Fällen genaue Antwortvorgaben vor, sodass eine einheitliche Erfassung und Verar-beitung der hier interessierenden Variablen gegeben war. Da die Angaben der Befragten subjektiv sind, gilt die Objektivität jedoch nur für die Erfassungs- und Auswertungsmethoden.

Für eine Prüfung der Reliabilität der Messungen müsste dieselbe Befragung mindestens zwei Mal an denselben Personen durchgeführt werden (BORTZ &

DÖRING, 2006). Da jedoch weder zeitlich wiederholte noch multiple Messungen der interessierenden Konstrukte vorliegen, noch die interessierenden erfassten Merk-male als stabil angenommen werden können (es sollten auch Veränderungen der Arbeitsbedingungen erfasst werden), können bezüglich der Reliabilität nur theoretische Erwägungen angestellt werden. Da in allen Befragungen ähnliche Verteilungen der wöchentlichen Arbeitszeit sowie der gesundheitlichen und sozialen Beeinträchtigungen ermittelt werden konnten, ist die Reliabilität der Erfassung vermutlich ausreichend für die hier vorgenommenen Analysen. Die europäischen

Befragungen wurden mit derselben Methode (aber einigen Veränderungen der Fragestellungen) zu zwei Zeitpunkten durchgeführt. Es könnte also angenommen werden, dass Veränderungen in den gemessenen Variablen, wie etwa in der Beschwerdehäufigkeit oder den Arbeitsbedingungen, auf reale Veränderungen zwischen den Jahren 2000 und 2005 zurückführbar sind. Es gibt jedoch einige Hinweise darauf, dass die ermittelten Veränderungen auf Änderungen in den Fragestellungen und der Erfassung der Daten zurückgehen. So wurde in EU 2005 die Filterfrage „Wirkt sich Ihre Arbeit auf Ihre Gesundheit aus?“ korrekt durchgeführt, wohingegen in EU 2000 recht viele gesundheitliche Beschwerden erfasst wurden, obwohl die Personen die Filterfrage mit „Nein“ beantwortet hatten. Der Rückgang der Beschwerdehäufigkeit zwischen EU 2000 und 2005 ist also höchstwahrscheinlich auf die verbesserte Datenerfassung zurückzuführen, mit Hilfe derer die Erfassung

„arbeitsbezogener“ Beeinträchtigungen verbessert wurde. Die Zusammenfassung der gesundheitlichen Beeinträchtigungen zu den Komponenten PVB und MSB klärt in den europäischen Befragungen etwa 50 % der Varianz auf, in GA 2004 und BB 2006 dagegen etwa ein Drittel. Dies deutet darauf hin, dass die Reliabilität der Erfassung der gesundheitlichen Beschwerden für die untersuchten Fragestellungen gut bis ausreichend ist. Veränderungen in der Operationalisierung anderer Konstrukte, wie sie z. B. bei den außerberuflichen Aktivitäten vorgenommen wurden, erschweren die Vergleichbarkeit der zwei Zeitpunkte und die Abschätzung der Reliabilität ebenfalls enorm, jedoch konnten die entsprechenden einzelnen Variablen auch hier zu sehr ähnlichen Faktoren mit einer zufriedenstellenden Varianzaufklärung, und damit einer zumindest strukturell vergleichbaren Messung, zusammengefasst werden.

Insbesondere stellt sich jedoch die Frage, wie reliabel die selbst berichteten wöchentlichen Arbeitszeiten sind. RODE (2004) berichtet nur geringe Korrelationen der selbst berichteten Arbeitszeit zwischen zwei Zeitpunkten (im Abstand von 3 Jahren) von r = 0,52. Angesichts der Fragestellung „Wie viele Stunden arbeiten Sie im Durchschnitt pro Woche?“ kann angenommen werden, dass durchaus Verzerrungen durch ungenaue Erinnerung, Unwissen oder soziale Erwünschtheit entstehen. Kritisch anzumerken ist auch, dass einige Angaben der Befragten schlicht unplausibel sind und anscheinend während der Interviews nicht geprüft wurden.

Besonders bei den Angaben zur wöchentlichen Arbeitszeit fiel dies auf. So wurden in BB 2006 und EU 2005 Zeiten von über 120 Std./Woche angegeben, in der EU 2005 waren es sogar zweimal 168 Std. (= 7 Tage x 24 Std.). Es sei daran erinnert, dass für die hier vorgelegten Untersuchungen nur abhängig Erwerbstätige in den Stichproben belassen worden waren. Auch die Angaben zur täglichen Dauer der sozialen Aktivitäten in EU 2005 sind teilweise unrealistisch. Addiert man die tägliche Zeit für alle Aktivitäten, multipliziert sie mit sieben und rechnet die wöchentliche Arbeitsdauer hinzu, so ergeben sich bei immerhin 3 % der Befragten Werte von deutlich mehr als 120 Stunden pro Woche und bei etwa 100 Personen Werte zwischen 168 und 376 (!) Wochenstunden. Die Erfassung der täglichen Dauer sozialer Aktivitäten ist prinzipiell sehr interessant, da der Zeitaufwand außerhalb der Arbeitszeit die verbleibenden Ruhezeiten deutlich beeinflusst. Jedoch sollte bereits während der Interviews etwas genauer auf inhaltliche Plausibilität geachtet werden, damit die erhobenen Werte nicht nur als bloße Tendenz verwendet werden können. Die beschriebenen Einzelfälle, in denen unplausible Antworten vorlagen, wurden nach einer Plausibilitätsprüfung aus den Analysen ausgeschlossen. Dies sollte einer Verzerrung

der Ergebnisse vorbeugen, auch wenn die vereinzelten Fälle bei den vorhandenen Stichprobengrößen vermutlich keinen großen Effekt auf die Ergebnisse gehabt hätten.

Bei der hier vorgenommenen Analyse von strukturellen Beziehungen zwischen der berichteten wöchentlichen Arbeitszeit und den gesundheitlichen sowie sozialen Beeinträchtigungen spielt die Veridikalität bzw. Validität der Erfassung der Arbeitszeit allerdings eine eher untergeordnete Rolle, da keine Punktschätzungen vorgenom-men werden sollten (s. o.). Für die Betrachtung von Trends erscheinen die verwendeten Daten daher als durchaus aussagekräftig, insbesondere, da der Vergleich der Stichproben eine recht hohe strukturelle Übereinstimmung der Verteilung der Arbeitsdauer zeigte.

Bei der Prüfung der Validität der Ergebnisse lassen sich verschiedene Arten der Validität unterscheiden, für die verschiedene potenzielle Validitätsbedrohungen in Frage kommen (vgl. COOK & CAMPBELL, 1979; SHADISH et al., 2002; NICKEL &

NACHREINER, im Druck): die Validität des statistischen Schlusses, die interne Validität, die Konstruktvalidität und die externe Validität. Bedrohungen der Validität des statistischen Schlusses konnten durch die Verwendung sehr umfangreicher Stichproben verringert werden. Darüber hinaus wurden nicht ausschließlich Signifikanzprüfungen vorgenommen, sondern vor allem Messungen der Effekt-stärken, wodurch eine weitere potenzielle Bedrohung gemindert wurde.

Eine mögliche Bedrohung der internen Validität kann u. a. durch die (Selbst-) Selektion der Erwerbsfähigen entstehen. Da aber auf die Gesamtpopulation der abhängig Erwerbstätigen geschlossen werden soll, kann dies in Kauf genommen werden. Eine weitere Bedrohung durch Drittverursachung der Effekte kann zwar nicht völlig ausgeschlossen werden, wurde jedoch durch die Berechnung kontroll-starker Modelle eingegrenzt. In einigen Analysen wurde die auf individuelle Unter-schiede zurückzuführende Störvarianz durch Mittelung der interessierenden Variablen über größere Gruppen der Arbeitsdauer eliminiert. Die somit auf Gruppen-basis berechneten Zusammenhänge zwischen der Arbeitsdauer und den gesund-heitlichen Beeinträchtigungen, der Vereinbarkeit und der außerberuflichen Aktivitäten wiesen bei dieser Reduktion der individuellen Varianz außerordentlich hohe Effekt-stärken auf. Dies stützt ebenfalls die Annahme, dass Drittverursachung weitgehend ausgeschlossen werden kann.

Unter dem Aspekt der Konstruktvalidität wird geprüft, ob und in wieweit die verwendeten Operationalisierungen die dahinterstehenden angenommenen Konstrukte abbilden. Da die wöchentliche Arbeitsdauer nur mit einer einzelnen Variablen erfasst wurde, sind die Bildung eines Konstrukts aus mehreren Variablen sowie die Überprüfung der Konstruktvalidität hier nicht möglich. Die berichtete Anzahl von Tagen mit >10 Arbeitsstunden erschien dafür ebenfalls nicht als sinnvoll, da deren Varianz bereits z. T. in der Anzahl der wöchentlichen Arbeitsstunden enthalten ist.

Die verschiedenen Items zu den Gesundheitsbeschwerden repräsentieren das Konstrukt „gesundheitliche Beeinträchtigungen“. Mittels Hauptkomponentenanalysen

konnten jeweils die Komponenten PVB und MSB ermittelt werden, die in allen Stichproben gut übereinstimmende Faktorlösungen bilden. Aufgrund der großen Übereinstimmung der verschiedenen Stichproben und der zufriedenstellenden Varianzaufklärungen (mit etwa 50 % bzw. 30 %) stellt sich die Validität des Konstruktes „gesundheitliche Beeinträchtigung“ als gut dar. Anhand von Strukturmodellen konnte an anderer Stelle gezeigt werden, dass die verwendeten Daten das Konstrukt der PVB gut abbilden und die Mess- und Wirkstrukturen in allen Stichproben ausgesprochen ähnlich sind (WIRTZ & NACHREINER, in Vorbereitung).

Aufgrund dessen kann die Konstruktvalidität als gut bezeichnet werden.

Die Beschwerdefreiheit als neu eingeführte Operationalisierung des Konstrukts der Beeinträchtigungsfreiheit scheint eine höhere Validität zu besitzen als die Faktor-lösungen, da alle Beschwerden gleichwertig einbezogen werden und keine möglicherweise ungerechtfertigte Kompensation der einzelnen Beschwerden unter-einander stattfinden kann. Es ist weiterhin zu vermuten, dass die Art der Befragung die Qualität der Konstrukte maßgeblich mitbestimmt. Mit der Formulierung „Schlaf-störungen während/nach der Arbeit“ bzw. „an Arbeitstagen“ gelingt möglicherweise der kurzfristige zeitliche, nicht aber der kausale Bezug auf die Arbeit, da gesund-heitliche Beeinträchtigungen und insbesondere Schlafstörungen auch längerfristig auftreten können. Die Filterfrage aus den europäischen Befragungen erscheint an dieser Stelle unter Validitäts- und Reliabilitätsgesichtspunkten (s. o.) als sinnvoller.

Allerdings besteht auch hier die Möglichkeit, dass die Beschäftigten keine Verbin-dung zwischen ihren gesundheitlichen Beeinträchtigungen und ihren Arbeits-bedingungen erkennen, sodass die Effekte der ArbeitsArbeits-bedingungen möglicherweise unterschätzt werden.

Die Faktorlösungen für die Konstrukte „Physische Belastung“, „Psychische Belastung“ und „Autonomie“ waren in allen Datensätzen ähnlich, besaßen jedoch nicht immer völlig zufriedenstellende Varianzaufklärungen, was zum Teil an der auf nur wenigen Dimensionen erfassten psychischen Belastung liegen könnte (die körperliche Belastung wurde dagegen i. d. R. mit mehr Variablen operationalisiert).

Die Konstrukte „Haushaltsaktivitäten“, „Freizeitaktivitäten“ und „ehrenamtliche/-politische Aktivitäten“ zeigten hingegen zufriedenstellende Varianzaufklärungen.

Trotz der unterschiedlichen, insgesamt aber zufriedenstellenden Abbildungsgüte der Konstrukte ließen sich sehr ähnliche Strukturen in den Datensätzen mit verschiedenen Operationalisierungen und Erhebungsmethoden zeigen. Dies spricht ebenfalls für die Gültigkeit der Erfassung dieser Konstrukte, da sie unabhängig von der jeweiligen Befragungsmethode und Operationalisierung gebildet werden konnten.

Die externe Validität der Ergebnisse wird als sehr gut eingeschätzt. Zum einen wurden sehr große Stichproben für die Analysen herangezogen, die als repräsentativ für die deutsche bzw. die europäische Population der Erwerbstätigen gelten. Daher kann von der Generalisierbarkeit der Ergebnisse auf die Gesamtpopulation der Erwerbstätigen ausgegangen werden. Es konnten darüber hinaus strukturell gleich-artige Beziehungen in vier heterogenen Stichproben und ganz unterschiedlichen, homogenen Substichproben nachgewiesen werden. Somit kann angenommen werden, dass die Ergebnisse nicht nur für Gruppen spezifischer Bedingungen oder für bestimmte Zeitpunkte gültig sind. Auch die Art der Fragestellung und die

Erhebungsmethoden (Interviews, Fragebogen) führten nicht zu Unterschieden in den ermittelten Relationen.

Die Validität der Ergebnisse kann damit insgesamt als ausgesprochen hoch beurteilt werden, da dieselben Konstrukte und gleichartige relationale Beziehungen zwischen diesen mit unterschiedlichen Methoden, Operationalisierungen, Stichproben und zu verschiedenen Zeitpunkten nachgewiesen werden konnten.

6.6 Implikationen für die Arbeitszeitgestaltung und Ausblick