• Keine Ergebnisse gefunden

Gewichtung des Datensatzes

7 „Member Check“ – Rückmeldung an das und aus dem Feld

8.2.3 Gewichtung des Datensatzes

Auf Grund der disproportionalen Schichtung der Stichprobe war es nötig, eine Design-Gewichtung vorzunehmen. Dazu werden den Fällen im Normalfall auf Basis ihrer Auswahlwahrscheinlichkeit Gewichte zugewiesen. Dies konnte bei der vorlie-genden Stichprobe nur näherungsweise geschehen, da der Adressanbieter beim Ziehen der Stichproben aus seinem Adress-Pool nicht darauf geachtet hatte, dass die Ziehungsgrundlagen überschneidungsfrei waren. Da vielen Betrieben mehrere WZ-Codes zugeordnet waren, gab es Betriebe, die über mehrere Ziehungsgrundla-gen in die Stichprobe gelanZiehungsgrundla-gen konnten. Laut Auskunft des Adressanbieters war der Umfang der Ziehungsgrundlage zusammenaddiert 3.797.208 Datensätze. Rechnet man jedoch die Doppelverbranchungen heraus, verbleiben 3.089.912. Daher konnte die genaue Auswahlwahrscheinlichkeit nicht berechnet werden. Bei der näherungsweisen Berechnung der Design-Gewichte wurde so verfahren, als ob die Ziehungsgrundlagen disjunkt gewesen wären.

Unter Einbezug dieser näherungsweisen Design-Gewichte, wurde im Anschluss auch eine Anpassungsgewichtung an die Grundgesamtheit aller Betriebe in Deutsch-land vorgenommen. Referenz für die Anpassungsgewichtung war die Beschäfti-gungsstatistik der Bundesagentur für Arbeit zum Stichtag 30. Juni 2015. Die Berech-nung geschah über das iterative Randsummenverfahren anhand der Gewichtungsva-riablen WZ-Code (zweistellig) und Betriebsgröße. Eine reine Poststratifikation war leider nicht möglich, da nicht jede Zelle (Kombination aus WZ-Code und Be-triebsgröße), die in der Grundgesamtheit besetzt ist, auch in der Stichprobe besetzt

war. Bei dem Randsummenverfahren werden die Randverteilungen der Stichprobe solange schrittweise an die Randverteilungen der Grundgesamtheit angepasst, bis die Randverteilungen mit geringen Abweichungen übereinstimmen oder die graduel-len Verbesserungen nicht mehr substantiell sind und eine vorher festgelegte Schran-ke unterschreiten. Die endgültigen Gewichte ergeben sich aus dem Produkt der De-sign- und Anpassungs-Gewichte und wurden auf die reale Stichprobengröße nor-miert. Die nötigen Berechnungen wurden von Gesis - Leibnitz-Institut für Sozialwis-senschaften, Abteilung Survey Design & Methodology durchgeführt.

Die normierten Gewichte liegen zwischen 0,0008 und 28,7559 und weisen somit eine Spannweite von 36.296,0142 auf. Dies bedeutet, dass der Betrieb mit dem maxima-len Gewicht ca. 36.300-mal mehr zählt, als der Betrieb mit dem minimamaxima-len Gewicht.

Dieser Unterschied ergibt sich vor allem aus der disproportionalen Anlage der Stichprobe. Aus anderen nach Branchengruppe und Betriebsgröße gewichteten Befragungen, beispielsweise in den Methodenberichten zu den GDA-Betriebsbefragungen 2011 und 2015 (vgl. Riedmann, 2012, S. 30ff., Sleik et al., 2015) werden Spannweiten zwischen 400 und 1.500 berichtet. Die hier vorliegende Spannweite ist also ungewöhnlich hoch, was sich allerdings damit erklären lässt, dass die Befragung mit insgesamt 375 realisierten Interviews vergleichsweise klein ausgefallen ist und die Disproportionalität der vorab gebildeten Quadranten zugleich sehr groß war. So befinden sich beispielsweise in Quadrant III (WZ-Codes 49-53) nur 3,8 Prozent, in Quadrant IV jedoch ca. 61 Prozent aller Betriebe der Grundgesamt-heit (vgl. 8.1.3). Auf Grund der beabsichtigten Disproportionalität, stellen die beiden Quadranten jeweils ca. 25 Prozent in der ungewichteten Stichprobe. Dies wird durch die Gewichte korrigiert. Einen Vergleich des gewichteten mit dem ungewichteten Da-tensatz anhand der Betriebsgröße und NACE-Einteilung findet sich in folgenden Dia-grammen (Abb. 8.1 u. Abb. 8.2).

Abb. 8.1 Vergleich des ungewichteten mit dem gewichteten Netto-Datensatz nach Betriebsgröße

Betrachtet man in diesem Diagramm die gewichteten Datensätze, wird nochmals deutlich, wie die Teilnahmebereitschaft mit zunehmender Beschäftigtenzahl ansteigt.

Gerade die Betriebe mit maximal neun Beschäftigten sind im ungewichteten Daten-satz unterrepräsentiert und bleiben es auch, nachdem durch die Design-Gewichtung die unterschiedlichen Auswahlwahrscheinlichkeiten berücksichtigt wurden. Betriebe mit 10 bis 49 Beschäftigten sind vor der Anpassungsgewichtung noch überrepräsen-tiert. Dies kann, muss aber kein Hinweis auf eine Positivauswahl sein.

Betrachtet man jedoch die Branchenzugehörigkeit, gibt es stärkere Hinweise auf einen Zusammenhang zwischen Teilnahmebereitschaft und dem Thema der Befragung. Ein Teil der Disproportionalitäten, die nicht durch die Design-Gewichtung ausgeglichen werden, können auch auf Disproportionalitäten innerhalb der Adress-dateien zurückgeführt werden (vgl. Abb. 8.2 und Abb. 8.3). Quadrant I setzt sich zusammen aus den NACE-Codes Q und Teilen von C und G. Nach der Design-Gewichtung sind jedoch die Betriebe, die dem Gesundheitsbereich zugeordnet wurden (Code Q), unterrepräsentiert, was als Hinweis gedeutet werden kann, dass gerade in diesem Bereich eine geringere Teilnahmebereitschaft vorlag. Dies deckt sich mit den Erfahrungen aus der qualitativen Feldphase, da auch hier gerade kleinere Betriebe aus dem Gesundheitsbereich eine Teilnahme ablehnten. Die Ver-antwortlichen vor Ort gaben oft Überforderung durch das Tagesgeschäft als Grund dafür an. Auch in Quadrant II waren die Wirtschaftszweige C und B (Produktion und Bergbau) nach der Design-Gewichtung noch überrepräsentiert, wohingegen A und F (Land-/Forstwirtschaft und Baugewerbe) unterrepräsentiert waren und somit auch dort eine geringere Teilnahmebereitschaft vorlag. Da Quadrant III nur aus dem Wirt-schaftszweig Transport- und Verkehrswirtschaft (H) besteht, gibt es keine Auffällig-keiten. Im Quadrant IV, der vor allem aus Dienstleistungsbereichen besteht, sind die

0 20 40 60 80 100 120 140 160

Beschäftigte1-4 5-9

Beschäftigte 10-19

Beschäftigte 20-49

Beschäftigte 50-249

Beschäftigte Mehr als 250 Beschäftigte ungewichtet Designgewicht Design- und Anpassungsgewichtung

Finanzdienstleister (K) überrepräsentiert. Unterrepräsentiert sind die Gastwirtschaft, Kommunikationsdienstleistungen, unternehmensnahe Dienstleistungen und Erbrin-gung von sonstigen Dienstleistungen (I, J, N, S).

Abb. 8.2 Vergleich des ungewichteten mit dem gewichteten Netto-Datensatz nach NACE-Codes

Durch die anschließende Anpassungsgewichtung wurden diese Disproportionalitä-ten, die in der unterschiedlichen Teilnahmebereitschaft und der Adressquelle begründet liegen, ausgeglichen. Es muss jedoch in Anbetracht des Rücklaufs und der eben dargestellten Ergebnisse davon ausgegangen werden, dass es sich bei der Stichprobe auch um eine Positivauswahl handelt. Das heißt, Betriebe, die mit dem Tagesgeschäft voll und ganz ausgelastet sind oder sich wenig für Arbeits- und Gesundheitsschutz interessieren, sind womöglich in dieser Stichprobe nicht in dem Maße vertreten, wie in der Grundgesamtheit.

0 20 40 60 80 100 120

A B C E F G H I J K L M N Q S

ungewichtet Designgewicht Design- und Anpassungsgewichtung

Abb. 8.3 Vergleich des ungewichteten mit dem gewichteten Netto-Datensatz nach Quadrant und Branche