Beobachtbare und interessierende Variablen

Zur Herstellung einer Verbindung zwischen Aussagen basierend auf den m¨oglichen Ergebnissen der Untersuchung und dem Gegenstand des For-schungsinteresses ist, neben ¨Uberlegungen etwa zum Forschungsdesign und der Art der zu verwendenden Instrumente und Daten, die Frage nach der eigentlichen Messbarkeit (zu einer Definition von Messung siehe unten) der

interessierenden Eigenschaften oder Merkmale der Untersuchungseinheiten zu beantworten. Dabei spielt dieMesstheorie, ein eigenst¨andiger Bereich in-nerhalb der Datenanalyse, eine wichtige Rolle (vgl. Fahrmeir und Hamerle, 1996a).

2.2.1 Messtheorie: Repr¨asentationaler Ansatz

Wie andere Wissenschaftszweige auch, stellt die Messtheorie weder ein ho-mogenes unumstrittenes Theoriengeb¨aude dar, noch k¨onnen die jeweils ver-tretenen Ausrichtungen alle Fragen befriedigend beantworten, die sich in der empirischen Forschungspraxis stellen. Die folgende Darstellung lehnt sich im Wesentlichen an Fischer (1974) und Hamerle (1982) an und ist eher dem sogenannten repr¨asentationalen Ansatz zuzuordnen, dessen Wurzeln unter anderem in den Arbeiten von Stevens (1946, 1951, 1959), Suppes (1951) oder Suppes und Zinnes (1963) zu finden sind. Zahlreiche Weiter-entwicklungen f¨uhrten zu einem umfassenden Theoriegeb¨aude dessen Dar-stellung etwa in Krantz, Luce, Suppes und Tversky (1971), Suppes, Krantz, Luce und Tversky (1989) und Luce, Krantz, Suppes und Tversky (1990) zu finden ist (siehe auch die in Hamerle, 1982, oder Heidenreich, 1999a, zitier-te Lizitier-teratur). F¨ur eine kritische Diskussion des repr¨asentationalen Ansatzes siehe Michell (1986, 1999).

Gegenstand der Messtheorie ist die Untersuchung der Voraussetzungen der Messbarkeit (z.B. Fischer, 1974; Hamerle, 1982). Unter einer Messung versteht man dabei einehomomorphe Abbildung der Untersuchungseinhei-ten und der zwischen diesen empirisch feststellbaren Relationen in Bezug auf die interessierende Eigenschaft(empirisches Relativ)in eine Menge von Zahlen und Relationen zwischen diesen (numerisches Relativ). Homomor-phe Abbildungen sind solche, die jedem Element und jeder Relation aus dem empirischen Relativ eindeutig ein Element und eine analoge Relation aus dem numerischen Relativ zuordnen. Eine solche Abbildung zusammen mit dem empirischen und dem numerischen Relativ wird auch als Skala bezeichnet. Nun existieren im Allgemeinen ausgehend von einem speziel-len empirischen Relativ, welches die entsprechenden Bedingungen erf¨ullt, nicht nur eine sondern viele m¨ogliche Skalen, die ineinander transformiert

werden k¨onnen. Transformationen, die die Abbildung der empirischen Re-lationen durch die gew¨ahlten numerischen ReRe-lationen nicht zerst¨oren, hei-ßen zul¨assig. Alle Skalen mit derselben Menge zul¨assiger Transformationen charakterisieren einen Skalentyp. F¨ur ein sehr anschauliches Beispiel zur Konstruktion eines solchen Skalentyps siehe Fischer (1974, S. 155 ff.).

Die gebr¨auchlichsten Skalentypen sind die Nominalskala, die Ordinals-kala, dieIntervall- und die Verh¨altnisskala. Auf Nominalskalenniveau sind alle Transformationen, die die Verschiedenheit der Zahlen im numerischen Relativ erhalten, d.h. eineindeutige Transformationen, zul¨assig. Beispiele f¨ur entsprechende Eigenschaften sind etwa Geschlecht oder Nationalit¨at.

Auf Ordinalskalenniveau sind es streng monoton steigende Transformatio-nen. Beispiele hierf¨ur sind etwa Ausbildungsniveau oder H¨artegrad von Mi-neralien nach der Mohsschen H¨arteskala. Auf Intervallskalenniveau sind es positiv-lineare und auf Verh¨altnisskalenniveau schließlich ¨ Ahnlichkeit-stransformationen, d.h. Transformationen der Art v^′ = αv (α > 0). Bei-spiele f¨ur entsprechende Eigenschaften auf Intervallskalenniveau sind etwa Temperatur in Grad Celsius oder kalendarische Zeit und auf Verh¨altnisska-lenniveau K¨orpergr¨oße oder Lebensalter.

Als metrische oder kardinale Merkmale werden solche Variablen be-zeichnet, die mindestens intervallskaliert sind. Qualitative Merkmale sind Merkmale deren Auspr¨agungen sich unterscheiden ohne dass ein Ausmaß der Auspr¨agungen angebbar ist. Hingegen l¨asst sich das Ausmaß der Aus-pr¨agungenquantitativer Merkmale durch Zahlen kennzeichnen. Nominals-kalierte Merkmale sind demnach qualitative, metrische dagegen sind quan-titative Merkmale. Ordinalskalierte Merkmale werden h¨aufig ebenfalls als quantitative Merkmale aufgefasst, da zwischen den qualitativen Auspr¨agun-gen eine Gr¨oßer-Kleiner-Beziehung besteht.

Gegen die Einteilung von Merkmalen nach ihrem Skalenniveau ist die Einteilung danach ob es sich umstetige oderdiskrete Merkmale handelt ab-zugrenzen. Unter stetigen Merkmalen versteht man solche, bei denen mit jeweils zwei Auspr¨agungen auch jeder Zwischenwert m¨oglich ist². Diskrete

2In Verbindung mit linearen Regressionsmodellen sollen in sp¨ateren Kapiteln steti-ge Variablen, die mindestens intervallskaliert sind, etwas unsteti-genau aber kurz als stetisteti-ge

Merkmale sind solche, die h¨ochstens abz¨ahlbar viele Auspr¨agungen anneh-men k¨onnen. Kategoriale Merkmale schließlich sind Merkmale mit endlich vielen Auspr¨agungen.

Ausgehend von einem bestimmten Skalentyp stellt sich schließlich die Frage, welche numerischen Aussagen, also Aussagen die durch Operationen im numerischen Relativ gewonnen werden, f¨ur diesen Skalentyp eine empi-rische Relevanz besitzen oder bedeutsam sind. Darunter werden Aussagen verstanden, die f¨ur alle m¨oglichen Skalen, die einen Skalentyp charakte-risieren, wahr sind. Dieses Kriterium ist notwendig, denn Aussagen, die f¨ur einige, nicht aber f¨ur alle Skalen, die einen Skalentyp charakterisieren, g¨ultig sind, basieren offensichtlich auf Informationen, die nicht im empiri-schen Relativ enthalten sind (vgl. Acz´el und Roberts, 1989; Luce, Krantz, Suppes und Tversky, 1990; Michell, 1986).

Zu den Operationen im numerischen Bereich geh¨oren vor allem alle statistischen Verfahren. Eine hier h¨aufig verwendete Operation, etwa zur Berechnung des arithmetischen Mittels, ist die Summation. Um Aussagen, die aufgrund dieser mathematischen Operation gewonnen werden, in obi-gem Sinne empirisch relevant interpretieren zu k¨onnen ist allerdings der Nachweis n¨otig, dass das empirische Relativ den Bedingungen einer Inter-vallskala gen¨ugt (f¨ur weitere Beispiele, siehe etwa Nagl, 1992, Kap. 2; f¨ur eine formale Darstellung dieser Problematik siehe z.B. Acz´el und Roberts, 1989). Zu beachten ist, dass entsprechend dem beschriebenen Konzept das Skalenniveau auch abh¨angig von der Fragestellung beziehungsweise den Hy-pothesen ist. So kann etwa das monatliche Einkommen einmal als verh¨alt-nisskaliertes Merkmal betrachtet werden, wenn es beispielsweise um den Aspekt der Kaufkraft geht, oder als ordinales Merkmal, wenn es um den Aspekt der

”Lebensqualit¨at“ geht (Nagl, 1992, S. 54). Zu beachten ist zu-dem, dass Aussagen, die f¨ur einen bestimmten Skalentyp in obigem Sinne keine empirische Relevanz besitzen, bei Bezugnahme auf eine spezifische Skala durchaus korrekte und unter Umst¨anden interessante Informationen

Variablen bezeichnet werden. Diese Bezeichnung wurde gew¨ahlt um — gegen¨uber einer m¨oglichen Bezeichung als metrische Variablen — explizit kategoriale metrische Variablen auszuschließen.

liefern k¨onnen. So folgt etwa aus der Aussage”Der Mittelwert der Variablen

‘H¨artegrad’ unter Verwendung der Mohsschen H¨arteskala der in Stichprobe A enthaltenen Mineralien ist gr¨oßer als derjenige der Variablen ‘H¨artegrad’

unter Verwendung der Mohsschen H¨arteskala in Stichprobe B“, dass wenig-stens ein Mineral in Stichprobe A h¨arter ist als ein Mineral in Stichprobe B (vgl. Michell, 1986).

F¨ur die Anwendung der Ergebnisse dieses messtheoretischen Ansatzes bedeuten die obigen Ausf¨uhrungen, dass zun¨achst zu ¨uberpr¨ufen ist, ob das in Frage stehende empirische Relativ die f¨ur einen bestimmten Ska-lentyp notwendigen Bedingungen ¨uberhaupt erf¨ullt. Wichtig ist dabei, dass die entsprechenden Relationen im empirischen Bereich vor der Messung und unabh¨angig von dieser bestehen und festgestellt werden. Kann dieser Nach-weis nicht erbracht werden, dann sind entsprechende Aussagen zumindest problematisch.

Handelt es sich bei den interessierenden Merkmalen um Gr¨oßen aus dem naturwissenschaftlichen oder technischen Bereich, dann lassen sich die im empirischen Relativ notwendigen Relationen zur Begr¨undung minde-stens einer Intervallskala in vielen F¨allen nachweisen. Entsprechendes gilt im Allgemeinen f¨ur im sozialwissenschaftlichen, ¨okonomischen oder psycho-logischen Kontext benutzte physikalische Gr¨oßen, etwa Temperatur, L¨ange oder Zeit. Sind die entsprechenden Voraussetzungen erf¨ullt, dann k¨onnen, bei Annahme zufallsbehafteter Messungen, statistische Techniken etwa zur Bestimmung der Messgenauigkeit der verwendeten Instrumente eingesetzt werden.

2.2.2 Messmodelle: Latent-Trait Modelle

F¨ur viele in sozialwissenschaftlichen, ¨okonomischen oder psychologischen Untersuchungen interessierende Merkmale sind messtheoretische Fragen al-lerdings erheblich schwieriger zu beantworten, das heißt entsprechende Re-lationen im empirischen Relativ nur schwer nachzuweisen. Meist handelt es sich bei diesen Merkmalen um sogenannte latente, das heißt nicht direkt be-obachtbare Variablen, die ¨uber einen bestimmten Zeitraum als relativ stabil angenommen werden. Unter solchen latenten Merkmalen werden Variablen

wie Einstellungen, Normen oder kognitive F¨ahigkeiten verstanden. Aber nicht nur Personen oder allgemeiner Untersuchungseinheiten, wie Haus-halte oder Firmen, sondern auch den verschiedensten Reizobjekten, etwa Lichtsignalen, Umweltbedingungen, Testaufgaben oder Statements in ei-nem Fragebogen, werden solche latente Eigenschaften oder Dimensionen, auch als

”latent traits“ bezeichnet, zugesprochen. Beobachtet werden die Reaktionen der Untersuchungseinheiten auf die Vorgabe der verschiedenen Reizobjekte. Diese beobachtbaren oder manifesten Variablen werden aber lediglich als Indikatoren oder Symptome f¨ur die latenten Traits betrach-tet, auf keinen Fall wird das Symptom oder der Indikator gleichgesetzt mit den als latente Traits aufgefassten Ph¨anomenen. Die jeweiligen empiri-schen Relationen werden in den entsprechendenLatent-Trait Modellen nun durch mathematisch-statistische Modellvorstellungen ¨uber den zugrundelie-genden Prozess ersetzt. An die Stelle des Nachweises bestimmter Relationen im empirischen Bereich tritt damit die Notwendigkeit der ¨Uberpr¨ufung der Voraussetzungen des jeweiligen Messmodells, das den Zusammenhang zwi-schen den beobachteten Indikatoren und den latenten Traits herstellt, denn erst die G¨ultigkeit des Modells sichert ein bestimmtes Skalenniveau und erm¨oglicht damit entsprechende Aussagen ¨uber den Gegenstand des For-schungsinteresses. Die Modellierung des Zusammenhangs zwischen beob-achtbaren Indikatoren und den latenten Traits setzt wiederum eine Theorie des Messens als integralen Bestandteil der bez¨uglich der zugrundeliegenden Fragestellung formulierten Theorie voraus.

Die Klasse der mathematisch-statistischen Modelle, die unter dem Be-griff der Latent-Trait Modelle subsumiert werden k¨onnen, ist recht um-fangreich (vgl. Hamerle, 1982). Grob lassen sich hier Modelle, bei denen sich das ausschließliche Interesse auf die Messung der latenten Eigenschaf-ten der Reizobjekte bezieht, von solchen unterscheiden, bei denen auch die latenten Eigenschaften der Untersuchungseinheiten gemessen werden sollen. Ein Beispiel f¨ur erstere sind etwa die in der ¨Okonomie enwickelten Pr¨aferenz- und Nutzenmodelle (f¨ur einen kurzen ¨Uberblick siehe etwa Fish-burn, 1989), ein Beispiel f¨ur letztere sind Modelle zur Messung von Einstel-lungen und Intelligenz, wie etwa das Rasch-Modell (Hamerle, 1982; Bartho-lomew, 1996), die in der Soziologie entwickelten Latent-Structure-Modelle

(z.B. Andersen, 1980, S. 235–292; Lazarsfeld und Henry, 1968) sowie die neueren Strukturgleichungs- beziehungsweise Mittelwert- und Kovarianz-strukturmodelle (z.B. J¨oreskog, 1973, 1978, 1993; K¨usters, 1987; Muth´en, 1984, 1997; Muth´en und Satorra, 1995; Schepers, Arminger und K¨usters, 1991).

Indem der oben beschriebene Ansatz mit der Untersuchung der Vor-aussetzungen von Messbarkeit, der Entwicklung entsprechender Modelle, der expliziten Formulierung der jeweils notwendigen Annahmen und der Forderung nach deren empirischer ¨Uberpr¨ufung einen eigenen Forschungs-zweig begr¨undet, werden f¨ur die angewandte Forschungspraxis schwer zu beantwortende Fragen aufgeworfen, die im Rahmen anderer Ans¨atze ¨ uber-haupt nicht gestellt werden. Ein wesentlicher Punkt weshalb sich dieser Ansatz nur wenig durchgesetzt hat, sind wohl neben der Tatsache, dass dieser relativ junge Forschungszweig nicht f¨ur alle Problemstellungen fer-tige Rezepte liefern kann (z.B. Loomes und Sugden, 1998; Michell, 1999), auch zahlreiche Befunde, die gegen die mit verschiedenen Messmodellen verkn¨upften Annahmen sprechen. Im Bereich der Nutzentheorie siehe etwa Fishburn (1989), beziehungsweise allgemeiner Fishburn und LaValle (1989).

Ausf¨uhrliche Diskussionen der Latent-Trait-Modelle findet man in Hamerle (1982) und, vor allem im Hinblick auf den psychologisch-testtheoretischen Kontext, in Fischer (1974) oder Rost (1996). F¨ur verschiedene Kritikpunkte am Rasch-Modell aber auch an anderen Modellen siehe etwa Heidenreich (1999a) oder Henning (1999) und die jeweils dort zitierte Literatur.

2.2.3 Messtheorie: Operationaler Ansatz

Die oben angef¨uhrten Schwierigkeiten werden umgangen folgt man dem An-satz der

”operationalen Definition“ (Hamerle, 1982; Michell, 1986). Dabei werden anstelle der eigentlich interessierenden latenten Variablen leichter erfassbare Variablen gemessen, wobei angenommen wird, dass zwischen er-sterer und letzteren ein enger Zusammenhang besteht. So werden etwa statt der latenten Variablen

”Schichtzugeh¨origkeit“ die Variablen”Einkommen“,

”Ausbildungsstatus“ und

”Beruf“ gemessen, wobei Messung hier lediglich die Zuordnung von Zahlen zu Beobachtungsdaten unter Verwendung

ei-ner in der operationalen Definition festgelegten Zuordnungs- oder Messvor-schrift meint. Oft wird in der MessvorMessvor-schrift zus¨atzlich die Konstruktion ei-nes Indexes als Funktion der erhobenen Variablen festgelegt. Entsprechend dem operationalen Ansatz ist es Ziel quantitativer Forschung, ausgehend von einer operationalen Messvorschrift, quantitative Beziehungen zwischen den so gewonnenen Zahlen zu entdecken.

Dieser Ansatz ist mit verschiedenen Schwierigkeiten behaftet. Indem lediglich angenommen wird, dass zwischen latenten und erhobenen Varia-blen ein enger Zusammenhang besteht, wird eine zentrale Forderung im Rahmen des repr¨asentationalen Ansatzes, n¨amlich die Begr¨undung und der Nachweis eines solchen Zusammenhanges, ignoriert. Ein anderes Problem besteht darin, dass kein objektives und theoretisch befriedigendes Kriterium exisiert, mit Hilfe dessen entschieden werden k¨onnte, welche operationale Definition der latenten Variablen am besten gerecht wird (Hamerle, 1982).

Aus diesem Grund wird eine solche Art von Messung auch als

”vereinbarte Messung“ oder

”measurement by fiat“ bezeichnet. Gerechtfertigt wird das Vorgehen entsprechend dem operationalen Ansatz h¨aufig mit dem Hinweis darauf, dass sich dieser Ansatz in der Praxis oft bew¨ahrt habe (vgl. Michell, 1986), zu brauchbaren Ergebnissen gef¨uhrt habe (z.B. Heidenreich, 1999b, S. 410) oder, ein eher pragmatischer Standpunkt, dass empirische Forschung in den Sozialwissenschaften, der ¨Okonomie oder Psychologie nicht erst dann beginnen kann, wenn alle messtheoretischen Fragen beantwortet sind (vgl.

Anderson, Basilevsky und Hum, 1983).

2.2.3.1 Beispiel: Klassische psychologische Testtheorie

Ein bekanntes Beispiel f¨ur diesen Ansatz ist die klassische psychologische Testtheorie, deren Anliegen es zun¨achst war, die Gr¨oße des Messfehlers ab-zusch¨atzen, der bei der Messung von Merkmalen wie Intelligenz gemacht wird und Verfahren bereitzustellen, mit Hilfe derer die Ergebnisse solcher Messungen verl¨asslicher gemacht werden k¨onnen (Fischer, 1974). Ausgangs-punkt der klassischen psychologischen Testtheorie ist die Annahme eines linearen statistischen Modells, genauer, einer zufallsbehafteten manifesten Variablen, deren Erwartungswert gleich dem wahren Wert gesetzt wird,

wobei sich der Messfehler als Differenz zwischen der manifesten Zufallsva-riablen und dem wahren Wert ergibt. Zwei zentrale Themen der klassischen psychologischen Testtheorie waren und sind die Fragen nach derReliabilit¨at oder Messgenauigkeit und der Validit¨at oder G¨ultigkeit eines Messinstru-mentes. Die Reliabilit¨at eines Instrumentes in einer Population ist definiert als das Verh¨altnis der Varianz der wahren Werte — unabh¨angig davon wof¨ur diese wahren Werte stehen — in dieser Population zur Varianz der manifesten Zufallsvariablen in derselben Population und kann auch als qua-drierte Korrelation zwischen beiden verstanden werden. Diese Definition ist zwar in praktischen Anwendungen zun¨achst nicht brauchbar, es lassen sich aber, jeweils unter bestimmten Bedingungen, f¨ur die Praxis Formeln zur Absch¨atzung der Reliabilit¨at eines Messinstrumentes ableiten. Diese beru-hen meist auf einem sehr h¨aufig benutzten statistiscberu-hen Kennwert, n¨amlich dem Produkt-Moment-Korrelationskoeffizienten. Auch die Validit¨at, ein ne-ben der Reliabilit¨at weiteres G¨utekriterium zur Beurteilung eines Messin-strumentes, die Auskunft dar¨uber geben soll, wie gut das eigentlich interes-sierende Merkmal durch das verwendete Messinstrument tats¨achlich erfasst wird, wird h¨aufig ¨uber einen Korrelationskoeffizienten bestimmt. F¨ur eine ausf¨uhrliche Darstellung der klassischen psychologischen Testtheorie siehe etwa Lord und Novick (1968). Eine kurze Darstellung und eine ausf¨ uhrli-che Kritik der klassisuhrli-chen Testtheorie findet man etwa in Fisuhrli-cher (1974).

F¨ur eine Darstellung der klassischen psychologischen Testtheorie und ih-res statistischen Instrumentariums im Kontext der f¨ur sozialwissenschaftli-che Erhebungen typissozialwissenschaftli-chen Umfrageforschung siehe etwa Bohrnstedt (1983).

Festzuhalten ist, dass die klassische psychologische Testtheorie einen Ver-such darstellt, Aussagen ¨uber die G¨ute von Messinstrumenten zu machen und zwar aufbauend auf und mit Hilfe von statistischen Modellen und Me-thoden, insbesondere der Varianzzerlegung sowie der Regressions- und Kor-relationsrechnung.

2.2.4 Praxis: Umfrageforschung

Sehr oft, vor allem in der Umfrageforschung, wird auf die Untersuchung messtheoretischer Fragen oder zumindest der G¨ute der verwendeten

Mess-instrumente im Sinne der klassischen psychologischen Testtheorie v¨ollig ver-zichtet. Dem oben kurz beschriebenen operationalen Ansatz folgend, ist das Augenmerk meist auf die Auswahl und Konstruktion des Messinstrumen-tes, im Allgemeinen ein standardisierter Fragebogen, im Sinne einer techni-schen Vorbereitung der Messung, beschr¨ankt. Entsprechende Aussagen im Hinblick auf messtheoretische Fragen oder G¨utekriterien der verwendeten Messinstrumente findet man daher kaum.

Die Konstruktion der Messinstrumente basiert hier im Wesentlichen auf den Ergebnissen sogenannter“Pretests“, bei denen etwa die verschiedenen Fragen oder ein Auswahl daraus in einer mehr oder weniger kontrollier-ten Untersuchung unter Verwendung verschiedener Techniken (siehe etwa Porst, 2000; Statistisches Bundesamt, 1996) einer mehr oder weniger zuf¨alli-gen Stichprobe unter Umst¨anden in verschiedenen Fassunzuf¨alli-gen vorgelegt wer-den. Nach Porst (2000) sollte ein solcher Pretest Auskunft geben etwa uber die Verst¨andlichkeit der Fragen, Probleme von Befragungspersonenen¨ mit ihrer Aufgabe, Interesse und Aufmerksamkeit der Befragungsperson bei einzelnen Aufgaben aber auch w¨ahrend der gesamten Befragungsdau-er, Wohlbefinden der Befragungsperson, Kontexteffekte, Reihenfolge der Fragen, H¨aufigkeitsverteilung der Antworten und so weiter. Das Kriteri-um der Akzeptanz einer bestimmten Frage oder eines gesamten Fragen-komplexes basiert h¨aufig auf Beurteilungen und Aussagen der Interviewer und einer anschliessenden Bewertung durch sogenannte

”Pretestexperten“

(Porst, 2000, S. 72), mithin also auf Erfahrungen der mit Befragungssitua-tionen befassten Personen. In erster Linie zielen Pretests demnach darauf ab, die Qualit¨at des Messinstrumentes im Hinblick auf die weitestgehende Ausschaltung potentieller Fehlerquellen, die in der Gestaltung des Frage-bogens und der Befragungssituation begr¨undet sind, zu optimieren.

Die mit diesem Ansatz verkn¨upften Probleme liegen auf der Hand. Ei-nerseits greift hier die bereits weiter oben am operationalen Ansatz ge¨ubte Kritik. Dar¨uber hinaus werden, im Gegensatz zum Ansatz entsprechend der klassischen psychologischen Testtheorie, Fragen nach den oben bereits genannten G¨utekriterien weitgehend ignoriert. Auch die Frage danach, ob beziehungsweise inwieweit die Antworten der befragten Personen zum Bei-spiel von den Messinstrumenten oder den Interviewern unabh¨angig sind

(”Objektivit¨at“ im Sinne der klassischen psychologischen Testtheorie, siehe etwa Lienert, 1969) wird im Allgemeinen wissenschaftlich nur unbefriedi-gend beantwortet. Insgesamt ist das beschriebene Vorgehen im Hinblick auf Kriterien, wie ¨Offentlichkeit und zumindest prinzipiell unabh¨angige Repro-duzierbarkeit der Vorgehensweise und Resultate des Pretests problematisch.

Obwohl solche Pretests insbesondere dann, wenn sie sorgf¨altig geplant, durchgef¨uhrt und ausgewertet werden, eine wichtige Stufe im Prozess der Fragebogenkonstruktion sein k¨onnen, sind sie als einzig verwendetes Ver-fahren im Allgemeinen nicht ausreichend.

2.2.5 Erg¨anzungen und weitere Arbeitsgrundlagen

Die Auswahl und Konstruktion der Erhebungsinstrumente ist unabh¨angig vom gew¨ahlten Ansatz ein sehr wichtiger Punkt im Rahmen des empirischen Forschungsprozesses und eng verkn¨upft mit messtheoretischen Ans¨atzen oder ¨Uberlegungen zur G¨ute des Instrumentes. Darstellungen der verschie-denen Erhebungsinstrumente findet man in den meisten Arbeiten zu den Methoden empirischer Forschung (z.B. Roth, Heidenreich und Holling, 1999).

Da in diesem Kapitel die Darstellung der engen Verkn¨upfung statistischer Methoden und Konzepte mit den verschiedenen Stationen des empirischen Forschungsprozesses im Vordergrund stehen, wird auf diese Thematik, auch weil sie den Rahmen sprengen w¨urde, nicht weiter eingegangen. Dassel-be gilt f¨ur die im Zusammenhang mit der Umfrageforschung sehr wich-tigen Forschungsfelder zu m¨oglichen Fehlerfaktoren beim Ausf¨ullen von Frageb¨ogen, wie absichtliche Verstellung, soziale Erw¨unschtheit, Akquies-zenz oder, gegebenenfalls von Seiten der Befrager, absichtliche oder unab-sichtliche F¨alschungen sowie zu weiteren in unterschiedlicher Weise das Be-fragungsergebnis beeinflussenden Faktoren einschließlich neuerer Ans¨atze, bei denen explizit kognitive Aspekte auf Seiten der Befragten in der Be-fragungssituation ber¨ucksichtigt werden (z.B. Groves und Couper, 1998;

Sirken, Herrmann, Schechter, Schwarz, Tanur und Tourangeau, 1999). Zu erw¨ahnen sei allerdings, dass sich die in diesem Bereich durchgef¨uhrten Untersuchungen, zumindest auf der Auswertungsebene, gr¨oßtenteils selbst wieder auf statistische Methoden st¨utzen.

Nun soll hier nicht der Standpunkt vertreten werden, dass Forschung uber sozial- und wirtschaftswissenschaftliche oder psychologische Themen¨ erst dann m¨oglich ist, wenn alle entsprechenden Messmodelle, einschließ-lich der notwendigen Sch¨atz- und Testmethoden, zur Verf¨ugung stehen und der Nachweis erbracht ist, dass die jeweiligen Bedingungen erf¨ullt sind.

Stattdessen wird eine eher pragmatische Position eingenommen, wonach entsprechende Untersuchungen auch unter weniger strengen Voraussetzun-gen vorVoraussetzun-genommen werden k¨onnen, allerding unter verschiedenen Bedingun-gen. Dazu geh¨ort, dass die Interpretation der Ergebnisse nur eingeschr¨ankt m¨oglich ist, sich unter Umst¨anden nur auf die beobachteten Variablen be-zieht und, dass messtheoretische Fragen soweit wie m¨oglich ber¨ucksichtigt werden und das zugrundegelegte Messmodell falls m¨oglich angepasst wird wenn Erkenntnisse dies nahelegen (vgl. etwa Anderson, Basilevsky und Hum, 1983, S. 235 f.; Bartholomew, 1996, S. 9 f.). Gleichzeitig sei an die-ser Stelle aber die Wichtigkeit von Grundlagenforschung in diesem Bereich betont, denn sehr h¨aufig scheint in der empirischen Forschungspraxis allzu leichtfertig ¨uber messtheoretische Fragen hinweggegangen zu werden (z.B.

Blalock, 1982; Duncan, 1984).

Im Dokument Analyse von Längsschnittdaten mit fehlenden Werten: Grundlagen, Verfahren und Anwendungen. (Seite 35-46)