• Keine Ergebnisse gefunden

Vorhersage der beruflichen Eignung: Diskriminanzanalyse

3. Methoden

3.3 Vorhersage der beruflichen Eignung: Diskriminanzanalyse

Die Vorhersage, für welche spezielle berufliche Ausbildung jemand geeignet ist, kann mit einer Diskriminanzanalyse getroffen werden. Das Prinzip einer Diskriminanzanaly-se ist, die Wahrscheinlichkeit zu bestimmen, mit der ein bestimmter Merkmalsvektor, also eine bestimmte Kombination von relevanten Testergebnissen, unter der Bedingung, dass die Daten von einer Person aus einer bestimmten Gruppe sind, vorkommt.

Da die Zahl der einzelnen Tests zu groß ist, als dass jeder Test für sich als Prädiktor gehandhabt werden könnte, werden die Merkmalsvektoren aus den aus der Faktorenana-lyse geschätzten Faktoren bestehen. Die Benennung der Faktoren kann natürlich erst im Rahmen der Interpretation erfolgen. Eine zweite Diskriminanzanalyse soll auf Basis der Zusammenfassung der Tests, wie sie im Berufsförderungswerk Eckert verwandt wird, gerechnet werden (vgl. Tabelle 7). Bei dieser Beurteilung spielen auch immer die Er-gebnisse der praktischen Erprobung und der Eindruck, den der Rehabilitand bei den Praktikern hinterlassen hat sowie die Einstellung des Rehabilitanden zu der Erprobung eine Rolle. Aus den acht Einzelnoten der praktischen Testung (vgl. Anhang D) wird eine Durchschnittsnote gebildet (Praxisnote). Bei der Beurteilung des Arbeitsverhaltens (vgl. Anhang E), das pro Item nur drei Antwortmöglichkeiten zulässt, soll allen Zwei-feln zu trotz Intervallskalierung angenommen und ebenfalls ein Mittelwert berechnet werden (Praxisurteil). Auch diese Variablen werden standardisiert. Bezüglich der

eige-nen Einschätzung der praktischen Erprobung (vgl. Anhang F) sollen die vier Fragen, ob die Erprobung gefallen hat, ob der Rehabilitand mit den Aufgaben zurecht gekommen ist, ob er gesundheitliche Schwierigkeiten hatte und ob er sich eine Ausbildung in die-sem Bereich vorstellen kann, einzeln geprüft und gegebenenfalls mit aufgenommen werden. Es wird für jede Frage eine univariate Varianzanalyse gerechnet, um zu über-prüfen, ob die Variable zwischen den fünf Gruppen Unterschiede zeigen kann.

Bei der Diskriminanzanalyse geht man vom jeweiligen Centroid der Gruppe, also dem multidimensionalen Mittelwert, aus und berechnet dann den Abstand des Merk-malsvektors zum Centroid. Ein 3-dimensionales Beispiel wird in Abbildung 3 gegeben.

Dieser Abstand und die Varianzen bzw. Kovarianzen der verschiedenen Merkmale bestimmen die Wahrscheinlichkeit, dass der Merkmalsvektor vorliegt, unter der Bedin-gung, dass die Person einer bestimmten Gruppe angehört. Die Maximum-Likelihood-Entscheidungsregel besagt dann: Ordne Einheit u zu Gruppe g, wenn die Wahrschein-lichkeit für die Beobachtung des Merkmalsvektors Xu

r

für Gruppe g größer ist als für alle anderen Gruppen (Huberty, 1994).

Der einfachste Weg zur Bestimmung der Gruppenzugehörigkeit ist die Klassifizie-rung nach Fisher (1936). Werden die entsprechenden Faktorwerte mit den jeweiligen Koeffizienten einer Ausbildung multipliziert, diese Produkte und die Konstante sowie der natürliche Logarithmus der a-priori-Wahrscheinlichkeit dann addiert, ergeben sich für eine Person fünf Werte. Die Funktion, die den größten Wert hat, bestimmt die Zuge-hörigkeit der Person zur entsprechenden Gruppe. Dafür muss aber davon ausgegangen werden, dass Streuung in den Gruppen gleich ist, d. h. die Kovarianzmatrizen sich nicht unterscheiden. Diese Voraussetzung kann mittels des Box Test überprüft werden (Hu-berty, 1994).

Abbildung 3: In dem dreidimensionalen Beispiel hat der Centroid 1 die xyz-Koordinaten (2 3 1)´, Centroid 2 die xyz-Koordinaten (3 4 3)´ und der Merkmalsvektor (3 4 4)´. Hier sieht man deutlich, dass der Träger der Merkmalskombination mit höherer Wahrscheinlichkeit zu Gruppe 1 ge-hört als zu Gruppe 2

Zur Verringerung der Gesamtfehlerrate berücksichtigt man weiter die a-priori-Wahrscheinlichkeit p(g), also die Wahrscheinlichkeit ohne jedes weitere Wissen, dass ein Element zu Gruppe u gehört, und die Klassenverteilung f(xr|g)

. Da die meisten Merkmale der Analyse Testergebnisse von psychologischen Leistungstests sind, die in der Regel normal verteilt sind bzw. wenigstens als normal verteilt angenommen werden, soll diese Annahme auch hier für alle Merkmale angenommen werden. Die a-priori-Wahrscheinlichkeiten für nur diese fünf Gruppen lässt sich deshalb schwer bestimmen, da die Gruppen nur einen Ausschnitt aus einer viel größeren Menge von möglichen Be-rufsausbildungen darstellen. Dennoch soll die Zahl der Umschüler, die im Berufsförde-rungswerk Eckert in den Jahren 1997 bis 2004 eine zweiwöchige Abklärung der beruf-lichen Eignung und Arbeitserprobung absolviert haben und einen der fünf Berufe Büro-kaufmann, HotelBüro-kaufmann, IndustrieBüro-kaufmann, Steuerfachangestellter oder IT-System-elektroniker im Berufsförderungswerk Eckert gelernt haben, als Gesamtzahl dienen und die A-priori-Wahrscheinlichkeit durch die relative Häufigkeit der einzelnen Berufe dies-bezüglich geschätzt werden (vgl. Tabelle 10).

Tabelle 10: A-priori-Wahrscheinlichkeiten der fünf Berufsausbildungen, geschätzt durch die relative Häufigkeit der Umschulung in die Berufe während der Jahre 1997 bis 2004 nach einer Abklärung der beruflichen Eignung und Arbeitserprobung im Berufsförderungswerk Eckert

Unter diesen Voraussetzungen kann nun die Bayes-Entscheidungsregel formuliert wer-den: Ordne Einheit u zu Gruppe g zu, wenn die Wahrscheinlichkeit der Zugehörigkeit zu Gruppe g unter der Bedingung der Beobachtung des Merkmalsvektors Xu

r größer ist als die Zugehörigkeit zu einer der anderen Gruppen. Um Einheit u Gruppe g zuzu-ordnen, muss also gelten (Huberty, 1994):

) Normalverteilung der Merkmale bestimmt wird. Es kann so eine Formel für die Berech-nung der A-posteriori-Wahrscheinlichkeit P(g|Xu)

r einer Einheit u, sprich die Wahr-scheinlichkeit, dass ein Umschüler Gruppe g angehört, unter der Bedingung, dass die-ser die entsprechenden Testergebnisse erzielt hat, angegeben werden:

( )

Dabei ist Σg1 die Inverse der aus den Daten geschätzten Kovarianzmatrix der Gruppe g und µrg der Mittelwertvektor aller Testmittelwerte. (Xru −µrg)′Σg1(Xru−µrg) ist das Quadrat der so genannten Mahalanobis-Distanz, die den Abstand zweier Punkte im mehrdimensionalen Raum angibt. Da aber der Exponent die Größe des Terms bestimmt, wird als Diskriminanzfunktion nur der Exponent benutzt (Fahrmeir, Hamerle & Tutz, 1996):

Nachdem nach diesem Verfahren die Wahrscheinlichkeiten für die Gruppenzugehö-rigkeit für jede der fünf Gruppen berechnet wurden, wird die höchste Wahrscheinlich-keit bestimmt und die Gruppenzuordnung entsprechend getroffen.

Zur Prüfung des Modells wird die U-Statistik (Wilks’ Lambda) berechnet. Sie setzt die nicht erklärte Streuung in Verhältnis zur erklärten Streuung, ist χ2-verteilt und mit ihr wird die Nullhypothese geprüft, dass sich die diskriminierten Gruppen nicht unter-scheiden:

uung Gesamtstre

Streuung erklärte

nicht

= Λ

Dabei ist Wilks’ Lambda ein inverses Gütemaß, dessen Werte zwischen 0 und 1 lie-gen und das bei niedrilie-gen Werten für eine gute Anpassung spricht (Backhaus et al., 2003).

Da die Gruppenzugehörigkeiten der Einheiten, d. h. die verschiedenen Umschu-lungsberufe, bekannt sind, führt auch der Vergleich der wahren Gruppenzugehörigkeit mit der durch die Diskriminanzanalyse errechneten zu einer Prüfung der Güte der Dis-kriminanzfunktion. Dabei ist zu beachten, dass die Funktion mit dem Ziel aus den Daten bestimmt wurde, eine möglichst geringe Fehlerquote bei der Klassifikation zu erzeugen.

Diese Vorgabe führt aber zu einer Überschätzung der wahren Trefferquote der Funkti-on. Um dieser Verfälschung der Ergebnisse zu begegnen, wird die Leave-One-Out-Methode (Huberty, 1984) zur Bestimmung der Gruppenzugehörigkeit benutzt. Dabei wird zur Berechnung der Diskriminanzfunktion ein Fall aus der Stichprobe nicht be-nutzt. Dieser Fall wird stattdessen durch die aus den N−1 Fällen geschätzte Diskrimi-nanzfunktion klassifiziert. Dieses Verfahren wird mit allen Fällen gemacht, so dass jede Einheit durch die Diskriminanzfunktion geschätzt wird, bei deren Berechnung sie nicht beteiligt ist. Die so gewonnene Zuordnung wird nun verglichen mit der zufälligen Zu-ordnung zu den Gruppen. Die Zahl der zufällig richtig klassifizierten Einheiten berech-net sich aus der Summe der Produkte der A-priori-Wahrscheinlichkeit und der Grup-pengröße (vgl. Tabelle 10):

=

g

ng

g p

e ( )

Im vorliegenden Fall ist e=25 (vgl. Tabelle 10). Die Anzahl der durch die Diskri-minanzanalyse richtig klassifizierten Einheiten wird mit o bezeichnet. Dadurch kann eine standardnormal verteilte Prüfgröße z berechnet werden (Stevens, 1996):

N

Dabei gilt, dass die Zuordnung durch die Diskriminanzfunktion auf einem Signifi-kanzniveau von α =.05 überzufällig richtig ist, wenn z≥1.65.