• Keine Ergebnisse gefunden

Das Bestimmtheitsmaß der linearen Regression

N/A
N/A
Protected

Academic year: 2022

Aktie "Das Bestimmtheitsmaß der linearen Regression"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

on der Vielzahl an Gütemaßen ist das Bestimmtheitsmaß oder R2das bekann- teste. Es gibt an, wie gut die durch ein Regressionsmodell vorhergesagten Werte mit den tatsächlichen Beobachtungen über- einstimmen.

planung&analyse3/2019

26

ein& ausblicke statistik

Johannes Lüken, Diplom- Psychologe, ist Leiter des Bereichs Data Sciences bei IfaD.

jlueken@ifad.de

Prof. Dr. Heiko Schim- melpfennig, Diplom- Kaufmann, ist Projekt- leiter für Data Sciences bei IfaD.

hschimmelpfennig@ifad.de

Hermann, A.; Huber, F.;

Kressmann, F.: Varianz- und kovarianzbasierte Strukturgleichungs- modelle. In: zfbf, Nr.1/2006, S. 34-66.

Homburg, C.; Baum- gartner, H.: Beurteilung von Kausalmodellen.

In: Marketing ZFP, Nr. 3/1995, S.162-176.

Literatur

Interpretation des R2in der linearen Regression Formal ist das Bestimmtheitsmaß der Anteil der Va- rianz der abhängigen Variable, der durch die unabhän- gige(n) Variable(n) erklärt wird. Es kann insofern Werte zwischen 0 und1annehmen.

Abbildung 1 zeigt verschiedene Konstellationen der Beobachtungen einer unabhängigen Variable X und einer abhängigen Variable Y. Die lineare Regressions- analyse bestimmt in diesem einfachen Fall mit den Regressionskoeffizienten den Achsenabschnitt und die Steigung einer Geraden, die möglichst gut alle Be- obachtungen widerspiegelt. Wie gut dies gelingt, be- schreibt das R2. Ist R2=1, so liegen alle Beobachtungen genau auf der Regressionsgeraden. Zwischen X und Y besteht dann ein perfekter linearer Zusammenhang. Je kleiner R2ist, desto geringer ist der lineare Zusammen- hang. Ein R2= 0 bedeutet, dass zwischen X und Y kein linearer Zusammenhang vorliegt. Die Regressionsge- rade ist eine horizontale Linie, die die Y-Achse in Höhe des Mittelwertes der Beobachtungen der abhängigen Variable schneidet. Aus R2≈0 lässt sich jedoch nicht zwangsläufig folgern, dass gar kein Zusammenhang besteht. Er kann zum Beispiel quadratisch sein.

Beurteilung der Höhe des Bestimmtheitsmaßes Grundsätzliche Empfehlungen, wie hoch das Be- stimmtheitsmaß mindestens sein sollte, lassen sich nicht geben. Das R2hängt von der Höhe der Varianz ab, die überhaupt erklärbar, das heißt nicht durch den

Zufall bedingt ist, und damit von der untersuchten Fragestellung.

Zudem tendiert das Bestimmtheitsmaß dazu, mit größerem Stichprobenumfang zu sinken. Dies lässt sich anhand des beispielhaften Streudiagramms in Abbil- dung 2 veranschaulichen. Gleichgültig ob (a) nur die drei roten oder (b) alle neun roten und blauen Be- obachtungen zur Schätzung der Regressionskoeffizen- ten herangezogen werden, ergibt sich dieselbe dargestell- te Regressionsfunktion. In (a) ist R2= 0,79, in (b) da- gegen ist R2= 0,56. Je größer der Stichprobenumfang, desto eher gibt es zu demselben Wert der unabhängigen Variable bzw. dersel-

ben Kombination von Werten der un- abhängigen Varia- blen unterschiedli- che Werte der ab- hängigen Variable, so dass sich das R2 verringert.

Nichtsdestoweni- ger machen Autoren aus der Marketing- forschung Angaben zu Grenzwerten. Für Strukturgleichungs- modelle nennen Homburg/Baum-

gartner (1995) 0,4 oder Hermann et al. (2006) 0,3, wenn das Ziel die möglichst gute Erklärung der abhängigen Variable ist.

Aber selbst Regressionsanalysen mit geringem R2 können wertvolle Infomationen liefern. Der Einfluss ein- zelner unabhängiger Variablen kann statistisch signifi- kant sein, das heißt es werden Variablen identifiziert, mit denen die abhängige Variable verändert werden kann.

Relative Wichtigkeit einzelner Variable

Die Höhe der geschätzten Regressionskoeffizienten hängt auch vom Skalenniveau der Variablen ab. Der standardisierte Regressionskoeffizientβdagegen gibt unbeeinflusst vom Skalenniveau die Stärke des linearen Zusammenhangs zwischen einer unabhängigen und der abhängigen Variable an. Im Fall einer einfachen Regression entspricht er dem Korrelationskoeffizien- ten r. Dann ist das Bestimmtheitsmaß R2=β· r = r2. Bei mehreren unabhängigen Variablen Xiist R2=∑(βi· ri).

Demnach ist der Beitrag einer Variablen Xi zum R2 gleichβi· riund damit in Treiberanalysen ein Maß für die relative Wichtigkeit einer unabhängigen Variable für die abhängige Variable.

In Ausgabe 4/2019: Nicht-lineare Regression

Das Bestimmtheitsmaß der linearen Regression

Abbildung 2: Stichprobenumfang und R2

Abbildung 1: Beispiele geschätzter Regressionsgeraden

V

Referenzen

ÄHNLICHE DOKUMENTE

Wenn auch selten, aber da es in den Staaten mit dem Energiesparen noch nicht sehr weit her ist, sind im Bereich der Gebäudevernetzung die Europäer und mit ihnen auch die Entwickler

Stimmt es, dass Alleinerziehende aufgrund des hängigen Rechtsstreits, die Stipendien für ihre sich in Ausbildung befindenden Kinder sistiert worden sind.. Wenn ja, weshalb wurde

Auf Optimierungsprobleme können die Kriterien, die für die Kurvenuntersuchung gelten, angewendet werden (siehe Abschnitt „1 Differenzieren“). Lokale Extremwerte findest du über

Liegen nichtmetrische Merkmale vor, die mit einem bestimmten anderen monotonen Merkmal korrelieren, dann kann ein Korrelationskoeffizient dann berechnet werden, wenn beide Merkmale

Bevor sich beide Spieler entscheiden, ob Sie zum Boxkampf oder zum Ballett gehen, hat Spieler 1 die Möglichkeit, öffentlich Geld im Wert von einer Geldeinheit zu verbrennen..

Zumindest geht die Informa- tionsmache so weit, dass die Verbrau- cher nicht mehr wissen, was sie essen sollen, die Bauern um ihre Existenz fürchten und wir alle nicht mehr nach

Gehe die Liste mit den Werten durch und markiere alle Werte, die dir in deinem Leben wichtig sind und mit denen du ein sehr positives Gefühl verbindest.. Werte, bei denen du

In einigen dieser Sprachen kann zwischen Wert- und Referenzsemantik und zwischen Wert- und Referenzparametern gewählt werden, jedoch bieten die Sprachen keine konzeptionelle