• Keine Ergebnisse gefunden

Lineare Regression

N/A
N/A
Protected

Academic year: 2022

Aktie "Lineare Regression"

Copied!
5
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Lineare Regression

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Im einfachsten Fall werden mehrere Prädiktoren (oder nur einer) für eine abhängige

Variable gewählt, mit der Methode "Einschluß" werden alle Prädiktoren simultan ins Modell aufgenommen.

Dialogfeld Lineare Regression

Abhängige Variable (Kriterium)

Unabhängige Variablen (Prädiktoren)

"Block" und "Methode" ermög- lichen das Schrittweise Hinzu- nehmen und Ausschließen von Prädiktoren aus dem Modell (s.u.).

Variable zur Auswahl bestimmter Fälle, i.d.R. nicht nötig (und geht auch über "Fälle auswählen") Variable zur Fallbeschriftung in Diagrammen (z.B. Vpn-Nr.) Hier können die Aufnahme- und Ausschlußkriterien für Prädiktoren bei schrittweiser Analyse (s.u.) gewählt werden: Weiterhin kann die Regressionskonstante im Modell unterdrückt werden (b0=0) und die Behandlung fehlender Werte eingestellt werden.

Hier können u.a. vorhergesag- te Werte, Residuen und Konfidenzintervallgrenzen für jeden Fall als neue Variablen Als Diagramme können Streu-

diagramme von vorhergesag- ten Werten und Residuen angefordert werden. Außer- dem kann die Normalvertei- Zum Berechnen eines

Modells gewichteter kleinster Quadrate.

Statistiken s.u.

(2)

Dialogfeld Statistiken

Zusätzlich zur Standardausgabe (s.u.) "Schätzer" und "Anpassungsgüte" können eine Reihe weiterer Statistiken angefordert werden:

Konfidenzintervalle: Gibt 95%-Konfidenzintervalle für die Schätzungen der b-Gewichte mit aus.

Kovarianzmatrix: Eine Tabelle mit Korrelationen und Kovarianzen der Prädiktoren untereinander.

Änderung in R-Quadrat: Gibt (bei schrittweisem Vorgehen, s.u.) die Änderungen in der determinierten Varianz nach Hinzunehmen oder Weglassen von Prädiktoren an.

Nützlich zum Testen der Signifikanzen von Inkrementen/Dekrementen!

Deskriptive Statistik: Zeigt Variablenmittelwerte, Standardabweichungen und eine Korrelationsmatrix mit einseitigen Wahrscheinlichkeiten an.

Teil- und partielle Korrelationen: Zeigt die für jeden Prädiktor die einfachen Korrelationen ("nullter Ordnung") mit dem Kriterium sowie Partielle und Part- Korrelationen unter Kontrolle der übrigen Prädiktoren an.

Kollinearitätsdiagnose: Zeigt die Toleranzen für einzelne Variablen und eine Vielzahl von Statistiken für die Diagnose von Kollinearitätsproblemen an. Kollinearität (oder

(3)

Schrittweise Analyse

Die Lineare Regressionsanalyse baut auf dem allgemeinen linearen Modell auf, die

Ergebnisse, die mit diesem Verfahren erzielt werden, sind insofern rechnerisch dieselben, die man mit "Allgemeines Lineares Modell"-"Allgemein mehrfaktoriell" erhält, wenn man nur intervallskalierte Prädiktoren ("Kovariaten") im Modell hat. Der Vorteil der "Linearen Regression" ist die Möglichkeit eines Schrittweisen Vorgehens und damit der gezielten Bestimmung von Inkrementen. Mehrere Analyseschritte werden als "Blöcke" definiert, indem nach dem ersten "Block" mit "weiter" zu einem nächsten Schritt gewechselt wird:

Im nächsten Schritt ("Block") können zusätzliche Variablen ins Modell aufgenommen oder Prädiktoren aus dem ersten Block entfernt werden. Dies geschieht über die Methoden

"Einschluß" und "Ausschluß".

Beispiel: Wenn im ersten Schritt ein Modell mit zwei Prädiktoren x1 und x2 berechnet werden soll und im zweitem zum Vergleich nur x1 als prädiktor verwendet werde soll, muß in "Block 2" nur x2 im Feld "unabhängige Variablen" stehen und im "Methode"-Feld

"Ausschluß" gewählt sein:

c d

Ist hierbei unter "Statistiken" (s.o.) "Änderung in R-Quadrat" gewählt, erhält man in der Ausgabe die Differenz zwischen dem ersten und zweiten Modell (x1 und x2 vs. nur x1) sowie die Signifikanz dieser Differenz (in diesem Fall das Dekrement von x2; dies

entspricht dem Test "uneingeschränktes vs. eingeschränktes Modell"). Umgekehrt könnte in Schritt eins nur x1 aufgenommen werden und in Schritt zwei x2 mit "Einschluß"

hinzugenommen werden.

(4)

Neben "Einschluß" und "Ausschluß", wobei in benutzerdefinierter Reihenfolge Prädiktoren aufgenommen oder ausgeschlossen werden, stehen folgende Methoden zur Verfügung, die bei einem Block mit einer Liste von Prädiktoren verwendet werden können:

"Schrittweise": Bei jedem Schritt wird die noch nicht in der Gleichung enthaltene

unabhängige Variable mit der kleinsten F-Wahrscheinlichkeit aufgenommen. Bereits in der Regressionsgleichung enthaltene Variablen werden entfernt, sobald ihre F-

Wahrscheinlichkeit groß genug ist. Die Analyse wird abgebrochen, wenn keine Variablen für Aufnahme- oder Ausschluß mehr vorhanden sind.

"Vorwärts": Eine Prozedur zur schrittweisen Variablenauswahl, in der die Variablen nacheinander in das Modell aufgenommen werden. Die erste Variable, die betrachtet wird, ist die mit der größten positiven bzw. negativen Korrelation bezüglich der

abhängigen Variablen. Diese Variable wird nur in die Gleichung aufgenommen, wenn sie das Aufnahmekriterium erfüllt. Wenn die erste Variable ausgewählt ist, wird die unabhängige Variable mit der größten partiellen Korrelation betrachtet. Die Prozedur stoppt, wenn keine verbliebene Variable das Aufnahmekriterium erfüllt.

"Rückwärts": Alle Variablen werden in die Gleichung aufgenommen und anschließend sequentiell ausgeschlossen. Die Variable mit der kleinsten Teilkorrelation zur

unabhängigen Variablen wird als erste für den Ausschluß in Betracht gezogen. Wenn Sie die Ausschlußkriterien erfüllt, wird sie entfernt. Nach dem Ausschluß der ersten Variablen wird die nächste Variable mit der kleinsten Teilkorrelation in Betracht gezogen. Die Prozedur wird beendet, wenn keine Variablen mehr zur Verfügung stehen, die die Ausschlußkriterien erfüllen.

Diese drei Vorgehensweisen sind geeignet, um aus einer Liste von Prädiktoren diejenigen auszuwählen, die einen signifikanten Beitrag zur Erklärung des Kriteriums leisten, und die übrigen auszuschließen. Im Unterschied zu "Schrittweise" werden bei "Vorwärts" und

"Rückwärts" keine Variablen mehr ausgeschlossen, die einmal aufgenommen wirden. Die Modellgütekriterien und –parameter werden für jeden Schritt ausgegeben. Die Ein- und Ausschlußkriterien für Prädiktoren können unter "Optionen" verändert werden.

(5)

Standardausgabe

Ohne die Wahl zusätzlicher Ausgabeoptionen (z.B. unter "Statistiken, s.o.) liefert die Lineare Regression folgende Standardausgabe (Nach Punkten im Ausgabe-Navigator):

1) Titel: „Regression“

2) Anmerkungen: Werden nur bei Doppelklicken auf den entsprechenden Punkt im Navigator angezeigt; enthalten u.a. die SPSS-Syntax der durchgeführten Analyse.

3) Aufgenommene/Entfernte Variablen: Einfache Liste der Prädiktoren, die in den einzelnen Analyseschritten ins Modell aufgenommen oder daraus entfernt wurden.

4) Modellzusammenfassung: Eine tabellarische Darstellung der multiplen R's und R- Quadrate für jedes Modell (i.e. jeden Analyseschritt). Hier kommen ggf. (s.

"Statistiken") die "Änderungen im R-Quadrat" von Schritt zu Schritt hinzu.

5) ANOVA: Signifikanzprüfung der Gesamtmodelle (erklärte Varianz, F-Werte und p's).

6) Koeffizienten: Schätzungen der Einflußgewichte (b-Werte) und deren Signifikanzen für jedes Modell. Hier kommen ggf. (s. "Statistiken") die Korrelationen nullter Ordnung, Part- und Partielle Korrelationen der Prädiktoren mit dem Kriterium sowie

Konfidenzintervallgrenzen für die b's hinzu.

7) Ausgeschlossene Variablen: Eine Tabelle mit allen in den einzelnen Schritten nicht im Modell vorhandene Prädiktoren sowie b-Gewichte und Signifikanzen derselben, wenn sie mit im Modell gewesen wären.

Modelle mit Moderatorterm

Ein Moderatoreffekt wird mit aufgenommen, indem das Produkt zweier Prädiktoren als Prädiktorvariable hinzugenommen wird. Im SPSS-Verfahren "Lineare Regression" muß man hierzu tatsächlich eine zusätzliche Variable berechnen ("Transformieren"-

"Berechnen"). In "Allgemeines Lineares Modell"-"Allgemein mehrfaktoriell" kann die Wechselwirkung zwischen zwei intervallskalierten Prädiktoren (was rechnerisch dasselbe ist) unter "Modell"-"Anpassen" ohne Berechnung einer zusätzlichen Variablen ins Modell aufgenommen werden. Da die Prüfung des Zuwachses an erklärter Varianz durch den Moderatorterm in der "Linearen Regression" durch das schrittweise Vorgehen bequemer ist, kann sich der Aufwand, eine neue Variable zu berechnen, dennoch lohnen.

Rechnerisch leisten beide Verfahren dasselbe und führen entsprechend zu denselben Ergebnissen!

Referenzen

ÄHNLICHE DOKUMENTE

P(Theorie | Daten) Wahrscheinlichkeit, dass die Theorie stimmt, wenn bestimmte Daten beobachtet wurden. P(Daten | Theorie) Wahrscheinlichkeit, bestimmte Daten zu beobachten,

Figure 1 illustrates that the Volume Home Block has a pointer to the first sector of the File Headers, as well as to the first sector of the Master File Directory.. Each Directory

In order to get out of the self refresh mode, the display controller inputs the shift clock XSCL to the SED1580 for four or more horizontal display periods with the timing of the

Page direction address control is performed when the display RAM is accessed by the MPU and when contents of the display data RAM are read for the liquid crystal display.. When the

The voltage converter, consisting of a boost control cir- cuit and a voltage converter circuit, receives clocks from the clock generator circuit and boosts the input power voltage (V

◊ When the CK counter counts 8 of shift clock input (CK input) (reads the input 8-bit serial data), the serial data taken in the command/data register is output to the display

The line count register is incremented by the CL clock once for every display line, thus generating a pointer to the current line of data in display data RAM being transferred to

The differentiator, zero-volt comparator generate data pulses from the amplified signals from the magnetic head and waveform shaper section... Figure 4 Input