• Keine Ergebnisse gefunden

3. Hauptstudie

3.4 Datenauswertung

3.4.2 Auswertung der Phase III - fMRT-Auswertung

3.4.2.2 Datenanalyse und Statistik

Nach der Vorverarbeitung der funktionellen Hirndaten erfolgt die statistische Anal yse.

Modell: Ziel der statistischen Auswertung ist die Lokalisation des neurophysiologischen Signals, um diesem anatomischen Funktionen zuordnen zu können. Die graphische Dar-stellung signifikanter Aktivierungen bedarf statistischer Methoden, wobei in der vorli e-genden Studie parametrische Modelle582F 582F579 im Rahmen der Zeitreihenanalyse, basierend auf dem Allgemeinen Linearen Modell (ALM), angewandt wurden.

Allgemeine Darstellung583F 583F580: Das ALM erklärt die Reaktions-Variable Yj als lineare Kombination der erklärenden Variable sowie eines Fehlerterms und lässt sich wie folgt formal darstellen:

Formel 12: Allgemeines lineares Modell

j L jL l

jl j

j

x x x

Y

1 1

... ...

bzw.

mit Yj = abhängige Variable, mit j 1,...,J als Index für die jeweilige Bebachtung,

xjl = Menge an Beobachtungen mit L (L<J) erklärenden Variablen, wobei l 1,...,Lder In-dex für den jeweiligen Prädiktor darstellt

l = unbekannte Parameter, geben Einfluss der jeweiligen Prädiktoren xij wieder

j = Fehlerterm (error term), unabhängig und gleichverteilt (independent and identical dis-tributed, iid); Mittelwert Null, Varianz ² ( ~N(0, ²)

iid

j )

576 Vgl. ebenda, S. 679-680

577 Funktion mit fmax =0,6 ergibt Kernel-Breite h= 0,3 auf der Y-Achse

578 Voxel außerhalb dieses Bereiches werden als nicht signifikant verworfen.

579 So lassen sich nichtparametrische Methoden und multivariate Analysemethoden nutzen. Lineare parametri-sche Ansätze zählen aber zu den häufigst verwendeten Analysemethoden. Vgl. Lange, N.(2000), S..305

580 Die folgende Darstellung folgt weitestgehend Kiebel, S.J., Holmes, A.P. (2007), S. 101-105

Yj ist als Zufallsvariable zu verstehen und wird zur Modellierung vor der eigentlichen Erhebung als solche behandelt. Für die Prädiktoren xjl gilt, dass für jede Beobachtung eine Menge an L (L J) zu erklärenden Variablen zur Verfügung steht, wobei

L

l 1,..., der Index für den jeweiligen Prädiktor darstellt. Die unabhängigen Variablen

x

jl können Kovariate584F 584F581 oder Dummy-Variablen sein.

Matrizenform und OLS-Schätzer: Aufgrund der Erhebungsart mittels fMRT liegen zur Analyse mehrere Zeitreihen pro Voxel pro Proband vor, sodass sich ein System von Gleichungen aufstellen lässt. Im Folgenden wird zudem auf die Matrizenda rstellung des ALM und die Kleinst-Quadrate-Methode (Ordinary Least Squares, OLS) eingegangen.

Wird 614H614HFormel 12 in Matrizenform für jede Beobachtung j geschrieben, ergibt sich eine Menge an Gleichungen, die sich auch als Matrix für alle Beobachtung aufstellen lässt.

Formel 13: Gleichungssystem und Matrix-Form des ALM

a) Gleichungssystem b) Matrix-Form

J L JL l

Jl J

J

j L jL l

jl j

j

L L l

l

x x

x Y

. .

. .

. .

x x

x Y

. .

. .

. .

x x

x Y

...

...

. . .

...

...

. . .

...

...

1 1

1 1

1 1

1 1 11 1

J j

L l

JL Jl

J

jL jl

j

L l

J j

x x

x

x x

x

x x

x

Y Y Y

. . . . . .

. . . . . .

...

...

. . . . . . . . . . .

...

...

. . . . . . . . . . .

...

...

. . . . . .

1 1

1 1

1 1

11 1

Y ist der Spaltenvektor der Beobachtungen, der so viele Zeilen wie Beobachtun-gen j 1,...,J. Die Design-Matrix X hat ebenos viele Zeilen wie Beobachtungen

J

j 1,..., und Spalten wie unabhängige Variablen l 1,...,L hat. Basierend auf der Mo-dellierung erfolgt die Schätzung mittels Kleinst-Quadrate Methode.

Parameterschätzung mittels OLS585F 585F582: Nach der Durchführung der Messung steht eine Vielzahl an Beobachtungswerten für die Zufallsvariable Yj zur Verfügung, die im Fol-genden daher mit yj gekennzeichnet werden. Das Gleichungssystem lässt sich gut lö-sen, solange so viele unbekannte Parameter wie Gleichungen vorhanden sind. Dies trifft

581 In Modellen mit kategorialen Variablen lassen sich zusätzlich metrische unabhängige Variablen einfügen (Kovariate), die nicht mit den kategorialen Variablen korrelieren dürfen. Zumeist werden Kovariate genutzt, um in faktoriellen Designs die Reststreuung (nicht erklärte Streuung durch die Faktoren) durch zusätzliche Varia b-len, die nicht im faktoriellen Design enthalten sind, jedoch einen vermuteten Einfluss auf die unabhängige Var i-able besitzen, zu minimieren. Vgl. Jansen, J., Laatz, W. (2003), S. 349, Backhaus, K. et al. (2008), S. 170

582 nach Markoff ist die Methode der Kleinsten Quadrate ein „[…] Mittel, angenäherte Ergebnisse aus vielen Beobachtungen zu erhalten, mit Schätzung der Zuverlässigkeit dieser Ergebnisse“ Markoff, A.A: (1912), S. 201

im vorliegenden Fall nicht zu, da mehr Gleichungen J (Beobachtungen) als unbekannte Parameter L existieren (L (L J)). Zur Lösung dieses Problems wird daher eine Me-thode angewandt, mittels derer die entsprechenden Parameter so geschätzt werden, dass sie sich möglichst gut an die beobachteten Daten anpassen. Das Ziel soll es demnach sein, die Parameterkoeffizienten

l so zu schätzen, dass das ALM die beobachteten Werte yj möglichst gut durch die unabhängigen Parameter xjl erklärt werden können, oder anders ausgedrückt, dass der Fehlerterm j möglichst minimal ist. An dieser Stelle wird auf die OLS zurückgegriffen. Die Anwendung wird im Folgenden kurz dargestellt.

Der Zeilenvektor ˆ ˆ ,..., ˆL T

1 stellt den transponierten Spaltenvektor586F 586F583 der geschätz-ten Parameterkoeffiziengeschätz-ten dar. Durch Multiplikation mit dem Parametervektor ergeben sich die durch das Modell geschätzten WerteYˆ :

Formel 14: Gleichung der geschätzten Beobachtungswerte ˆ ˆ

,..., ˆ

ˆ Y1 Y X

Y J T bei Beachtung des Fehlers 1

,...,

J T

Y Y ˆ Y X ˆ

. Die Summe der quadrierten Abweichung (Quadratsumme) des Fehlerterms (

SS

Res) ist die Summe der quadrierten Differenzen zwischen beobachteten Yj und geschätzten Werten Yˆ und gibt die Güte der Schätzung bzw. die Anpassung der geschätzten Werte an die beobachteten Werte wieder. Die OLS-Schätzer sind Parameterschätzer, welche die Summe der quadrierten Abweichungen minimieren. Dies entspricht 615H615HFormel 15.

Formel 15: Quadratsumme des Fehlerterms

J

j

T j

s

e e e

SS

1 2

Re 587F587F584  ( ˆ ... ˆ )²

1

1 1

Re jL L

J

j

j j

s Y x x

SS

Zur Auffindung der optimalen Parameter wird die erste Ableitung der Quadratsumme nach den Parameterschätzern genutzt, welche der folgenden Gleichung folgt:

Formel 16: Ableitung der Quadratsumme des Fehlerterms 0

ˆ ) )(

(

ˆRe 2 1 1

J

j

L j j jl l

s x Y x

SS .

583 Die Transponierung des Spaltenvektors ist notwendig, da eine Multiplikation zweier Matrizen (respektive eine Matrix und eines Vektor in diesem Fall) voraussetzt, dass eine Matrix so viele Spalten wie die zweite Matrix Zeilen hat. Ohne die Transponierung ließe sich die Multiplikation daher nicht realisieren.

584 Die Multiplikation einer Matrix mit ihrer transponierten Matrix ergibt eine sogenannte Systemmatrix, die lediglich zur Quadrierung der Matrixelemente führt, Beispiel: 3 3 4 4 5 5 91625

5 4 3 5 4 3 e

eT .

Dies entspricht geometrisch der Euklidischen Distanz

616H616H

Formel 16 entspricht der l-ten Zeile von 617H617HFormel 17, wobei ˆ den Vektor der OLS-Schätzer darstellt.

Formel 17: Zusammenhang zwischen den Parametern

) ˆ ( X X Y

X

T T 588F588F585.

Die OLS-Schätzer entsprechen, gemäß dem Satz von Gauß-Markow, minimalvarianten linearen erwartungstreuen Schätzer (best linear unbiased estimators, BLUE589F 589F586). Dies bedeutet, dass für alle geschätzten linearen Parameter die OLS-Schätzer die geringste Varianz aufweisen. Um 618H618HFormel 17 nach ˆ auflösen und somit die OLS-Schätzer be-stimmen zu können, muss mit der Inversen von XTX multipliziert werden. Wenn

X

XT invertierbar ist (die Design-Matrix X volle Ränge, also regulär, nicht singulär

ist590F 590F587) entsprechen die OLS-Schätzer

ˆ

nach Multiplikation mit der Inversen 619H619HFormel 18:

Formel 18: Kleinst-Quadrate-Schätzer

ˆ ˆ

ˆ X X 1 X X 1X Y X X 1 X X X X 1X Y

X X Y

XT T T T T T T T T

Geometrische Darstellung: Zum besseren Verständnis lässt sich der obige Zusammen-hang in Form einer geometrischen Darstellung wiedergeben (Vgl. 620H620HAbbildung 22). Der Spaltenvektor der beobachteten Werte Y entspricht einem Punkt im J J-dimensionalen Euklidischen Raum591F 591F588 (Vektorraum). Die Linearkombination von X und

ˆ ergibt für ein bestimmtes ˆ inXˆeinen Punkt in einem Unterraum von J (dem X-Raum). Dieser X-Raum wird durch die Spalten der Design-Matrix Xaufgespannt, wo-bei die Spalten J-Vektoren mit so vielen jeweils Zeilen wie Beobachtungen j 1,...,J darstellen. Die Fehlerquadratsumme für die geschätzten ˆ entsprechen, wie bereits dar-gestellt, der Abweichung von Xˆ und Y. Demnach korrespondiert jedes geschätzte ˆ mit demjenigen Punkt im X-Raum, der möglichst nahe am jeweilig korrespondierenden

Y liegt. Lotet man von Y in den X-Raum, trifft man den Punkt Yˆ Xˆ. Für das Lot lässt sich die Projektionsmatrix definieren:

585 Schreibweise entspricht Assoziativgesetz der Matrizenmultiplikation:

Y T T

TY X X X X

X ( )ˆ ˆ

586 dies ist nur dann zulässig, wenn die Fehler nicht korreliert (keine Autokorrelation) sind, einen Erwartungs-wert von Null besitzen und Homoskedastizität (gleiche Varianz) vorliegt.

587 Matrizen sind nur invertierbar, wenn sie volle Ränge aufweisen. Sie werden als reguläre Matrizen bezeich-net, andernfalls werden sie als singulär bezeichnet und weisen weniger Ränge als Dimensionen auf, dies kann auch vorliegen, wenn die Spalten der Design-Matrix linear voneinander abhängig sind. Im Falle einer singulä-ren Matrix lassen sich mehrere Lösungen für die KQ-Schätzer bestimmen indem, wie z.B. auch in der verwen-deten Software, die Pseudoinverse (z.B. von Moore-Penrose) genutzt wird.

588 Vgl. weiterführend z. B. Jänich, K. (2001), S. 477-514

X X X X X Y Y X X X X Y Y PY X

Y X X

X x

P T T

T T

Y T

T

x

) ˆ ˆ (

) ˆ (

)

ˆ ( 1 1

ˆ

1    

P

x entspricht einer geometrischen Projektion in den X-Raum, wobei in Verbindung mit der Fehlerquadratsumme e in Matrixschreibform gilt:

R ( E

J

P

x

)

. Umgeformt be-deutet dies:RY e und R demnach eine Projektionsmatrix ist, welche orthogonal zum X-Raum verläuft. Graphisch lässt sich dies wie folgt darstellen:

Abbildung 22: Geometrische Darstellung des Schätzproblems

Hier zeigt sich, dass die geringste Distanz zwischen den Beobachtungswerten Y und den geschätzten Werten Yˆ sich aus der OLS-Schätzung dort ergibt, wo der geringste Ab-stand zwischen beiden Werten ist (gekennzeichnet durch e).

Zur Studie

Für die Untersuchungen der Hauptstudie werden die ALM im Folgenden aufgestellt. Das ALM erklärt die Reaktions-Variable Yj (hier: hämodynamische Reaktion, BOLD-Signal) bezüglich der Linearkombination der jeweils beiden Prädiktoren und des Fehler-terms. Zugrunde liegt eine Zeitreihe mit N Beobachtungen:

Y

1

..., Y

s

,... Y

N, die zum Zeit-punkt ts in für einen Voxel erfasst wurden mit s 1,...,N(455) als Scan-Nummer und

j als Fehlerterm.

Formel 19: Allgemeines lineares Modell der Studie

s s L L s

l l s

s f t f t f t

Y 1 1( ) ... ( ) ... ( )

Die L Funktionen f1(.),...,f L(.) entsprechen den Regressoren (X), deren Linearkombi-nationen den Raum der möglichen fMRT-Daten Yj aufspannen. Für alle Zeitpunkte

455 ,..., 1 s mit

ts lässt sich 621H621HFormel 19 als Gleichungssystem oder Matrix formulieren:

Formel 20: Gleichungssystem II

a) Gleichungssystem b) Matrix-Form

N N L L N

l l N

N

s s L L s

l l s

s

L L l

l

t f t

f t

f Y

. .

. .

. .

t f t

f t

f Y

. .

. .

. .

t f t

f t

f Y

) ( ...

) ( ...

) ( .

. .

) ( ...

) ( ...

) ( .

. .

) ( ...

) ( ...

) (

1 1

1 1

1 1 1

1 1 1 1

N s

L l

N L N

l N

s L s

l s

L l

N s

t f t

f t

f

t f t

f t

f

t f t

f t

f

Y Y Y

. . . . . .

. . . . . .

) ( ...

) ( ...

) (

. . . . . . . . . . .

) ( ...

) ( ...

) (

. . . . . . . . . . .

) ( ...

) ( ...

) (

. . . . .

. 1 1

1 1

1 1

1 1 1

Die obige Matrix lässt sich vereinfacht im hier jeweils vorliegenden Fall mit zwei Prä-diktoren auch als Y X1 1 X2 2 schreiben, wobei X als Design-Matrix die Werte der stetigen Regressoren zum Zeitpunkt ts einer fMRT-Zeitreihe darstellt. Die Spalten der Design-Matrix entsprechen daher den Regressoren, die den Raum der fMRT-Reaktionswerte des Experimentes spannen. Die abhängige Variable Y wird als lineare Kombination der unabhängigen Variablen X in einer Design-Matrix und einem Error-Term e mit bekannter Autokorrelation modelliert. Diese Autokorrelation liegt vor, da die Messreihen von jeweils einer Person stammen und eine Abhängigkeit aufgrund der recht langsamen hämodynamischen Reaktion vorliegt. Um diesem Problem zu begegnen, wird eine zeitliche Glättung592F 592F589 mittels Tiefpassfilter zur Beseitigung von Hochfrequenzrau-schen genutzt. Dies vermindert die Korrelation der aufeinanderfolgenden Werte (Gauß-Kernel, 4 Sekunden). Mittels Hochpassfilter wurden Artefakte rausgerechnet, die unter-halb einer kritischen Grenze liegen. Das Grundprinzip der Auswertung besteht in einer Modellierung der Signalveränderung in den fMRT-Daten, die gemessen wurden. Dazu wird ein experimentelles Paradigma spezifiziert (hier Block-Design), welches linear mo-delliert wird. Diese Modell-Zeitreihe wird sodann mit den beobachteten Zeitreihen kol-lationiert (Boxcar-Regressor) und die Abweichung zwischen Modell und tatsächlichem Signalverlauf bestimmt. 622H622HAbbildung 23 zeigt diese Modellierung graphisch.

Abbildung 23: Grundprinzip der statistischen Auswertung

In Anlehnung an: Jäncke, L., Lutz, K. (2005), S. 109

589Vgl. Jäncke, L.,Lutz, K. (2005), S. 110

Im Folgenden wird getestet, ob das Signal in einem Voxel signifikant von der experi-mentellen Bedingung hervorgerufen wurde. Mittels ALM werden die beobachteten Da-ten in durch das Modell erklärbare (Effektvarianz) und nichterklärbare Varianzanteile (Residualvarianz) zerlegt und verglichen. Je größer die Residuen sind, desto schlechter kann das Modell den Signalverlauf beschreiben.593F 593F590

Inferenzen: Für jeden Probanden muß zunächst eine Einzelprobanden-Analyse über ein Fixed-Effect-Modell berechnet werden. Hierbei wird davon ausgegangen, dass es bei der Schätzung des mittleren (durchschnittlichen) Effekts nur einen wahren Effektwert gibt, da sämtliche Beobachtungen von einer Person stammen und die Heterogenität der beo-bachteten Werte zum Gesamteffekt beitragen. Diese Flexibilität hinsichtlich der indivi-duellen Heterogenität ist an dieser Stelle von Vorteil, da es um die Einschätzung eines einzelnen Probanden geht. Durch den fehlenden Vergleich ist eine Inferenz für die Grundgesamtheit jedoch nicht möglich. Random-Effect-Modelle werden für die Grup-penanalysen (entweder alle Probanden oder ex post gebildete Gruppen wie in dieser Stu-die preis- und markenbewusste Probanden) genutzt, um Stu-die Verteilung von Effektwerten abhängig von der jeweiligen Person zu berücksichtigen. Wirkungsunterschiede gehen auf die Varianz zwischen den Individuen zurück.594F 594F591

Single-Subject Analyse (Einzelprobandenebene) - Fixed-Effect-Modell

Nach Analyse der ersten Ebene (Individualebene) lassen sich die ersten gewonnen Er-gebnisse weiter verwenden. Für Gruppenanalysen ist die Normalisierung notwendig.

Vor der Gruppenanalyse werden zunächst für jeden Probanden zwei Prädiktoren auf Basis der individuellen Bewertung gebildet (sympathische, nichtsympathische Marken), auf deren Basis ein Block-Design (Boxcar-Regressor) für jeden Probanden berechnet wird. Das entsprechende Modell lautet:

Formel 21: Einzelprobandenebene

2 2 1

1

X

X

Y

mit Y als abhängige Variable (BOLD-Signal), X1 und X2 als die beiden unabhängige Va-riablen (1=sympathische Marken, like, 2=nichtsympathische Marken, dislike), l ist der jeweils korrespondierende Regressionskoeffizient zum Prädiktor Xl und j entspricht dem Fehlerterm. Mittels OLS erfolgt die Schätzung über alle 455 Beobachtungen und

zwei Regressoren pro Proband: ( ˆ ... ˆ )²

1

1 1

Re jL L

J j

j j

s Y x x

SS .

590 Vgl. Jäncke, L.,Lutz, K. (2005), S.108

591 Vgl. Penny, W.D., Holmes, A.J. (2007), S. 156

Nach der Schätzung liegt für jeden Zeitpunkt ein geschätzter Parametervektor ˆ vor:

ˆ

1

X Y X

X

T T .

Um im Weiteren zu analysieren, welcher der Prädiktoren oder Bedingungen (like, dislike) welchen Effekt bei den Probanden erzeugt, werden Kontraste595F 595F592 aufgestellt, die eine statistische Inferenz ermöglichen. Dazu lassen sich die Bedingungen miteinander addieren, voneinander subtrahieren oder separat betrachten.

Für das erste Modell der Einzelprobanden-Analyse wird nach neuronalen Korrelaten für sympathische oder nichtsympathische Marken gesucht. Daher werden die Konditionen voneinander subtrahiert, um zu prüfen, ob Aktivierungen für sympathische Marken nach Abzug von nicht sympathischen einen signifikanten spezifischen linearen Anstieg der Aktivierungen darstellen. Die Bedingungen like und dislike werden voneinander subtra-hiert, was sich formal im ersten Kontrast ausdrückt. Im zweiten Schritt erfolgt die Sub-traktion der zweiten Bedingung (dislike) von der ersten (like) und führt formal zum zweiten Kontrast. Um die -Werte zu überprüfen, wird die Linearkombination von

ˆ ... ˆ

ˆ1 1

T p

p erzeugt, wobei der Spaltenvektor zur Multiplikation mit dem Parametervektor vorher transponiert werden muss: 1T [ 1,..., p]. P entspricht der Anzahl an Parametern oder Regressoren in X (hier: like, dislike). Der Kontrastvektor lässt sich nutzen, wenn er als Linearkombination mit den Zeilen von X dargestellt wer-den kann und somit im X-Raum XT liegt.

Für den ersten Kontrast gilt: 1T [1 1]  [1 1]ˆ. Gesucht ist demnach die Signi-fikanz der Aktivierungen der like-Marken abzüglich der Aktivierungen der dislike-Marken. Diametral gilt für den zweiten Kontrast: T2 [ 1 1]  [ 1 1]ˆ. Die Kon-traste werden über Einstichproben-t-Tests ausgewertet.

Formel 22: t-Statistik

ˆ ) (

ˆ

T T

SD t

Die Ergebnisse der Analyse dienen nicht der statistische Inferenz auf die Population, da es sich jeweils nur um ein bestimmtes Gehirn handelt, nicht um die gemittelte Analyse mehrerer Probanden.

592 Kontraste (lineare Verbindungen) dienen der Analyse und Überprüfung von (gerichteten) Hypothesen und ermöglichen es, einzelne Parameter zu untersuchen. Mittels t-Tests oder F-Test lässt sich die Nullhypothese untersuchen, ob im Falle des t-Tests bestimmte Linearkombinationen (Bedingung 1 minus 2) Null sind. Vgl.

Friston, K. (2007), S. 17

mit SD als Standardabweichung, als jeweiliger Kontrast

t folgt approximativ der t-Verteilung

Multi-Subject Analyse (Gruppenebene) - Random-Effect-Modell

Nach Analyse auf Einzelprobandenebene lassen sich die Daten und aufgestellten Kon-traste weiter für Gruppenanalysen verwenden. Für Gruppenanalysen ist jedoch eine Normalisierung notwendig. Mittels Random-Effect-Modell können alle Probanden ge-meinsam oder definierte Gruppen analysiert werden. Die Auswertungen erfolgen mittels t-Statistik (Einstichproben-t-Test), um signifikante differentielle Aktivierungen gemäß der aufgestellten Bedingungen zu analysieren.

Wie in Teil C ausgeführt, sollen Hypothesen mittels der fRT-Daten überprüft werden:

Hypothese 1 (Begeisterungs-/ Enttäuschungsreaktionen) wird im Folgenden nicht getes-tet, da die nötigen Reaktionen außerhalb des Scanners nicht aufkamen.

In Hypothese 2 soll bewiesen werden, dass sympathische (like) Schokoladenmarken das Belohnungszentrum aktivieren, nichtsympathische (dislike) Schokoladenmarken nicht.

Die Überprüfung erfolgt mittels Random-Effect-Modell und Einstichproben-t-Test. Als signifikant gilt ein Ergebnis, wenn der p-Wert ein Signifikanzniveau von 0,001 nicht überschreitet ( p ). Das Modell und die Kontrastgewichtungsvektoren folgen:

j j

j

i X X

Y 1 1 2 2 mit 1bT 1 1 und 2bT 1 1, mit xjl = Prädiktoren (l 1,2; 1= sympathische Marken, 2 nichtsympathische Marken).