Remissionsdauer (in Monaten)

(1)

Tempus neminem manet

Überlebenszeitanalyse

(2)

Remissionsdauer bei Leukämie

Die Wirksamkeit des Medikaments 6-Mercaptopurin (6-MP) wurde in einer placebokontrollierten Studie an 42 Kindern mit akuter

Leukämie geprüft, die nach Behandlung mit Prednison in teilweise oder vollständig Remission gegangen waren. Primäre Zielgröße der

Studie war die Dauer der Remission (in Monaten).

6-MP 10 7 32 23 22 6 16

6-MP 34 32 25 11 20 19 6

6-MP 17 35 6 13 9 6 10

Placebo 1 22 3 12 8 17 2

Placebo 11 8 12 2 5 4 15

Placebo 8 23 5 11 4 1 8

aus: Klein JP, Moeschberger ML (2003) Survival Analysis. Springer, New York

(3)

Remissionsdauer (in Monaten)

0 10 20 30 40

Wilcoxon-Test: W=565.5 p=0.0042

6-MP Placebo

16 8

(4)

Definition

Überlebensfunktion

Es sei T eine positive, stetig verteilte Zufallsvariable, die die Zeit bis zum Eintritt eines bestimmten Ereignisses

("Ereigniszeit" oder "Lebensdauer") misst. Man bezeichnet in diesem Fall

) t T

( P )

t (

S = >

als "Überlebensfunktion" von T.

(5)

0 5 10 15 20 25 30 35 40

17

000 .

21 1 ) 21

4 (

S ˆ = =

190 .

21 0 ) 4

30 (

S ˆ = =

810 .

21 0 ) 17

6 (

S ˆ = =

000 .

21 0 ) 0

37 (

S ˆ = =

Schätzung der Überlebensfunktion (6-MP)

(6)

Remissionsdauer t (in Monaten)

0 10 20 30 40

S(t)

0,0 0,2 0,4 0,6 0,8 1,0

6-MP

Placebo

geschätzte Überlebensfunktion

(7)

Definition

Exponentialverteilung

Eine Ereigniszeit T mit Dichte

) t exp(

) t (

f = λ ⋅ − λ

heißt "exponentialverteilt" mit Parameter λ>0.

Für eine exponentialverteilte Ereigniszeit T gilt S(t)=exp(-λt) und E(T)=1/λ.

(8)

Zeit t (in Jahren)

0 20 40 60 80 100

Überlebensfunktion S(t)

0,0 0,2 0,4 0,6 0,8 1,0

exponentialverteilte Ereigniszeit

λ=1/25 λ=1/50 λ=1/75

S(t)=exp(-λt)

(9)

0 10 20 30 40

S(t)

0,0 0,2 0,4 0,6 0,8 1,0

6-MP: t=17.1

Placebo: t=8.7 exp(-t/17.1)

exp(-t/8.7)

(10)

Zensierung

unzensiert (T=t) rechtszensiert

(T>t) linkszensiert

(T>t-t₁) intervallzensiert

(t₁<T<t)

t

₁

t

Zeit

0

(11)

6-MP 10 7 32⁺ 23 22 6 16

6-MP 34⁺ 32⁺ 25⁺ 11⁺ 20⁺ 19⁺ 6

6-MP 17⁺ 35⁺ 6 13 9⁺ 6⁺ 10⁺

Placebo 1 22 3 12 8 17 2

Placebo 11 8 12 2 5 4 15

Placebo 8 23 5 11 4 1 8

aus: Klein JP, Moeschberger ML (2003) Survival Analysis. Springer, New York

+: rechtszensiert

(12)

Bedingte Wahrscheinlichkeit

Es seien A⊂B zwei "absteigende" Ereignisse, d.h. wenn A eintritt, tritt auch B ein. Dann gilt

) B

| A ( P )

B ( P )

A (

P = ⋅

absteigende Ereignisse

Beweis:

Ω Ω Ω Ω

B A

) B A

(

P ∩

=

) B ( P

) B A

( ) P B ( P )

B

| A ( P ) B (

P ⋅ = ⋅ ∩

) A (

= P

(13)

0 5 10 15 20 25 30 35 40

) 9 T

| 10 T

( Pˆ ) 9 T

( Pˆ )

10 T

(

Pˆ > = > ⋅ > >

Problem: Pˆ(T>10)=? Lösung (Rekursion):

) 8 T

| 9 T

( Pˆ ) 8 T

( Pˆ )

9 T

(

Pˆ > = > ⋅ > >

) 1 T

| 2 T

( Pˆ ) 1 T

( Pˆ )

2 T

(

Pˆ > = > ⋅ > >

) 0 T

| 1 T

( Pˆ ) 0 T

( Pˆ )

1 T

(

Pˆ > = > ⋅ > >

...

(14)

0 5 10 15 20 25 30 35 40

Anzahl unter Beobachtung im 10. Monat Anzahl mit Relaps nach dem 10. Monat

=

>

>10| T 9)

T ( Pˆ

15

933 .

15 0 14 =

=

(15)

0 5 10 15 20 25 30 35 40

) 1 t T

| t T (

Pˆ > > − t

1 ...

5 6 7 8 9 10

21:21 ...

21:21 18:21 16:17 16:16 16:16 14:15

) 1 t T

| t T (

Pˆ > > − t

11 12 13

14 15 16

17 18

13:13 12:12 11:12

11:11 11:11 10:11

10:10 9:9

) 1 t T

| t T (

Pˆ > > − t

19 20 21 22 23 24 25 26

9:9 8:8 7:7 6:7 5:6 5:5 5:5 4:4

) 1 t T

| t T (

Pˆ > > − t

27 ..

32 33 34 35

4:4 ...

4:4 2:2 2:2 1:1

(16)

) t T ( Pˆ >

t 1 ...

6 7 ...

10 ...

13 ...

16 ...

22 23 ...

1.000 ...

0.857 0.807

...

0.753 ...

0.690 ...

0.627 ...

0.538 0.448

...

) 1 t T

| t T (

Pˆ > > − )

1 t T (

Pˆ > − 1.000

...

1.000 0.857

...

0.807 ...

0.753 ...

0.690 ...

0.627 0.538

...

1.000 ...

0.857 0.941

...

0.933 ...

0.917 ...

0.909 ...

0.857 0.833

...

(17)

Für eine Stichprobe teilweise rechtszensierter

Beobachtungen einer Ereigniszeit T bezeichne {t_i} die Zeitpunkte unzensierter Beobachtungen von T, d_idie Anzahl unzensierter Beobachtungen zum Zeitpunkt t_i,

und n_i die Anzahl der Beobachtungen mit T≥t_i.

∏

≤







 

 −

=

t

t i

i i

i

n

d ) n

t ( S ˆ

Kaplan-Meier-Schätzer

Überlebensfunktion

heißt "Kaplan-Meier-Schätzer" der Überlebensfunktion.

(18)

Remissionsdauer (in Monaten)

0 10 20 30 40

0,0 0,2 0,4 0,6 0,8 1,0

6-MP

(Kaplan-Meier)

Placebo

8 16 23

S(t)

(19)

Kaplan-Meier-Schätzer

Überlebensfunktion

Kaplan-Meier-Schätzer von Überlebensfunktionen - werden mit fortschreitender Ereigniszeit immer

ungenauer.

- weisen nur zu Zeitpunkten unzensierter Beobachtungen Sprünge auf.

- bleiben nach der letzten unzensierten Beobachtung konstant.

- sind nur bis zum Zeitpunkt der letzten Beobachtung (zensiert oder unzensiert) definiert.

(20)

t_i n_X,i d_X,i n_Y,i d_Y,i e_X,i e_Y,i

1 21 0 21 2 1.00 1.00

2 21 0 19 2 1.05 0.95

3 21 0 17 1 0.55 0.45

4 21 0 16 2 1.14 0.86

5 21 0 14 2 1.20 0.80

6 21 3 12 0 1.91 1.09

7 17 1 12 0 0.59 0.41

8 16 0 12 3 1.71 1.29

10 15 1 9 0 0.63 0.37

11 13 0 9 2 1.24 0.76

12 12 0 7 2 1.26 0.74

13 12 1 5 1 1.41 0.59

15 11 0 4 1 0.73 0.27

16 11 1 3 0 0.79 0.21

17 10 0 3 1 0.77 0.23

22 7 1 2 1 1.56 0.44

23 6 1 1 1 1.71 0.29

∑ 9 21 19.25 10.75

d_X d_Y e_X e_Y

X: 6-MP

versus

Y: Placebo

(21)

Log-Rank-Test

Vergleich von Überlebensfunktionen

Hypothesen

Teststatistik

Zufallsvariable

X, Y

Ereigniszeiten

mit Überlebensfunktionen S_X und S_Y

Ablehnungs- bereich

Y

2 Y Y

X

2 X 2 X

e

) e d

( e

) e d

( − + −

= χ

∑ + ⋅ +

=

_i

i , y i

, x

i , x i

, y i

, x

X

n n

) n d d

( e

χ²≥ χ²_1-_α_,1

H

₀

: S

_X

=S

_Y

H

_A

: S

_X

≠S

_Y

Erwartete Anzahl

Ereignisse ^{, e}^Y ^analog

(22)

1 21 0 21 2 1.00 1.00

2 21 0 19 2 1.05 0.95

3 21 0 17 1 0.55 0.45

4 21 0 16 2 1.14 0.86

5 21 0 14 2 1.20 0.80

6 21 3 12 0 1.91 1.09

7 17 1 12 0 0.59 0.41

8 16 0 12 3 1.71 1.29

10 15 1 9 0 0.63 0.37

11 13 0 9 2 1.24 0.76

12 12 0 7 2 1.26 0.74

13 12 1 5 1 1.41 0.59

15 11 0 4 1 0.73 0.27

16 11 1 3 0 0.79 0.21

17 10 0 3 1 0.77 0.23

22 7 1 2 1 1.56 0.44

23 6 1 1 1 1.71 0.29

∑ 9 21 19.25 10.75

X: 6-MP

versus

Y: Placebo

231 .

75 15 . 10

) 75 . 10 21

( 25

. 19

) 25 . 19 9

( ² ²

2 = − + − =

χ ^p=9.5^×¹⁰^-5

(23)

Das Schwert des Damokles Richard Westall (1765 – 1836)

(24)

Es sei T eine Ereigniszeit mit Dichte f(t) und Überlebensfunktion S(t).

Definition

Hazardfunktion

heißt "Hazardfunktion" oder "Eintrittsrate" von T.

( ) ( )

) t ( S

) t ( f t

t T

| t t

T t

lim P t

h

t 0

=

∆

>

∆ +

≤

= <

→

∆

Beispiel: f(t) = λ ⋅exp(−λt) S(t) = 1−F(t) = exp(−λt) λ λ

λ

λ ₌

−

= ⋅

) t exp(

) t ) exp(

t ( h

(25)

0 20 40 60 80 100 10^-5

10^-4 10^-3 10^-2 10^-1 10⁰

Lebensalter (Jahre)

Sterberate

Quelle: Statistisches Bundesamt

weiblich männlich

Sterbetafel Deutschland 2010

h(t)=8.2×10^-5⋅e^0.085⋅t

h(t)=2.3×10^-5⋅e^0.097⋅t

(26)

Definition

Gompertz-Verteilung

Eine Ereigniszeit T mit Dichtefunktion

 

 



 ⋅ + −

⋅

= exp t ( 1 e

^⋅

) )

t (

f

^α ^t

θ α α

θ

für t≥0 heißt "Gompertz-verteilt" mit den Parametern θ,α>0.

Für Gompertz-verteilte Ereigniszeiten gilt h(t)=θ⋅exp(α⋅t).

Benjamin Gompertz (1779 - 1865)

(27)

0 5 10 15 20 25

S(t)

0,0 0,2 0,4 0,6 0,8 1,0

Exponentialverteilung Gompertz-Verteilung

S(t)=exp(-0.068⋅1.18⋅t^1.18)

(28)

Weibull-verteilte Lebensdauer

S(t)=exp(-λ⋅t^γ) h(t)=

λγ⋅

^t^γ^-1

0 20 40 60 80 100

0,0 0,2 0,4 0,6 0,8 1,0

γ=0.8, λ=1/50 γ=1.0, λ=1/50

γ=1.2, λ=1/50

Zeit t (in Jahren)

Überlebensfunktion S(t)

0 20 40 60 80 100

0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07

Zeit t (in Jahren)

Hazardfunktion h(t)

γ=0.8, λ=1/50 γ=1.0, λ=1/50 γ=1.2, λ=1/50

"burn-in"

"wear-out"

(29)

Regressionsanalyse

) x ,..., x

, t ( g )

t (

h =

₁ _k

Sir David R. Cox (1924 -)

Modellierung der Hazardfunktion

T:

X

₁

,...,X

_k

: h(t):

Ereigniszeit

Einflussgrößen

Hazardfunktion

(30)

Überlebenszeit bei Malignem Melanom

Von 1962 bis 1977 wurde im Universitätsklinikum Odense (DK) bei 225 Patienten ein Malignes Melanom operativ entfernt. Neben der Überlebenszeit im Follow-up bis 1977 ist für 205 Patienten auch das

Geschlecht, das Alter bei Operation, die Größe des Tumors und das Auftreten einer Ulzeration bekannt.

aus: Andersen PK, Borgan Ø, Gill RD, Keiding N (1991) Statistical Models Based on Counting Processes. Springer, New York

Zeit

(Tage) Geschlecht

Alter

(Jahre) Tumor (mm) Ulcus

10⁺ 1 76 6.76 1

30⁺ 1 56 0.65 0

35⁺ 1 41 1.34 0

99⁺ 0 71 2.90 0

185⁺ 1 52 12.08 1

204⁺ 1 28 4.84 1

(31)

Überlebenszeit t (in Tagen)

0 1000 2000 3000 4000 5000 6000

S(t)

0,0 0,2 0,4 0,6 0,8 1,0

weiblich (n=126, n⁺=98) männlich (n=79, n⁺=50)

Log-Rank χ²=6.468, 1 d.f., p=0.011

(32)

Störgrößen Ulcus, Alter Störgröße

Geschlecht

Einflussgröße Tumorgröße

Confounding

Ursache ?

Korrelation

Zielgröße Überlebenszeit

(33)

Definition

Hazard-Ratio

Eine Population sei in zwei Schichten gegliedert

(z.B. "exponiert", "nicht exponiert") mit Ereigniszeiten T_e und T_n und zugehörigen Hazardfunktionen h_e und h_n.

) t ( h

) t ( ) h

t ( HR

n

=

e

wird als "Hazard-Ratio" bei Exposition bezeichnet.

Beispiel: Für exponentialverteilte Ereigniszeiten T_e und T_n mit Parametern λ_e und λ_n gilt HR(t)=λ_e/λ_n.

(34)

Cox-Regressionsanalyse

k k

1

x ... b x

b )

t ( )]

t ( h

ln[ = α + ⋅ + + ⋅

"proportional hazards"

T:

X

₁

,...,X

_k

: h(t):

Ereigniszeit

Einflussgrößen Hazardfunktion

Ist X₁ eine dichotome Einflussgröße

(z.B. 1:"exponiert", 0:"nicht exponiert"), dann gilt

) b exp(

₁

=

HR(t)

(35)

Cox-Regressionsanalyse

"proportional hazards"

] x

b ...

x b

exp[

)]

t ( exp[

] x

b ...

x b

exp[

)]

t ( ) exp[

t ( HR

b , k k

b , 1 1

a , k k

a , 1 1

⋅ +

+

⋅

⋅ α

⋅ +

+

⋅

= α

h_b(t)=0.5⋅h_a(t) proportional

h_b(t) h_a(t)

h_b(t)

h_a(t)

h_b(t)=4+h_a(t) nicht proportional

(36)

Ulzeration (b₁) Tumorgröße (b₂) Alter (b₃)

Geschlecht (b₄)

Term s.e.

ln[h(t)]=α(t)+1.164⋅x₁+0.109⋅x₂+0.012⋅x₃+0.433⋅x₄

Cox-Regressionsanalyse

volles Modell

1.164 0.109 0.012 0.433

0.310 0.037 0.008 0.267

bˆ

i

^p

0.0002 0.0039 0.1415 0.1055

s.e.: Standardfehler, p: zweiseitiger p-Wert des Wald-Tests

(37)

Ulzeration (b₁) Tumorgröße (b₂) Geschlecht (b₄)

Term s.e.

Cox-Regressionsanalyse

1.167 0.113 0.459

0.311 0.038 0.267

bˆ

i

^p

0.0002 0.0028 0.0850 Modellauswahl (Rückwärtsselektion)

(38)

Ulzeration (b₁) Tumorgröße (b₂)

Term s.e.

ln[h(t)]=α(t)+1.218⋅x₁+0.114⋅x₂

Cox-Regressionsanalyse

endgültiges Modell

1.218 0.114

0.309 0.036

bˆ

i

^p

<0.0001 0.0016

Hazard-Ratios

Ulzeration:

Tumorgröße (je mm):

3.38 1.12

(39)

Zusammenfassung

- Bei der statistischen Analyse von beobachteten Ereigniszeiten müssen Zensierungen berücksichtigt werden.

- Gängige Modelle für die Verteilung von Ereigniszeiten sind die Exponential-, Gompertz- und Weibull-Verteilung.

- Die Kaplan-Meier-Analyse liefert eine sinnvolle Schätzung der Überlebensfunktion aus rechtszensierten Beobachtungen.

- Der Unterschied zweier geschätzter Überlebensfunktionen kann mit dem Log-Rank-Test auf statistische Signifikanz geprüft werden.

- Die Hazardfunktion misst die Eintrittsrate eines Ereignisses zu einem festen Zeitpunkt.

- Ein gängiges Verfahren für die statistische Modellierung von Hazardfunktionen ist die Cox-Regression.

(40)