Tempus neminem manet
Überlebenszeitanalyse
Remissionsdauer bei Leukämie
Die Wirksamkeit des Medikaments 6-Mercaptopurin (6-MP) wurde in einer placebokontrollierten Studie an 42 Kindern mit akuter
Leukämie geprüft, die nach Behandlung mit Prednison in teilweise oder vollständig Remission gegangen waren. Primäre Zielgröße der
Studie war die Dauer der Remission (in Monaten).
6-MP 10 7 32 23 22 6 16
6-MP 34 32 25 11 20 19 6
6-MP 17 35 6 13 9 6 10
Placebo 1 22 3 12 8 17 2
Placebo 11 8 12 2 5 4 15
Placebo 8 23 5 11 4 1 8
aus: Klein JP, Moeschberger ML (2003) Survival Analysis. Springer, New York
Remissionsdauer bei Leukämie
Remissionsdauer (in Monaten)
0 10 20 30 40
Wilcoxon-Test: W=565.5 p=0.0042
6-MP Placebo
16 8
Definition
Überlebensfunktion
Es sei T eine positive, stetig verteilte Zufallsvariable, die die Zeit bis zum Eintritt eines bestimmten Ereignisses
("Ereigniszeit" oder "Lebensdauer") misst. Man bezeichnet in diesem Fall
) t T
( P )
t (
S = >
als "Überlebensfunktion" von T.
0 5 10 15 20 25 30 35 40
Remissionsdauer bei Leukämie
17
000 .
21 1 ) 21
4 (
S ˆ = =
190 .
21 0 ) 4
30 (
S ˆ = =
810 .
21 0 ) 17
6 (
S ˆ = =
000 .
21 0 ) 0
37 (
S ˆ = =
Schätzung der Überlebensfunktion (6-MP)
Remissionsdauer bei Leukämie
Remissionsdauer t (in Monaten)
0 10 20 30 40
S(t)
0,0 0,2 0,4 0,6 0,8 1,0
6-MP
Placebo
geschätzte Überlebensfunktion
Definition
Exponentialverteilung
Eine Ereigniszeit T mit Dichte
) t exp(
) t (
f = λ ⋅ − λ
heißt "exponentialverteilt" mit Parameter λ>0.
Für eine exponentialverteilte Ereigniszeit T gilt S(t)=exp(-λt) und E(T)=1/λ.
Zeit t (in Jahren)
0 20 40 60 80 100
Überlebensfunktion S(t)
0,0 0,2 0,4 0,6 0,8 1,0
exponentialverteilte Ereigniszeit
λ=1/25 λ=1/50 λ=1/75
S(t)=exp(-λt)
Remissionsdauer bei Leukämie
Remissionsdauer t (in Monaten)
0 10 20 30 40
S(t)
0,0 0,2 0,4 0,6 0,8 1,0
6-MP: t=17.1
Placebo: t=8.7 exp(-t/17.1)
exp(-t/8.7)
Zensierung
unzensiert (T=t) rechtszensiert
(T>t) linkszensiert
(T>t-t1) intervallzensiert
(t1<T<t)
t
1t
Zeit
0
Remissionsdauer bei Leukämie
6-MP 10 7 32+ 23 22 6 16
6-MP 34+ 32+ 25+ 11+ 20+ 19+ 6
6-MP 17+ 35+ 6 13 9+ 6+ 10+
Placebo 1 22 3 12 8 17 2
Placebo 11 8 12 2 5 4 15
Placebo 8 23 5 11 4 1 8
aus: Klein JP, Moeschberger ML (2003) Survival Analysis. Springer, New York
+: rechtszensiert
Bedingte Wahrscheinlichkeit
Es seien A⊂B zwei "absteigende" Ereignisse, d.h. wenn A eintritt, tritt auch B ein. Dann gilt
) B
| A ( P )
B ( P )
A (
P = ⋅
absteigende Ereignisse
Beweis:
Ω Ω Ω Ω
B A
) B A
(
P ∩
=
) B ( P
) B A
( ) P B ( P )
B
| A ( P ) B (
P ⋅ = ⋅ ∩
) A (
= P
Remissionsdauer bei Leukämie
0 5 10 15 20 25 30 35 40
) 9 T
| 10 T
( Pˆ ) 9 T
( Pˆ )
10 T
(
Pˆ > = > ⋅ > >
Problem: Pˆ(T>10)=? Lösung (Rekursion):
) 8 T
| 9 T
( Pˆ ) 8 T
( Pˆ )
9 T
(
Pˆ > = > ⋅ > >
) 1 T
| 2 T
( Pˆ ) 1 T
( Pˆ )
2 T
(
Pˆ > = > ⋅ > >
) 0 T
| 1 T
( Pˆ ) 0 T
( Pˆ )
1 T
(
Pˆ > = > ⋅ > >
...
Remissionsdauer bei Leukämie
0 5 10 15 20 25 30 35 40
Anzahl unter Beobachtung im 10. Monat Anzahl mit Relaps nach dem 10. Monat
=
>
>10| T 9)
T ( Pˆ
15
933 .
15 0 14 =
=
Remissionsdauer bei Leukämie
0 5 10 15 20 25 30 35 40
) 1 t T
| t T (
Pˆ > > − t
1 ...
5 6 7 8 9 10
21:21 ...
21:21 18:21 16:17 16:16 16:16 14:15
) 1 t T
| t T (
Pˆ > > − t
11 12 13
14 15 16
17 18
13:13 12:12 11:12
11:11 11:11 10:11
10:10 9:9
) 1 t T
| t T (
Pˆ > > − t
19 20 21 22 23 24 25 26
9:9 8:8 7:7 6:7 5:6 5:5 5:5 4:4
) 1 t T
| t T (
Pˆ > > − t
27 ..
32 33 34 35
4:4 ...
4:4 2:2 2:2 1:1
Remissionsdauer bei Leukämie
) t T ( Pˆ >
t 1 ...
6 7 ...
10 ...
13 ...
16 ...
22 23 ...
1.000 ...
0.857 0.807
...
0.753 ...
0.690 ...
0.627 ...
0.538 0.448
...
) 1 t T
| t T (
Pˆ > > − )
1 t T (
Pˆ > − 1.000
...
1.000 0.857
...
0.807 ...
0.753 ...
0.690 ...
0.627 0.538
...
1.000 ...
0.857 0.941
...
0.933 ...
0.917 ...
0.909 ...
0.857 0.833
...
Für eine Stichprobe teilweise rechtszensierter
Beobachtungen einer Ereigniszeit T bezeichne {ti} die Zeitpunkte unzensierter Beobachtungen von T, di die Anzahl unzensierter Beobachtungen zum Zeitpunkt ti,
und ni die Anzahl der Beobachtungen mit T≥ti.
∏
≤
−
=
t
t i
i i
i
n
d ) n
t ( S ˆ
Kaplan-Meier-Schätzer
Überlebensfunktion
heißt "Kaplan-Meier-Schätzer" der Überlebensfunktion.
Remissionsdauer bei Leukämie
Remissionsdauer (in Monaten)
0 10 20 30 40
0,0 0,2 0,4 0,6 0,8 1,0
6-MP
(Kaplan-Meier)
Placebo
8 16 23
S(t)
Kaplan-Meier-Schätzer
Überlebensfunktion
Kaplan-Meier-Schätzer von Überlebensfunktionen - werden mit fortschreitender Ereigniszeit immer
ungenauer.
- weisen nur zu Zeitpunkten unzensierter Beobachtungen Sprünge auf.
- bleiben nach der letzten unzensierten Beobachtung konstant.
- sind nur bis zum Zeitpunkt der letzten Beobachtung (zensiert oder unzensiert) definiert.
Remissionsdauer bei Leukämie
ti nX,i dX,i nY,i dY,i eX,i eY,i
1 21 0 21 2 1.00 1.00
2 21 0 19 2 1.05 0.95
3 21 0 17 1 0.55 0.45
4 21 0 16 2 1.14 0.86
5 21 0 14 2 1.20 0.80
6 21 3 12 0 1.91 1.09
7 17 1 12 0 0.59 0.41
8 16 0 12 3 1.71 1.29
10 15 1 9 0 0.63 0.37
ti nX,i dX,i nY,i dY,i eX,i eY,i
11 13 0 9 2 1.24 0.76
12 12 0 7 2 1.26 0.74
13 12 1 5 1 1.41 0.59
15 11 0 4 1 0.73 0.27
16 11 1 3 0 0.79 0.21
17 10 0 3 1 0.77 0.23
22 7 1 2 1 1.56 0.44
23 6 1 1 1 1.71 0.29
∑ 9 21 19.25 10.75
dX dY eX eY
X: 6-MP
versus
Y: PlaceboLog-Rank-Test
Vergleich von Überlebensfunktionen
Hypothesen
Teststatistik
Zufallsvariable
X, Y
Ereigniszeitenmit Überlebensfunktionen SX und SY
Ablehnungs- bereich
Y
2 Y Y
X
2 X 2 X
e
) e d
( e
) e d
( − + −
= χ
∑ + ⋅ +
=
ii , y i
, x
i , x i
, y i
, x
X
n n
) n d d
( e
χ2≥ χ21-α,1
H
0: S
X=S
YH
A: S
X≠S
YErwartete Anzahl
Ereignisse , eY analog
Remissionsdauer bei Leukämie
ti nX,i dX,i nY,i dY,i eX,i eY,i
1 21 0 21 2 1.00 1.00
2 21 0 19 2 1.05 0.95
3 21 0 17 1 0.55 0.45
4 21 0 16 2 1.14 0.86
5 21 0 14 2 1.20 0.80
6 21 3 12 0 1.91 1.09
7 17 1 12 0 0.59 0.41
8 16 0 12 3 1.71 1.29
10 15 1 9 0 0.63 0.37
ti nX,i dX,i nY,i dY,i eX,i eY,i
11 13 0 9 2 1.24 0.76
12 12 0 7 2 1.26 0.74
13 12 1 5 1 1.41 0.59
15 11 0 4 1 0.73 0.27
16 11 1 3 0 0.79 0.21
17 10 0 3 1 0.77 0.23
22 7 1 2 1 1.56 0.44
23 6 1 1 1 1.71 0.29
∑ 9 21 19.25 10.75
X: 6-MP
versus
Y: Placebo231 .
75 15 . 10
) 75 . 10 21
( 25
. 19
) 25 . 19 9
( 2 2
2 = − + − =
χ p=9.5×10-5
Das Schwert des Damokles Richard Westall (1765 – 1836)
Es sei T eine Ereigniszeit mit Dichte f(t) und Überlebensfunktion S(t).
Definition
Hazardfunktion
heißt "Hazardfunktion" oder "Eintrittsrate" von T.
( ) ( )
) t ( S
) t ( f t
t T
| t t
T t
lim P t
h
t 0=
∆
>
∆ +
≤
= <
→
∆
Beispiel: f(t) = λ ⋅exp(−λt) S(t) = 1−F(t) = exp(−λt) λ λ
λ
λ =
−
−
= ⋅
) t exp(
) t ) exp(
t ( h
0 20 40 60 80 100 10-5
10-4 10-3 10-2 10-1 100
Lebensalter (Jahre)
Sterberate
Quelle: Statistisches Bundesamt
weiblich männlich
Sterbetafel Deutschland 2010
h(t)=8.2×10-5⋅e0.085⋅t
h(t)=2.3×10-5⋅e0.097⋅t
Definition
Gompertz-Verteilung
Eine Ereigniszeit T mit Dichtefunktion
⋅ + −
⋅
= exp t ( 1 e
⋅) )
t (
f
α tθ α α
θ
für t≥0 heißt "Gompertz-verteilt" mit den Parametern θ,α>0.
Für Gompertz-verteilte Ereigniszeiten gilt h(t)=θ⋅exp(α⋅t).
Benjamin Gompertz (1779 - 1865)
Remissionsdauer bei Leukämie
Remissionsdauer t (in Monaten)
0 5 10 15 20 25
S(t)
0,0 0,2 0,4 0,6 0,8 1,0
Exponentialverteilung Gompertz-Verteilung
S(t)=exp(-0.068⋅1.18⋅t1.18)
Weibull-verteilte Lebensdauer
S(t)=exp(-λ⋅tγ) h(t)=
λγ⋅
tγ-10 20 40 60 80 100
0,0 0,2 0,4 0,6 0,8 1,0
γ=0.8, λ=1/50 γ=1.0, λ=1/50
γ=1.2, λ=1/50
Zeit t (in Jahren)
Überlebensfunktion S(t)
0 20 40 60 80 100
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07
Zeit t (in Jahren)
Hazardfunktion h(t)
γ=0.8, λ=1/50 γ=1.0, λ=1/50 γ=1.2, λ=1/50
"burn-in"
"wear-out"
Regressionsanalyse
) x ,..., x
, t ( g )
t (
h =
1 kSir David R. Cox (1924 -)
Modellierung der Hazardfunktion
T:
X
1,...,X
k: h(t):
Ereigniszeit
Einflussgrößen
Hazardfunktion
Überlebenszeit bei Malignem Melanom
Von 1962 bis 1977 wurde im Universitätsklinikum Odense (DK) bei 225 Patienten ein Malignes Melanom operativ entfernt. Neben der Überlebenszeit im Follow-up bis 1977 ist für 205 Patienten auch das
Geschlecht, das Alter bei Operation, die Größe des Tumors und das Auftreten einer Ulzeration bekannt.
aus: Andersen PK, Borgan Ø, Gill RD, Keiding N (1991) Statistical Models Based on Counting Processes. Springer, New York
Zeit
(Tage) Geschlecht
Alter
(Jahre) Tumor (mm) Ulcus
10+ 1 76 6.76 1
30+ 1 56 0.65 0
35+ 1 41 1.34 0
99+ 0 71 2.90 0
185+ 1 52 12.08 1
204+ 1 28 4.84 1
Überlebenszeit bei Malignem Melanom
Überlebenszeit t (in Tagen)
0 1000 2000 3000 4000 5000 6000
S(t)
0,0 0,2 0,4 0,6 0,8 1,0
weiblich (n=126, n+=98) männlich (n=79, n+=50)
Log-Rank χ2=6.468, 1 d.f., p=0.011
Störgrößen Ulcus, Alter Störgröße
Geschlecht
Einflussgröße Tumorgröße
Confounding
Ursache ?
Korrelation
Zielgröße Überlebenszeit
Überlebenszeit bei Malignem Melanom
Definition
Hazard-Ratio
Eine Population sei in zwei Schichten gegliedert
(z.B. "exponiert", "nicht exponiert") mit Ereigniszeiten Te und Tn und zugehörigen Hazardfunktionen he und hn.
) t ( h
) t ( ) h
t ( HR
n
=
ewird als "Hazard-Ratio" bei Exposition bezeichnet.
Beispiel: Für exponentialverteilte Ereigniszeiten Te und Tn mit Parametern λe und λn gilt HR(t)=λe/λn.
Cox-Regressionsanalyse
k k
1
1
x ... b x
b )
t ( )]
t ( h
ln[ = α + ⋅ + + ⋅
"proportional hazards"
T:
X
1,...,X
k: h(t):
Ereigniszeit
Einflussgrößen Hazardfunktion
Ist X1 eine dichotome Einflussgröße
(z.B. 1:"exponiert", 0:"nicht exponiert"), dann gilt
) b exp(
1=
HR(t)
Cox-Regressionsanalyse
"proportional hazards"
] x
b ...
x b
exp[
)]
t ( exp[
] x
b ...
x b
exp[
)]
t ( ) exp[
t ( HR
b , k k
b , 1 1
a , k k
a , 1 1
⋅ +
+
⋅
⋅ α
⋅ +
+
⋅
⋅
= α
hb(t)=0.5⋅ha(t) proportional
hb(t) ha(t)
hb(t)
ha(t)
hb(t)=4+ha(t) nicht proportional
Ulzeration (b1) Tumorgröße (b2) Alter (b3)
Geschlecht (b4)
Term s.e.
ln[h(t)]=α(t)+1.164⋅x1+0.109⋅x2+0.012⋅x3+0.433⋅x4
Cox-Regressionsanalyse
volles Modell
1.164 0.109 0.012 0.433
0.310 0.037 0.008 0.267
bˆ
ip
0.0002 0.0039 0.1415 0.1055
s.e.: Standardfehler, p: zweiseitiger p-Wert des Wald-Tests
Ulzeration (b1) Tumorgröße (b2) Geschlecht (b4)
Term s.e.
Cox-Regressionsanalyse
1.167 0.113 0.459
0.311 0.038 0.267
bˆ
ip
0.0002 0.0028 0.0850 Modellauswahl (Rückwärtsselektion)
s.e.: Standardfehler, p: zweiseitiger p-Wert des Wald-Tests
Ulzeration (b1) Tumorgröße (b2)
Term s.e.
ln[h(t)]=α(t)+1.218⋅x1+0.114⋅x2
Cox-Regressionsanalyse
endgültiges Modell
1.218 0.114
0.309 0.036
bˆ
ip
<0.0001 0.0016
Hazard-Ratios
Ulzeration:
Tumorgröße (je mm):
3.38 1.12
s.e.: Standardfehler, p: zweiseitiger p-Wert des Wald-Tests
Zusammenfassung
- Bei der statistischen Analyse von beobachteten Ereigniszeiten müssen Zensierungen berücksichtigt werden.
- Gängige Modelle für die Verteilung von Ereigniszeiten sind die Exponential-, Gompertz- und Weibull-Verteilung.
- Die Kaplan-Meier-Analyse liefert eine sinnvolle Schätzung der Überlebensfunktion aus rechtszensierten Beobachtungen.
- Der Unterschied zweier geschätzter Überlebensfunktionen kann mit dem Log-Rank-Test auf statistische Signifikanz geprüft werden.
- Die Hazardfunktion misst die Eintrittsrate eines Ereignisses zu einem festen Zeitpunkt.
- Ein gängiges Verfahren für die statistische Modellierung von Hazardfunktionen ist die Cox-Regression.