Randomisierte Algorithmen
Randomisierte Algorithmen
10. Schnell mischende Markov-Ketten
Thomas Worsch
Fakultรคt fรผr Informatik Karlsruher Institut fรผr Technologie
Wintersemester 2019/2020
1 / 36
10. Schnell mischende Markov-Ketten รberblick
รberblick
Anmerkungen zu Eigenwerten
Konvergenzverhalten ergodischer Markov-Ketten
Schnell mischende Markov-Ketten
10. Schnell mischende Markov-Ketten รberblick
Ein schรถnes Buch
David A. Levin, Yuval Peres, Elizabeth L. Wilmer:
Markov Chains and Mixing Times AMS (2008)
http://darkwing.uoregon.edu/~dlevin/MARKOV/markovmixing.pdf
3 / 36
10. Schnell mischende Markov-Ketten Anmerkungen zu Eigenwerten
รberblick
Anmerkungen zu Eigenwerten
Konvergenzverhalten ergodischer Markov-Ketten Schnell mischende Markov-Ketten
10. Schnell mischende Markov-Ketten Anmerkungen zu Eigenwerten
Lemma
Es sei๐ eine zeilenstochastische Matrix.
I Dann ist1ein Eigenwert von๐.
I Fรผr jeden Eigenwert๐von๐ gilt:|๐| โค 1.
5 / 36
10. Schnell mischende Markov-Ketten Anmerkungen zu Eigenwerten
Beweis
I Erster Teil klar wegen๐(1, . . . ,1)๐ =(1, . . . ,1)๐. I sei๐ โCEigenwert mit๐(๐ฅ1, . . . , ๐ฅ๐)๐ =๐(๐ฅ1, . . . , ๐ฅ๐)๐
und๐0ein Index mit|๐ฅ๐
0|=max๐ |๐ฅ๐|.
I dann
|๐| ยท |๐ฅ๐
0| = |๐ยท๐ฅ๐
0|=
ร
๐
๐๐
0๐๐ฅ๐
โค ร
๐
๐๐
0๐|๐ฅ๐| โค ร
๐
๐๐
0๐|๐ฅ๐
0|
= |๐ฅ๐
0|ร
๐
๐๐
0๐ =|๐ฅ๐
0| .
also|๐| โค 1.
10. Schnell mischende Markov-Ketten Anmerkungen zu Eigenwerten
Beweis
I Erster Teil klar wegen๐(1, . . . ,1)๐ =(1, . . . ,1)๐. I sei๐ โCEigenwert mit๐(๐ฅ1, . . . , ๐ฅ๐)๐ =๐(๐ฅ1, . . . , ๐ฅ๐)๐
und๐0ein Index mit|๐ฅ๐
0|=max๐ |๐ฅ๐|.
I dann
|๐| ยท |๐ฅ๐
0| = |๐ยท๐ฅ๐
0|=
ร
๐
๐๐
0๐๐ฅ๐
โค ร
๐
๐๐
0๐|๐ฅ๐| โค ร
๐
๐๐
0๐|๐ฅ๐
0|
= |๐ฅ๐
0|ร
๐
๐๐
0๐ =|๐ฅ๐
0| .
also|๐| โค 1.
6 / 36
10. Schnell mischende Markov-Ketten Anmerkungen zu Eigenwerten
Lemma
sei๐stochastische Matrix
I einer reversiblen Markov-Kette I mit|๐|=๐ Zustรคnden dann besitzt๐
I nur reelle Eigenwerte
I mit1=๐1>๐2โฅ ยท ยท ยท โฅ๐๐ >โ1.
10. Schnell mischende Markov-Ketten Anmerkungen zu Eigenwerten
Abkรผrzung
I ๐max =max{|๐| | ๐ist Eigenwert von๐und๐โ 1}.
I Eben bewiesen:
I fรผr ergodische Markov-Ketten:๐max โค1.
I fรผr reversible Markov-Ketten:๐max=max{|๐2|,|๐๐|}<1
8 / 36
10. Schnell mischende Markov-Ketten Anmerkungen zu Eigenwerten
Bemerkung
Falls๐๐ <0:
I Gehe vonPzuP0= 12(P+I)รผber.
I Eigenwerte๐0
๐ = 12(๐๐+1) >0, also I ๐max =๐2
10. Schnell mischende Markov-Ketten
Konvergenzverhalten ergodischer Markov-Ketten
รberblick
Anmerkungen zu Eigenwerten
Konvergenzverhalten ergodischer Markov-Ketten Schnell mischende Markov-Ketten
10 / 36
10. Schnell mischende Markov-Ketten
Konvergenzverhalten ergodischer Markov-Ketten
Definition
I Fรผr zwei Verteilungenpundqist dietotale Variationsdistanz
kpโqktv =1 2
ร
๐โ๐
|p๐ โq๐|.
I รbung:
kpโqktv =max
๐โ๐
|p(๐) โq(๐) | wobeip(๐) =ร
๐โ๐p๐ I also0โค kpโqktv โค1
10. Schnell mischende Markov-Ketten
Konvergenzverhalten ergodischer Markov-Ketten
Definition
I ergodische Markov-KetteP, stationรคre Verteilungw;
fรผr alle Verteilungenpsei
๐ฟp(๐ก) =kpP๐ก โwktv I DieVariationsdistanz zum Zeitpunkt๐กist
ฮ(๐ก)=max
p
๐ฟp(๐ก) .
I รbung: Maximum fรผr einen Einheitsvektor ฮ(๐ก) =max
๐
kP๐ก๐ โwktv
wobeiP๐ก๐ die๐-te Zeile vonP๐ก ist.
I klar: lim๐กโโฮ(๐ก) =0 aber:Wie schnell geht das?
12 / 36
10. Schnell mischende Markov-Ketten
Konvergenzverhalten ergodischer Markov-Ketten
Satz
ergodische Markov-Kette, MatrixP, stationรคre Verteilungw
Es existieren Konstanten๐ถund๐ผ <1mit ฮ(๐ก) =max
๐
kP๐ก๐โwktv โค๐ถ ๐ผ๐ก
10. Schnell mischende Markov-Ketten
Konvergenzverhalten ergodischer Markov-Ketten
Beweis (1)
I P๐ก0 enthalte nur positive Werte I Wwie bisher
I dann exisitiert0<๐ฟ <1so, dass fรผr alle๐und๐ gilt:P๐ก๐ ๐0 โฅ๐ฟw๐
I ๐ =1โ๐ฟ I QMatrix mit
P๐ก0 =(1โ๐)W+๐Q Qist zeilenstochastisch
I fรผr jedes๐ โN0gilt:
I Q๐W=W denn mitQist auchQ๐zeilenstochastisch I WP๐ก0=W dennwist stationรคre Verteilung
14 / 36
10. Schnell mischende Markov-Ketten
Konvergenzverhalten ergodischer Markov-Ketten
Beweis (2)
nun induktiv: fรผr jedes๐ โN+ist P๐ก0๐ =(1โ๐๐)W+๐๐Q๐ I ๐=1: Definition vonQ
I ๐;๐+1:
P๐ก0(๐+1) =P๐ก0๐P๐ก0
=
(1โ๐๐)W+๐๐Q๐
P๐ก0 Ind.vor.
=(1โ๐๐)WP๐ก0 +๐๐Q๐P๐ก0
=(1โ๐๐)W+๐๐Q๐P๐ก0 vorige Folie
=(1โ๐๐)W+๐๐Q๐ ( (1โ๐)W+๐Q) Ind.anf.
10. Schnell mischende Markov-Ketten
Konvergenzverhalten ergodischer Markov-Ketten
Beweis (3)
I P๐ก0๐ =(1โ๐๐)W+๐๐Q๐ also P๐ก0๐+๐ โW=๐๐ Q๐P๐ โW I Zeile๐:kP๐ก๐0๐+๐ โwktv โค๐๐
I fรผr beliebiges๐ก =๐ก0๐+๐ mit๐ =๐กdiv๐ก0und๐ =๐ก mod๐ก0
kP๐ก๐โwktv = kP๐ก๐0๐+๐ โwktv
โค๐๐
= 1 ๐
๐1/๐ก0
๐ก0 ๐1/๐ก0
๐ก0๐
โค 1 ๐
๐1/๐ก0 ๐+๐ก0๐
da ๐ <๐ก0und๐ <1
= 1 ๐
๐1/๐ก0
๐ก
16 / 36
10. Schnell mischende Markov-Ketten
Konvergenzverhalten ergodischer Markov-Ketten
Mitteilung (ohne Beweis)
Satz
Fรผr reversible Markov-Kette mit stationรคrer Verteilungwgilt:
ฮ(๐ก) โค ๐๐ก
max
๐คmin .
dabei sei๐คmin =min๐w๐
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
รberblick
Anmerkungen zu Eigenwerten
Konvergenzverhalten ergodischer Markov-Ketten Schnell mischende Markov-Ketten
18 / 36
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Definition
ergodische Markov-Kette mit stationรคrer Verteilungw fรผr๐ >0definiere ihre๐-Konvergenzzeit:
๐(๐)=min{๐ก | โ๐ก0 โฅ๐ก :ฮ(๐ก0) โค๐}
I engl.mixing time
I falls kein๐explizit angegeben:1/4
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Von Probleminstanzen zu Markovketten
mitunter vorliegende Situation
I gegeben: unendliche Menge von ยซProbleminstanzenยป๐ผ I zu jedem๐ผwird eine Markovkette๐(๐ผ)konstruiert Beispiel:
I ๐ผ: Graph(๐ , ๐ธ)
I ๐(๐ผ): Markovkette mit I Zustรคnde: Matchings in๐ผ
I รbergangswahrscheinlichkeiten fรผr Matching๐: wรคhle zufรคllig gleichverteilt eine Kante๐ โ๐ธ
I mit W.keit1/2kein รbergang I mit W.keit1/2รbergang zu
๐0=
๏ฃฑ๏ฃด
๏ฃด๏ฃด
๏ฃฒ
๏ฃด๏ฃด
๏ฃด
๏ฃณ
๐โ๐, falls๐ โ๐
๐+๐, falls๐โ๐und๐+๐Matching
๐, sonst
20 / 36
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Definition
Familie๐(๐ผ)von Markovketten heiรtschnell mischend, falls die๐-Konvergenzzeit polynomiell in|๐ผ|undln 1/๐ist.
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Rechnung
reversible Markov-Kette jedenfalls dann schnell mischend, wenn fรผr ein๐ก, das polynomiell in|๐ผ|undlog 1/๐ist, gilt
๐๐ก
max
๐คmin
โค๐
22 / 36
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Rechnung (2)
I
1 ๐max
๐ก
โฅ 1
๐๐คmin
๐ก โฅ ln๐โ1+ln๐คโ1
min
ln๐maxโ1
I Wegen1โ๐ฅ โค ln๐ฅโ1fรผr0<๐ฅ < 1ist dafรผr hinreichend:
โฅ ln๐โ1+ln๐คโ1
min
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Satz
(ohne Beweis)
Fรผr reversible Markov-Ketten gilt:
๐(๐) โค 1
1โ๐max log 1 ๐คmin๐ ๐(๐) โฅ 1
2(1โ๐max)log 1 2๐
Woher bekommt man๐max?
24 / 36
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Definition
I reversible Markov-Kette๐ =(๐ ,P), stationรคre Verteilungw
I sei๐น๐ der gerichtete kantengewichtete Graph mit I Knotenmenge๐und
I Kantenmenge๐ธ๐น ={(๐, ๐) |๐โ ๐โง๐๐ ๐ >0}.
I jede Kante(๐, ๐)gewichtet mit Zahl๐(๐, ๐) =w๐๐๐ ๐.
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Definition
I Fรผr reversible Markov-Kette mit Zustandsmenge๐ und stationรคrer Verteilungw
I definiere fรผr jede Teilmenge๐ โ๐
dieKapazitรคt ๐ถ(๐) = ร
๐โ๐
w๐
denFluร ๐น(๐) = ร
๐โ๐ , ๐โ๐
w๐P๐ ๐
und ฮฆ(๐) = ๐น(๐)/๐ถ(๐) I DerLeitwertฮฆder Markov-Kette ist dann
ฮฆ=min
๐โ๐max{ฮฆ(๐),ฮฆ(๐ r๐)} = min
๐โ๐ ,0<๐ถ(๐) โค1/2ฮฆ(๐) .
26 / 36
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Satz
Fรผr jede reversible Markov-Kette gilt:
1โ2ฮฆ2โค๐2โค1โ ฮฆ2 2 .
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Korollar
Fรผr reversible Markov-Ketten (mit๐2=๐max) ist
๐(๐) โค 2
ฮฆ2(ln๐โ1+ln๐คโ1
min)
Woher bekommt manฮฆ?
28 / 36
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Definition
I fรผr Paar(๐, ๐)von Knoten in๐น๐soll
I von einem โGutโ๐๐ ๐ die Mengew๐w๐ von๐nach๐ transportiert werden.
I gesucht: Flรผsse๐๐ ๐ :๐ธ๐น โR+, so dass gilt:
ร
๐
๐๐ ๐(๐, ๐) = w๐w๐
fรผr alleโโ ๐, ๐ :ร
๐
๐๐ ๐(๐ , โ) = ร
๐
๐๐ ๐(โ , ๐) ร
๐ (๐ , ๐) = ww
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Definition (2)
I Gesamtfluss durch eine Kante๐sei
๐(๐) =ร
๐โ ๐
๐๐ ๐(๐)
und
I dierelative Kantenauslastung ๐(๐) =max
๐โ๐ธ๐น
๐(๐)/๐(๐)
mit๐( (๐, ๐))=w๐P๐ ๐
30 / 36
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Lemma
(ohne Beweis)
Fรผr jede Markov-Kette mit Flรผssen๐๐ ๐gilt:
ฮฆโฅ 1 2๐(๐) .
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Beispiel: Hyperwรผrfel
I reversible Markov-Kette๐๐บ ,๐ฝwie in Kapitel 9 fรผr Hyperwรผrfel๐ป๐der Dimension๐mit๐ฝ =1/2.
I P๐๐ =1/2undP๐ ๐ =1/2๐fรผr๐โ ๐. I stationรคre Verteilung
I Gleichverteilung mit๐คmin=1/2๐ I alsolog 1/๐คmin=๐polynomiell in๐ I Schnelles Mischen: Suche Flรผsse๐๐ ๐
I die1/22๐transportieren und I kleine Kantenauslastung erzeugen.
32 / 36
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Beispiel: Hyperwรผrfel (2)
I Wรคhle: gleichmรครige Verteilung auf alle๐!kรผrzeste Pfade zwischen ๐und๐(๐ =Hammingdistanz)
I Aus Symmetriegrรผnden gleicher Gesamtfluss auf jeder Kante.
I Fรผr jedes๐gibt es2๐ยท ๐๐
Paare(๐, ๐)mit Abstand๐.
I Fรผr einfestesPaar(๐, ๐)haben alle fรผr den Fluss๐๐ ๐ verwendeten Pfade Lรคnge๐. Also:
ร
๐โ๐ธ ๐น
๐๐ ๐(๐) =๐w๐w๐ .
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Beispiel: Hyperwรผrfel (3)
๐(๐) = 1
|๐ธ๐น|
๐
ร
๐=1
2๐ ๐
๐
ยท๐ยทw๐w๐
= 1 ๐2๐
๐
ร
๐=1
2๐ ๐
๐
ยท๐ยท 1 22๐
= 1 22๐
๐
ร
๐=1
๐ ๐
ยท๐ ๐
= 1 22๐
๐
ร
๐=1
๐โ1 ๐โ1
= 1 22๐
๐โ1
ร
๐=0
๐โ1 ๐
= 2๐โ1 22๐ = 1
2ยท2๐
34 / 36
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Beispiel: Hyperwรผrfel (4)
I eben:๐(๐) =1/(2ยท2๐).
I andererseits๐(๐) =w๐P๐ ๐ =1/(2๐ยท2๐) I also๐(๐) = 1/(2ยท2
๐) 1/(2๐ยท2๐) =๐ I daherฮฆโฅ 2๐1(๐) = 21๐ I daher1โ 2๐12 โค๐2 โค1โ 81๐2 I also1/(1โ๐2) โฮ(๐2) I zusammen mitln๐คโ1
min=๐
I Korollar von vorhin: Markov-Kette schnell mischend
10. Schnell mischende Markov-Ketten Schnell mischende Markov-Ketten
Zusammenfassung
I bei schnellem Mischen geht es um ganze Familien von Markov-Ketten (passend zu von Probleminstanzen)
I und nicht um eine einzelne Markov-Kette
I Kriterien, um festzustellen, ob sie schnell mischend sind
36 / 36