VL-09: Das Postsche Correspondenzproblem
(Berechenbarkeit und Komplexit¨ at, WS 2017) Gerhard Woeginger
WS 2017, RWTH
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 1/42
Organisatorisches
I N¨achste Vorlesung:
Mittwoch, November 22, 14:15–15:45 Uhr, Roter H¨orsaal
I Webseite:
http://algo.rwth-aachen.de/Lehre/WS1718/BuK.php
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 2/42
Wiederholung
Wdh.: Abschlusseigenschaften von Sprachen
Satz
Die Menge der rekursiven Sprachen ist abgeschlossen unter Komplementbildung, Vereinigungen und Schnitten.
Satz
Die Menge der rekursiv aufz¨ahlbaren Sprachen ist abgeschlossen unter Vereinigungen und Schnitten.
Sie istnichtabgeschlossen unter Komplementbildung.
Wdh.: Berechenbarkeitslandschaft
rekursiv aufz¨ahlbare
Probleme H
H D
Probleme mit rekursiv aufz¨ahlbarem
Komplement H H
D entscheidbare
Probleme
Unentscheidbare Probleme mit unentscheidbarem Komplement Htot
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 5/42
Wdh.: Reduktionen
Definition
Es seienL1und L2 zwei Sprachen ¨uber einem AlphabetΣ.
Dann heisst L1 aufL2 reduzierbar(mit der Notation L1≤L2), wenn eine berechenbare Funktionf: Σ∗→Σ∗existiert, so dass f¨ur alle x∈Σ∗ gilt: x ∈L1 ⇔ f(x)∈L2.
Satz
FallsL1≤L2und fallsL1nicht entscheidbarist, so istL2nicht entscheidbar.
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 6/42
Vorlesung VL-09
Das Postsche Correspondenzproblem
IDefinition des PCP IDefinition des MPCP
IUnentscheidbarkeit von MPCP und PCP ILeichte und schwierige Varianten
Das Postsche Correspondenzproblem (1)
DasPostsche Correspondenzproblem(PCP) ist ein Puzzle aus Dominos.
I Jeder Dominostein ist mit zwei W¨ortern ¨uber einem AlphabetΣ beschriftet, und zwar mit einem Wort in der oberen H¨alfte und einem Wort in der unteren H¨alfte.
I Gegeben ist eine MengeK von Dominosteinen.
Jeder Dominostein darf beliebig oft verwendet werden.
I Die Aufgabe besteht darin, einecorrespondierende Folgevon Dominos ausK zu finden, mit der sich oben und unten jeweils das selbe Wort ergibt.
I Die Folge muss mindestens einen Dominostein enthalten.
Das Postsche Correspondenzproblem (2)
Beispiel A
F¨ur die Dominomenge K =
b ca
,
a ab
,
ca a
,
dbd cef
abc c
gibt es die correspondierende Folgeh2,1,3,2,5imit a
ab b ca
ca a
a ab
abc c
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 9/42
Das Postsche Correspondenzproblem (3)
Beispiel B
Nicht f¨ur jede MengeK existiert eine correspondierende Folge, wie zum Beispiel f¨ur die Dominomenge
K =
abc ca
,
b aa
,
abcb abc
,
abc bc
Warum hat dieses PCP keine L¨osung?
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 10/42
Das Postsche Correspondenzproblem (4)
Zur ¨Ubung m¨ogen engagierte H¨orer versuchen, mit Computer
Programmen die k¨urzeste L¨osung f¨ur die folgenden drei PCPs zu finden:
Beispiel C
K1=
aaba a
,
baab aa
,h a
aab i
K2= haaa
aab i
, baa
a
, ab
abb
, b
aa
K3= aab
a
,ha ba
i ,
b aab
Das Postsche Correspondenzproblem (5)
Formale Definition (Postsches Correspondenzproblem; kurz:
PCP)
EineInstanzdes PCP besteht aus einer endlichen Menge K =
x1 y1
, . . . ,
xk yk
wobei x1, . . . ,xk undy1, . . . ,yk nichtleere W¨orter ¨uber einem endlichen AlphabetΣsind.
Das Problem besteht darin, zu entscheiden, ob es einecorrespondierende Folgehi1, . . . ,inivon Indizes in{1, . . . ,k}gibt, sodass gilt:
xi1xi2. . .xin = yi1yi2. . .yin
Die Elemente vonK nennen wirDominosteineoderDominos.
Emil Leon Post (1897–1954)
Wikipedia: Emil Post was a Polish-American mathematician and logician.
He is best known for his work in the field that eventually became known as computability theory.
In 1936, Post developed, independently of Alan Turing, a mathematical model of computation. Intending this as the first of a series of models of equivalent power but increasing complexity, he titled his paper
“Formulation 1”.
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 13/42
Das modifiziertes PCP (MPCP)
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 14/42
Das modifizierte PCP
Definition (Modifiziertes PCP; kurz: MPCP)
Eine Instanz des MPCP besteht aus einer endlichen Menge K =
x1 y1
, . . . ,
xk yk
wobeix1, . . . ,xk undy1, . . . ,yk nicht-leere W¨orter ¨uber einem endlichen AlphabetΣsind.
Das Problem besteht darin zu entscheiden, ob es eine correspondierende Folgehi1, . . . ,inivon Indizesmiti1=1gibt, sodass gilt:
xi1xi2. . .xin = yi1yi2. . .yin
Die Modifikation besteht also nur darin, dass der Stein x1
y1
nun das Startdominoist, mit dem die correspondierende Folge beginnen muss.
Unser Arbeitsplan
Wir werden die folgenden beiden Aussagen beweisen.
Satz A
MPCP ≤PCP
Satz B
H≤MPCP
Die Transitivit¨at der Reduzierbarkeit (¨Ubung) impliziert H≤PCP.
Satz
Das PCP ist unentscheidbar.
Berechenbarkeitslandschaft
rekursiv aufz¨ahlbare
Probleme
H
H D
Probleme mit rekursiv aufz¨ahlbarem
Komplement H H
D entscheidbare
Probleme
Unentscheidbare Probleme mit unentscheidbarem Komplement Htot
MPCP PCP
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 17/42
Beweis von Satz A:
MPCP ≤ PCP
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 18/42
Beweis von MPCP ≤ PCP (1)
Wir modellieren eine MPCP Instanz als PCP Instanz:
I Wir betrachten MPCP Instanz K= x1
y1
, . . . , xk
yk
I Es seien#und $zwei Symbole, die nicht im MPCP vorkommen
I Wir konstruierenxi0aus xi,
indem wirhinterjedem Buchstaben ein#einf¨ugen
I Wir konstruierenyi0 ausyi,
indem wirvorjedem Buchstaben ein#einf¨ugen
I Ferner setzen wirx00 = #x10; y00 =y10; xk0+1= $; undyk+10 = #$.
I Damit berechnen wir die folgende PCP Instanz f(K) =
x00 y00
, x10
y10
, . . . , xk0
yk0
, xk+10
yk+10
Beweis von MPCP ≤ PCP (2)
Beispiel:
MPCP K = ab
a
, h c
abc i
, ha
b i
wird modelliert als PCPf(K) =
#a#b#
#a
,
a#b#
#a
,
c#
#a#b#c
, a#
#b
, $
#$
L¨osung des MPCP:
ab a
a b
ab a
c abc
L¨osung des PCP:
#a#b#
#a
a#
#b
a#b#
#a
c#
#a#b#c
$
#$
Beweis von MPCP ≤ PCP , Korrektheit (1)
Wir zeigen: (1) WennK∈MPCP, dannf(K)∈PCP
I Es sei(i1,i2, . . . ,in)L¨osung f¨ur MPCP K. Dann gilti1=1und xi1xi2. . .xin = yi1yi2. . .yin = a1a2. . .as
f¨ur gewisse Buchstabena1, . . . ,as ausΣ.
I Dann ist(0,i2, . . . ,in,k+1)eine L¨osung f¨ur PCPf(K), denn x00xi02. . .xi0n$ = #a1#a2#. . .#as#$ = y00yi02. . .yi0n#$
I Aus einer L¨osung f¨ur MPCP K l¨asst sich also eine L¨osung f¨ur PCP f(K)konstruieren. Damit ist die Implikation (1) gezeigt.
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 21/42
Beweis von MPCP ≤ PCP , Korrektheit (2)
Wir zeigen: (2) Wennf(K)∈PCP, dannK ∈MPCP
I Es sei(i1,i2, . . . ,in)eine L¨osungminimaler L¨angef¨urf(K).
I Fakt A:i1=0, da nurx00 und y00 mit dem selben Zeichen beginnen
I Fakt B: in=k+1, da nurxk0+1undyk0+1 mit selbem Zeichen enden
I Fakt C:ij 6=0f¨ur2≤j≤n. Andernfalls folgen im oberen Wort zwei
#-Zeichen direkt aufeinander, was im unteren Wort unm¨oglich ist.
I Fakt D:ij 6=k+1f¨ur1≤j <n. Andernfalls k¨urzere L¨osung.
I Durch das L¨oschen aller #und $Symbole wird das PCP
L¨osungswort also zum MPCP L¨osungswort.
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 22/42
Beweis von Satz B:
H ≤ MPCP
Illustrierendes Beispiel (1)
Wir betrachten die TMM = (Q,Σ,Γ,B,q0,q, δ)
I mit Σ ={0,1}, Γ ={0,1,B}, undQ={q0,q1,q2,q},
I und mit der folgenden ¨Uberf¨uhrungsfunktionδ:
δ 0 1 B
q0 (q0,0,R) (q1,1,R) (q,1,N) q1 (q2,0,R) (q1,1,R) (q,1,N) q2 (q2,0,R) (q2,1,R) (q2,B,R)
Die TMM erkennt die Sprache0∗1∗:
I Bei Eingabeworten in0∗1∗erreicht die Berechnung den Zustandq, und die Maschine akzeptiert.
I Bei Eingabeworten nicht in0∗1∗ bleibt die Berechnung im Zustand q2 stecken, und der Kopf l¨auft weiter und weiter nach rechts.
Illustrierendes Beispiel (2)
Die Berechnung der TMM auf einem gegebenen Eingabewort wird durch eine Konfigurationsfolge beschrieben:
Konfigurationsfolge vonM auf Eingabew =0011
q00011 ` 0q0011 ` 00q011 ` 001q11 ` 0011q1B ` 0011q1
Wir werden solche Konfigurationsfolgen nun durch geeignet gew¨ahlte Dominos in einem MPCP beschreiben, kodieren, und simulieren.
Dominosteine / Teil 1
BeimStartdominobesteht das untere Wort aus der Anfangskonfiguration mit drei zus¨atzlichen Trennzeichen:
#
##q00011#
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 25/42
Illustrierendes Beispiel (3)
Dominosteine / Teil 2
Weiters gibt es f¨ur jedes Zeichen ausΓ∪ {#}einen entsprechenden Stein:
0 0
, 1
1
, B
B
, #
#
Dominosteine / Teil 3
Auch f¨ur jeden Eintrag in der Tabelle derUberf¨¨ uhrungsfunktionδgibt es einen entsprechenden Stein, der den jeweiligen ¨Ubergang inklusive der Kopfbewegung beschreibt:
q00 0q0
,
q01 1q1
,
q0B q1
,
q10 0q2
,
q11 1q1
,
q1B q1
,
q20 0q2
,
q21 1q2
,
q2B Bq2
(Die Konstruktion wird sp¨ater noch erweitert und fortgesetzt.)
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 26/42
Illustrierendes Beispiel (4)
Beobachtung:
Angenommen, wir erg¨anzen den Startdomino
#
##q00011#
mit einer Folge von Dominos aus der bisherigen Liste erlaubter Dominos derart, dass der obere String einen Pr¨afix des unteren Strings bildet.
I In der ersten Erg¨anzungsphase konstruieren wir dadurch im unteren String die Nachfolge-Konfiguration vonM f¨urq00011.
I In den sp¨ateren Erg¨anzungsphasen konstruieren wir weitere Nachfolge-Konfigurationen, wobei der obere String dem unteren String immer um genau eine Konfiguration nachhinkt.
Illustrierendes Beispiel (5)
Rekonstruktion der Konfigurationsfolge
Die ersten Dominos in der L¨osung des Puzzles sind #
##q00011#
#
# q00 0q0
0 0
1 1
1 1
#
# #
# 0 0
q00 0q0
1 1
1 1
#
# #
# 0 0
0 0
q01 1q1
1 1
#
# #
# 0 0
0 0
1 1
q11 1q1
#
# #
# 0 0
0 0
1 1
1 1
q1# q1#
. . . .
Illustrierendes Beispiel (6)
Alarm! Alarm! Alarm! Alarm! Alarm! Alarm! Alarm! Alarm!
Der letzte Schritt war illegal,
da er einen nicht definierten Dominostein verwendet.
Deshalb erg¨anzen wir nun die Liste erlaubter Dominos:
Dominosteine / Teil 4
Die folgenden Dominos realisieren ¨Uberf¨uhrungen, die ein zus¨atzliches Blank-Symbolben¨otigen, da der Kopf am Ende des Wortes steht.
q0# q1#
,
q1# q1#
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 29/42
Illustrierendes Beispiel (7)
Wie beenden wir die Geschichte nun? Wie kann der obere String seinen ewigen R¨uckstand am Ende der Rechnung doch noch aufholen?
Dominosteine / Teil 5
Wir f¨uhren einige Dominos ein, die nur dann zum Einsatz kommen k¨onnen, wenn derEndzustandqbereits erreicht ist:
q0 q
,
q1 q
,
qB q
,
0q q
,
1q q
,
Bq q
Schlussendlich f¨ugen wir noch denAbschlussdomino hinzu:
#q##
#
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 30/42
Illustrierendes Beispiel (8)
Rekonstruktion der Konfigurationsfolge / Fortsetzung
. . . #
# 0 0
0 0
1 1
1 1
q1# q1#
#
# 0 0
0 0
1 1
1 1
q1 q
#
# #
# 0 0
0 0
1 1
1q q
#
# #
# 0 0
0 0
1q q
#
# #
# 0 0
0q q
#
# #
# 0q
q
#
#
#q##
#
(Fertig)
Zur¨ uck zum Beweis von Satz B
Nach dem illustrierenden Beispiel kehren wir zum Beweis von Satz B zur¨uck und beweisenH≤MPCP.
I Wir beschreiben eine berechenbare Funktionf, die eine syntaktisch korrekte InstanzhMiw f¨urs Halteproblem H in eine syntaktisch korrekte InstanzK :=f hMiw
f¨urs MPCP ¨ubersetzt
I Dabei gilt: M h¨alt aufw ⇐⇒ K hat correspondierende Folge
I Syntaktisch nicht korrekte Eingaben f¨urH werden auf syntaktisch nicht korrekte Eingaben f¨urs MPCP abgebildet
I F¨ur die MPCP Instanz verwenden wir das AlphabetΓ∪Q∪ {#}mit
#6∈Γ∪Q
Die Reduktion (1)
Dominosteine (Startdomino)
DerStartdominoist von der Form #
##q0w#
Dominosteine (Kopierdominos)
Weiters enth¨altK die folgendenKopierdominos:
ha a i
f¨ur allea∈Γ∪ {#}
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 33/42
Die Reduktion (2)
Dominosteine (¨ Uberf¨ uhrungsdominos)
qa q0c
falls δ(q,a) = (q0,c,N), f¨urq∈Q\ {q},a∈Γ qa
cq0
falls δ(q,a) = (q0,c,R), f¨urq∈Q\ {q}, a∈Γ bqa
q0bc
falls δ(q,a) = (q0,c,L), f¨urq∈Q\ {q},a,b∈Γ
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 34/42
Die Reduktion (3)
Dominosteine (¨ Uberf¨ uhrungsdominos f¨ ur implizite Blanks)
#qa
#q0Bc
fallsδ(q,a) = (q0,c,L), f¨urq∈Q\ {q}, a∈Γ q#
q0c#
fallsδ(q,B) = (q0,c,N), f¨urq∈Q\ {q}
q#
cq0#
fallsδ(q,B) = (q0,c,R), f¨urq∈Q\ {q}
bq#
q0bc#
fallsδ(q,B) = (q0,c,L), f¨ur q∈Q\ {q}, b∈Γ #q#
#q0Bc#
fallsδ(q,B) = (q0,c,L), f¨ur q∈Q\ {q}
Die Reduktion (4)
Dominosteine (L¨ oschdominos)
Weiters enth¨altK die folgendenL¨oschdominos:
aq q
und
qa q
f¨ura∈Γ
Dominosteine (Abschlussdomino)
DerAbschlussdominoist von der Form #q##
#
Die Reduktion und die Beschreibung der Funktionf sind damit abgeschlossen.
Korrektheit (1)
Das Korrektheitsargument besteht aus drei Teilen:
Teil 1: f ist berechenbar X
Teil 2: M h¨alt aufw ⇒ K ∈MPCP Teil 3: K ∈MPCP ⇒ M h¨alt aufw
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 37/42
Korrektheit (2)
Zum Beweis von Teil 2: M h¨alt aufw ⇒ K∈MPCP
I Die Berechnung vonM aufw entspricht einer endlichen Konfigurationsfolge k0 ` k1 ` · · · ` kt−1 ` kt
wobeik0 die Startkonfiguration im Zustandq0und kt die Endkonfiguration im Zustandq ist.
I Wir konstruieren eine correspondierende Folge, die mit dem Startdomino beginnt.
Der obere String ist ein Pr¨afix des unteren Strings:
##k0##k1## · · · ##kt−1#
Der untere String gibt die vollst¨andige Konfigurationsfolge an:
##k0##k1## · · · ##kt−1##kt#
I Durch Hinzuf¨ugen von einer Folge von L¨oschdominos kann das Nachhinken des oberen Strings fast ausgeglichen werden.
Danach sind beide Strings identisch bis auf einen Suffix der Form
#q#, der im oberen String fehlt.
I Hinzuf¨ugen des Abschlussdominos macht beide Strings identisch.
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 38/42
Korrektheit (3)
Zum Beweis von Teil 3: K ∈MPCP ⇒ M h¨alt aufw
Der Satz von Dominosteinen im MPCP hat folgende Eigenschaften:
I Beim Startdomino ist der obere String k¨urzer als der untere
I Bei den Kopier- und ¨Uberf¨uhrungsdominos ist der obere String immer h¨ochstens so lang wie der untere String
I Nur auf Abschluss- und L¨oschdominos ist der obere String l¨anger als der untere String
Die correspondierende Folge f¨urK liefert uns eine entsprechende Konfigurationsfolge vonM aufw.
I Diese Konfigurationsfolge beginnt mit dem Startdomino
I Diese Konfigurationsfolge muss zumindest einen L¨osch- oder Abschlussdomino enthalten (andernfalls w¨are der untere String l¨anger als der obere String)
I Deshalb erscheint der Zustandq in dieser Konfigurationsfolge, und
Leichte und schwierige Varianten
Varianten des PCPs (1)
Wie ist die Komplexit¨at f¨ur eingeschr¨ankte Varianten des Problems?
Falls nur kurze W¨orter erlaubt sind:
I Wenn alle W¨orter auf den Dominos L¨ange 1 haben, so ist das PCP entscheidbar.
I Wenn alle W¨orter L¨ange 1 oder 2 haben, so ist das PCP unentscheidbar.
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 41/42
Varianten des PCPs (2)
Falls nur wenige Dominos erlaubt sind:
I F¨ur 1 Domino ist das PCP trivial.
I F¨ur 2 Dominos ist das PCP entscheidbar.
[Ehrenfeucht, Rozenberg](1981)
I F¨ur 3 und 4 Dominos ist die Komplexit¨at ungekl¨art.
I F¨ur 5 Dominos ist das PCP unentscheidbar. [Neary](2015)
I F¨ur 7 Dominos oder mehr ist das PCP unentscheidbar.
[Matijasevich, S´enizergues](1996)
I F¨ur unbeschr¨ankt viele Dominos ist das PCP unentscheidbar.
[Post](1947)
BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 42/42