VL-09: Das Postsche Correspondenzproblem

(1)

VL-09: Das Postsche Correspondenzproblem

(Berechenbarkeit und Komplexit¨ at, WS 2017) Gerhard Woeginger

WS 2017, RWTH

BuK/WS 2017 VL-09: Das Postsche Correspondenzproblem 1/42

Organisatorisches

I N¨achste Vorlesung:

Mittwoch, November 22, 14:15–15:45 Uhr, Roter H¨orsaal

I Webseite:

http://algo.rwth-aachen.de/Lehre/WS1718/BuK.php

Wiederholung

Wdh.: Abschlusseigenschaften von Sprachen

Satz

Die Menge der rekursiven Sprachen ist abgeschlossen unter Komplementbildung, Vereinigungen und Schnitten.

Satz

Die Menge der rekursiv aufz¨ahlbaren Sprachen ist abgeschlossen unter Vereinigungen und Schnitten.

Sie istnichtabgeschlossen unter Komplementbildung.

(2)

Wdh.: Berechenbarkeitslandschaft

rekursiv aufz¨ahlbare

Probleme H

H D

Probleme mit rekursiv aufz¨ahlbarem

Komplement H H

D entscheidbare

Probleme

Unentscheidbare Probleme mit unentscheidbarem Komplement Htot

Wdh.: Reduktionen

Definition

Es seienL₁und L₂ zwei Sprachen ¨uber einem AlphabetΣ.

Dann heisst L₁ aufL₂ reduzierbar(mit der Notation L₁≤L₂), wenn eine berechenbare Funktionf: Σ^∗→Σ^∗existiert, so dass f¨ur alle x∈Σ^∗ gilt: x ∈L1 ⇔ f(x)∈L2.

Satz

FallsL₁≤L₂und fallsL₁nicht entscheidbarist, so istL₂nicht entscheidbar.

Vorlesung VL-09

Das Postsche Correspondenzproblem

IDefinition des PCP IDefinition des MPCP

IUnentscheidbarkeit von MPCP und PCP ILeichte und schwierige Varianten

Das Postsche Correspondenzproblem (1)

DasPostsche Correspondenzproblem(PCP) ist ein Puzzle aus Dominos.

I Jeder Dominostein ist mit zwei Wörtern über einem AlphabetΣ beschriftet, und zwar mit einem Wort in der oberen Hälfte und einem Wort in der unteren Hälfte.

I Gegeben ist eine MengeK von Dominosteinen.

Jeder Dominostein darf beliebig oft verwendet werden.

I Die Aufgabe besteht darin, einecorrespondierende Folgevon Dominos ausK zu finden, mit der sich oben und unten jeweils das selbe Wort ergibt.

I Die Folge muss mindestens einen Dominostein enthalten.

(3)

Das Postsche Correspondenzproblem (2)

Beispiel A

F¨ur die Dominomenge K =

b ca

,

a ab

,

ca a

,

dbd cef

abc c

gibt es die correspondierende Folgeh2,1,3,2,5imit a

ab b ca

ca a

a ab

abc c

Das Postsche Correspondenzproblem (3)

Beispiel B

Nicht f¨ur jede MengeK existiert eine correspondierende Folge, wie zum Beispiel f¨ur die Dominomenge

K =

abc ca

,

b aa

,

abcb abc

,

abc bc

Warum hat dieses PCP keine L¨osung?

Das Postsche Correspondenzproblem (4)

Zur Übung mögen engagierte Hörer versuchen, mit Computer

Programmen die kürzeste Lösung für die folgenden drei PCPs zu finden:

Beispiel C

K1=

aaba a

,

baab aa

,h a

aab i

K2= haaa

aab i

, baa

a

, ab

abb

, b

aa

K₃= aab

a

,ha ba

i ,

b aab

Das Postsche Correspondenzproblem (5)

Formale Definition (Postsches Correspondenzproblem; kurz:

PCP)

EineInstanzdes PCP besteht aus einer endlichen Menge K =

x₁ y1

, . . . ,

x_k yk

wobei x1, . . . ,xk undy1, . . . ,yk nichtleere W¨orter ¨uber einem endlichen AlphabetΣsind.

Das Problem besteht darin, zu entscheiden, ob es einecorrespondierende Folgehi1, . . . ,inivon Indizes in{1, . . . ,k}gibt, sodass gilt:

xi₁xi₂. . .xi_n = yi₁yi₂. . .yi_n

Die Elemente vonK nennen wirDominosteineoderDominos.

(4)

Emil Leon Post (1897–1954)

Wikipedia: Emil Post was a Polish-American mathematician and logician.

He is best known for his work in the field that eventually became known as computability theory.

In 1936, Post developed, independently of Alan Turing, a mathematical model of computation. Intending this as the first of a series of models of equivalent power but increasing complexity, he titled his paper

“Formulation 1”.

Das modifiziertes PCP (MPCP)

Das modifizierte PCP

Definition (Modifiziertes PCP; kurz: MPCP)

Eine Instanz des MPCP besteht aus einer endlichen Menge K =

x₁ y1

, . . . ,

x_k yk

wobeix1, . . . ,xk undy1, . . . ,yk nicht-leere W¨orter ¨uber einem endlichen AlphabetΣsind.

Das Problem besteht darin zu entscheiden, ob es eine correspondierende Folgehi1, . . . ,inivon Indizesmiti1=1gibt, sodass gilt:

xi1xi2. . .xin = yi1yi2. . .yin

Die Modifikation besteht also nur darin, dass der Stein x₁

y1

nun das Startdominoist, mit dem die correspondierende Folge beginnen muss.

Unser Arbeitsplan

Wir werden die folgenden beiden Aussagen beweisen.

Satz A

MPCP ≤PCP

Satz B

H≤MPCP

Die Transitivit¨at der Reduzierbarkeit (¨Ubung) impliziert H≤PCP.

Satz

Das PCP ist unentscheidbar.

(5)

Berechenbarkeitslandschaft

rekursiv aufz¨ahlbare

Probleme

H

H D

Probleme mit rekursiv aufz¨ahlbarem

Komplement H H

D entscheidbare

Probleme

Unentscheidbare Probleme mit unentscheidbarem Komplement Htot

MPCP PCP

Beweis von Satz A:

MPCP ≤ PCP

Beweis von MPCP ≤ PCP (1)

Wir modellieren eine MPCP Instanz als PCP Instanz:

I Wir betrachten MPCP Instanz K= x1

y₁

, . . . , xk

y_k

I Es seien#und $zwei Symbole, die nicht im MPCP vorkommen

I Wir konstruierenx_i⁰aus xi,

indem wirhinterjedem Buchstaben ein#einf¨ugen

I Wir konstruiereny_i⁰ ausy_i,

indem wirvorjedem Buchstaben ein#einf¨ugen

I Ferner setzen wirx₀⁰ = #x₁⁰; y₀⁰ =y₁⁰; x_k⁰₊₁= $; undy_k+1⁰ = #$.

I Damit berechnen wir die folgende PCP Instanz f(K) =

x₀⁰ y₀⁰

, x₁⁰

y₁⁰

, . . . , x_k⁰

y_k⁰

, x_k+1⁰

y_k+1⁰

Beweis von MPCP ≤ PCP (2)

Beispiel:

MPCP K = ab

a

, h c

abc i

, ha

b i

wird modelliert als PCPf(K) =

#a#b#

#a

,

a#b#

#a

,

c#

#a#b#c

, a#

#b

, $

#$

L¨osung des MPCP:

ab a

a b

ab a

c abc

L¨osung des PCP:

#a#b#

#a

a#

#b

a#b#

#a

c#

#a#b#c

$

#$

(6)

Beweis von MPCP ≤ PCP , Korrektheit (1)

Wir zeigen: (1) WennK∈MPCP, dannf(K)∈PCP

I Es sei(i₁,i₂, . . . ,i_n)L¨osung f¨ur MPCP K. Dann gilti₁=1und x_i₁x_i₂. . .x_i_n = y_i₁y_i₂. . .y_i_n = a₁a₂. . .a_s

f¨ur gewisse Buchstabena₁, . . . ,a_s ausΣ.

I Dann ist(0,i2, . . . ,in,k+1)eine L¨osung f¨ur PCPf(K), denn x₀⁰x_i⁰₂. . .x_i⁰_n$ = #a1#a2#. . .#as#$ = y₀⁰y_i⁰₂. . .y_i⁰_n#$

I Aus einer Lösung für MPCP K lässt sich also eine Lösung für PCP f(K)konstruieren. Damit ist die Implikation (1) gezeigt.

Beweis von MPCP ≤ PCP , Korrektheit (2)

Wir zeigen: (2) Wennf(K)∈PCP, dannK ∈MPCP

I Es sei(i1,i2, . . . ,in)eine Lösungminimaler Längefürf(K).

I Fakt A:i₁=0, da nurx₀⁰ und y₀⁰ mit dem selben Zeichen beginnen

I Fakt B: in=k+1, da nurx_k⁰₊₁undy_k⁰₊₁ mit selbem Zeichen enden

I Fakt C:i_j 6=0f¨ur2≤j≤n. Andernfalls folgen im oberen Wort zwei

#-Zeichen direkt aufeinander, was im unteren Wort unm¨oglich ist.

I Fakt D:ij 6=k+1für1≤j <n. Andernfalls kürzere Lösung.

I Durch das L¨oschen aller #und $Symbole wird das PCP

L¨osungswort also zum MPCP L¨osungswort.

Beweis von Satz B:

H ≤ MPCP

Illustrierendes Beispiel (1)

Wir betrachten die TMM = (Q,Σ,Γ,B,q0,q, δ)

I mit Σ ={0,1}, Γ ={0,1,B}, undQ={q0,q₁,q₂,q},

I und mit der folgenden ¨Uberf¨uhrungsfunktionδ:

δ 0 1 B

q0 (q0,0,R) (q1,1,R) (q,1,N) q₁ (q₂,0,R) (q₁,1,R) (q,1,N) q2 (q2,0,R) (q2,1,R) (q2,B,R)

Die TMM erkennt die Sprache0^∗1^∗:

I Bei Eingabeworten in0^∗1^∗erreicht die Berechnung den Zustandq, und die Maschine akzeptiert.

I Bei Eingabeworten nicht in0^∗1^∗ bleibt die Berechnung im Zustand q₂ stecken, und der Kopf l¨auft weiter und weiter nach rechts.

(7)

Illustrierendes Beispiel (2)

Die Berechnung der TMM auf einem gegebenen Eingabewort wird durch eine Konfigurationsfolge beschrieben:

Konfigurationsfolge vonM auf Eingabew =0011

q₀0011 ` 0q₀011 ` 00q₀11 ` 001q₁1 ` 0011q₁B ` 0011q1

Wir werden solche Konfigurationsfolgen nun durch geeignet gew¨ahlte Dominos in einem MPCP beschreiben, kodieren, und simulieren.

Dominosteine / Teil 1

BeimStartdominobesteht das untere Wort aus der Anfangskonfiguration mit drei zus¨atzlichen Trennzeichen:

#

##q₀0011#

Illustrierendes Beispiel (3)

Dominosteine / Teil 2

Weiters gibt es f¨ur jedes Zeichen ausΓ∪ {#}einen entsprechenden Stein:

0 0

, 1

1

, B

B

, #

#

Dominosteine / Teil 3

Auch f¨ur jeden Eintrag in der Tabelle derUberf¨¨ uhrungsfunktionδgibt es einen entsprechenden Stein, der den jeweiligen ¨Ubergang inklusive der Kopfbewegung beschreibt:

q00 0q0

,

q01 1q1

,

q0B q1

,

q10 0q2

,

q11 1q1

,

q1B q1

,

q20 0q2

,

q21 1q2

,

q2B Bq2

(Die Konstruktion wird sp¨ater noch erweitert und fortgesetzt.)

Illustrierendes Beispiel (4)

Beobachtung:

Angenommen, wir erg¨anzen den Startdomino

#

##q00011#

mit einer Folge von Dominos aus der bisherigen Liste erlaubter Dominos derart, dass der obere String einen Pr¨afix des unteren Strings bildet.

I In der ersten Erg¨anzungsphase konstruieren wir dadurch im unteren String die Nachfolge-Konfiguration vonM f¨urq₀0011.

I In den sp¨ateren Erg¨anzungsphasen konstruieren wir weitere Nachfolge-Konfigurationen, wobei der obere String dem unteren String immer um genau eine Konfiguration nachhinkt.

Illustrierendes Beispiel (5)

Rekonstruktion der Konfigurationsfolge

Die ersten Dominos in der L¨osung des Puzzles sind #

##q₀0011#

#

# q00 0q₀

0 0

1 1

#

# #

# 0 0

q₀0 0q0

1 1

#

# #

# 0 0

0 0

q₀1 1q1

1 1

#

# #

# 0 0

0 0

1 1

q11 1q₁

#

# #

# 0 0

0 0

1 1

q1# q1#

. . . .

(8)

Illustrierendes Beispiel (6)

Alarm! Alarm! Alarm! Alarm! Alarm! Alarm! Alarm! Alarm!

Der letzte Schritt war illegal,

da er einen nicht definierten Dominostein verwendet.

Deshalb erg¨anzen wir nun die Liste erlaubter Dominos:

Dominosteine / Teil 4

Die folgenden Dominos realisieren Überführungen, die ein zusätzliches Blank-Symbolbenötigen, da der Kopf am Ende des Wortes steht.

q0# q1#

,

q1# q1#

Illustrierendes Beispiel (7)

Wie beenden wir die Geschichte nun? Wie kann der obere String seinen ewigen R¨uckstand am Ende der Rechnung doch noch aufholen?

Dominosteine / Teil 5

Wir f¨uhren einige Dominos ein, die nur dann zum Einsatz kommen k¨onnen, wenn derEndzustandqbereits erreicht ist:

q0 q

,

q1 q

,

qB q

,

0q q

,

1q q

,

Bq q

Schlussendlich f¨ugen wir noch denAbschlussdomino hinzu:

#q##

#

Illustrierendes Beispiel (8)

Rekonstruktion der Konfigurationsfolge / Fortsetzung

. . . #

# 0 0

0 0

1 1

q1# q1#

#

# 0 0

0 0

1 1

q1 q

#

# #

# 0 0

0 0

1 1

1q q

#

# #

# 0 0

0 0

1q q

#

# #

# 0 0

0q q

#

# #

# 0q

q

#

#q##

#

(Fertig)

Zur¨ uck zum Beweis von Satz B

Nach dem illustrierenden Beispiel kehren wir zum Beweis von Satz B zur¨uck und beweisenH≤MPCP.

I Wir beschreiben eine berechenbare Funktionf, die eine syntaktisch korrekte InstanzhMiw f¨urs Halteproblem H in eine syntaktisch korrekte InstanzK :=f hMiw

f¨urs MPCP ¨ubersetzt

I Dabei gilt: M h¨alt aufw ⇐⇒ K hat correspondierende Folge

I Syntaktisch nicht korrekte Eingaben f¨urH werden auf syntaktisch nicht korrekte Eingaben f¨urs MPCP abgebildet

I F¨ur die MPCP Instanz verwenden wir das AlphabetΓ∪Q∪ {#}mit

#6∈Γ∪Q

(9)

Die Reduktion (1)

Dominosteine (Startdomino)

DerStartdominoist von der Form #

##q₀w#

Dominosteine (Kopierdominos)

Weiters enth¨altK die folgendenKopierdominos:

ha a i

f¨ur allea∈Γ∪ {#}

Die Reduktion (2)

Dominosteine (¨ Uberf¨ uhrungsdominos)

qa q⁰c

falls δ(q,a) = (q⁰,c,N), f¨urq∈Q\ {q},a∈Γ qa

cq⁰

falls δ(q,a) = (q⁰,c,R), f¨urq∈Q\ {q}, a∈Γ bqa

q⁰bc

falls δ(q,a) = (q⁰,c,L), f¨urq∈Q\ {q},a,b∈Γ

Die Reduktion (3)

Dominosteine (¨ Uberf¨ uhrungsdominos f¨ ur implizite Blanks)

#qa

#q⁰Bc

fallsδ(q,a) = (q⁰,c,L), f¨urq∈Q\ {q}, a∈Γ q#

q⁰c#

fallsδ(q,B) = (q⁰,c,N), f¨urq∈Q\ {q}

q#

cq⁰#

fallsδ(q,B) = (q⁰,c,R), f¨urq∈Q\ {q}

bq#

q⁰bc#

fallsδ(q,B) = (q⁰,c,L), f¨ur q∈Q\ {q}, b∈Γ #q#

#q⁰Bc#

fallsδ(q,B) = (q⁰,c,L), f¨ur q∈Q\ {q}

Die Reduktion (4)

Dominosteine (L¨ oschdominos)

Weiters enth¨altK die folgendenL¨oschdominos:

aq q

und

qa q

f¨ura∈Γ

Dominosteine (Abschlussdomino)

DerAbschlussdominoist von der Form #q##

#

Die Reduktion und die Beschreibung der Funktionf sind damit abgeschlossen.

(10)

Korrektheit (1)

Das Korrektheitsargument besteht aus drei Teilen:

Teil 1: f ist berechenbar X

Teil 2: M h¨alt aufw ⇒ K ∈MPCP Teil 3: K ∈MPCP ⇒ M h¨alt aufw

Korrektheit (2)

Zum Beweis von Teil 2: M h¨alt aufw ⇒ K∈MPCP

I Die Berechnung vonM aufw entspricht einer endlichen Konfigurationsfolge k0 ` k1 ` · · · ` k_t−1 ` kt

wobeik0 die Startkonfiguration im Zustandq0und kt die Endkonfiguration im Zustandq ist.

I Wir konstruieren eine correspondierende Folge, die mit dem Startdomino beginnt.

Der obere String ist ein Pr¨afix des unteren Strings:

##k₀##k₁## · · · ##k_t−1#

Der untere String gibt die vollst¨andige Konfigurationsfolge an:

##k0##k1## · · · ##k_t−1##kt#

I Durch Hinzuf¨ugen von einer Folge von L¨oschdominos kann das Nachhinken des oberen Strings fast ausgeglichen werden.

Danach sind beide Strings identisch bis auf einen Suffix der Form

#q#, der im oberen String fehlt.

I Hinzuf¨ugen des Abschlussdominos macht beide Strings identisch.

Korrektheit (3)

Zum Beweis von Teil 3: K ∈MPCP ⇒ M h¨alt aufw

Der Satz von Dominosteinen im MPCP hat folgende Eigenschaften:

I Beim Startdomino ist der obere String k¨urzer als der untere

I Bei den Kopier- und Überführungsdominos ist der obere String immer höchstens so lang wie der untere String

I Nur auf Abschluss- und L¨oschdominos ist der obere String l¨anger als der untere String

Die correspondierende Folge f¨urK liefert uns eine entsprechende Konfigurationsfolge vonM aufw.

I Diese Konfigurationsfolge beginnt mit dem Startdomino

I Diese Konfigurationsfolge muss zumindest einen Lösch- oder Abschlussdomino enthalten (andernfalls wäre der untere String länger als der obere String)

I Deshalb erscheint der Zustandq in dieser Konfigurationsfolge, und

Leichte und schwierige Varianten

(11)

Varianten des PCPs (1)

Wie ist die Komplexität für eingeschränkte Varianten des Problems?

Falls nur kurze W¨orter erlaubt sind:

I Wenn alle W¨orter auf den Dominos L¨ange 1 haben, so ist das PCP entscheidbar.

I Wenn alle W¨orter L¨ange 1 oder 2 haben, so ist das PCP unentscheidbar.

Varianten des PCPs (2)

Falls nur wenige Dominos erlaubt sind:

I F¨ur 1 Domino ist das PCP trivial.

I F¨ur 2 Dominos ist das PCP entscheidbar.

[Ehrenfeucht, Rozenberg](1981)

I Für 3 und 4 Dominos ist die Komplexität ungeklärt.

I F¨ur 5 Dominos ist das PCP unentscheidbar. [Neary](2015)

I F¨ur 7 Dominos oder mehr ist das PCP unentscheidbar.

[Matijasevich, S´enizergues](1996)

I F¨ur unbeschr¨ankt viele Dominos ist das PCP unentscheidbar.

[Post](1947)