Kontextfreie Sprachen: Teil II

(1)

Formale Sprachen und Komplexit¨ at

Sommersemester 2019

Kontextfreie Sprachen: Teil II

Prof. Dr. David Sabel

LFE Theoretische Informatik

Letzte ¨Anderung der Folien: 11. Juni 2019

Inhalts¨ ubersicht

Effiziente L¨ osung des Wortproblems f¨ ur CFLs:

Der Cocke-Younger-Kasami-Algorithmus Kellerautomaten

Deterministisch kontextfreie Sprachen

Entscheidbarkeitsresultate f¨ ur kontextfreie Sprachen

TCS | 05 Kontextfreie Sprachen (II)| SoSe 2019 2/57 CYK PDAs Det.CFLs Entscheidbarkeit

Effizientes L¨ osen des Wortproblems f¨ ur CFLs

Algorithmus f¨ ur Typ 1-Sprachen hat exponentielle Laufzeit Jetzt: Algorithmus von Cocke, Younger und Kasami f¨ ur CFLs Ver¨ offentlich in den 1960er Jahren

Kurz: CYK-Algorithmus Polynomielle Laufzeit

Idee des CYK-Algorithmus

Eingabe:

CFG G = (V, Σ, P, S ) in Chomsky-Normalform und Wort w ∈ Σ

^∗

Ausgabe:

ja, wenn w ∈ L(G), nein, wenn w 6∈ L(G) Grundidee des Algorithmus:

(Rekursiver) Test, ob Variable A ein Wort u erzeugt.

Verwende Test zum Pr¨ ufen, ob S das Wort w erzeugt.

(2)

Idee des CYK-Algorithmus (2)

Pr¨ ufe, ob A ∈ V ein Wort u = a

₁

· · · a

_n

erzeugt:

Wenn u = a ∈ Σ, dann pr¨ ufe ob A → a ∈ P

Anderenfalls (|u| > 1) kann u nur erzeugt werden, wenn:

Es gibt Produktion A → BC ∈ P Es gibt Index 1 ≤ i < n, sodass:

B erzeugt a

₁

· · · a

_i

und C erzeugt a

_i+1

· · · a

_n

A

B C

| {z }

a1· · ·ai

| {z }

ai+1· · ·an

Daher pr¨ ufe f¨ ur alle A → BC ∈ P und alle i mit 1 ≤ i < n rekursiv, ob B das Wort w = a

₁

· · · a

_i

und C das Wort a

_i+1

· · · a

_n

erzeugt.

TCS | 05 Kontextfreie Sprachen (II) | SoSe 2019 5/57 CYK PDAs Det.CFLs Entscheidbarkeit

Beispiel

S → AB | BA, A → AA | AB | a, B → BB | b S erzeugt bbbaab, denn S → BA und

B erzeugt bbb, denn B → BB und

B erzeugt bb, denn B → BB und B → b und B → b B erzeugt b, denn B → b

A erzeugt aab, denn A → AB und A erzeugt aa, denn A → AA und

Aerzeugta, dennA→aund Aerzeugta, dennA→a

B erzeugt b, denn B → b

Bevor der rekursive Algorithmus diesen richtigen Pfad findet, sucht er einige erfolglose ab, z.B. f¨ ur S → AB

Pr¨ufe, obAerzeugtbundBerzeugtbbabgilt.

Pr¨ufe, obAerzeugtbbundBerzeugtbabgilt.

Pr¨ufe, obAerzeugtbbbundBerzeugtabgilt.

Pr¨ufe, obAerzeugtbbbaundBerzeugtbgilt.

Naiv finden wiederholt dieselben Tests statt, z.B. ob A erzeugt b gilt.

Idee des CYK-Algorithmus (3)

Effizienz: Statt Rekursion verwende dynamische Programmierung Algorithmus berechnet Menge V (i, j) ⊆ V , sodass

V (i, j ) = {A ∈ V | A ⇒

^∗

a

_i

· · · a

i+j−1

}

” V (i, j ) enth¨ alt alle A ∈ V , die a

_i

· · · a

_i+j−1

erzeugen“

Berechnung der V (i, j):

Starte mit V (i, 1) = {A | A → a

_i

∈ P }.

Berechne V (i, j ) mit ansteigender L¨ ange j.

F¨ ur j > 1 gilt:

A ∈ V (i, j) g.d.w.

A → BC ∈ P und B ∈ V (i, k), C ∈ V (i + k, j − k)

Berechnung: f¨ ur festes (i, j) betrachte alle k mit k = 1, 2, . . . , j − 1 Finaler Schritt: Pr¨ ufe, ob S ∈ V (1, n) ist.

Algorithmus 8: CYK-Algorithmus

Eingabe: CFG G = (V, Σ, P, S) in Chomsky-NF und Wort w = a

₁

· · · a

_n

∈ Σ

^∗

Ausgabe: Ja, wenn w ∈ L(G) und Nein, wenn w 6∈ L(G)

Beginn

f¨ ur i = 1 bis n tue

V (i, 1) = {A ∈ V | A → a

i

∈ P } f¨ ur j = 2 bis n tue

f¨ ur i = 1 bis n + 1 − j tue V (i, j ) = ∅;

f¨ ur k = 1 bis j − 1 tue V (i, j) = V (i, j ) ∪







A → BC ∈ P, A ∈ V B ∈ V (i, k),

C ∈ V (i + k, j − k)







wenn S ∈ V (1, n) dann return Ja

sonst

return Nein

(3)

Laufzeit des CYK-Algorithmus

Drei geschachtelte F¨ ur-Schleifen

Im inneren wird noch ¨ uber alle Produktionen aus P iteriert Mit n = |w| und |P | = Anzahl der Iterationen kann die Laufzeitkomplexit¨ at mit O(n

³

· |P |) abgesch¨ atzt werden.

Theorem

Das Wortproblem f¨ ur kontextfreie Sprachen kann in Polynomialzeit entschieden werden.

Beispiel

Sei w = bbddc und G = ({S, A, B}, {b, c, d}, P, S) mit

P = {S → AC, A → BE, A → BD, E → AD, C → c, B → b, D → d}

V (i, j )-Tabelle ist zun¨ achst leer:

V (i, j)

b b d d c

1 2 3 4 5

i

j

Beispiel (2)

Sei w = bbddc und G = ({S, A, B}, {b, c, d}, P, S) mit

P = {S → AC, A → BE, A → BD, E → AD, C → c, B → b, D → d}

F¨ ullen der V (i, 1)-Eintr¨ age:

V (i, j )

b b d d c

1 2 3 4 5

i

j

B B D D C

Beispiel (3)

Sei w = bbddc und G = ({S, A, B}, {b, c, d}, P, S) mit

P = {S → AC, A → BE, A → BD, E → AD, C → c, B → b, D → d}

V(i, j)

b b d d c

1 2 3 4 5

i

j

B B D D C

A E A S

Da S ∈ V (1, 5) gilt w ∈ L(G)

(4)

Kellerautomaten: Motivation

Endliche Automaten (DFA & NFA) haben fast keinen Speicher Einziger Speicher dort: Zust¨ ande Daher endlicher Speicher

Daher z.B. unm¨ oglich {w$w | w ∈ {a, b, c}

^∗

} zu erkennen:

Man m¨ usste beim Lesen von w alle gelesenen Zeichen speichern, um sie dann beim Lesen von w zu vergleichen.

Kellerautomaten: F¨ ugen einen Speicher hinzu

Kellerspeicher

Kellerautomaten haben Kellerspeicher

(Stack, LIFO-Speicher, last-in-first-out-Speicher)

Uendlich großer Speicher als Stapel auf den nur von oben zugegriffen werden kann.

Zustands¨ ubergang:

Endlicher Automat Kellerautomat

Eingabe Zustand und Zeichen Zustand, Zeichen, oberstes Symbol im Keller

Ausgabe n¨ achster Zustand Zustand, Sequenz von Kel- lersymbolen, die das erste Symbol ersetzen

Kellerautomat: Illustration

a

₁

a

₂

a

₃

· · · a

_n

Eingabeband

Lesekopf (bewegt sich nur nach rechts)

Keller

Zugriff auf Keller nur von oben endliche

Steuerung

A

₁

A

₂

.. . A

_n

Kellerautomaten: Definition

Definition (Kellerautomat, PDA)

Ein (nichtdeterministischer) Kellerautomat (PDA, pushdown automaton) ist ein Tupel M = (Z, Σ, Γ, δ, z

₀

, #), wobei

Z ist eine endliche Menge von Zust¨ anden, Σ ist das (endliche) Eingabealphabet, Γ ist das (endliche) Kelleralphabet,

δ : (Z × (Σ ∪ {ε}) × Γ) → P

_e

(Z × Γ

^∗

) ist die

Zustands¨ uberf¨ uhrungsfunktion (oder nur Uberf¨ ¨ uhrungsfunktion) z

₀

∈ Z ist der Startzustand und

# ∈ Γ ist das Startsymbol im Keller.

(z

⁰

, B

₁

· · · B

_k

) ∈ δ(z, a, A) bedeutet: im Zustand z bei Eingabe a und A oben auf dem Keller darf der PDA in Zustand z

⁰

wechseln: Dabei wird A durch B

₁

· · · B

_k

ersetzt (B

₁

liegt oben; k = 0 ist erlaubt)

(5)

Illustration: Zustands¨ ubergang

(z

⁰

, B

₁

· · · B

_k

) ∈ δ(z, a, A) a a

⁰

· · ·

z

A .. .

→

a a

⁰

· · ·

z

⁰

B

₁

.. . B

_k

.. .

Bemerkungen

Mit unserer Definition von PDAs:

PDAs sind nichtdeterministisch erlauben ε- ¨ Uberg¨ ange

keine Endzust¨ ande!

Wir werden sehen:

Akzeptieren: Wenn Eingabe verarbeitet und Keller leer Am Anfang: Keller enth¨ alt #

Konfigurationen

Buchf¨ uhren w¨ ahrend einer Berechnung mit dem PDA:

akueller Zustand, Resteingabe, aktueller Kellerinhalt Wird dargestellt durch PDA-Konfiguration

Definition (Konfiguration eines Kellerautomaten) Sei M = (Z, Σ, Γ, δ, z

₀

, #) ein PDA.

Eine Konfiguration von M ist ein Tripel (z, w, W ) mit z ∈ Z , w ∈ Σ

^∗

, W ∈ Γ

^∗

.

Die Menge aller Konfigurationen f¨ ur M ist daher Z × Σ

^∗

× Γ

^∗

. z ist der aktuelle Zustand

w ist die Resteingabe W ist der Kellerinhalt

Transitionsrelation

Definition (Transitionsrelation f¨ ur PDA-Konfigurationen) F¨ ur einen PDA M = (Z, Σ, Γ, δ, z

₀

, #) definieren wir

`

_M

⊆ (Z × Σ

^∗

× Γ

^∗

) × (Z × Σ

^∗

× Γ

^∗

) durch

(z, a

₁

· · · a

_n

, A

₁

· · · A

_m

) `

_M

(z

⁰

, a

₂

· · · a

_n

, W A

₂

· · · A

_m

) falls (z

⁰

, W ) ∈ δ(z, a

₁

, A

₁

) und

(z, w, A

₁

· · · A

_m

) `

_M

(z

⁰

, w, W A

₂

· · · A

_m

) falls (z

⁰

, W ) ∈ δ(z, ε, A

₁

).

Weitere Notation:

`

^∗_M

= reflexiv-transitive H¨ ulle von `

_M

`

ⁱ_M

= i-fache Anwendung von `

_M

Wenn M eindeutig: ` statt `

_M

(6)

PDA: Akzeptierte Sprache

Definition (Akzeptierte Sprache eines PDA)

Sei M = (Z, Σ, Γ, δ, z

₀

, #) ein PDA. Die durch M akzeptierte Sprache L(M ) ist definiert als

L(M) := {w ∈ Σ

^∗

| (z

₀

, w, #) `

^∗

(z, ε, ε) f¨ ur ein z ∈ Z}.

Notation als Zustandsgraph

Darstellung analog zu DFA / NFA

F¨ ur (z

⁰

, B

₁

· · · B

_k

) ∈ δ(z, a, A) zeichnen wir

z z

⁰

(A, a) : B

₁

· · · B

_k

Beachte, dass das Startsymbol im Keller bekannt sein muss (¨ uberlicherweise #)

Beispiel

PDA M = ({z

₀

, z

₁

}, {a, b}, {B, #}, δ, z

₀

, #) mit

δ(z

₀

, a, #) = {(z

₀

, B#)} δ(z

₀

, b, B) = {(z

₁

, ε)} δ(z

₁

, ε, #) = {(z

₁

, ε)}

δ(z

₀

, a, B) = {(z

₀

, BB)} δ(z

₁

, b, B) = {(z

₁

, ε)} δ(z

₀

, ε, #) = {(z

₀

, ε)}

und δ(z

_i

, c, A) = ∅ in allen anderen F¨ allen Zustandsgraph dazu:

z

₀

z

₁

(#, a) : B #, (#, ε) : ε, (B, a) : BB

(B, b) : ε

(B, b) : ε, (#, ε) : ε

Beispiel (2)

z

₀

z

₁

(#, a) : B#, (#, ε) : ε, (B, a) : BB

(B, b) : ε

(B, b) : ε, (#, ε) : ε

M akzeptiert ε, denn (z

₀

, ε, #) ` (z

₀

, ε, ε).

M akzeptiert das Wort a

ⁱ

b

ⁱ

f¨ ur i > 0, da (z

₀

, a

ⁱ

b

ⁱ

, #) ` (z

₀

, a

ⁱ⁻¹

b

ⁱ

, B#) `

^∗

(z

₀

, b

ⁱ

, B

ⁱ

#)

` (z

₁

, b

ⁱ⁻¹

, B

ⁱ⁻¹

#) `

^∗

(z

₁

, ε, #) ` (z

₁

, ε, ε).

andere Worte werden nicht akzeptiert:

f¨ ur jedes gelesene a wird ein B auf den Keller gelegt, das durch lesen von b abgebaut werden muss.

In z

₀

k¨ onnen nur a’s und ein b gelesen werden, dann Wechsel in z

₁

und dort k¨ onnen nur b’s gelesen werden.

L(M) = {a

ⁱ

b

ⁱ

| i ∈ N }

(7)

Weiteres Beispiel

Sei M = ({z

₀

, z

₁

}, {a, b}, {A, B, #}, δ, z

₀

, #) mit δ(z

₀

, a, #) = {(z

₀

, A#), (z

₁

, #)}

δ(z

₀

, b, #) = {(z

₀

, B#), (z

₁

, #)}

δ(z

₀

, a, A) = {(z

₀

, AA), (z

₁

, A)}

δ(z

₀

, b, A) = {(z

₀

, BA), (z

₁

, A)}

δ(z

₀

, a, B) = {(z

₀

, AB), (z

₁

, B)}

δ(z

₀

, b, B) = {(z

₀

, BB), (z

₁

, B)}

δ(z

₀

, ε, A) = {(z

₁

, A)}

δ(z

₀

, ε, B) = {(z

₁

, B)}

δ(z

₀

, ε, #) = {(z

₁

, #)}

δ(z

₁

, a, A) = {(z

₁

, ε)}

δ(z

₁

, b, B) = {(z

₁

, ε)}

δ(z

₁

, ε, #) = {(z

₁

, ε, ε)}

und δ(z

_i

, c, C) = ∅ f¨ ur alle anderen F¨ alle.

L(M) = {w ∈ {a, b}

^∗

| w ist Palindrom}:

In z

₀

werden die gelesenen Zeichen (als A, B) auf den Keller gelegt In z

₁

werden sie dann wieder abgearbeitet (durch Lesen von a, b) Wechsel von z

₀

zu z

₁

mit einem Zeichen (f¨ ur Palindrome uau, ubu) oder mit ε (f¨ ur Palindrome uu).

Richtiger Zeitpunkt des Wechsels: Macht der Nichtdeterminismus.

Akzeptanz durch Endzust¨ ande

Definition (PDA mit Endzust¨ anden)

Ein (nichtdeterministischer) Kellerautomat mit Endzust¨ anden (PDA mit Endzust¨ anden) ist ein Tupel M = (Z, Σ, Γ, δ, z

₀

, #, E) wobei

Z ist eine endliche Menge von Zust¨ anden, Σ ist das (endliche) Eingabealphabet, Γ ist das (endliche) Kelleralphabet

δ : Z × ((Σ ∪ {ε}) × Γ) → P

_e

(Z × Γ

^∗

) ist die Uberf¨ ¨ uhrungsfunktion z

₀

∈ Z ist der Startzustand,

# ∈ Γ ist das Startsymbol im Keller und E ⊆ Z ist die Menge der Endzust¨ ande.

Ein PDA mit Endzust¨ anden akzeptiert die Sprache

L(M) = {w ∈ Σ

^∗

| (z

₀

, w, #) `

^∗

(z, ε, W ) und z ∈ E}.

Aquivalenz: Akzeptanz durch Endzust¨ ¨ ande / leeren Keller

Lemma

F¨ ur jeden Kellerautomat mit Endzust¨ anden M kann ein

Kellerautomat M

⁰

(ohne Endzust¨ ande) konstruiert werden, so dass L(M) = L(M

⁰

) gilt

Lemma

F¨ ur jeden Kellerautomat M kann ein Kellerautomat mit

Endzust¨ anden M

⁰

konstruiert werden, so dass L(M) = L(M

⁰

) gilt.

Satz

PDAs mit Endzust¨ anden und PDAs ohne Endzust¨ ande (mit Akzeptanz durch leeren Keller) sind ¨ aquivalente Formalismen.

Beweise dazu sind im Skript

Aquivalenz: PDAs und CFLs ¨

Wir zeigen, dass PDAs genau die Typ 2-Sprachen erkennen.

Beweis in zwei Teilen:

1

Konstruktion eines PDA aus CFG in Greibach-NF

2

Konstruktion einer CFG aus einem PDA (sogenannte Tripelkonstruktion)

(PDA mit Einschr¨ ankung:

max. 2 Kellersymbole pro Schritt erzeugen)

(8)

CFG → PDA

Ideen:

CFG in Greibach-Normalform gegeben PDA simuliert Linksableitung S ⇒ w

Da CFG in Greibach-NF, sieht eine Linksableitung nach i-Schritten immer so aus: S ⇒

ⁱ

a

₁

· · · a

_i

B

₁

· · · B

_j

. Start mit Eingabe w und S auf dem Keller

Nach i Schritten, ist a

₁

· · · a

_i

verarbeitet und B

₁

· · · B

_j

auf dem Keller

CFG → PDA (2)

Satz

Jede kontextfreie Sprache wird durch einen Kellerautomaten erkannt.

Beweis:

Sei L eine CFL und G = (V, Σ, P, S) mit L(G) = L \ {ε} in Greibach-NF.

Sei M = ({z

₀

}, Σ, V, δ, z

₀

, S) ein PDA, sodass

δ(z

₀

, a, A) := {(z

₀

, B

₁

· · · B

_n

) | (A → aB

₁

· · · B

_n

) ∈ P } und falls ε ∈ L setze zus¨ atzlich δ(z

₀

, ε, S) := {(z

₀

, ε)}.

In allen anderen F¨ allen sei δ(z

₀

, ε, A) = ∅.

Wir zeigen L(M ) = L.

Zun¨ achst: ε ∈ L g.d.w. (z

₀

, ε, S) ` (z

₀

, ε, ε) und damit ε ∈ L(M).

CFG → PDA (2)

M= ({z₀},Σ,Σ∪V, δ, z0, S)mitδ(z0, a, A) :={(z₀, B1· · ·Bn)|(A→aB1· · ·Bn)∈P}. . .

Beweis (Fortsetzung):

F¨ ur die weiteren F¨ alle zeigen wir f¨ ur alle i ∈ N (mit Induktion ¨ uber i) S ⇒

ⁱ_G

a

₁

· · · a

_i

B

₁

· · · B

_m

mit einer Linksableitung

genau dann, wenn

(z

₀

, a

₁

· · · a

_i

w, S ) `

ⁱ

(z

₀

, w, B

₁

· · · B

_m

) f¨ ur alle w ∈ Σ

^∗

. Basis i = 0: gilt, denn S ⇒

⁰_G

S und (z

₀

, w, S) `

⁰

(z

₀

, w, S) F¨ ur i > 0 und “ ⇒”:

Sei S ⇒

ⁱ_G

a

₁

· · · a

_i

B

₁

· · · B

_m

eine Linksableitung.

Da G in Greibach-NF, kann diese geschrieben werden als S ⇒

ⁱ⁻¹_G

a

1

· · · a

i−1

B

x

B

j+1

· · · B

m

⇒

G

a

1

· · · a

i

B

1

· · · B

m

, wobei B

x

→ a

i

B

1

· · · B

j

∈ P als letzte Produktion angewendet wurde.

Induktionsannahme liefert: S ⇒

ⁱ⁻¹_G

a

1

· · · a

_i−1

B

x

B

j+1

· · · B

m

genau dann, wenn (z

0

, a

1

· · · a

_i−1

w, S) `

ⁱ⁻¹

(z

0

, w, B

x

B

j+1

· · · B

k

).

Verwende w = a

i

w

⁰

und da (z

0

, B

1

· · · B

j

) ∈ δ(z

0

, a

i

, B

x

), gilt (z

₀

, a

₁

· · · a

_i

w

⁰

, S) `

ⁱ

(z

₀

, w

⁰

, B

₁

· · · B

_k

) f¨ ur alle w

⁰

.

CFG → PDA (3)

M= ({z0},Σ,Σ∪V, δ, z0, S)mitδ(z0, a, A) :={(z0, B1· · ·Bn)|(A→aB1· · ·Bn)∈P}. . .

Beweis (Fortsetzung):

F¨ ur i > 0 und “⇐”:

Sei (z

₀

, a

₁

· · · a

_i

w, S) `

ⁱ

(z

₀

, w, B

₁

· · · B

_k

).

Dann muss der letzte Schritt a

i

gelesen haben D.h. die Folge l¨ asst sich zerlegen in

(z

0

, a

1

· · · a

i

w, S) `

ⁱ⁻¹

(z

0

, a

i

w, B

x

B

j+1

· · · B

k

) ` (z

0

, w, B

1

· · · B

k

),

wobei (z

0

, B

1

· · · B

j

) ∈ δ(z

0

, a

i

, B

x

).

Dann muss B

_x

→ aB

₁

· · · B

_j

eine Produktion in P sein.

Induktionsannahme liefert: S ⇒

ⁱ⁻¹_G

a

1

· · · a

_i−1

B

x

B

j+1

· · · B

k

und wir k¨ onnen obige Produktion anwenden und erhalten S ⇒

ⁱ_G

a

1

· · · a

i

B

1

· · · B

k

.

(9)

Hilfssatz f¨ ur PDA → CFG-Beweis

Lemma (PDAs mit Erzeugung von ≤ 2 Kellersymbolen) F¨ ur jeden PDA M = (Z, Σ, Γ, δ, z

₀

, #) gibt es einen PDA M

⁰

= (Z, Σ, Γ

⁰

, δ

⁰

, z

₀

, #) mit L(M) = L(M

⁰

), sodass gilt: Wenn (z

⁰

, B

₁

· · · B

_k

) ∈ δ

⁰

(z, a, A) (f¨ ur a ∈ (Σ ∪ {ε})), dann ist k ≤ 2.

Beweis (Skizze):

Transformiere M in M

⁰

wie folgt (mit A ∈ Γ und a ∈ (Σ ∪ {ε})):

(z

⁰

, B

₁

· · · B

_k

) ∈ δ

⁰

(z, a, A) wenn (z

⁰

, B

₁

· · · B

_k

) ∈ δ(z, a, A), k ≤ 2.

falls (z

⁰

, B

₁

· · · B

_k

) ∈ δ(z, a, A) mit k > 2, dann (z, C

_k

B

_k

) ∈ δ

⁰

(z, a, A), und

δ(z, ε, C

_i

) = {(z, C

_i−1

B

_i−1

)} f¨ ur alle i mit 4 ≤ i ≤ k, und δ(z, ε, C

3

) = {(z

⁰

, B

1

B

2

)}

wobei C

₃

, . . . , C

_k

∈ Γ

⁰

neue Kellersymbole sind

(diese werden jeweils neu erzeugt pro ersetztem Eintrag).

PDA → CFG

Ideen

Verwende PDA mit Erzeugung von ≤ 2 Kellersymbolen Erzeuge Grammatik mit Tripelkonstruktion

Variablen der Grammatik:

Tripel hz

⁰

, A, zi, die alle Worte w erzeugt, die den PDA von z

⁰

mit Kellerinhalt A und Wort w zu z und leeren Keller f¨ uhren

Produktionen

hz

⁰

, A, zi → a wenn z

⁰

(A, a) : ε z

hz

⁰

, A, zi → ahz

⁰⁰

, B, zi wenn z

⁰

z

⁰⁰

(A, a) : B

hz

⁰

, A, zi → ahz

⁰⁰

, B, z

₁

ihz

₁

, C, zi wenn z

⁰

z

⁰⁰

(A, a) : BC

PDA → CFG (2)

Satz

Kellerautomaten akzeptieren kontextfreie Sprachen.

Beweis: Sei M = (Z, Σ, Γ, δ, z

₀

, #) ein PDA mit k ≤ 2 f¨ ur alle (z

⁰

, B

₁

· · · B

_k

) ∈ δ(z, a, A) (und a ∈ (Σ ∪ {ε})).

Konstruiere G = (V, Σ, P, S ) mit S neues Symbol und V = {S} ∪ {hz

i

, A, z

j

i | z

i

, z

j

∈ Z, A ∈ Γ}

P = {S → hz

0

, #, zi | z ∈ Z}

∪ {hz

⁰

, A, zi → a | (z, ε) ∈ δ(z

⁰

, a, A), a ∈ Σ ∪ {ε}, A ∈ Γ}

∪ {hz

⁰

, A, zi → ahz

⁰⁰

, B, zi | (z

⁰⁰

, B) ∈ δ(z

⁰

, a, A), z ∈ Z, a ∈ Σ ∪ {ε}, A ∈ Γ}

∪ {hz

⁰

, A, zi → ahz

⁰⁰

, B, z

1

ihz

1

, C, z i | (z

⁰⁰

, BC) ∈ δ(z

⁰

, a, A),

z, z

1

∈ Z, a ∈ Σ ∪ {ε}, A ∈ Γ}

Wir beweisen hz

⁰

, A, zi ⇒

^∗_G

w g.d.w.(z

⁰

, w, A) `

^∗_M

(z, ε, ε).

Da S → hz

₀

, A, zi folgt: w ∈ L(G) ⇐⇒ w ∈ L(M), d. h. L(G) = L(M ).

PDA → CFG (3)

” ⇒“:

Sei hz

⁰

, A, zi ⇒

ⁱ_G

w eine Linksableitung.

Wir verwenden Induktion ¨ uber i.

Basis i = 1: Sei hz

⁰

, A, zi ⇒

_G

w

Verwendete Produktion muss hz

⁰

, A, zi → a sein

Dann muss (z, ε) ∈ δ(z

⁰

, a, A) gelten und damit gilt: (z

⁰

, a, A) ` (z, ε, ε).

Schritt: hz

⁰

, A, zi ⇒

_G

u ⇒

ⁱ⁻¹_G

w. mit i − 1 > 0

Wenn u = a ∈ (Σ ∪ {ε}), dann kann i − 1 > 0 nicht gelten.

Wenn u = ahz

⁰⁰

, B, zi, dann (z

⁰⁰

, B) ∈ δ(z

⁰

, a, A) und u = ahz

⁰⁰

, B, zi ⇒

ⁱ⁻¹

aw

⁰

= w.

Dann gilt hz

⁰⁰

, B, zi ⇒

ⁱ⁻¹

w

⁰

und die Induktionsannahme liefert

(z

⁰⁰

, w

⁰

, B) `

^∗_M

(z, ε, ε). Mit (z

⁰⁰

, B) ∈ δ(z

⁰

, a, A) zeigt dies

(z

⁰

, u, A) = (z

⁰

, aw

⁰

, A) `

_M

(z

⁰⁰

, w

⁰

, B) `

^∗_M

(z, ε, ε).

(10)

PDA → CFG (4)

. . .

Wenn u = ahz

⁰⁰

, B, z

1

ihz

1

, C, zi, dann ist (z

⁰⁰

, BC) ∈ δ(z

⁰

, a, A) und u = ahz

⁰⁰

, B, z

1

ihz

1

, C, zi ⇒

ⁱ⁻¹

aw

⁰

= w

Dann gilt auch hz

⁰⁰

, B, z

1

ihz

1

, C, zi ⇒

ⁱ⁻¹

w

⁰

und es gibt Linksableitungen hz

⁰⁰

, B, z

1

i ⇒

^j

w

⁰₀

und hz

1

, C, zi ⇒

^k

w

⁰₁

mit j + l ≤ i − 1, w

⁰

= w

⁰₀

w

⁰₁

. F¨ ur beide k¨ onnen wir die Induktionsannahme anwenden und erhalten (z

⁰⁰

, w

⁰₀

, B) `

^∗_M

(z

₁

, ε, ε) und (z

₁

, w

⁰₁

, C) `

^∗_M

(z, ε, ε).

Ab¨ andern der 1. Konfigurationsfolge: C auf den Keller & w

⁰₁

anh¨ angen (z

⁰⁰

, w

⁰

, BC) = (z

⁰⁰

, w

₀⁰

w

₁⁰

, BC) `

^∗_M

(z

1

, w

⁰₁

, C).

Anh¨ angen der 2. Konfigurationsfolge liefert: (z

⁰⁰

, w

⁰

, BC) `

^∗_M

(z, ε, ε).

Da (z

⁰⁰

, BC) ∈ δ(z

⁰

, a, A), gilt

(z

⁰

, u, BC) = (z

⁰

, aw

⁰

, BC) `

M

(z

⁰⁰

, w

⁰

, BC) `

^∗_M

(z, ε, ε).

PDA → CFG (5)

” ⇐“:

Sei (z

⁰

, w, A) `

ⁱ_M

(z, ε, ε). Zeige hz

⁰

, A, zi ⇒

^∗_G

w mit Induktion ¨ uber i Basis i = 1: Dann gilt w = a ∈ (Σ ∪ {ε}) und (z, ε) ∈ δ(z

⁰

, w, A).

Damit gibt es hz

⁰

, A, zi → a ∈ P und daher hz

⁰

, A, zi ⇒

_G

a.

Schritt: Sei i > 1 und daher (z

⁰

, aw

⁰

, A) ` (z

⁰⁰

, w

⁰

, α) `

ⁱ⁻¹_M

(z, ε, ε) f¨ ur i − 1 > 0, a ∈ Σ ∪ {ε} und α = ε, α = B oder α = BC.

Wir betrachten alle drei F¨ alle f¨ ur α einzeln:

α = ε: Dieser Fall ist nicht m¨ oglich, da i − 1 > 0 nicht gelten kann.

α = B. Dann ist hz

⁰

, A, zi → ahz

⁰⁰

, B, zi ∈ P .

Da (z

⁰⁰

, w

⁰

, B) `

ⁱ⁻¹_M

(z, ε, ε), liefert Induktionsannahme hz

⁰⁰

, B, zi ⇒

^∗_G

w

⁰

und daher: hz

⁰

, A, zi ⇒

G

ahz

⁰⁰

, B, zi ⇒

^∗_G

aw

⁰

= w.

PDA → CFG (6)

. . .

α = BC. Dann ist hz

⁰

, A, zi → hz

⁰⁰

, B, z

1

ihz

1

, C, zi ∈ P . Schreibe (z

⁰⁰

, w

⁰

, BC) `

ⁱ⁻¹_M

(z, ε, ε) als

(z

⁰⁰

, w

⁰₁

w

₂⁰

, BC) `

^j_M

(z

1

, w

⁰₂

, C ) `

^k_M

(z, ε, ε) mit j + k = i − 1.

Weglassen von C und w

⁰₂

im ersten Teil zeigt:

(z

⁰⁰

, w

⁰₁

, B) `

^j_M

(z

₁

, ε, ε),

Da j < i und k < i liefert Induktionsannahme hz

⁰⁰

, B, z

1

i ⇒

^∗_G

w

⁰₁

und hz

1

, C, zi ⇒

^∗_G

w

₂⁰

. Daher gilt

hz

⁰

, A, zi ⇒

G

ahz

⁰⁰

, B, z

₁

ihz

1

, C, zi ⇒

^∗_G

aw

⁰₁

hz

1

, C, zi ⇒

^∗_G

aw

₁⁰

w

⁰₂

= w.

Geschafft...

Die gezeigten S¨ atze zusammengefasst ergeben:

Theorem

Kellerautomaten erkennen genau die kontextfreien Sprachen.

(11)

Bemerkung

Die bisherigen Beweise zeigen auch, dass man PDAs einschr¨ anken kann auf PDAs mit genau einem Zustand:

Sei M ein PDA.

Transformiere M in Grammatik G mit L(G) = L(M ) Transformiere G in G

⁰

in Greibach-Normalform (mit L(G

⁰

) = L(G) \ ε)

Transformiere Grammatik G

⁰

in PDA M

⁰

mit L(M

⁰

) = L(G) unsere Konstruktion verwendet nur einen Zustand!

Beispiel

z

₀

z

₁

(#, a) : B#, (#, ε) : ε, (B, a) : BB

(B, b) : ε

(B, b) : ε, (#, ε) : ε

Der vorherige Beweis konstruiert die Grammatik G = (V, Σ, P, S) mit V = {S, hz

0

, B, z

0

i, hz

0

, B, z

1

i, hz

1

, B, z

0

i, hz

1

, B, z

1

i,

hz

0

, #, z

0

i, hz

0

, #, z

1

i, hz

1

, #, z

0

i, hz

1

, #, z

1

i}

P = {S → hz

0

, #, z

0

i, S → hz

0

, #, z

1

i.}

∪ {hz

0

, B, z

1

i → b, hz

1

, B, z

1

i → b, hz

0

, #, z

0

i → ε, hz

1

, #, z

1

i → ε}

∪ {hz

0

, #, z

0

i → ahz

0

, B, z

0

i, hz

0

, #, z

1

i → ahz

0

, B, z

1

i}

∪ {hz

0

, B, z

0

i → ahz

0

, B, z

0

ihz

0

, B, z

0

i, hz

0

, B, z

1

i → ahz

0

, B, z

0

ihz

0

, B, z

1

i, hz

0

, B, z

0

i → ahz

0

, B, z

1

ihz

1

, B, z

0

i, hz

0

, B, z

1

i → ahz

0

, B, z

1

ihz

1

, B, z

1

i}

Beispiel (2)

Vereinfachen der Grammatik ergibt:

{S → hz

₀

, #, z

₀

i | hz

₀

, #, z

₁

i, hz

₀

, #, z

₀

i → ε, hz

₀

, #, z

₁

i → ahz

₀

, B, z

₁

i, hz

₀

, B, z

₁

i → b | ahz

₀

, B, z

₁

ihz

₁

, B, z

₁

i, hz

₁

, B, z

₁

i → b}

Umbenennen, Streichen von nicht erreichbaren Variablen und Entfernen von Einheitsproduktionen ergibt

G = ({S, B, C}, {a, b}, {S → ε | aB, B → b | aBC, C → b}, S) (ist bis auf ε-Produktion in Greibach-NF.)

Beispiel (3)

Der vorherige Beweis konstruiert f¨ ur

G = ({S, B, C }, {a, b}, {S → ε | aB, B → b | aBC, C → b}, S)

den PDA M = ({z

₀

}, Σ, Σ ∪ V, δ, z

₀

, S) mit

δ(z

₀

, a, S) = {(z

₀

, B)} δ(z

₀

, b, B) = {(z

₀

, ε)} δ(z

₀

, a, B) = {(z

₀

, BC)}

δ(z

₀

, b, C ) = {(z

₀

, ε)} δ(z

₀

, ε, S ) = {(z

₀

, ε)} δ(z

₀

, d, A) = ∅ sonst Eine Konfigurationsfolge f¨ ur die Eingabe aaabbb ist

(z

₀

, aaabbb, S)

` (z

₀

, aabbb, B)

` (z

₀

, abbb, BC)

` (z

₀

, bbb, BCC)

` (z

₀

, bb, CC)

` (z

₀

, b, C)

` (z

₀

, ε, ε)

(12)

Deterministisch kontextfreie Sprachen

Definiert durch deterministische Kellerautomaten mit Akzeptanz durch Endzust¨ ande.

ε- ¨ Uberg¨ ange sind erlaubt, aber nur wenn es keinen anderen

Ubergang (mit einem Terminalzeichen und selben Kellersymbol) gibt. ¨ Definition (Deterministischer Kellerautomat, DPDA)

Ein Kellerautomat mit Endzust¨ anden M = (Z, Σ, Γ, δ, z

₀

, #, E) ist deterministisch (ein DPDA) wenn f¨ ur alle (z, a, A) ∈ (Z, Σ, Γ) gilt:

|δ(z, a, A)| + |δ(z, ε, A)| ≤ 1.

Die von DPDAs akzeptierten Sprachen heißen deterministisch kontextfrei.

Beispiele (1)

Satz

Die Sprache L = {w$w | w ∈ {a, b}

^∗

} ist deterministisch kontextfrei.

Beweis: Betrachte den DPDA

M = ({z

₀

, z

₁

, z

₂

}, {a, b, $}, {#, A, B}, δ, z

₀

, #, {z

₂

}) mit δ(z

₀

, a, #) = {(z

₀

, A#)}

δ(z

₀

, b, #) = {(z

₀

, B#)}

δ(z

₀

, a, A) = {(z

₀

, AA)}

δ(z

₀

, b, A) = {(z

₀

, BA)}

δ(z

₀

, a, B) = {(z

₀

, AB)}

δ(z

₀

, b, B) = {(z

₀

, BB)}

δ(z

₀

, $, A) = {(z

₁

, A)}

δ(z

₀

, $, B ) = {(z

₁

, B )}

δ(z

₀

, $, #) = {(z

₁

, #)}

δ(z

₁

, a, A) = {(z

₁

, ε)}

δ(z

₁

, b, B) = {(z

₁

, ε)}

δ(z

₁

, ε, #) = {(z

₂

, ε)}

und δ(z

_i

, c, C) = ∅ sonst

Beachte: L = {ww | w ∈ {a, b}

^∗

} ist nicht deterministisch kontextfrei aber kontextfrei

Beispiele (2)

Satz

Die Sprache L = {a

ⁱ

b

ⁱ

| i ∈ N

>0

} ist deterministisch kontextfrei.

Beweis: Betrachte den DPDA

M = ({z

₀

, z

₁

, z

₂

}, {a, b}, {#, A}, δ, z

₀

, #, {z

₂

}) mit δ(z

₀

, a, #) = {(z

₀

, A#)}

δ(z

₀

, a, A) = {(z

₀

, AA)}

δ(z

₀

, b, A) = {(z

₁

, ε)}

δ(z

₁

, b, A) = {(z

₁

, ε)}

δ(z

₁

, ε, #) = {(z

₂

, ε)}

und δ(z

_i

, c, B) = ∅, sonst

Eigenschaften von deterministisch kontextfreien Sprachen

Theorem (Eigenschaften determin. kontextfreier Sprachen)

1

Das Wortproblem f¨ ur deterministisch kontextfreie Sprachen kann in Linearzeit entschieden werden.

2

F¨ ur deterministisch kontextfreie Sprachen gibt es eindeutige Grammatiken.

3

Deterministisch kontextfreie Sprachen sind unter Komplementbildung abgeschlossen.

Beweis: siehe Literatur

(13)

Weitere Eigenschaften

Satz

Deterministisch kontextfreie Sprachen sind nicht abgeschlossen bez¨ uglich Vereinigung und Schnitt.

Beweis: i) Schnittbildung:

Die Sprachen L

₁

= {a

ⁿ

b

ⁿ

c

^m

| n, m ∈ N

>0

} und

L

₂

= {a

ⁿ

b

^m

c

^m

| n, m ∈ N

>0

} sind deterministisch kontextfrei L

₁

∩ L

₂

= {a

ⁿ

b

ⁿ

c

ⁿ

| n ∈ N

>0

} ist nicht kontextfrei.

ii) Vereinigung:

L ∩ L

⁰

= L ∪ L

⁰

Annahme: Det. CFLs abgeschlossen bez. Vereinigung Da Det. CFLs auch abgeschlossen bez. Komplement, folgt:

Det. CLFs abgeschlossen bez. Schnitt. Widerspruch!

D.h. Annahme falsch, Det. CFLs nicht abgeschlossen bez. ∪.

Weitere Eigenschaften (2)

Satz

Der Schnitt einer (deterministisch) kontextfreien Sprachen mit einer regul¨ aren Sprache ist (deterministisch) kontextfrei.

Beweis: Sei M = (Z, Σ, Γ, δ, z

₀

, #, E ) ein PDA mit Endzust¨ anden und M

⁰

= (Z

⁰

, Σ, δ

⁰

, z

⁰₀

, E

⁰

) ein DFA. Konstruiere PDA mit Endzust¨ anden:

M

⁰⁰

= (Z × Z

⁰

, Σ, δ

⁰⁰

, (z

₀

, z

⁰₀

), #, E × E

⁰

) mit (z

_k

, z

⁰_k

, B

₁

· · · B

_m

) ∈ δ

⁰⁰

((z

_i

, z

⁰_i

), a, A) falls

(z

_k

, B

₁

· · · B

_m

) ∈ δ(z

_i

, a, A) und δ

⁰

(z

_i⁰

, a) = z

_k⁰

und

(z

_k

, z

_i⁰

, B

1

· · · B

m

) ∈ δ

⁰⁰

((z

i

, z

_i⁰

), ε, A) falls (z

_k

, B

1

· · · B

m

) ∈ δ(z

i

, ε, A).

Es gilt:

L(M

⁰⁰

) = L(M ) ∩ L(M

⁰

), denn M

⁰⁰

simuliert M und M

⁰

gleichzeitig, und akzeptiert nur, wenn beide Automaten akzeptieren.

M

⁰⁰

ist deterministisch, wenn M deterministisch ist.

Entscheidbarkeitsfragen f¨ ur CFLs

CYK-Algorithmus zeigt: Das Wortproblem f¨ ur kontextfreie Grammatiken ist effizient entscheidbar.

Viele Fragestellungen sind f¨ ur CFLs unentscheidbar (z.B. das ¨ Aquivalenzproblem und das Schnittproblem) Wir betrachten weitere Entscheidungsprobleme

Leerheitsproblem

Satz

Das Leerheitsproblem f¨ ur kontextfreie Grammatiken ist entscheidbar.

Beweis:

Sei L als CFG gegeben

Pr¨ ufe zun¨ achst, ob ε ∈ L (wenn ja, dann ist L nicht leer) Sei G = (V, Σ, P, S) eine CFG in Chomsky-NF mit L(G) = L \ {ε}.

Der folgende Algorithmus markiert alle A ∈ V mit {w ∈ Σ

^∗

| A ⇒

^∗_G

w} 6= ∅

Pr¨ ufe, ob S markiert wird (wenn ja, dann ist L nicht-leer)

(14)

Algorithmus 9: Markierung der Variablen, die nichtleere Sprachen erzeugen

Eingabe: Grammatik G = (V, Σ, P, S) in Chomsky-Normalform Ausgabe: Menge W ⊆ V aller Variablen, die nicht die leere

Sprache erzeugen Beginn

W := {A ∈ V | A → a ∈ P, a ∈ Σ};

wiederhole W

_alt

:= W ;

W := W

_alt

∪ {A | A → BC ∈ P, B ∈ W

_alt

, C ∈ W

_alt

};

bis W = W

_alt

; return W

Endlichkeitsproblem

Satz

Das Endlichkeitsproblem f¨ ur kontextfreie Sprachen ist entscheidbar.

Beweis: Sei G = (V, Σ, P, S ) eine CFG in Chomsky-NF. Sei n die Zahl aus dem Pumping-Lemma f¨ ur CFGs (z.B. n = 2

^|V^|

siehe Beweis Pumping-L.).

Wir zeigen zun¨ achst: Es gilt |L(G)| = ∞ g.d.w. es ein Wort z ∈ L(G) mit n ≤ |z| < 2n gibt:

” ⇐“:

Sei z ∈ L mit |z| ≥ n.

Pumping-Lemma zeigt: uv

ⁱ

wx

ⁱ

y ∈ L f¨ ur alle i ∈ N . Also L(G)| = ∞

Endlichkeitsproblem (2)

. . .

Wir zeigen zun¨ achst: Es gilt |L(G)| = ∞ g.d.w. es ein Wort z ∈ L(G) mit n ≤ |z| < 2n gibt:

” ⇒“:

Beweis durch Widerspruch

Annahme: Es gibt kein Wort z ∈ L(G) f¨ ur n ≤ |z| < 2n, aber trotzdem gilt |L(G)| = ∞.

Sei z ∈ L(G) das k¨ urzeste Wort mit |z| ≥ 2n.

Pumping-Lemma: Es gibt u, v, w, x, y gibt mit z = uvwxy, |vx| > 0 und |vwx| ≤ n, sodass insbes. uv

⁰

wx

⁰

y ∈ L gilt.

Da |uv

⁰

wx

⁰

y| = |uwy| < |uvwxy| und |uwy| ≥ n gilt, war z nicht minimal gew¨ ahlt. Widerspruch!

Entscheide Endlichkeitsproblem: Teste f¨ ur alle Worte w ∈ Σ

^∗

, der L¨ ange n ≤ |w| < 2n, ob w ∈ L(G) gilt (mit CYK-Algorithmus).

Weiteres Entscheidbarkeitsproblem

Das Problem, ob eine deterministisch kontextfreie Sprache

¨ aquivalent zu einer regul¨ aren Sprache ist, ist entscheidbar.

Sei L

₁

durch DPDA gegeben und L

₂

durch einen DFA.

Pr¨ ufe L

₁

∩ L

₂

= ∅ und L

₁

∩ L

₂

= ∅

Beides ist entscheidbar, da DPDAs und DFAs abgeschlossen unter Komplementbildung, Schnittbildung zwischen DPDA und DFA durch DPDA konstruierbar ist und Leerheitsproblem f¨ ur CFLs entscheidbar ist

L

_i

∩ L

_j

= ∅ impliziert L

_i

⊆ L

_j

Daher ist V

(i,j)∈{(1,2),(2,1)}

L

_i

∩ L

_j

= ∅ ¨ aquivalent zu L

₁

= L

₂

.

(15)

Zusammenfassung

CYK-Algorithmus: w ∈ L(G) in O(n

³

) f¨ ur CFGs G in Chomsky-NF entscheiden.

Kellerautomaten erkennen genau die CFLs Deterministisch kontextfreie Sprachen (DPDAs) Entscheidbarkeitsresultate f¨ ur kontextfreie Sprachen