Sommersemester2007 BernhardBeckert GrundlagenderTheoretischenInformatik/EinführungindieTheoretischeInformatikI Vorlesung

(1)

Vorlesung

Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I

Bernhard Beckert

Institut für Informatik

Sommersemester 2007

(2)

Dank

Diese Vorlesungsmaterialien basieren ganz wesentlich auf den Folien zu den Vorlesungen von

Katrin Erk (gehalten an der Universität Koblenz-Landau) Jürgen Dix (gehalten an der TU Clausthal)

Ihnen beiden gilt mein herzlicher Dank.

– Bernhard Beckert, April 2007

(3)

Inhalt von Teil IV

Die vonKellerautomaten(Push-Down-Automaten,PDAs) erkannten Sprachen sind genau die vom Typ 2 (kontextfrei).

Normalformenfür kontextfreie Grammatiken.

Pumping-Lemmafür kontextfreie Sprachen.

Effiziente Algorithmen fürProbleme über PDAs

(4)

Teil IV

Kellerautomaten und kontextfreie Sprachen

1 Ableitungsbäume

2 Umformung von Grammatiken

3 Normalformen

4 Pumping-Lemma für kontextfreie Sprachen

5 Pushdown-Automaten (PDAs)

6 Determinierte PDAs

7 Abschlusseigenschaften

8 Wortprobleme

9 Der CYK-Algorithmus

(5)

Zur Erinnerung: kontextfreie Grammatiken

Kontextfreie Grammatiken Kontextfreie Regel:

Eine Variable wird durch ein Wort ersetzt, (egal in welchem Kontext die Variable steht) Es wird eineeinzelneVariable ersetzt.

Das Wort in der Conclusio kann Variablen und Terminale inbeliebiger Mischungenthalten.

(6)

Zur Erinnerung: kontextfreie Sprachen

Beispiel 18.1 (kontextfreie Sprachen)

{

aⁿbⁿ

|

n

∈

N0

}

{

aⁿbaⁿ

|

n

∈

N0

}

{

ww^R

|

w

∈ {

a

,

b

}

^∗

}

(7)

Ableitungsbäume

Definition 18.2 (Ableitungsbaum zu einer Grammatik) Sei

G

= (

V

,

T

,

R

,

S

)

eine kontextfreie Grammatik.

EinAbleitungsbaum (parse tree)zuGist ein angeordneter Baum B

= (

W

,

E

,

v0

)

(8)

Ableitungsbäume

Definition 18.3 (Ableitungsbaum zu einer Grammatik, Fortsetzung) Zudem muss gelten:

Jeder Knotenv

∈

W ist mit einem Symbol ausV

∪

T

∪ {ε}

markiert.

Die Wurzelv0ist mitSmarkiert.

Jeder innere Knoten ist mit einer Variablen ausV markiert.

Jedes Blatt ist mit einem Symbol ausT

∪ {ε}

markiert.

Istv

∈

W ein innerer Knoten mit Söhnenv1

, . . . ,

vk in dieser Anordnung und istAdie Markierung vonv undA_i die Markierung vonv_i,

dann istA

→

A1

. . .

Ak

∈

R.

Ein mitεmarkiertes Blatt hat keinen Bruder

(denn das entspräche einer Ableitung wieA

→

abεBc).

(9)

Ableitungsbäume

Ablesen eines Wortes vom Ableitungsbaum Wenn Wortwvon GrammatikGerzeugt wird,

dann gibt es einen Ableitungsbaum mit den Buchstaben vonw als Blätter von links nach rechts.

Merke

Die Blätter eines Ableitungsbaumes sind angeordnet.

Es gibt eine Ordnung unter den Söhnen eines Knotens.

(10)

Ableitungsbäume

Definition 18.4

Seienb1

,

b2Blätter. Dann:

b1

<

b2gdw b1, b2sind Brüder, und b1liegt ”links” von b2, oder

∃

v

,

v1

,

v2

∈

W v

→

v1, v

→

v2, v1

<

v2

und vi ist Vorfahre von bi für i

∈ {

1

,

2

}

.

Definition 18.5

Sei

{

b1

, . . . ,

bk

}

die Menge aller Blätter inBmitb1

< . . . <

bk, und seiAi die Markierung vonb_i.

Dann heißt das WortA1

. . .

Ak dieFrontvonB.

(11)

Ableitungsbäume

Theorem 18.6

Sei G

= (

V

,

T

,

R

,

S

)

eine kontextfreie Grammatik.

Dann gilt für w

∈

T^∗: S

= ⇒

^∗_G w

gdw Es existiert ein Ableitungsbaum zu G mit Front w .

Beweis.

Einfach aus den Definitionen.

(12)

Ableitungsbäume: Beispiel

Beispiel 18.7

Grammatik für die Menge aller aussagenlogischen Formeln über den Variablen

{

x

,

x0

,

x1

,

x2

, . . .}

:

G

= ({

S

,

A

,

N

,

N⁰

}, {

x

,

0

, . . . ,

9

,(, ),∧, ∨, ¬},

R

,

S

)

mit der Regelmenge

R

= {

S

→ (

S

∧

S

) | (

S

∨

S

) | ¬

S

|

A A

→

x

|

xN

N

→

1N⁰

|

2N⁰

| . . . |

9N⁰

|

0 N⁰

→

0N⁰

|

1N⁰

| . . . |

9N⁰

|

ε}

(13)

Ableitungsbäume: Beispiel

Ableitungsbaum für((¬x∧x38)∨x2)

A x S

N

’ N ε S

( S )

( )

S A x

2 S

’ 3 S A x

8

N ε

N N’

(14)

Ableitungsbäume: Beispiel

Ableitung für((¬x∧x38)∨x2)

Der Ableitungsbaum steht für vieleäquivalenteAbleitungen, darunter diese:

S

(

S

∨

S

) ⇒

((

S

∧

S

) ∨

S

) ⇒ ((¬

S

∧

S

) ∨

S

) ⇒

((¬

A

∧

S

) ∨

S

) ⇒ ((¬

x

∧

S

) ∨

S

) ⇒

((¬

x

∧

A

) ∨

S

) ⇒ ((¬

x

∧

xN

) ∨

S

) ⇒

((¬

x

∧

x3N⁰

) ∨

S

) ⇒ ((¬

x

∧

x38N⁰

) ∨

S

) ⇒

((¬

x

∧

x38

) ∨

S

) ⇒ ((¬

x

∧

x38

) ∨

A

) ⇒

((¬

x

∧

x38

) ∨

xN

) ⇒ ((¬

x

∧

x38

) ∨

x2N⁰

) ⇒

((¬

x

∧

x38

) ∨

x2

)

(15)

Links- und Rechtsableitung

Definition 18.8 (Linksableitung) Eine Ableitung

w1

= ⇒

_G w2

= ⇒

_G

. . . = ⇒

_G wn

heißtLinksableitungfallswi+1durch Ersetzen der linkesten Variable inwi

entsteht für allei

<

n.

DieRechtsableitungist analog definiert.

(16)

Mehrdeutigkeit

Definition 18.9 (Mehrdeutigkeit) Eine cf-GrammatikGheißtmehrdeutig

gdw

es gibt ein Wortw

∈

L

(

G

)

,

zu dem es inGzwei verschiedene Linksableitungengibt.

EineSpracheL

∈

L2heißtinhärent mehrdeutig gdw

alle kontextfreien Grammatiken fürLsind mehrdeutig.

Bemerkung

Eine GrammatikGist mehrdeutig, gdw :

(17)

Mehrdeutigkeit: Beispiele

Beispiel 18.10 (Mehrdeutigkeit)

EindeutigeGrammatik für aussagenlogische Formeln:

S

→ (

S

∧

S

) | (

S

∨

S

) | ¬

S

|

A A

→

x

|

xN

N

→

1N⁰

|

2N⁰

| . . . |

9N⁰

|

0 N⁰

→

0N⁰

|

1N⁰

| . . . |

9N⁰

|

ε}

MehrdeutigeGrammatik für aussagenlogische Formeln:

K

→

K

∧

K

|

D Regel mit Klammer-Ersparnis!

D

→ (

D

∨

D

) |

L L

→ ¬

A

|

A

→

v

|

w

|

x

|

y

|

z

(18)

Mehrdeutigkeit: Beispiele

D L A x

D L

y K

K K

D (

D ) D L A

v w

A L

K

K D

L A

x y

L D

K K

D ( D D )

L L

A A

(19)

Mehrdeutigkeit: Beispiele

Beispiel 18.11 (Inhärente Mehrdeutigkeit) Die Sprache

L:=

{

aⁱb^jc^k

|

i

=

joderj

=

k

}

istinhärent mehrdeutig.

(20)

Teil IV

Kellerautomaten und kontextfreie Sprachen

1 Ableitungsbäume

2 Umformung von Grammatiken

3 Normalformen

4 Pumping-Lemma für kontextfreie Sprachen

5 Pushdown-Automaten (PDAs)

6 Determinierte PDAs

7 Abschlusseigenschaften

8 Wortprobleme

9 Der CYK-Algorithmus

(21)

Startsymbol nur links

Einfache Annahme

Im folgenden soll für alle cf-Grammatiken gelten:

Das StartsymbolSkommt nie auf einer rechten Regelseite vor.

Umformung

Ist das bei einer Grammatik nicht gegeben, kann man es wie folgt erreichen:

Führe ein neues StartsymbolSneuein Füge die Regel

Sneu

→

S hinzu.

(22)

Nutzlose Symbole

Nutzlose Symbole und Regeln: Intuition

Variablen und Symbole, die vom Startsymbol aus unerreichbar sind.

Variablen, von denen aus kein Terminalwort abgeleitet werden kann.

Regeln, die solche Variablen und Symbole enthalten

(23)

Nutzlose Symbole

Definition 19.1 ((co-)erreichbare, nutzlose Symbole) SeiG

= (

V

,

T

,

R

,

S

)

eine Grammatik.

Ein Symbolx

∈ (

V

∪

T

)

heißt

erreichbar: Es gibtα,β

∈ (

V

∪

T

)

^∗:S

= ⇒

^∗_Gαxβ co-erreichbar: Es gibtw

∈

T^∗:x

= ⇒

^∗_G w

nutzlos: xist nicht erreichbar oder nicht co-erreichbar.

(24)

Nutzlose Symbole

Theorem 19.2 (cf-Grammatik ohne nutzlose Symbole) Ist G

= (

V

,

T

,

R

,

S

)

eine cf-Grammatik mit L

(

G

) 6=

0/, dann existiert eine cf-Grammatik G⁰

= (

V⁰

,

T⁰

,

R⁰

,

S⁰

)

mit:

G⁰ist äquivalent zu G.

Jedes x

∈ (

V

∪

T

)

ist erreichbar und co-erreichbar.

Beweis

Man kannG⁰ausGeffektiv konstruieren:

Wie im folgenden beschrieben, die nutzlosen Symbole bestimmen.

Diese Symbole und alle Regeln, die sie enthalten, entfernen.

(25)

Nutzlose Symbole

Algorithmus zur Berechnung der co-erreichbaren Variablen Input:GrammatikG

= (

V

,

T

,

R

,

S

)

Output:co-erreichbare Variablen Alt :=0/

Neu :=

{

A

∈

V

| ∃

w

∈

T^∗

(

A

→

w

∈

R

)}

whileAlt

6=

Neu

{

Alt := Neu

Neu := Alt

∪ {

A

∈

V

| ∃α ∈ (

T

∪

Alt)^∗

(

A

→

α

∈

R

)}

}

outputNeu

(26)

Nutzlose Symbole

Algorithmus zur Berechnung der erreichbaren Symbole Input:GrammatikG

= (

V

,

T

,

R

,

S

)

Output:erreichbare Symbole Alt :=0/

Neu :=

{

S

}

whileAlt

6=

Neu

{

Alt :=Neu

Neu :=Alt

∪ {

x

∈ (

V⁰⁰

∪

T⁰⁰

) | ∃

A

∈

Alt

∃α,

β

∈ (

V⁰⁰

∪

T⁰⁰

)

^∗

(

A

→

αxβ

∈

R

)}

}

(27)

Normalform für Regeln

Theorem 19.3 (Normalform)

Zu jeder Grammatik G (beliebigen Typs) existiert eine äquivalente Grammatik G⁰, bei der für alle Regeln P

→

Q

∈

R⁰gilt:

Q

∈

V^∗und P beliebig Q

∈

T und P

∈

V

Für alle Typen außer den linearen hat G⁰denselben Typ wie G.

(28)

Normalform für Regeln

Beweis.

Für jedes Terminalt

∈

T erzeuge man eine neue VariableVt. V⁰

=

V

∪ {

Vt

|

t

∈

T

}

R⁰entsteht ausR, indem für jede RegelP

→

Q

∈

RinQalle Vorkommen eines Terminalstdurch die zugehörige VariableV_t ersetzt werden.

Außerdem enthältR⁰für jedest

∈

T eine neue RegelVt

→

t. AlsoL

(

G⁰

) =

L

(

G

)

,

und für alle Sprachklassen außerL₃hatG⁰denselben Typ wieG.

(29)

Elimination von ε -Regeln

Idee

Variablen, aus denenεableitbar ist, sollten eliminiert werden

Definition 19.4 (ε-Regel, nullbare Variablen) Eine Regel der Form

P

→

ε (Peine Variable) heißtε-Regel.

Eine VariableAheißtnullbar, falls

A

= ⇒

^∗ε

(30)

Elimination von ε -Regeln

Theorem 19.5 (ε-Regeln sind eliminierbar)

Zu jeder cf-Grammatik G existiert eine äquivalente cf-Grammatik G⁰ ohneε-Regeln und nullbare Variablen,

fallsε

6∈

L

(

G

)

,

mit der einzigenε-Regel S

→

εund der einzigen nullbaren Variablen S, fallsε

∈

L

(

G

)

und S das Startsymbol ist.

(31)

Elimination von ε -Regeln

Algorithmus zur Berechnung der nullbaren Variablen

Input:GrammatikG

= (

V

,

T

,

R

,

S

)

So.B.d.A. in keiner Regel rechts Output:nullbare Variablen

Alt :=0/

Neu:=

{

A

∈

V

|

A

→

ε

∈

R

}

whileAlt

6=

Neu

{

Alt :=Neu

für alle

(

P

→

Q

) ∈

Rdo

{

ifQ

=

A₁

. . .

A_n andA_i

∈

Neufür 1

≤

i

≤

nandP

6∈

Neu

,

thenNeu:=Neu

∪ {

P

} }

}

outputNeu

(32)

Elimination von ε -Regeln

Beweis (Forts.)

AusgangsgrammatikGhabe die Normalform, bei der für jede RegelP

→

Q:

Q

∈

V^∗oderQ

∈

T.

Für jede RegelP

→

A1

. . .

Angeneriere alle möglichen Kombinationen P

→

α1

. . .

αn

mit

αi

∈ {ε,

Ai

}

fallsAi nullbar αi

=

A_i fallsA_i nicht nullbar Dann

Füge alle diese neuen Regeln zur Grammatik hinzu

(33)

Elimination von ε -Regeln

Beweis (Forts.) Zu zeigen:

Für die neue GrammatikG⁰gilt:L

(

G⁰

) =

L

(

G

)

Vorgehen:

Ghat die Normalform:

Für jede RegelP

→

Q giltQ

∈

V^∗oderQ

∈

T. Wir beweisen die etwas stärkere Behauptung

für alleA

∈

V für allew

∈ (

V

∪

T

)

^∗

− {ε}

(

A

= ⇒

^∗_Gw

)

gdw

(

A

= ⇒

^∗

G0 w

)

,

Daraus folgt sofortL

(

G⁰

) =

L

(

G

)

.

(34)

Elimination von ε -Regeln

Beweis (Forts.)

”⇒” Wir zeigen: AusA

= ⇒

^∗

G wfolgtA

= ⇒

^∗

G0 w(Induktion über Länge einer Ableitung vonAnachwinG).

Induktionsanfang: Länge = 0.

Dann istw

=

A, undA

= ⇒

^∗

G0 Agilt immer.

Induktionsschritt: Es sei schon gezeigt: Wenn inGinn Schritten eine AbleitungB

= ⇒

^∗

Gudurchgeführt werden kann, dann folgt, daß inG⁰ die Ableitung B

= ⇒

^∗

G0 umöglich ist.

(35)

Elimination von ε -Regeln

Beweis (Forts.)

Außerdem gelte in der AusgangsgrammatikG:A

= ⇒

^∗_G w

6=

εinn

+

1 Schritten.

Dann gilt:

A

= ⇒

_Gw⁰

= ⇒

^∗_Gw,

w⁰

=

A1

. . .

A`

= ⇒

^∗_Gw1

. . .

w`

=

w,

und es wird jeweilsA_i zuw_i in höchstensnSchritten für geeignete w⁰

,

A1

, . . . ,

A`

,

w1

, . . . ,

w`.

Per Induktionsvoraussetzung gilt also schon:

EntwederA_i=⇒^∗

G0 w_i oderw_i=εfür 1≤i≤`.

(36)

Elimination von ε -Regeln

Beweis (Forts.)

Fall 1: wi

=

ε,Ai ist nullbar.

Dann gibt es inG⁰eine RegelA

→

A1

. . .

Ai−1Ai+1

. . .

A_`nach der obigen Konstruktionsvorschrift fürG⁰, falls

A1

. . .

Ai−1Ai+1

. . .

A`

6=

ε. Das ist der Fall, denn sonst hätten wir:

A

= ⇒

w⁰

=

ε

= ⇒

^∗w

=

ε(aus nichts wird nichts), aberw

=

εist ausgeschlossen.

Fall 2: wi

6=

ε. Dann gilt nach Induktionsvoraussetzung A_i

= ⇒

^∗

G0 w_i.

(37)

Elimination von ε -Regeln

Beweis (Forts.)

Wir haben also folgendes gezeigt:

SeiI

= {

i

∈ {

1

. . . `} |

wi

6=

ε} 6=0/.

Dann gibt es inR⁰eine RegelA

→

Ai1

. . .

Aim mitI

= {

i1

, . . . ,

im

}

, und dieAi

sind so angeordnet wie in der ursprünglichen RegelA

→

A₁

. . .

A_`. Mit dieser neuen Regel können wirwso ableiten:

A

= ⇒

_G0 Ai1

. . .

Aim

= ⇒

^∗

G0 wi1

. . .

wim

=

w

(38)

Elimination von ε -Regeln

Beweis (Forts.)

”⇐” Wir zeigen: AusA

= ⇒

^∗

G0 wfolgtA

= ⇒

^∗_Gw(Induktion über Länge einer Ableitung vonAnachwinG⁰):

Induktionsanfang: Länge = 0. Dann istw

=

A, undA

= ⇒

^∗_G Agilt immer.

Induktionsschritt: Es gelte für alle AbleitungenA

= ⇒

^∗

G0 weiner Länge von höchstensn, daßA

= ⇒

^∗_Gw.

IstA

= ⇒

^∗

G0 weine Ableitung der Längen

+

1, so gibt es ein

`

, Wörterw1

, . . . ,

w_`und VariablenA1

, . . . ,

A_`mitA

= ⇒

G0

A₁

. . .

A_`

= ⇒

^∗

G0 w

=

w₁

. . .

w_`. Es gilt jeweilsA_i

= ⇒

^∗

G0 w_i in höchstensnSchritten, undwi

6=

ε.

(39)

Elimination von ε -Regeln

Beweis (Forts.)

Nach der Induktionsvoraussetzung folgt daraus:

für die OriginalgrammatikGgibt es AbleitungenAi

= ⇒

^∗_G wi

damit gibt es auch eine AbleitungA1

. . .

A`

= ⇒

^∗_Gw.

Da es inG⁰eine AbleitungA

= ⇒

_G0 A₁

. . .

A_`gibt, gibt es inR⁰eine Regel

A

→

A1

. . .

A`. Wie ist diese Regel ausRentstanden?

Eine Regel inR⁰ entsteht aus einer Regel inR, indem einige nullbare Variablen gestrichen werden. Es gab also inGnullbare VariablenB₁bisB_m, so daßRdie Regel

A

→

A₁

. . .

A_`₁B₁A_`₁₊₁

. . .

A_`₂B₂

. . .

A_mB_mA_m₊₁

. . .

A_`

enthält. (mkann auch 0 sein, dann war die Regel selbst schon inR.)

(40)

Elimination von ε -Regeln

Beweis (Forts.) Also gilt inG:

A

= ⇒

_GA1

. . .

A_`₁B1A_`₁₊1

. . .

A_`₂B2

. . .

AmBmAm+1

. . .

A_`

= ⇒

^∗_G A1

. . .

A`1A`1+1

. . .

A`2

. . .

AmAm+1

. . .

A`

= ⇒

^∗_Gw da jaBi

= ⇒

^∗_G εmöglich ist.

(41)

Elimination von ε -Regeln: Beispiel

Beispiel 19.6

R: R⁰:

S

→

ABD S

→

ABD

|

AD

|

BD

|

D A

→

ED

|

BB A

→

ED

|

BB

|

B B

→

AC

|

ε B

→

AC

|

A

|

C C

→

ε

D

→

d D

→

d

E

→

e E

→

e

Für die RegelmengeRin der linken Spalte sind die VariablenA

,

B

,

Cnullbar.

Der obige Algorithmus erzeugt ausRdie rechts aufgeführte RegelmengeR⁰.

(42)

Elimination von ε -Regeln

Beobachtung

Der Algorithmus lässt nutzlose Variablen zurück, die nicht in Prämissen auftauchen

(und deshalb nicht co-erreichbar sind).

Hier:C.

Der Algorithmus lässt nutzlose Regeln zurück.

Hier:B

→

AC

|

C.