Formale Sprachen und Automatentheorie

(1)

Automatentheorie

Udo Hebisch WS 2019/20

Dieses Skript enth¨ alt nur den “roten Faden”

der Vorlesung. Wesentliche Inhalte werden ausschließlich in der Vorlesung vermittelt. Daher ist dieses

Skript nicht zum Selbststudium gedacht, sondern

nur als “Erinnerungsst¨ utze”.

(2)

Inhaltsverzeichnis

1 Formale Sprachen 3

1.1 Freie Halbgruppen, Halbringe und Formale Sprachen . . . 3

1.2 Regul¨are, rationale und erkennbare Sprachen . . . 11

1.3 Automaten . . . 14

1.4 Syntaktische Monoide. . . 20

1.5 Aufgaben . . . 22

2 Regelgrammatiken und Regelsprachen 26 3 Typen endlicher Automaten 42 4 Keller-Automaten und deterministische Sprachen 51 5 Turing-Maschinen 59 6 Pumping-Lemma und Folgerungen 75 7 Weitere Verkn¨upfungen formaler Sprachen 80 8 Der Satz von Parikh 85 9 Lindenmayer-Systeme 88 10 Weitere Arten endlicher Automaten 91 11 Anhang 94 11.1 Beispiele wichtiger formaler Sprachen . . . 94

11.2 Abschlußeigenschaften der Sprachklassen . . . 96 12 L¨osungen zu ausgew¨ahlten Aufgaben 98

(3)

Die Automatentheorie ist eine mathematische Theorie, die sich Verdienste um die Begriffsbildung und um die Auf- deckung der prinzipiellen M¨oglichkeiten erwarb. Sie hat enge Verbindung zur Theorie der formalen Sprachen und damit zu den Programmiersprachen. Sie soll nicht als prak- tikable Hilfswissenschaft f¨ur konkrete Schaltwerke verstan- den werden, sondern als eine Grundlagentheorie.

Peter Deussen

1 Formale Sprachen

1.1 Freie Halbgruppen, Halbringe und Formale Sprachen

In der Automatentheorie und der Theorie formaler Sprachen werden einige Be- griffe und Resultate über Halbgruppen und Halbringe benötigt. Sie werden daher hier zunächst einmal zusammengestellt. Umfangreichere Darstellungen der hier behandelten Zusammenhänge zwischen algebraischen Strukturen, Automa- tentheorie und formalen Sprachen findet man in den folgenden Büchern:

Peter Deussen, Halbgruppen und Automaten, Springer, Berlin 1971.

Hartmut Ehrig, Michael Pfender, Kategorien und Automaten, DeGruyter, Berlin 1972.

Jean Eric Pin, Varieties of Formal Languages, Plenum Press, New York 1986.

Werner Kuich, Arto Salomaa, Semirings, Automata, Languages, Springer, Berlin 1986.

Arto Salomaa, Matti Soittola, Automata-Theoretic Aspects of Formal Power Se- ries, Springer, Berlin 1978.

Definition 1.1 Unter einer Halbgruppe (S,·) versteht man eine nichtleere Men- ge S zusammen mit einer bin¨aren Verkn¨upfung (der Multiplikation) ·, die also je zwei Elementen a, b ∈ S genau ein Produkt a ·b ∈ S zuordnet, so daß das Assoziativgesetzgilt:

a·(b·c) = (a·b)·c f¨ur alle a, b, c∈S.

(1)

(4)

Besitzt die Halbgruppe einEinselement e∈S gem¨aß e·a=a·e=a f¨ur alle a∈S,

(2)

so spricht man von einem Monoid. Gilt in (S,·) das Kommutativgesetz a·b=b·a f¨ur alle a, b∈S,

(3)

so nennt man die Halbgruppe (das Monoid)kommutativ. Gilt a·a=a f¨ur alle a∈S,

(4)

so heißt die Halbgruppe (das Monoid) idempotent. Einzelne Elemente a∈S, die (4) erf¨ullen nennt man ebenfalls idempotent und man definiert E(S) = {a ∈ S | a·a=a}.

Ein Elementa∈S heißt linksk¨urzbar[rechtsk¨urzbar] in (S,·), wenn a·x=a·y ⇒ x=y [x·a =y·a ⇒ x=y]

(5)

für alle x, y ∈ S gilt. Ist a sowohl links- als auch rechtskürzbar, so nennt man eskürzbar. Sind alle Elemente a ∈S einer Halbgruppe linkskürzbar, rechtskürz- bar oder kürzbar, so nennt man die Halbgruppe linkskürzbar, rechtskürzbar bzw.

k¨urzbar.

Beispiel 1.2 F¨ur jede MengeM 6=∅bildet die Menge T_M ={f :M →M}aller Abbildungen (Transformationen) vonM in sich mit der Nacheinanderanwendung von Abbildungen einMonoid (TM,◦), dasTransformationsmonoid auf M. Dabei ist die identische Abbildung auf M Einselement.

Definition 1.3 Unter einem Halbring (S,+,·) versteht man zwei Halbgruppen (S,+) und (S,·), so daß die beiden Distributivgesetze

a·(b+c) = a·b+a·cund (a+b)·c=a·c+b·c f¨ur allea, b, c∈S (6)

erfüllt sind. Ist (S,+)kommutativ[idempotent,kürzbar], so nennt man den Halb- ring additiv kommutativ [additiv idempotent, additiv kürzbar], ist (S,·) kommutativ [idempotent], so nennt man den Halbring multiplikativ kommutativ [multiplikativ idempotent]. Ist (S,·) ein Monoid, so nennt man das Einselement e von

(5)

(S,·) das Einselement des Halbringes (S,+,·), ist (S,+) ein Monoid, so nennt man das Einselement o von (S,+) das Nullelement des Halbringes (S,+,·). Ein Nullelemento, das noch

a·o=o=o·a f¨ur allea∈S (7)

erf¨ullt, heißt absorbierend.

Beispiel 1.4 a) JederRingist ein additiv kommutativer und k¨urzbarer Halbring.

Das Nullelement des Ringes ist stets absorbierend.

b) Die natürlichen Zahlen bilden mit den üblichen Operationen der Addition und Multiplikation einen Halbring (_N₀,+,·) mit absorbierendem Nullelement 0 und Einselement 1, der kein Ring ist. Dasselbe gilt für (_N,+,·), wobei dieser Halbring kein Nullelement besitzt. Beide Halbringe sind additiv kommutativ und kürzbar und multiplikativ kommutativ.

c) Der zweielementige Verband (_B,+,·) = ({o, e},∨,∧}) ist (wie jederdistributive Verband) ein additiv und multiplikativ kommutativer und idempotenter Halbring.

Dies gilt ebenso für den Verband (I,∨,∧) auf dem Einheitsintervall I mit den Operationen ∨ der Supremumsbildung und ∧ der Infimumsbildung. Man nennt (B,+,·) auch den Booleschen Halbring. Diese Halbringe sind additiv idempotent und daher nicht kürzbar. Sie sind auch multiplikativ idempotent. Genau dann besitzen sie ein absorbierendes Nullelement o, wenn sie (durch o) nach unten beschränkt sind, und genau dann besitzen sie ein Einselement e, wenn sie (durch e) nach oben beschränkt sind.

Definition 1.5 Es seien (S,·) und (T,) zwei Halbgruppen. Eine Abbildung ϕ:S →T heißt ein (Halbgruppen-)Homomorphismus von (S,·) in (T,), wenn

ϕ(a·b) = ϕ(a)ϕ(b) (8)

f¨ur alle a, b∈S gilt.

Sind (S,+,·) und (T,⊕,) zwei Halbringe, so heißt ϕ: S → T ein (Halbring-) Homomorphismus, wenn neben (8) noch

ϕ(a+b) = ϕ(a)⊕ϕ(b) (9)

f¨ur alle a, b∈S gilt.

Einen bijektiven (Halbgruppen- oder Halbring-) Homomorphismus nennt man einenIsomorphismus.

(6)

Definition 1.6 Es sei (S,·) eine Halbgruppe. Eine ¨Aquivalenzrelation ∼ auf S heißt eine Linkskongruenz [Rechtskongruenz] auf (S,·), wenn

x∼y ⇒ z·x∼z·y [x∼y ⇒ x·z ∼y·z]

(10)

für alle x, y, z ∈S erfüllt ist. Sind beide Implikationen aus (10) erfüllt, so nennt man∼ eine Kongruenz(relation)auf (S,·). Handelt es sich bei (S,+,·) um einen Halbring und ist ∼ Linkskongruenz [Rechtskongruenz, Kongruenz] sowohl auf (S,+) als auch auf (S,·), so spricht man von einer Linkskongruenz [Rechtskon- gruenz, Kongruenz] des Halbringes (S,+,·).

Beispiel 1.7 a) Jede Halbgruppe (S,·) bzw. jeder Halbring (S,+,·) besitzt die trivialen Kongruenzen ι_S ={(a, a)|a ∈S}, die identische Relation, und S×S, die Allrelation auf S.

b) Ist ϕ : S → T Homomorphismus von (S,·) in (T,·) bzw. von (S,+,·) in (T,+,·), so wird durch

x∼y ⇐⇒ ϕ(x) = ϕ(y) (11)

f¨ur alle x, y ∈S eine Kongruenz auf (S,·) bzw. (S,+,·) definiert.

Lemma 1.8 Ist∼Kongruenzauf einerHalbgruppe(S,·) und bezeichnetS/∼=

{[x]|x∈S}die Menge aller Restklassen[x] ={y∈S |y∼x}, dann wird durch [x]·[y] = [x·y]

(12)

f¨ur alle [x],[y]∈S/∼eine assoziative Multiplikation definiert. Daher ist (S/∼,·) eine Halbgruppe, die Restklassenhalbgruppe von (S,·) nach ∼. Die Abbildung ϕ : S → S/ ∼ mit ϕ(x) = [x] ist wegen (12) ein surjektiver Homomorphismus.

Also ist mit (S,·) auch (S/∼,·)kommutativbzw. idempotent. Iste Einselement von (S,·), so ist [e] Einselement von (S/∼,·).

Definition 1.9 Sind a und b Elemente einer Halbgruppe (S,·) und ist c=a·b ihr Produkt, so nennt man a einen linken Teiler oder ein Pr¨afix und b einen rechten Teileroder einPostfixbzw. Suffixvonc. Handelt es sich bei (S,·) um ein Monoidmit dem Einselemente, so nennt man die Elemente, die gleichzeitig linke und rechte Teiler von e sind, die Einheiten von (S,·). Mit U(S) wird die Menge aller Einheiten von (S,·) bezeichnet (vgl. Aufgabe1.60).

(7)

Beispiel 1.10 In jedem Transformationsmonoid TM besteht die Menge U(TM) genau aus den bijektiven Abbildungen auf M. Es handelt sich also dabei um die symmetrischeGruppe auf M.

Beispiel 1.11 F¨ur eine beliebige Menge X 6= ∅ sei X⁺ = ^S_n∈_NXⁿ. Definiert man f¨ur alle (x₁, . . . , x_n),(y₁, . . . , y_m)∈X⁺ eine Multiplikation durch

(x₁, . . . , x_n)·(y₁, . . . , y_m) = (x₁, . . . , x_n, y₁, . . . , y_m), (13)

dann ist (X⁺,·) eine Halbgruppe, diefreie Halbgruppe über X. Man schreibt die Elemente (x₁, . . . , x_n)∈X⁺ einfach in der Form x₁· · ·x_n und die Multiplikation als Konkatenation x₁· · ·x_ny₁· · ·y_m. Speziell für endliches X nennt man X ein Alphabet, die Elemente x∈X Buchstaben und die Elementew=x1· · ·xn ∈X⁺ Wörter oder Strings über X. Adjungiert man zu (X⁺,·) ein leeres Wort als Einselement, so nennt man X^∗ = X⁺∪ {} das freie Monoid über X. Sowohl (X⁺,·) als auch (X^∗,·) sind kürzbar. Genau die Wörter u0 = ε, u1 = x1, u2 = x₁x₂, . . . , un−1 = x₁· · ·xn−1 und u_n = w sind Präfixe und die Wörter v₀ = w, v₁ = x₂· · ·x_n, . . . , vn−1 = x_n und v_n = ε sind Postfixe von w. Ist w = x₁. . . x_n ein Wort, so bezeichnet w = xn. . . x1 das gespiegelte Wort zu w. Es gilt also u·v = v · u für alle u, v ∈ X^∗. Unter einer formalen Sprache L (über dem AlphabetX) versteht man eine beliebige Teilmenge vonX^∗, also ein Element der Potenzmenge P(X^∗). Insbesondere sind L1 =∅ und L2 = {ε} zwei verschiedene formale Sprachen über jedem Alphabet X.

F¨ur jedes a∈X definiert man die Abbildung `a :X^∗ →N0 durch

`_a(w) = `_a(x₁. . . x_n) = |{i|x_i =a}|f¨ur allew=x₁. . . x_n∈X^∗. (14)

Weiterhin sei ` : X^∗ → N0 durch `(w) = ^P_a∈X`_a(w) für alle w ∈ X^∗ definiert. Man nennt `(w) die Länge von w. Schließlich sei für das Alphabet X ={a₁, . . . , a_k} die Parikh-Abbildung Ψ :X^∗ →_N^k₀ durch

Ψ(w) = (`_a₁(w), . . . , `_a_k(w)) (15)

festgelegt.

Bemerkung 1.12 a) Die Abbildung `_a z¨ahlt die Anzahl des Vorkommens des Buchstabens a ∈ X im Wort w ∈ X^∗. Sie ist, ebenso wie die Abbildungen

` und Ψ, ein Homomorphismus. F¨ur |X| = 1 stimmen alle diese Abbildungen

(8)

¨

uberein und definieren einen Isomorphismus von (X^∗,·) auf (N0,+). Man kann daher (_N₀,+) als das (bis auf Isomorphie) eindeutig bestimmte freie Monoid ¨uber einem einelementigen Alphabet auffassen.

b) Betrachtet man die zur Parikh-Abbildung Ψ :X^∗ →_N^k₀ gemäß Bemerkung1.7 gehörende Kongruenz, so nennt man Worte u, v ∈ X^∗ mit Ψ(u) = Ψ(v) sym- boläquivalent, denn u und v bestehen (bis auf die Reihenfolge) aus denselben Buchstaben. Man nennt dann Sprachen L₁, L₂ ⊆ X^∗ mit Ψ(L₁) = Ψ(L₂) eben- fallssymboläquivalent.

c) Ist das Alphabet X = {a₁, . . . , a_k} total geordnet gemäßa₁ < a₂ < . . . < a_k, so ist X^∗ und damit jede formale Sprache L ⊆ X^∗ total geordnet bezüglich der lexikographischen Ordnung x₁. . . x_n < y₁. . . y_m ⇐⇒n < m oder x_i < y_i für das kleinste i∈ {1, . . . , n} mit x_i 6=y_i.

Definition 1.13 Sind (S_i,_i)Halbgruppenf¨ur eine beliebige IndexmengeI 6=∅, dann wird auf dem kartesischen Produkt S= Π_i∈IS_i durch

(x_i)·(y_i) = (x_i_iy_i) (16)

f¨ur alle (xi),(yi) ∈ S eine Multiplikation definiert. Man nennt (S,·) das direkte Produktder Halbgruppen (S_i,_i).

Bemerkung 1.14 Die in (16) definierte Multiplikation ist ersichtlich assoziativ, (S,·) also eine Halbgruppe. Besitzt jede Halbgruppe (S_i,_i) ein Einselemente_i, so iste= (ei) Einselement von (S,·). Sind alle (Si,i) kommutativ[idempotent, k¨urzbar], so gilt dasselbe f¨ur (S,·).

Definition 1.15 Sind A und B Teilmengen einer Halbgruppe (S,·) so versteht man unter demKomplexprodukt AB die Teilmenge

AB ={a·b|a∈A, b∈B}.

(17)

F¨ur A = B schreibt man auch A² anstelle von AA, f¨ur einelementige Mengen A={a}bzw.B ={b}schreibt man auchaB anstelle von{a}B bzw.Abanstelle von A{b}.

(9)

Definition 1.16 Neben den mengentheoretischen Operationen Durchschnitt ∩, Vereinigung∪ und Komplement ⁰ existieren fürformale Sprachen K, L∈P(X^∗) noch die zweistellige Operation der Konkatenation K·L =KL gemäß (17) und die einstellige ∗-Operation L^∗ =^S_n∈_N₀Lⁿ, wobei die Sprachen Lⁿ rekursiv durch L⁰ = {ε} und Lⁿ⁺¹ = LLⁿ definiert sind. Schließlich definiert man noch den Linksquotientenoder das Linksresiduum von L bezüglich K durch

K⁻¹L={w∈X^∗ |Kw∩L6=∅}

(18)

und den Rechtsquotienten oder das Rechtsresiduum durch LK⁻¹ ={w∈X^∗ |wK∩L6=∅}

(19)

Bemerkung 1.17 a) Die Operationen ∪ und ∩ sind sowohl kommutativ als auch idempotent, die Konkatenation ist nicht idempotent und nur f¨ur |X| = 1 kommutativ (vgl. Aufgabe1.71).

b) Die Komplementbildung ist involutorisch, d. h. es gilt (A⁰)⁰ = A für alle A ⊆X^∗, die ∗-Operation ist nicht involutorisch. Außer für L =∅ und L ={ε}, was jeweils L^∗ ={ε} ergibt, ist L^∗ stets eine unendliche Sprache. Man definiert noch L⁺ = LL^∗ für jede formale Sprache L und hat L⁺ = L^∗\ {ε}, falls ε 6∈ L gilt.

c) Die Quotientenbildung ist ersichtlich nicht kommutativ. F¨ur einelementige SprachenK ={x}schreibt man auchx⁻¹Lstatt{x}⁻¹LundLx⁻¹ stattL{x}⁻¹. Folgerung 1.18 IstX ein Alphabet, so gilt f¨ur die Potenzmenge P(X^∗) und die entsprechenden Operationen:

a) (P(X^∗),∪,∩) ist ein sowohl additiv als auch multiplikativ kommutativer und idempotenter Halbring. Es istX^∗ Einselement und ∅absorbierendes Nullelement dieses Halbringes.

b) (P(X^∗),∪,·) ist ein additiv, aber nicht multiplikativ idempotenter Halbring.

W¨ahrend er auch stets additiv kommutativ ist, ist er f¨ur |X| > 1 nicht multiplikativ kommutativ. Es ist {ε} Einselement und ∅ absorbierendes Nullelement dieses Halbringes.

Beispiel 1.19 Beispiele f¨ur Sprachen ¨uber dem Alphabet X ={a, b}:

a)L1 ={aⁿ|n ≥0}={a}^∗ ⊂X^∗ (vgl. Bemerkung 1.28 a) und Beispiel2.7 c)),

(10)

b)L2 ={a⁽²ⁿ⁾|n ≥1}(vgl. Beispiel 2.8),

c)L₃ ={(ab)ⁿ|n ≥1}={ab}⁺, (vgl. Satz 1.26 (4)),

d)L₄ ={aⁿb^m |n, m≥1}={a}⁺{b}⁺ (vgl. Satz 1.26 (4) und (2)), e)L₅ ={aⁿbⁿ|n ≥1} ⊂L₄ (vgl. Beweis zu Satz 2.38 und Beispiel 1.57), f) L₆ ={aⁿba^m |n, m≥0}=L₁{b}L₁ (vgl. Bemerkung 1.28 a)),

g)L7 ={aⁿbaⁿ|n ≥0} ⊂L6 (vgl. Beispiel 2.29),

h)L₈ ={aⁿbⁿaⁿ |n≥1} (vgl. Beweis zu Satz 2.38 und Aufgabe 2.52), i)L₉ =L₅L₅ (vgl. Beispiel2.33).

Definition 1.20 Es sei (S,+,·) ein additiv kommutativer Halbring mit einem absorbierenden Nullelement o und einem Einselement e. Weiterhin sei X ein Alphabet. Unter einerformalen Potenzreihe f ¨uber S in den Unbestimmten x_i ∈ X versteht man dann eine Abbildungf :X^∗ →S mitf(w) =α_w ∈S, die gem¨aß

f = ^X

w∈X^∗

α_ww

geschrieben wird. Dabei heißtαw ∈S der Koeffizient vonf an der Stelle w∈X^∗ und supp(f) ={w∈X^∗ |α_w 6=o}derSupportoderTrägervonf. Ist der Träger von f endlich, so spricht man auch von einem Polynom f, für|supp(f)|= 1 von einem Monom. Gilt sogar supp(f)⊆ {ε}, so heißt das Polynom f konstant. Die Menge aller derartigen Potenzreihen wird mit S[[X]] bezeichnet, die Teilmenge aller Polynome mitS[X].

F¨ur Potenzreihenf =^P_w∈X^∗αwwundg =^P_w∈X^∗βwwdefiniert man die Summe f+g elementweise durch

f +g = ^X

w∈X^∗

(α_w+β_w)w und das Produkt f g alsCauchyprodukt gem¨aß

f g= ^X

w∈X^∗

X

uv=w

α_uβ_v

!

w.

Bemerkung 1.21 a) Ist X = {x} einelementig und S = R ein Ring, dann ist R[x] =R[{x}] der gew¨ohnliche Polynomring ¨uberR und beispielsweise_R[[x]] der

(11)

aus der Analysis bekannte Ring der (formalen) Potenzreihen ¨uber den reellen Zahlen.

b) IstS =BderBoolesche Halbring, so kann man jedesf ∈B[[X]] als charakteri- stische Funktion einer Teilmenge vonX^∗ auffassen. Jede formale Potenzreihe entspricht dann umkehrbar eindeutig einerformalen Sprache und umgekehrt. Diese Identifikation eröffnet einen ersten Zugang zu einer algebraischen Untersuchung formaler Sprachen. Im Hinblick auf den nächsten Satz entspricht der Halbring (_B[[X]],+,·) nämlich genau dem Halbring (P(X^∗),∪,·) aus Folgerung 1.18 b).

Satz 1.22 Es sei (S,+,·) ein additiv kommutativer Halbring mit einem absorbierenden Nullelementound einemEinselemente. Weiterhin seiX ein Alphabet.

Dann bildet die Menge aller formalen Potenzreihen über S in den Unbestimmten aus X einen additiv kommutativen Halbring (S[[X]],+,·) mit absorbierendem Nullelement o und Einselement e. Er enthält die Polynome als Unterhalbring und darin den Halbring (S,+,·) in Form der konstanten Polynome wiederum als Unterhalbring. Genau dann ist (S[[X]],+,·) (und damit (S[X],+,·)) additiv idempotent bzw. kürzbar, wenn dies auf (S,+,·) zutrifft.

1.2 Regul¨ are, rationale und erkennbare Sprachen

Definition 1.23 Es sei X ein Alphabet. Durch die folgenden Festlegungen werden reguläre Ausdrücke α und die ihnen zugeordneten regulären Sprachen L(α)⊆X^∗ definiert.

(1) ∅ ist ein regul¨arer Ausdruck ¨uber X mit L(∅) = ∅.

(2) ε ist ein regul¨arer Ausdruck ¨uber X mit L(ε) ={ε}.

(3) Für jedes x∈X ist xein regulärer Ausdruck über X mit L(x) ={x}.

(4) Sind α und β reguläre Ausdrücke über X, so auch α ∪β mit L(α∪β) = L(α)∪L(β) und αβ mit L(αβ) = L(α)L(β).

(5) Ist α regul¨arer Ausdruck ¨uberX, dann auch α^∗ mit L(α^∗) =L(α)^∗.

Nur die nach (1) - (5) erzeugbaren Ausdr¨ucke bzw. formalen Sprachen sind regul¨ar.

Zwei reguläre Ausdrückeα und β mit L(α) =L(β) heißen äquivalent.

(12)

Bemerkung 1.24 a) Zur Vereinfachung regulärer Ausdrücke vereinbart man noch, daß die ∗-Operation höchste Priorität besitzt, danach kommt die Kon- katenation, zuletzt die Vereinigung.

b) Nach der obigen Definition sind beispielsweise die regulären Ausdrücke α = ((a∪ε)a)^∗ und β =a^∗ überX ={a}äquivalent. Die ihnen zugeordnete reguläre Sprache ist L(α) ={a}^∗ =L₁ aus Beispiel 1.19.

c) Es gibt Algorithmen, die für beliebige reguläre Sprachen L₁ und L₂ über X und beliebigesx∈X^∗ entscheiden, ob gilt:

(1) x∈L₁ (Wortproblem),

(2) L₁ =∅(Leerheitsproblem) (vgl. Folgerung6.3), (3) |L₁| endlich (Endlichkeitsproblem),

(4) L₁∩L₂ =∅(Durchschnittsproblem), (5) L₁ =L₂ (Aquivalenzproblem).¨

d) Für jeden regulären AusdruckαüberXund jedesw∈X^∗ist das Wortproblem w∈L(α) in O(`(α)`(w)) Schritten entscheidbar.

Definition 1.25 Sind f, g :_N₀ →_CFunktionen, so schreibt man f(n) = O(g(n)),

wenn es ein c >0 und ein n0 ∈N0 gibt, so daß

|f(n)| ≤cg(n) f¨ur alle n≥n₀ gilt.

Satz 1.26 Sind L₁ und L₂ reguläre Sprachen über X^∗, dann sind auch die folgenden Sprachen regulär:

(1) L₁∪L₂, (2) L₁L₂, (3) L^∗₁,

(4) L⁺₁ =L₁L^∗₁,

(13)

(5) L⁰₁ =X^∗\L1, (6) L₁∩L₂, (7) L₁\L₂,

(8) L₁ (vgl. Aufgabe 1.70).

Beweisidee:(1) - (4) folgen unmittelbar aus Definition1.23. (5) läßt sich mit Hil- fe erkennender Monoide für reguläre Sprachen beweisen (vgl. Bemerkung1.28 b, Satz1.34 und Folgerung1.31 a)). (6) folgt dann aus (1) und (5) mit den DeMor- ganschen Regeln. (7) folgt aus (5) und (6) wegen L₁ \L₂ = L₁ ∩(X^∗\L₂). (8) folgt aus Aufgabe1.70.

Wegen dieser Abgeschlossenheit gegenüber den “einfachen” Rechenoperationen hat man auch eine andere Bezeichnungsweise für reguläre Sprachen.

Definition 1.27 Es sei X ein Alphabet. Die Menge Rat(X^∗) aller rationalen Sprachen von X^∗ ist die kleinste Teilmenge von P(X^∗), die alle einelementigen Sprachen {x} für x∈ X^∗ enthält und die abgeschlossen ist gegenüber endlichen Vereinigungen, Produkten und der∗-Operation.

Bemerkung 1.28 a) F¨ur X = {a, b} liegen jedenfalls die Sprachen L₁ = {a}^∗ und L₆ =L₁{b}L₁ aus Beispiel1.19 in Rat(X^∗).

b) Jede endliche Sprache ist als endliche Vereinigung von einelementigen Spra- chen rational. Also gilt auchX ∈Rat(X^∗) und damitX^∗ ∈Rat(X^∗). Schließlich betrachtet man auch die leere Sprache ∅, die man als “leere” (endliche) Vereini- gung auffaßt, als zuRat(X^∗) gehörig. Daher sind die rationalen Sprachen genau die regulären Sprachen gemäß Definition 1.23.

b) (Rat(X^∗),∪,·) ist der kleinste Unterhalbring von (P(X^∗),∪,·) (oder wegen Bemerkung 1.21 b) von (B[[X]],+,·)), der die einelementigen Sprachen (oder der (_B[X],+,·)) enth¨alt und der abgeschlossen gegen¨uber der ∗-Operation ist.

Dies er¨offnet einen algebraischen Zugang zu dieser Sprachklasse. Einen andereren algebraischen Zugang zu einer auf den ersten Blick anderen Sprachklasse (vgl.

aber Satz1.34), liefern die folgenden Definitionen.

Definition 1.29 Es seien X einAlphabet,L⊆X^∗ und (M,·) einMonoid. Man sagt (M,·) erkennt L, wenn es einen Homomorphismus ϕ : X^∗ → M und eine Menge P ⊆ M gibt, so daß L = ϕ⁻¹(P) gilt. Die Sprache L heißt erkennbar, wenn es ein endliches Monoid gibt, dasLerkennt. MitRec(X^∗) werde die Menge aller erkennbaren Sprachen aus X^∗ bezeichnet.

(14)

Bemerkung 1.30 a) Jede Sprache L ⊆ X^∗ wird durch das Monoid (X^∗,·) erkannt, man muß nur ϕ als identische Abbildung und P = L w¨ahlen. Bei der Erkennbarkeit einer Sprache spielt also die Endlichkeit des Monoids die entschei- dende Rolle.

b) Da ersichtlichX^∗homomorph auf das einelementige Monoid ({1},·) abgebildet werden kann, gilt jedenfallsX^∗ ∈Rec(X^∗) (f¨urP = {1}) und ∅ ∈Rec(X^∗) (f¨ur P =∅), also insbesondere Rec(X^∗)6=∅.

Folgerung 1.31 Es seien X ein Alphabet und L⊆X^∗.

a) Erkennt ein Monoid (M,·) die Sprache L, dann erkennt (M,·) auch X^∗ \L.

Die Menge Rec(X^∗) ist also abgeschlossen gegen¨uber der Komplementbildung.

b) Erkennt ein Monoid(M,·)die SpracheLund istK ⊆X^∗ eine weitere Sprache, dann erkennt (M,·) auch K⁻¹L und LK⁻¹.

Folgerung 1.32 Sind L₁ und L₂ Sprachen ¨uber dem Alphabet X, die von den Monoiden M₁ bzw. M₂ erkannt werden, dann werden die Sprachen L₁∪L₂ und L₁∩L₂ von dem MonoidM₁×M₂ erkannt. Insbesondere ist Rec(X^∗)auch abgeschlossen gegen¨uber endlichen Vereinigungen und Durchschnitten, also eine Boo- lesche Algebra.

Folgerung 1.33 Es seien X und Y Alphabete und ψ :X^∗ →Y^∗ ein Homomor- phismus. Wird die Sprache L⊆Y^∗ durch das Monoid M erkannt, dann erkennt M auch ψ⁻¹(L)⊆X^∗.

Der folgende Satz geht auf S. C. Kleene in seinem Artikel “Representation of events in nerve nets and finite automata”, C. E. Shannon, J. McCarthy (Hrsg.), Automata Studies, Princeton University Press, Princeton 1959, zur¨uck.

Satz 1.34 (S. C. Kleene)F¨ur jedes Alphabet X gilt Rec(X^∗) =Rat(X^∗).

1.3 Automaten

Die Theorie formaler Sprachen h¨angt eng mit der Theorie der Automaten zusammen, wie bereits in den folgenden ¨Uberlegungen deutlich wird.

(15)

Definition 1.35 Unter einem(endlichen) Automatenversteht man im allgemeinen ein 5-Tupel

A= (Q, X, δ, Q_s, Q_f),

bestehend aus einer (endlichen) Menge Q von Zuständen, einer nichtleeren Teil- menge Q_s ⊆ Q von Startzuständen, einer (möglicherweise leeren) Teilmenge Q_f ⊆ Q von Endzuständen, einem endlichen Eingabealphabet X mit X∩Q =∅ und einerUbergangsrelation¨ δ⊆Q×(X∪ {ε})×Q, wobeiε das leere Wort über X bezeichnet.

Bemerkung 1.36 Je nach zusätzlichen Bedingungen an die einzelnen Kompo- nenten des Automaten unterscheidet man verschiedene Automatenklassen. Gilt etwa |Q_s| = 1, so spricht man von initialen Automaten, bei |Q_s| = k > 1 von k-Eingangsautomaten. Existiert wenigstens ein Tripel (q, ε, q⁰)∈δ mit q6=q⁰, so nennt manA einenε-Automaten, gilt |{(q, x, q⁰)∈δ}| ≤1 für alle (q, x)∈Q×X und istA kein ε-Automat, so heißt A ein deterministischer Automatusw. In der folgenden alternativen Definition dieser einfachsten Klasse von Automaten sind die Angaben über Start- und Endzustände zunächst noch weggelassen.

Definition 1.37 Ein deterministischer (endlicher) Automat A = (Q, X,·) besteht aus einer (endlichen) Menge Q von Zuständen, einem Alphabet X und einer Operatoranwendung · : Q×X → Q, die für jeden Buchstaben x ∈ X zu jedem Zustand q ∈ Q den Folgezustand q ·x ∈ Q festlegt. Man erweitert die Operatoranwendung vonQ×X auf Q×X^∗, indem man für alle q ∈Q, w ∈X^∗ und x∈X definiert: q·ε=q und q·(wx) = (q·w)·x.

Bemerkung 1.38 a) Jedes Wort w ∈ X^∗ vermittelt also eine Transformation t_w : Q → Q der Menge der Zust¨ande des Automaten in sich. Die Menge aller derartigen Transformationen bildet offensichtlich ein UntermonoidM(A) des vollen TransformationsmonoidsT_Q. Dieses Monoid wird auchTransitionsmonoid des Automaten genannt. Man kann einen Automaten daher durch eine Tabelle der Transformationent_x f¨urx∈X beschreiben.

b) Auch durch einen Graphen läßt sich ein AutomatA = (Q, X,·) beschreiben: Zu jedem Zustandq ∈Qgehört ein Knoten des Graphen, und eine gerichtete Kante führt genau dann von einem Knoten q zu einem Knoten q⁰, wenn ein x∈X mit q·x=q⁰ existiert. Man markiert diese Kante dann mit dem Buchstaben x.

Beispiel 1.39 Der (endliche deterministische) Automat A = (Q, X,·) sei gegeben durch Q={1,2,3}, X ={a, b} und die Operatoranwendung

1·a= 2,1·b= 2·b= 1,2·a= 3·a= 3·b = 3.

(16)

Die zugeh¨orige Automatentafel ist dann

· 1 2 3 t_a 2 3 3 t_b 1 1 3 Das vollst¨andigeTransitionsmonoid ergibt sich zu

· 1 2 3 t_ε 1 2 3 t_a 2 3 3 t_b 1 1 3 taa 3 3 3 t_ab 1 3 3 t_ba 2 2 3 Der zugeh¨orige Graph ist

2 3

1

b a b

a

b

Definition 1.40 Es seien L ⊆ X^∗ eine Sprache und A = (Q, X,·) ein Auto- mat. Man sagt, daß L von A erkannt wird, wenn es einen Zustand q0 ∈ Q, den Anfangszustand, und eine Menge F ⊆ Q von Endzust¨anden gibt, so daß w ∈ L genau dann gilt, wenn q₀ ·w∈F gilt.

Beispiel 1.41 Ist A = (Q, X,·) der Automat aus Beispiel 1.39 und q₁ der An- fangszustand, so wird für F ={q₁} die Sprache L₁ ={b}^∗{a{b}⁺}^∗ erkannt, für F ={q2}die SpracheL2 =L1{a}und fürF ={q3}die SpracheL3 =X^∗{aa}X^∗. Bemerkung 1.42 a) Die Betrachtung “unendlicher” Automaten zur Erkennung von Sprachen macht zunächst wenig Sinn, wie die folgende Überlegung zeigt. Es sei L ⊆ X^∗ eine beliebige Sprache über dem (endlichen) Alphabet X. Definiere den deterministischen Automaten A = (Q, X,·) mit der abzählbar unendlichen Zustandsmenge Q = X^∗ und der Operatoranwendung · : X^∗ ×X^∗ → X^∗ als

(17)

Konkatenation gemäßu·v =uv. Für den Anfangszustand q0 =ε und die Menge F =Lvon Endzuständen wird dann genau die SpracheLerkannt. Schränkt man jedoch derartige unendliche Automaten durch die Forderung ein, daß das von ihnen gemäß Bemerkung 1.38 a) gebildete Transitionsmonoid M(A) endlich sein muß, so gibt es zu jedem derartigen eingeschränkten Automaten mit unendlich vielen Zuständen einen Automaten mit endlich vielen Zuständen, der dieselbe Sprache erkennt (vgl. Bemerkung1.45). Offensichtlich ist das Transitionsmonoid endlich, wenn schon die Zustandsmenge endlich ist

b) Oft werden endliche Automaten auch endliche (deterministische) Akzeptoren genannt und in der Form

A= (Q, X,·, q₀, F)

mit den Bedeutungen aus Definition1.40) definiert. Sie “akzeptieren” dann genau die Wortew∈X^∗, f¨ur dieq₀w∈F gilt. Manche Autoren nennenA = (Q, X,·, q₀) dann auch einen initialen endlichen Automaten.

c) Ist A = (Q, X,·) einAutomat, der mit dem Anfangszustand q₀ ∈Q und den Endzust¨anden F ⊆Q die Sprache L⊆X^∗ erkennt, so erkennt A mit demselben Anfangszustand und der MengeQ\F offensichtlich die SpracheX^∗\L.

Satz 1.43 Wird eineSprache Lvon einem AutomatenA= (Q, X,·)erkannt, so wird sie auch von demTransitionsmonoidM(A)erkannt. Eine Sprache ist genau dann erkennbar, wenn sie von einem endlichen Automaten erkannt wird.

Definition 1.44 Ist A= (Q, X,·) ein Automat und q₀ ∈Q ein ausgezeichneter Anfangszustand, so heißt ein Zustandq ∈Qerreichbar, wenn es ein w∈X^∗ mit q=t_w(q₀) gibt. Der AutomatA heißt vereinfacht(bezüglich des Anfangszustan- desq₀), wenn alle Zustände erreichbar sind. Ist weiterhinF ⊆Qeine ausgezeich- nete Menge von Endzuständen, so heißen zwei Zustände q, q⁰ ∈Q äquivalent, in Zeichenq ∼q⁰, wenn für alle w∈X^∗ gilt q·w∈F ⇐⇒q⁰·w∈F. Der Automat A= (Q, X,·) mit Startzustandq₀ und EndzuständenF heißtreduziert, wenn alle Zustände erreichbar sind und wenn aus q∼q⁰ stets q=q⁰ folgt.

Bemerkung 1.45 a) Man kann offensichtlich durch den folgenden Algorithmus alle von einem beliebigen Anfangszustandq0 aus erreichbaren Zustände ermitteln, indem man zunächst q₀ markiert und dann jeweils iterativ diejenigen Zustände q⁰ markiert, für dieq⁰ =q·x mit einem bereits markierten Zustandq und einem x∈X gilt. Die Iteration kann abgebrochen werden, sobald keine Zustände mehr neu markiert werden können. Ist das Transitionsmonoid endlich, so tritt dieser Fall auch mit Sicherheit ein und es sind nur endlich viele Zustände von q₀ aus erreichbar.

(18)

b) Offenbar können unerreichbare Zustände aus der Zustandsmenge eines Au- tomaten A entfernt werden, ohne daß, bei gleichem Startzustand, die erkannte Sprachegeändert wird.

c) Die Relation∼ ist eine ¨Aquivalenzrelation auf der Menge der Zust¨ande eines endlichen Automaten.

Beispiel 1.46 Der Automat A = (Q, X,·) sei gegeben durch Q = {1,2}, X = {a} und die Operatoranwendung

1·a= 2·a = 2.

Für q₀ = 1 sind alle Zustände erreichbar, für q₀ = 2 ist nur der Zustand 2 erreichbar.

Istq₀ = 1 Anfangszustand, so sind fürF ={1,2}oder fürF =∅beide Zustände

äquivalent, für F = {1} oder für F = {2} beide Zustände inäquivalent. Die erkannten Sprachen sind der Reihe nach X^∗, ∅, {ε} und X⁺. Im ersten und zweiten Fall kann man A zu dem Automaten A⁰ = ({1},{a},) mit 1a = 1 reduzieren (vgl. Satz1.47).

Satz 1.47 Ist A= (Q, X,·) ein Automat, der mit dem Startzustand q₀ ∈Q und den Endzust¨andenF die Sprache Lerkennt, dann gibt es einen reduziertenAuto- matenA⁰ = (Q⁰, X,), der mit dem Startzustand q⁰₀ ∈Q⁰ und den Endzust¨anden F⁰ ⊆Q⁰ ebenfalls L erkennt.

Definition 1.48 Es seien A = (Q, X,·) und A⁰ = (Q⁰, X,) zwei Automaten.

Man nennt A⁰ ein homomorphes Bild von A, wenn es eine surjektive Abbildung ϕ : Q → Q⁰ gibt, die mit den Operatoranwendungen in der folgenden Weise vertr¨aglich ist.

ϕ(q·x) = ϕ(q)x f¨ur alle x∈X.

(20)

Ist ϕ sogar bijektiv, dann heißen die beiden Automaten isomorph zueinander.

Sind für die beiden Automaten noch Startzustände q₀ ∈ Q und q⁰₀ ∈ Q⁰ und Endzustände F ⊆QsowieF⁰ ⊆Q⁰ spezifiziert, so verlangt man über (20) hinaus noch

ϕ(q₀) = q₀⁰ und (21)

q ∈F ⇐⇒ ϕ(q)∈F⁰. (22)

(19)

Bemerkung 1.49 a) Sind A = (Q, X,·) und A⁰ = (Q⁰, X,) wie in Defini- tion 1.48 mit den jeweils spezifizierten Start- bzw. Endzust¨anden, so erkennen beide Automaten dieselbe Sprache.

b) Sind A = (Q, X,·) und A⁰ = (Q⁰, X,) Automaten wie in Satz 1.47, so ist A⁰ homomorphes Bild von A. In diesem Sinne ist A⁰ minimaler Automat, der L erkennt. Der Homomorphismus ϕ ist durch die Forderung ϕ(q₀) = q₀⁰ eindeutig bestimmt.

c) Es gibt Algorithmen, die zu einem gegebenen Automaten den eindeutig be- stimmten reduzierten Automaten berechnen.

Mit dem folgenden Algorithmus wird zu einer gegebenen Sprache L ⊆ X^∗ ein (Minimal-)automat A = (Q, X,·) konstruiert, der (bei geeignetem Anfangszu- stand und geeigneten Endzust¨anden) L erkennt.

Zuerst werden die Zust¨ande berechnet. Diese sind Teilmengen von X^∗. 1. Beginne mitQ={q=L} (als sp¨aterem Startzustand).

2. F¨ur alle x ∈ X und alle (neu hinzugekommenen) Zust¨ande q ∈ Q berechne q⁰ =x⁻¹q⊆X^∗.

3. Alle noch nicht inQ vorhandenenq⁰ nehme neu in Q auf.

4. Falls keine neuen Zust¨ande hinzugenommen wurden, ist Q die endg¨ultige Zu- standsmenge, sonst mache weiter bei 2.

Die Operatoranwendung wird nun folgendermaßen festgelegt: F¨ur x ∈ X und q=A∈Qsetze q·x=A·x=x⁻¹A=q⁰.

Es gilt also Q={w⁻¹L|w∈X^∗} und

(w⁻¹L)·x=x⁻¹(w⁻¹L) = (wx)⁻¹Lf¨ur allex∈X.

Die Endzust¨ande zur Erkennung von L sind F ={w⁻¹L|w∈L}.

Beispiel 1.50 Bestimmung des Minimalautomaten f¨urL =X^∗aaX^∗ uber¨ X = {a, b}.

1. Setzeq₁ =L.

2. Berechnea⁻¹L=L∪aX^∗ =q₂ und b⁻¹L=L=q₁. 3. Bestimme neuQ={q1, q2}.

(20)

4. Mache weiter bei 2.

2. Berechne a⁻¹(L∪aX^∗) = a⁻¹L∪a⁻¹(aX^∗) = L∪aX^∗∪X^∗ =X^∗ = q₃ und b⁻¹(L∪aX^∗) =b⁻¹L∪b⁻¹(aX^∗) = L∪ ∅=L=q1.

3. Bestimme neuQ={q₁, q₂, q₃}.

4. Mache weiter bei 2.

2. Berechnea⁻¹X^∗ =X^∗ =q₃ und b⁻¹X^∗ =X^∗ =q₃. 3.Q ¨andert sich nicht mehr.

Es ergibt sich (bis auf die andere Bezeichnung der Zust¨ande) der Automat aus Beispiel 1.39.

1.4 Syntaktische Monoide

Satz 1.51 Es sei L⊆X^∗ eine Sprache. Die durch

u∼_Lv ⇐⇒ (xuy∈L⇔xvy∈L)

f¨ur alle u, v, x, y ∈X^∗ definierte Relation ist eine Kongruenzrelation auf (X^∗,·).

Es ist L eine Vereinigung von Kongruenzklassen, n¨amlich L=^S_x∈L[x]∼_L. Definition 1.52 Die Relation ∼_L heißt syntaktische Kongruenz von L und das Restklassenmonoid M(L) = X^∗/∼_L heißt syntaktisches Monoid von L.

Bemerkung 1.53 a) Die Nerode-Relation (Anil Nerode, 1932 - ) wird als

“rechtsseitige” Version der syntaktischen Kongruenz definiert gem¨aß u∼_r v ⇐⇒ (uy∈L⇔vy∈L)

für alle u, v, y ∈ X^∗. Sie ist zwar auch eine Äquivalenzrelation, aber nur noch eine Rechtskongruenz. Das Beispiel der regulären Sprache L=bX^∗∪abX^∗ über dem AlphabetX ={a, b}mitb ∼_r ab, aberab6∼_r aabzeigt, daß es sich nicht um eine Linkskongruenz handeln muß. Daher wird (X/∼_r,·) durch die repräsentan- tenweise Multiplikation der Klassen kein Monoid.

Die syntaktische Kongruenz erf¨ullt nun ∼L⊆∼r, d. h. die Klassen von ∼r sind gr¨oßer als die Klassen von ∼_L, es gibt also i. a. weniger von ihnen.

b) Da das syntaktische Monoid f¨ur jede formale Sprache existiert, kann man mit Hilfe geeigneter Klassen von Monoiden auch neue Klassen formaler Sprachen definieren, z. B. die Klasse aller Sprachen L ⊆ X^∗, f¨ur die M(L) kommutativ (idempotent etc.) ist.

(21)

Definition 1.54 Eine Halbgruppe (S,·) teilt die Halbgruppe (T,·), in Zeichen:

S < T, wenn es eine Unterhalbgruppe (T⁰,·) von (T,·) und einen surjektiven Homomorphismusϕ:T⁰ →S gibt.

Satz 1.55 Es seien L⊆X^∗ eine Sprache und M, N Monoide. Dann gelten (1) M erkennt L genau dann, wenn M(L)< M gilt.

(2) WennLvonM erkannt wird undM < N gilt, so wirdLauch von N erkannt.

Bemerkung 1.56 Eine Sprache L ⊆ X^∗ ist also genau dann erkennbar, wenn es eine Kongruenz ∼ auf (X^∗,·) und endlich viele W¨orter w₁, . . . , w_n ∈X^∗ gibt, so daß X^∗/∼ endlich ist und L = [w₁]_∼∪. . .∪[w_n]_∼ gilt. In diesem Fall ist die syntaktische Kongruenz∼_L eine derartige Kongruenz.

F¨ur eine (durch einen Automaten) erkennbare Sprache ist das syntaktische Mo- noid isomorph zum Transitionsmonoid des Automaten.

Beispiel 1.57 Die Sprache L={aⁿbⁿ|n ∈_N₀} ¨uber dem Alphabet X ={a, b}

ist nicht erkennbar, denn das syntaktische Monoid (X^∗/∼_L,·) ist nicht endlich.

Sind nämlich n, m ∈ N mit k 6= m, so würde aus a^k ∼_L a^m auch a(a^k)b^k+1 ∼_L a(a^m)b^k+1 folgen, da ∼_L eine Kongruenzrelation ist. Es ist aber a^k+1b^k+1 ∈ L, während a^m+1b^k+1 6∈ L gilt, da die beiden Exponenten verschieden sind. Daher gilta^k 6∼_La^m und je zwei derartige Elemente liegen in verschiedenen Klassen von (X^∗/∼_L,·). Also ist dieses Monoid nicht endlich.

Folgerung 1.58 Es seien L, L₁, L₂ ⊆ X^∗ erkennbare Sprachen und K ⊆ X^∗ eine beliebige Sprache. Dann gilt f¨ur die syntaktischen Monoide

(1) M(X^∗\L)∼=M(L),

(2) M(L₁∩L₂)< M(L₁)×M(L₂), (3) M(L₁∪L₂)< M(L₁)×M(L₂),

(4) M(K⁻¹L)< M(L) und M(LK⁻¹)< M(L),

(5) M(ϕ⁻¹(L))< M(L) f¨ur jedenHomomorphismus ϕ:Y^∗ →X^∗.

(22)

1.5 Aufgaben

Aufgabe 1.59 Ein Einselement eines Monoids ist eindeutig bestimmt. Daher gilt dasselbe für das Nullelement eines Halbringes. Ein Elemente∈S einer Halb- gruppe (S,·) ist genau dann ein Einselement, wenn es idempotentund kürzbarin (S,·) ist. Daher besteht eine idempotente und gleichzeitig kürzbare Halbgruppe aus genau einem Element.

Aufgabe 1.60 In jedem Monoid(S,·) bildet die Menge U(S) der Einheiten eine Untergruppe.

Aufgabe 1.61 Ein Wort w ∈ X^∗ heißt ein Palindrom, wenn w = w gilt. Die formale Sprache L⊆ X^∗ sei durch L= {ww|w ∈X^∗} definiert. Beweisen oder widerlegen Sie: Lbesteht genau aus den Palindromen.

Aufgabe 1.62 Es sei L⁰ ⊆ L Teilmenge einer regul¨aren Sprache ¨uber einem beliebigen Alphabet X. Beweisen oder widerlegen Sie die folgende Behauptung.

AuchL⁰ ist eine regul¨are Sprache.

Aufgabe 1.63 Uber dem Alphabet¨ X ={a, b, c} seien die beiden Sprachen L₁ ={a^mbⁿcⁿ |m, n∈N0} und L₂ ={a^mb^mcⁿ|m, n∈N0}

gegeben. Bestimmen Sie die SprachenL₁∩L₂ und L₁·L₂,

Aufgabe 1.64 Die formale Sprache L über dem Alphabet X = {a, b} bestehe aus allen Wörtern w, in denen sämtliche Buchstaben a vor allen Buchstaben b auftreten. Geben Sie eine formale Beschreibung fürL an. Ist L regulär?

Aufgabe 1.65 Die formale Sprache L über dem Alphabet X = {a, b} bestehe aus allen Wörternw, in denen der drittletzte Buchstabe eina ist. Geben Sie eine formale Beschreibung fürL an. Ist L regulär?

Aufgabe 1.66 Uber dem Alphabet¨ X ={a, b}sind die folgenden formalen Spra- chen gegeben:

L1 bestehe aus allen W¨orternw mit `a(w)≥`b(w) + 1,

L₂ bestehe aus allen Wörternw, in denen auf jedes b unmittelbar ein a folgt, L₃ bestehe aus allen Wörternw, die mit abbeginnen und `_a(w)≥3 erfüllen.

Entscheiden Sie jeweils, ob Li regul¨ar ist.

(23)

Aufgabe 1.67 Ist die Sprache L = {a^mbⁿ | n, m ∈ N, n+m ∈ 2N} uber dem¨ Alphabet X ={a, b} regul¨ar?

Aufgabe 1.68 Uber dem Alphabet¨ X ={0,1}sind die folgenden formalen Spra- chen gegeben:

L1bestehe aus allen Wörternw, von denen kein Präfix den Buchstaben 0 enthält, L₂ bestehe aus allen Wörtern w, von denen kein Präfix mit dem Buchstaben 0 beginnt,

L3 bestehe aus allen W¨ortern w, von denen jeder Pr¨afix mit dem Buchstaben 0 beginnt.

Geben Sie jeweils eine formale Beschreibung von L_i an und entscheiden Sie, ob Li regul¨ar ist.

Aufgabe 1.69 Untersuchen Sie die Sprachen aus Beispiel 1.19 auf Symbol¨aqui- valenz.

Aufgabe 1.70 Zu jedemregulären AusdruckαüberXgebe man einen regulären Ausdruckα an mit L(α) ={w|w∈L(α)}.

Aufgabe 1.71 F¨ur alle W¨orter x, y ∈ X⁺ sind folgende Bedingungen gleichwertig:

a)xy=yx,

b) es gibt n, m >0 mit x^m =yⁿ,

c) es gibt einz ∈X⁺ und k, l >0 mit x=z^k, y =z^l.

Aufgabe 1.72 Es sei X ein Alphabet. F¨ur a ∈ X, v, w ∈ X^∗ und K, L ⊆ X^∗ gelten:

a)w⁻¹(K∪L) =w⁻¹K ∪w⁻¹L, b)w⁻¹(K\L) =w⁻¹K \w⁻¹L, c)w⁻¹(K∩L) =w⁻¹K ∩w⁻¹L,

d) a⁻¹(KL) = (a⁻¹K)L, falls ε /∈ K, und a⁻¹(KL) = (a⁻¹K)L∪ a⁻¹L, falls ε∈K.

e)a⁻¹L^∗ = (a⁻¹L)L^∗, f) v⁻¹(w⁻¹L) = (wv)⁻¹L.

(24)

Aufgabe 1.73 Zu den folgenden SprachenL ¨uber dem jeweils angegebenenAl- phabet X ist der Minimalautomat zu bestimmen.

a)X ={a, b}, L={ab}.

b)X ={a, b}, L=X^∗a.

c)X ={a, b}, L=X^∗abX^∗. d)X ={a, b, c},L=X^∗abX^∗. e)X ={a, b}, L={ab}^∗.

Aufgabe 1.74 Es sei (S,·) eine Halbgruppe und L⊆S. Die durch u∼L v ⇐⇒ (xuy∈L⇔xvy ∈L)

f¨ur alle u, v, x, y ∈ S definierte Relation ist eine Kongruenzrelation auf (S,·).

Handelt es sich bei (S,·) um ein Monoid, so ist L eine Vereinigung von Kongru- enzklassen, n¨amlich L=^S_x∈L[x]∼_L.

Aufgabe 1.75 Zeigen Sie, daß die Teilbarkeitsrelationf¨ur Halbgruppen reflexiv und transitiv ist.

Aufgabe 1.76 Beweisen Sie die Behauptungen aus Bemerkung 1.56.

Aufgabe 1.77 Der deterministische Automat A = ({1,2,3,4,5,6},{a, b},·) sei durch die Automatentafel gem¨aß

· 1 2 3 4 5 6 t_a 2 3 4 6 6 4 t_b 5 5 4 2 5 2

gegeben. Als Startzustand sei 1 festgelegt, die Menge der Endzust¨ande sei F = {1,4,6}. Ermitteln Sie den zugeh¨origen reduzierten AutomatenA⁰ und geben Sie dessen Graphen an.

Aufgabe 1.78 Der deterministische Automat A = ({1,2,3,4,5,6},{0,1},·) sei durch die Automatentafel gem¨aß

· 1 2 3 4 5 6 t₀ 2 2 6 5 2 6 t₁ 4 3 1 4 3 6

gegeben. Als Startzustand sei 1 festgelegt, die Menge der Endzust¨ande sei F = {6}. Ermitteln Sie den zugeh¨origen reduzierten Automaten A⁰ und geben Sie dessen Graphen an.

(25)

Aufgabe 1.79 Zeigen Sie, daß die in Bemerkung 1.53 a) definierte Nerode- Relation∼_r eine Rechtskongruenz ist, die∼_L umfaßt.

Aufgabe 1.80 Es sei A = (Q, X,·) ein deterministischer Automat und q₀ ∈Q.

Zeigen Sie, daß durch

u∼q0 v ⇐⇒ q0·u=q0·v

f¨ur alle u, v ∈ X^∗ eine Rechtskongruenz auf dem freien Monoid (X^∗,·) definiert ist.

Aufgabe 1.81 Geben Sie einen endlichen deterministischen Automaten an, der die folgende Sprache akzeptiert

L={w∈ {a, b}^∗ |`_a(w)≥3}.

Aufgabe 1.82 Jemand argumentiert wie folgt:

1. F¨ur jede formale Sprache L ⊆ X^∗ sind L = L∪ {ε} und ε ∈ L gleichwertig.

Dies gilt insbesondere f¨ur jede regul¨are Sprache.

2. Ist L ⊆ X^∗ eine Sprache, die von dem endlichen deterministischen Automa- ten A = (Q, X,·, q0, F) mit dem Anfangszustand q0 und den Endzust¨anden F erkannt wird, d. h. giltL=L(A), so istε ∈L gleichwertig zu q₀ ∈F.

3. Ist A = (Q, X,·, q₀, F) ein beliebiger endlicher deterministischer Automat, der mit dem Anfangszustand q0 und den Endzust¨anden F die regul¨are Sprache L=L(A) erkennt, so wird durch A⁰ = (Q, X,·, q₀, F ∪ {q₀}) ein endlicher deterministischer Automat definiert, der die SpracheL(A⁰) = L∪ {ε} erkennt.

Ist diese Argumentationskette korrekt?

Aufgabe 1.83 Es sei A = (Q, X,·, q0, F) ein endlicher deterministischer Auto- mat, der die Sprache L = L(A) erkennt. Zur Erkennung der Sprache L⁺ werde durch die folgende “R¨uckkopplung” der (nichtdeterministische!) ε-Automat A⁰ = (Q, X, δ, q0, F) konstruiert mit

δ ={(q, x, q⁰)|q, q⁰ ∈Q, x∈X mit q·x=q⁰} ∪ {(q, ε, q₀)|q ∈F}.

Wie kann man A⁰ so abändern, daß er keine ε- Übergänge mehr enthält?

(26)

2 Regelgrammatiken und Regelsprachen

Im Jahr 1914 führte der norwegische Mathematiker Axel Thue (1863 - 1922) die heute nach ihm benannten Systeme zur Manipulation von Zeichenketten über einem beliebigen Alphabet ein. Dabei ging es ihm vor allem um die Untersuchung von Wortproblemen. Hierauf aufbauend führte dann der Linguist Noam Chomsky in den Jahren 1959 - 1963 eine ganze Hierarchie solcher Systeme ein, die heute Regelgrammatiken verschiedenen Typs genannt werden. Chomsky wollte mit ihnen die Grammatiken natürlicher Sprachen formalisieren und näher untersuchen.

Definition 2.1 Ein Produktionssystem oder Semi-Thue-System P = (X, R) besteht aus einemAlphabetXund einer nichtleeren, endlichen MengeR ⊂X^∗×X^∗ vonProduktionsregeln. Die Elemente (u, v)∈Rnennt man auch definierende Re- lationen und schreibt sie in der Form u → v. Das Produktionssystem heißt ein Thue-System, wenn die Relation R symmetrisch ist, wenn also mit u → v stets auchv →u gilt.

Definition 2.2 Es seiP = (X, R) ein Produktionssystem. FürWörterx, y ∈X^∗ definiert man die Relation x → y, wenn es Wörter z₁, z₂ ∈ X^∗ und eine Regel u → v aus R gibt, so daß x = z₁uz₂ und y = z₁vz₂ gelten. Weiterhin soll die Relationx→^∗ y genau dann gelten, wenn es endlich viele Wörter w₀, w₁, . . . , w_n (n ≥1) ausX^∗mitx=w₀, w_n=yundwi−1 →w_ifüri= 1, . . . , ngibt. Man sagt dann,ysei ausxdurchP innSchritten ableitbaroderxsei inyüberführbar. Eine derartige Ableitung heißt minimal, wenn die Wörter w_i paarweise verschieden sind.

Bemerkung 2.3 a) Die Ableitbarkeitsrelation→^∗ aufX^∗ ist ersichtlich reflexiv und transitiv und es gilt f¨ur allex, y, u, v ∈X^∗

x→^∗ y, u →^∗ v =⇒xu→^∗ yv.

(23)

b) F¨ur ein Thue-System ist →^∗ auch symmetrisch und wegen (23) daher eine Kongruenzrelationauf demMonoid(X^∗,·). Also existiert dasRestklassenmonoid X^∗/→^∗.

c) Unter dem Wortproblem für ein Semi-Thue-System P versteht man das Pro- blem, einen Algorithmus zu finden, der für beliebige Wörterx, y ∈X^∗ in endlich vielen Schritten entscheidet, ob x→^∗ ygilt oder nicht. Das allgemeine Wortpro- blem für Semi-Thue-Systemeist die Frage nach einem Algorithmus, der für jedes Semi-Thue-System diese Entscheidung in endlich vielen Schritten findet.

(27)

d) Für Thue-Systeme läuft das Wortproblem darauf hinaus zu entscheiden, ob für zwei beliebige Wörter x, y ∈ X^∗ in dem Restklassenmonoid X^∗/→^∗ bereits [x] = [y] gilt.

e) Man kann zeigen, daß das allgemeine Wortproblem sowohl für Semi-Thue- Systeme als auch für Thue-Systeme unlösbar ist. Weiterhin kann man sogar konkrete Semi-Thue-Systeme und Thue-Systeme angeben, für die das jeweili- ge Wortproblem unlösbar ist. Einen Beweis findet man etwa in Hans Hermes, Aufzählbarkeit, Entscheidbarkeit, Berechenbarkeit, Springer-Verlag, Berlin 1971.

Dort finden sich auch Literaturangaben zu zahlreichen Originalarbeiten aus diesem Problemkreis.

Beispiel 2.4 Es seiP = (X, R) dasProduktionssystem mit demAlphabet X = {S, L, K, W, B, a, b}und der RegelmengeR, die aus den folgenden Regeln besteht.

S → LaK

(24)

aK → W bbK (25)

aW → W bb (26)

LW b → LaB (27)

LW b → aB (28)

Bb → aB (29)

BK → K

(30)

BK → ε

(31)

Die Regeln (27) und (28) zeigen, daß ein Regelsystem im allgemeinen nichtde- terministisch sein kann. In dem obigen Regelsystem gelten die folgenden beiden Ableitungen

S → LaK →LW bbK (32)

→ aBbK →aaBK →aa (33)

S → LaK →LW bbK (34)

→ LaBbK →LaaBK →LaaK (35)

→ LaW bbK →LW bbbbK →aBbbbK →aaBbbK (36)

→ aaaBbK →aaaaBK →aaaa, (37)

(28)

wobei jede Ableitung mit dem Wort S beginnt und das jeweils letzte Wort der Ableitung stets aus der Menge {a}^∗ stammt (vgl. die nächste Definition). Es kann also auch Wörter geben, für die Alternativen bei der weiteren Ableitung bestehen. Diese Alternativen können wieder zum selben Wort führen oder, wie hier, zu verschiedenen Wörtern.

Um Regelsysteme etwas kompakter schreiben zu k¨onnen, faßt man alternative Regeln mit denselben linken Seiten auch zu einer Regel zusammen, wobei man die Alternativen auf der rechten Seite durch den senkrechten Strich “|” trennt, also hier etwa LW B →LaB|aB und BK →K |ε.

Definition 2.5 Eine Regelgrammatik oder Typ-0-Grammatik G = (V, T, R, S) besteht aus einemVariablenalphabetV, einemTerminalzeichenalphabetT mitV∩ T =∅, einer endlichen MengeRvonProduktionsregelnuber dem¨ Gesamtalphabet X =V ∪T und einerStartvariablenS ∈V. Dabei soll f¨ur jede Regelu→v ausR inumindestens eine Variable vorkommen. Die MengeL(G) = {x∈T^∗ |S →^∗ x}

heißt die vonG erzeugte Regelsprache. Die Elemente w∈X^∗ mit S →^∗ w nennt man auchSatzformen von G.

Bemerkung 2.6 a) Für jede RegelgrammatikGist die SpracheL(G) offensichtlich aufzählbar, da es wegen der Endlichkeit der Regelmenge nur endlich viele Wörter geben kann, die sich aus der Startvariablen innSchritten ableiten lassen.

Diese Wörter lassen sich für jedes n (und damit insgesamt) effektiv aufzählen.

b) Es gibt RegelgrammatikenG, f¨ur die L(G) nicht entscheidbar ist, d. h. es ist dannX^∗ \L(G) nicht aufz¨ahlbar.

c) Die RegelgrammatikGentstehe aus der RegelgrammatikGdadurch, daß man jede Regel u→v ∈ R zu der Regel u→ v ∈R umformt. Offensichtlich ist dann L(G) die gespiegelte Sprache zu L(G).

Beispiel 2.7 Es sei T ein beliebiges Alphabet, S /∈T und V ={S}.

a) F¨ur die Regelgrammatik G = (V, T,{S → S}, S) ist L(G) = ∅, also ∅ eine Regelsprache.

b) Ist L = {w₁, . . . , w_n} ⊂ T^∗(n > 0) eine beliebige endliche Sprache ¨uber T, so wird f¨urR={(S, w₁), . . . ,(S, w_n)}eine Regelgrammatik G= (V, T, R, S) mit L=L(G) definiert. Jede endliche Sprache ist daher eine Regelsprache.

c) IstR ={S →, S →aS | f¨ur allea ∈T}, so wird durchG= (V, T, R, S) eine Regelgrammatik mit L(G) = T^∗ definiert. Ersetzt man die Regel S → durch die endlich vielen RegelnS →a f¨ur jedes a∈T, so sieht man, daß auchT⁺ eine Regelsprache ist.

(29)

Beispiel 2.8 a) F¨ur V = {S, L, K, W, B}, T = {a, b} und R wie in Beispiel 2.4 istG= (V, T, R, S) eineTyp-0-Grammatik mit L(G) ={a⁽²ⁿ⁾ |n≥1}=L₂ aus Beispiel 1.19.

b) Erweitert man die Variablenmenge um eine neue Startvariable S₀, das Ter- minalalphabet um ein Begrenzungszeichen # und die Regelmenge um die eine Regel S₀ →#S#, dann wird mit dieser neuen Grammatik offensichtlich die Re- gelsprache L⁰ = {#a⁽²ⁿ⁾# | n ∈ _N} erzeugt. Man erh¨alt dieselbe Sprache aber auch durch die folgende einfachere Grammatik G = ({S, L, R},{#, a, b}, R⁰, S) mit der Regelmenge

R⁰ ={S →#aL#, aL→Laa,#L→#R,#L→#, Ra→aaR, R#→L#, R#→#}.

Diese neue Grammatik beschreibt exakt das Verhalten einer (nichtdeterministi- schen) Turing-Maschine, welche diese Sprache erzeugt: Die Variablen L und R beschreiben das Verhalten eines Lese-Schreibkopfes, der zwischen den Begren- zungszeichen # nach links bzw. rechts hin- und herwandert und dabei die jeweils schon vorhandenen Buchstabenaverdoppelt. Ein erster Buchstabe awird durch die erste Regel zwischen die Begrenzungszeichen geschrieben.

Definition 2.9 Regelgrammatiken G und G⁰ heißen ¨aquivalent, wenn L(G) = L(G⁰) f¨ur die von ihnen erzeugten Regelsprachen gilt.

Folgerung 2.10 Jede Typ-0-Grammatik G= (V, T, R, S)ist ¨aquivalent zu einer Typ-0-GrammatikG⁰ = (V⁰, T, R⁰, S⁰), bei der f¨ur alle Regelnu⁰ →v⁰ ∈R⁰ bereits u⁰ ∈V⁰⁺ gilt.

Beweisidee: Sei X⁰ = {x⁰ | x ∈ T} eine Kopie von T, also eine zu T disjunk- te gleichmächtige Menge. Definiere V⁰ = V ∪X⁰ als neue Variablenmenge. Die Regeln aus R⁰ entstehen aus den Regeln u → v ∈ R, indem in u und v alle Terminalzeichen x ∈ T durch ihre Kopien x⁰ ∈ V⁰ ersetzt werden. Schließlich werden noch alle Regeln x⁰ → x für x ∈ T zu R⁰ hinzugefügt. Dann ist G⁰ eine Grammatik der gewünschten Form und ersichtlich gilt L(G) = L(G⁰).

Bemerkung 2.11 a) Manche Autoren nehmen wegen dieser Folgerung die For- derungu∈V⁺f¨ur alle Regelnu→v ∈Rin die Definition der Typ-0-Grammatik mit auf.

(30)

b) Die Idee in diesem Beweis, alle Terminalzeichenxdurch neue “Hilfs-Variablen”

x⁰ zu ersetzen, sämtliche Ableitungen zunächst mit diesen Hilfsvariablen durch- zuführen, und erst “am Schluß” der jeweiligen Ableitung die zusätzlichenabschlie- ßenden Regeln x⁰ → x anzuwenden, wird in vielen Beweisen angewandt, in der gewisse “Normalformen” für die Regeln hergeleitet werden sollen, vgl. Satz2.35.

Definition 2.12 Eine Regelgrammatik G = (V, T, R, S) heißt beschränkt oder Typ-1-Grammatik, wenn für alle Regeln u →v aus R stets `(u)≤`(v) gilt. Da- gegen heißt Gkontextsensitiv, wenn `(u)≤`(v) mit einer möglichen Ausnahme, nämlich S → ε gilt. Gehört diese Regel aber zu R, so darf S in keiner rechten Seite v einer Regel vorkommen.

Beispiel 2.13 a) Die Regelgrammatik aus Beispiel2.7 a) ist eine Typ-1-Gram- matik.

b) Die Regelgrammatik aus Beispiel2.7b) ist genau dann eine Typ-1-Grammatik, wennw_i 6=ε f¨ur allei gilt. Sie ist aber stets kontextsensitiv.

c) In Beispiel 2.7 c) ist die f¨ur L(G) = T⁺ gegebene Grammatik eine Typ-1- Grammatik.

d) Die Grammatik aus Beispiel2.8 ist keine Typ-1-Grammatik wegen der Regeln (28), (30) und insbesondere (31).

Bemerkung 2.14 a) Gilt x →^∗ y f¨ur eine Ableitung bez¨uglich einer Typ-1- Grammatik G, so folgt `(x)≤`(y). Insbesondere ist L(G)ε-frei, d. h. es gilt ε6∈

L(G). Da manche Autoren diese M¨oglichkeitε ∈L(G) zulassen wollen, definieren sie Typ-1-Grammatiken als kontextsensitive Grammatiken im obigen Sinn. Dies macht die Inklusionen der weiter unten definierten Sprachklassen ¨uberschaubarer (vgl. Bemerkung2.36).

b) IstGeine beschr¨ankte (oder kontexsensitive) Regelgrammatik, so istL(G)entscheidbar, d. h. nebenL(G) ist auchT^∗\L(G) aufz¨ahlbar (vgl. Bemerkung2.6b)).

Wegen w = ε ∈ L(G) ⇐⇒ S → ε ∈ R für eine kontexsensitive Grammatik G, bleibt die Fragew∈L(G) in jedem Fall nur noch fürw 6=ε zu entscheiden. We- gen der Beschränktheit von G ist w ∈ L(G) aber in höchstens |X|^`(w) Schritten aus S ableitbar und alle (endlich vielen) Ableitungen dieser Länge sind effektiv aufzählbar.

c) Es gibt Regelgrammatiken, zu denen keine¨aquivalenten, beschr¨ankten Regel- grammatiken existieren.