Semantik von Programmiersprachen Sommersemester 2012

(1)

Sommersemester 2012

Lehrstuhl f¨ ur Programmierparadigmen

Andreas Lochbihler andreas.lochbihler@kit.edu

(2)

1 Einf¨uhrung 5

1.1 Was ist eine Semantik? . . . 5

1.2 Warum formale Semantik? . . . 5

1.3 Operational, denotational und axiomatisch . . . 7

2 Die Sprache While 9 2.1 Syntax . . . 9

2.2 Zustand . . . 9

2.3 Semantik von Ausdr¨ucken . . . 10

3 Operationale Semantik f¨ur While 11 3.1 Big-Step-Semantik f¨urWhile. . . 11

3.2 Determinismus der Big-Step-Semantik . . . 12

3.3 Small-Step-Semantik f¨urWhile . . . 13

3.4 Aquivalenz zwischen Big-Step- und Small-Step-Semantik . . . .¨ 16

3.5 Aquivalenz von Programmen¨ . . . 17

4 Ein Compiler f¨ur While 19 4.1 Ein abstraktes Modell eines Rechners ASM . . . 19

4.2 Ein Compiler vonWhilenach ASM . . . 20

4.3 Korrektheit des Compilers . . . 20

4.4 Vergleich der verschiedenen Semantiken . . . 26

5 Erweiterungen von While 27 5.1 NichtdeterminismusWhile_{N D} . . . 27

5.1.1 Big-Step-Semantik . . . 27

5.1.2 Small-Step-Semantik . . . 27

5.2 Parallelit¨atWhile_{P AR}. . . 28

5.3 Bl¨ocke und lokale VariablenWhile_B . . . 29

5.4 Ausnahmen While_X . . . 30

5.5 Prozeduren . . . 33

5.5.1 Prozeduren ohne Parameter WhileP ROC . . . 33

5.5.2 Prozeduren mit einem Parameter WhileP ROCP . . . 34

5.6 Getypte VariablenWhile_T . . . 38

5.6.1 Typen f¨urWhile_T . . . 38

5.6.2 Ein Typsystem f¨urWhileT . . . 39

5.6.3 Small-Step-Semantik f¨urWhile_T . . . 41

5.6.4 Typsicherheit von While_T . . . 42

6 Denotationale Semantik 45 6.1 Denotationale Semantik . . . 45

6.2 Fixpunkttheorie . . . 50

6.3 Existenz des Fixpunkts f¨urwhile . . . 53

6.4 Bezug zur operationalen Semantik . . . 55

6.5 Continuation-style denotationale Semantik . . . 58

7 Axiomatische Semantik 63 7.1 Ein Korrektheitsbeweis mit der denotationalen Semantik . . . 63

(3)

7.4 Korrektheit der axiomatischen Semantik . . . 68

7.5 Vollst¨andigkeit der axiomatischen Semantik . . . 69

7.6 Semantische Pr¨adikate und syntaktische Bedingungen . . . 71

7.7 Verifikationsbedingungen . . . 72

(4)

Termine

Vorlesung 2-stündig Mi, 14 – 15.30h, SR 236, Informatik-Hauptgebäude Ubung:¨ 2-stündig Di, 14 – 15.30h, SR 236, Informatik-Hauptgebäude

Unterlagen

Vorlesung Webseite http://pp.info.uni-karlsruhe.de/lehre/SS2012/semantik/

Skript kapitelweise als PDF

Ubung¨ http://pp.info.uni-karlsruhe.de/lehre/SS2012/semantik/uebung.php Ubungsbl¨¨ atter:

• Ver¨offentlichung am Mittwoch nach der Vorlesung bzw. am Donnerstag

• Besprechung in der folgenden ¨Ubung

• Keine Abgabe und keine Korrektur

Anrechenbarkeit Diplom Informatik:

Vertiefungsgebiete

”Theoretische Grundlagen“ und

”Softwaretechnik und ¨Ubersetzerbau“

Master Informatik:

Module [IN4INSPT] Sprachtechnologien und [IN4INFM] Formale Methoden ECTS-Punkte: 4

Literatur

• Hanne Riis Nielson, Flemming Nielson: Semantics with Applications. An Appetizer.

Springer, 2007. ISBN: 978-1-84628-691-9.

Grundlage der meisten Themen der Vorlesung, sehr anschaulich und gut verst¨andlich

• John C. Reynolds: Theories of Programming Languages.

Cambridge University Press, 1998. ISBN: 0-521-59414-6.

Fokus auf denotationaler Semantik

• Benjamin C. Pierce: Types and Programming Languages.

MIT Press, 2002. ISBN: 0-262-162209-1.

Schwerpunkt auf dem Lamda-Kalkül und Typsystemen, mit sehr guten Erklärungen, auch zu weiterführenden Themen.

• Glynn Winskel: The Formal Semantics of Programming Languages. An Introduction.

MIT Press, 1993. ISBN: 0-262-23169-7.

Ausführlicher Beweis der Unentscheidbarkeit eines vollständigen axiomatischen Kalküls

(5)

1 Einf¨ uhrung

1.1 Was ist eine Semantik?

Syntax und Semantik sind zwei unabdingbare Bausteine der Beschreibung von (Programmier-)Sprachen:

Syntax kümmert sich darum, welche Zeichenfolgen gültige Sätze (Programme) der Sprache sind. Syntax umfasst also Vokabular (Schlüsselwörter) und Grammatik. Semantik beschreibt, was die Bedeutung eines gültigen Satzes (Programms) sein soll. Für Programmiersprachen heißt das: Wie verhält sich das Programm, wenn man es ausführt?

Syntax legt auch den Aufbau eines Satzes, i. d. R. ein Baum, fest und erkl¨art wie man von einer Zeichenfolge zum Syntaxbaum kommt. Eine Semantik beschreibt, wie man dieser syntaktischen Struktur eine Bedeutung gibt, d.h.: Was ist die Bedeutung eines einzelnen Konstrukts? Wie erh¨alt man die Gesamtbedeutung aus den einzelnen Teilen?

Syntax und Semantik vieler Programmiersprachen sind standardisiert (C, C++, Pascal, Java, . . . ). Für die Definition der Syntax werden formale Techniken routinemäßig in der Praxis eingesetzt: kontext- freie Grammatiken (EBNF). Das Verhalten von Konstrukten der Programmiersprache und deren Zusammenwirken beschreiben die meisten dieser Standards allerdings nur in natürlicher Sprache, meistens auf englisch oder nur anhand konkreter Beispiele. Für umfangreiche Programmiersprachen ist es auf diese Weise fast unmöglich, alle möglichen Kombinationen eindeutig festzulegen und dabei trotzdem Widerspruchsfreiheit zu garantieren. Deswegen gibt es auch formale, d.h. mathematische, Beschreibungstechniken für Semantik, die das Thema dieser Vorlesung sind. Die funktionale Sprache ML wurde beispielsweise vollständig durch eine formale Semantik definiert; auch für Java gibt es formale Modellierungen, die zwar nicht Teil der Sprachdefinition sind, aber den Entwurf und die Weiterentwicklungen wesentlich beeinflussten (z.B. Featherweight Java, Java light, Jinja).

1.2 Warum formale Semantik?

Die einfachste Definition einer Sprache ist mittels eines Compilers: Alle Programme, die der Compiler akzeptiert, sind syntaktisch korrekt; die Semantik ist die des Zielprogramms. Eine solche Definition ist aber sehr problematisch:

1. Keine Abstraktion. Um das Verhalten eines Programmes zu verstehen, muss man den Compiler und das Kompilat in der Zielsprache verstehen. F¨ur neue, abstrakte Konzepte in der Program- miersprache gibt es keine Garantie, dass die Abstraktionsschicht nicht durch andere Konstrukte durchbrochen werden kann – geht es doch, ist das eine der Hauptfehlerquellen bei der Entwicklung von Programmen.

Beispiele:

• Pointer-Arithmetik in C++ kann die Integrit¨at von Objekten zerst¨oren, weil damit beliebig (auch auf private) Felder zugegriffen werden kann.

• setjmp/longjmpin C widerspricht dem Paradigma, dass Methoden stack-artig aufgerufen werden.

• LÂTEX ist nur ein Aufsatz auf TEX, der zwar in vielen Fällen eine gute Abstraktionsschicht schafft, aber diese nicht garantieren kann. Fast jeder ist schon über unverständliche TEX- Fehlermeldungen und Inkompatibilitäten zwischen LÂTEX-Paketen gestoplert.

2. Plattformabhängigkeit und Überspezifikation. Ein Wechsel auf eine andere Zielsprache oder einen anderen Compiler ist fast unmöglich. Schließlich ist auch festgelegt, wie viele einzelne

(6)

Ausf¨uhrungsschritte (z. B. Anzahl der Prozessorzyklen) jedes einzelne Konstrukt genau ben¨otigen muss.

Zwischen

”Sprachdefinition“ und Implementierungsdetails des Compilers kann nicht unterschieden werden. Weiterentwicklungen aus der Compiler-Technik sind damit ausgeschlossen.

3. Bootstrapping. Auch ein Compiler ist nur durch seinen Programmtext definiert. Was ist aber die Semantik dieses Programmtextes?

Eine Semantikbeschreibung in Prosa wie bei den meisten Sprachstandards ist zwar besser, kann aber Mehrdeutigkeiten, Missverständnisse oder Widersprüche auch nicht verhindern. Demgegenüber stehen die Vorteile mathematischer Beschreibungen einer Semantik:

1. Vollständige, rigorose Definition einer Sprache. Jedes syntaktisch gültige Programm hat eine eindeutige, klar festgelegte Semantik. Mathematische Beschreibungen sind syntaktisch oft viel kürzer als englischer Fließtext. Programmierer können die Semantik als Nachschlagereferenz verwenden, um subtile Feinheiten der Sprache zu verstehen. Compiler-Bauer können die Semantik einer solchen Sprache als Korrektheitskriterium ihres Compilers verwenden. Damit verhalten sich Anwender-Programme gleich, unabhängig vom verwendeten (korrekten) Compiler.

2. Nachweis von Programmeigenschaften. Ohne formale Semantik als Grundlage lassen sich Eigen- schaften eines Programms nicht beweisen, ja nicht einmal mathematisch aufschreiben. Dabei unterscheidet man zwischen Eigenschaften, die alle Programme erf¨ullen und damit Meta-Eigen- schaften der Sprache bzw. Semantik sind (z. B. Typsicherheit), und solchen eines einzelnen Programms (z. B. Korrektheit eines Algorithmus).

3. Unterstützung beim Programmiersprachenentwurf. Eine Programmiersprache mit vielen verschiedenen Konzepten, die klar, verständlich und ohne unnötige Sonderfälle zusammenwirken, zu entwerfen, ist sehr schwierig. Bereits der Versuch, eine formale Semantik für eine Programmier- sprache zu entwerfen, deckt viele Inkonsistenzen und unerwartete Interaktionen auf.

Hat man eine formale Beschreibung der Semantik, lässt sich automatisch ein prototypischer Interpreter für die Sprache erzeugen, z. B. als Prolog-Programm. Dadurch können verschiedene Designentscheidungen beim Entwurf der Semantik an konkreten Beispielen praktisch ausprobiert werden.

Programmverifikation ist einfacher, wenn die Semantik der Programmiersprache mathematisch einfach und klar ist. Eine zufällig, nach Gutdünken entworfene Programmiersprache hat in der Regel ein sehr kompliziertes mathematisches Modell. Dementsprechend ist es auch schwierig, darüber Beweise zu führen, da stets viele Sonderfälle berücksichtigt werden müssen.

4. Klare und konsistente Begrifflichkeit. Formale Semantik arbeitet mit der Sprache und den Begriffen der Mathematik, ¨uber deren Bedeutung man sich im Klaren ist. Damit werden Mehrdeutigkeiten und Missverst¨andnisse von vornherein ausgeschlossen.

Beispiele:

• Was ist der Wert vonxam Ende?

b = true; c = false;

if (b) if (c) x = 1; else x = 2;

• Was ist der Wert vonxbzw. i nach Ausf¨uhrung des folgenden C-Fragments? Was w¨are er in Java?

(7)

int i = 1;

i += i++ + ++i;

• Sind die beiden Initialisierungen vonb¨aquivalent?

boolean f(int a, int b) { return (a == 0) && (b == 0);

}

boolean b = (1 == 0) && (2 / 0 == 0);

boolean b = f(1, 2 / 0);

1.3 Operational, denotational und axiomatisch

In dieser Vorlesung werden die drei bekanntesten Beschreibungsarten f¨ur Semantiken vorgestellt – mit einem Schwerpunkt auf operationaler Semantik:

Operational Die Bedeutung eines Konstrukts ergibt sich aus seinen (abstrakten) Ausführungsschrit- ten, die durch symbolische Regeln beschrieben werden. Neben dem Ergebnis der Berechnung wird auch modelliert, wie die Berechnung zum Ergebnis kommt. Die Regeln beschreiben dabei nur eine mögliche (idealisierte) Implementierung der Sprache, reale Implementierungen können andere, äquivalente Abläufe verwenden.

Denotational Jedes Konstrukt wird als mathematisches Objekt realisiert, welches nur den Effekt seiner Ausf¨uhrung modelliert. Im Gegensatz zur operationalen Semantik ist irrelevant, wie der Effekt zustande kommt.

Axiomatisch Die Bedeutung eines Programms wird indirekt festgelegt, indem beschrieben wird, welche Eigenschaften des Programms (in einem zu entwerfenden Logik-Kalk¨ul) beweisbar sind.

Die drei verschiedenen Ansätze ergänzen sich: Für Compiler und Implementierungen sind operationale Semantiken gut geeignet. Denotationale Konzepte finden sich oft in der Programmanalyse. Programm- verifikation stützt sich auf die axiomatische Semantik. Zu jedem Ansatz werden wir eine Semantik für eine einfache imperative Sprache – ggf. mit verschiedenen Spracherweiterungen – entwickeln und die Beziehung der verschiedenen Semantiken zueinander untersuchen.

Beispiel 1. Semantik des Programms z := x; x := y; y := z

1. Die operationale Semantik beschreibt die Semantik, indem sie definiert, wie das Programm auszuf¨uhren ist: Eine Sequenz von zwei durch ; getrennten Anweisungen f¨uhrt die einzelnen Anweisungen nacheinander aus. Eine Zuweisung der Form < V ariable > := < Ausdruck >

wertet zuerst den Ausdruck zu einem Wert aus und weist diesen Wert dann der Variablen zu.

F¨ur einen Zustand [x7→5,y7→7,z7→0], der den Variablenx,yundzdie Werte 5, 7 und 0 zuweist, ergibt sich folgende Auswertungssequenz:

hz := x; x := y; y := z, [x7→5,y7→7,z7→0]i

→₁ hx := y; y := z, [x7→5,y7→7,z7→5]i

→₁ hy := z, [x7→7,y7→7,z7→5]i

→₁ [x7→7,y7→5,z7→5]

(8)

2. Die denotationale Semantik kümmert sich nur um den Effekt der Ausführung, nicht um die einzelnen Berechnungsschritte. Entsprechend ist die Semantik eines solchen Programms eine Funktion, die einen Ausgangszustand in einen Endzustand überführt. Für eine Sequenz erhält man die Funktion durch Komposition (Hintereinanderausführung) der Funktionen der beiden Anweisungen. Die Bedeutung einer Zuweisung ist die Funktion, die den übergebenen Zustand so

¨andert, dass der Variablen dann der Wert des Ausdrucks zugewiesen ist.

F¨ur das Programm ergibt sich dann:

DJz := x; x := y; y := zK(σ) = (DJy := zK◦ DJx := yK◦ DJz := xK) (σ)

=DJy := zK(DJx := yK(DJz := xK(σ)))

=DJy := zK(DJx := yK(σ[z7→σ(x)]))

=DJy := zK(σ[z7→σ(x), x7→σ[z7→σ(x)](y)])

=DJy := zK(σ[z7→σ(x), x7→σ(y)])

=σ[z7→σ(x), x7→σ(y), y7→σ[z7→σ(x), y7→σ(y)](z)]

=σ[x7→σ(y), y7→σ(x), z7→σ(x)]

F¨urσ = [x7→5,y7→7,z7→0] ergibt dies wieder:

DJz := x; x := y; y := zK(σ) = [x7→7,y7→5,z7→5]

3. Axiomatische Semantik konzentriert sich auf die Korrektheit eines Programms bezüglich Vor- und Nachbedingungen. Immer, wenn ein Startzustand die Vorbedingung erfüllt, dann sollte – sofern das Programm terminiert – nach der Ausführung des Programms mit diesem Startzustand der Endzustand die Nachbedingung erfüllen.

{x=n∧y=m}z := x; x := y; y := z{x=m∧y=n}

Dabei ist x = n ∧y = m die Vorbedingung und x = m∧y = n die Nachbedingung. Die Hilfsvariablen (logical variables)nund m, die nicht im Programm vorkommen, merken sich die Anfangswerte vonxund y.

Eine axiomatische Semantik definiert ein Regelsystem, mit dem Aussagen wie obige hergeleitet werden können. Beispielsweise ist {P}c1; c2{Q} für eine Sequenz c1; c2 herleitbar, wenn {P}c₁{R} und{R}c₂{Q}für eine BedingungR herleitbar sind. Dadurch ergeben sich viele Bedingungen an das Programmverhalten, die dieses dadurch (möglichst vollständig) beschreiben.

Wichtig dabei ist, dass die Regeln korrekt sind, d.h, keine widersprüchlichen Bedingungen herleitbar sind. Umgekehrt sollen sich möglichst alle Eigenschaften eines Programms durch das Kalkül herleiten lassen (Vollständigkeit).

(9)

2 Die Sprache While

Whileist eine einfache, imperative Programmiersprache, für die in dieser Vorlesung in allen drei Ansätzen eine Semantik ausgearbeitet wird. Obwohl eine Semantik erst auf einem abstrakten Syntaxbaum aufbaut, muss man sich auf eine konkrete Syntax festlegen, um überhaupt Programme textuell aufschreiben zu können.

2.1 Syntax

Programme werden üblicherweisein Schreibmaschinenschriftdargestellt. Deren Syntax wird durch eine BNF-Grammatik mit drei syntaktischen Kategorien beschrieben: arithmetische Ausdrücke Aexp, boolesche AusdrückeBexpund AnweisungenCom. Außerdem braucht man noch numerische LiteraleNum und einen unendlichen Vorrat Varan (Programm-)Variablen. Die Darstellung der numerischen Literale und (Programm-)Variablen ist nicht weiter relevant, im Folgenden werden die Dezimaldarstellung (z.B.

120,5) bzw. einfache Zeichenketten wie x,catch22 verwendet.

Variablenkonvention: Um nicht ständig die syntaktische Kategorie einer (Meta-)Variable angeben zu müssen, bezeichne astets einen arithmetischen Ausdruck,b einen booleschen,ceine Anweisung, nein numerisches Literal undx eine Programmvariable ausVar – entsprechende Dekorationen mit Indizes, Strichen, usw. eingeschlossen. Dabei muss man zwischen einer Meta-Variablenx, die für eine beliebige, aber feste Programmvariable ausVar steht, und den konkreten Programmvariablen wie x,y selbst unterscheiden.

Definition 1 (Syntax von While). Die Syntax von Ausdr¨ucken und Anweisungen sei durch folgende kontext-freie BNF-Grammatik gegeben:

Aexp a ::= n|x |a₁ - a₂ |a₁ * a₂

Bexp b ::= true|a1 <= a2 |not b |b1 && b2

Com c ::= skip|x := a|c1; c2 |if (b) then c1 else c2 |while (b) do c

Obwohl diese Sprache minimalistisch ist, sind viele weitere Programmkonstrukte ausdr¨uckbar: Bei- spielsweise sinda₁ + a₂,a₁ == a₂,false undb₁ || b₂ nur syntaktischer Zucker f¨ur

a1 - (0 - a2), (a1 <= a2) && (a2 <= a1), not true und not ((not b1) && (not b2))

Durch diese Reduktion auf das Wesentliche wird es einfacher, eine Semantik anzugeben und Beweise zu führen, da weniger Fälle berücksichtigt werden müssen.

Obige Grammatik ist mehrdeutig, z. B. hatwhile (true) do skip; x := yzwei verschiedene Ablei- tungsbäume, d.h. zwei verschiedene Syntaxbäume. Da die Semantik aber erst auf dem Syntaxbaum aufbaut, ist das nicht wesentlich: Man kann immer mittels zusätzlicher Klammern den gewünschten Baum eindeutig beschreiben.

2.2 Zustand

Whileenthält Zuweisungen an (Programm-)Variablen x := aund Zugriff auf Variablen in arithmetischen Ausdrücken. EinZustand modelliert den Speicher für diese Variablen, der sich während der Ausführung eines Programms von einem Anfangszustand in einen Endzustand entwickelt. Für das

(10)

formale Modell ist ein Zustand, hier ¨ublicherweise mitσ bezeichnet, eine Abbildung vonVarnach Z, die jeder Variablenxeinen Wert σ(x) zuordnet. Die Menge aller dieser Zust¨ande sei Σ.

Ein realer Computer muss nat¨urlich viele weitere Informationen im Zustand speichern, die nicht in einem (abstrakten) Zustand aus Σ enthalten sind, z.B. die Zuordnung von Variablen zu Speicheradressen.

Diese weiteren Informationen sind aber f¨ur die Beschreibung des Verhaltens von Whilenicht relevant, der abstrakte Zustand und das Modell abstrahieren also davon.

2.3 Semantik von Ausdr¨ucken

Ausdrücke inWhile liefern einen Wert (Zahl oder Wahrheitswert) zurück, verändern aber den Zustand nicht. Da sie Variablen enthalten können, wird der Wert erst durch einen Zustand endgültig festgelegt.

F¨ur eine Zahl nin Programmdarstellung, in unserem Fall Dezimaldarstellung, liefere NJnKden Wert der Zahl als Element vonZ. Beispiel: N J123K= 123, wobei 123∈Aexpein arithmetischer Ausdruck und 123∈Zeine ganze Zahl ist.

Definition 2 (Semantik arithmetischer Ausdrücke). Für beliebige arithmetische Ausdrücke a definiertAJaKσ rekursiv über den Syntaxbaum den Wert vona im Zustandσ:

AJnKσ = NJnK AJxKσ = σ(x)

AJa1 - a2Kσ = AJa1Kσ− AJa2Kσ AJa₁ * a₂Kσ = AJa₁Kσ· AJa₂Kσ

AJ Kist also eine Funktion des TypsAexp⇒Σ⇒Z, definiert ¨uber strukturelle (primitive) Rekursion

¨uber den Syntaxbaum arithmetischer Ausdr¨ucke.

Beispiel 2. Was istAJa₁ + a₂Kσ?

a₁ + a₂ ist syntaktischer Zucker f¨ura₁ - (0 - a₂). Damit gilt:

AJa₁ + a₂Kσ =AJa₁ - (0 - a₂)Kσ=AJa₁Kσ− AJ0 - a₂Kσ=AJa₁Kσ−(AJ0Kσ− AJa₂Kσ)

=AJa₁Kσ−(0− AJa₂Kσ) =AJa₁Kσ+AJa₂Kσ Die syntaktische Abk¨urzung a1 + a2 ist also sinnvoll.

Analog zu arithmetischen Ausdrücken lässt sich der Wert von booleschen Ausdrücken definieren. Dabei bezeichnentt undff die beiden Wahrheitswerte inB.

Definition 3 (Semantik boolescher Ausdr¨ucke).

Die Semantik boolescher Ausdr¨ucke BJ K ist definiert durch:

BJtrueKσ = tt

BJa1 <= a2Kσ = AJa1Kσ ≤ AJa2Kσ BJnot bKσ = ¬BJbKσ

BJb₁ && b₂Kσ = BJb₁Kσ∧ BJb₂Kσ

Ubung:¨ Was istBJa1 == a2Kσ? Ist die Abkürzung sinnvoll? Was wäre, wenn auch Ausdrücke den Zustand ändern könnten?

(11)

3 Operationale Semantik f¨ ur While

Eine operationale Semantik fürWhile beschreibt nicht nur das Ergebnis einer Programmausführung, sondern auch, wie man zu diesem Ergebnis gelangen kann. Dafür gibt es zwei Modellierungsansätze:

Big-step Semantik (Auswertungssemantik, natural semantics): Hier wird beschrieben, wie man aus dem Verhalten der Teile eines Programmkonstrukts dessen Gesamtverhalten konstruiert.

Small-step Semantik (Transitionssemantik, structural operational semantics): Hier liegt der Fokus auf einzelnen, kleinen Berechnungsschritten, die nach vielen Schritten zum Ende der Programm- ausf¨uhrung gelangen.

3.1 Big-Step-Semantik f¨ur While

Eine Big-Step Semantik ist eine Auswertungsrelationhc, σi ⇓σ⁰, die für ein Programm cund einen Anfangszustandσ bestimmt, obσ⁰ ein möglicher Endzustand einer Ausführung vonc inσ ist.

Definition 4 (Big-Step-Semantik).

Die Auswertungsrelation hc, σi ⇓σ⁰ wird durch folgende Regeln induktiv definiert:

SkipBS:hskip, σi ⇓σ _Ass_BS:hx := a, σi ⇓σ[x7→ AJaKσ]

SeqBS: hc₀, σi ⇓σ⁰ c1, σ⁰

⇓σ⁰⁰ hc₀; c1, σi ⇓σ⁰⁰

IfTTBS: BJbKσ =tt hc₀, σi ⇓σ⁰

hif (b) then c0 else c1, σi ⇓σ⁰ ^IfFF^BS: BJbKσ =ff hc₁, σi ⇓σ⁰ hif (b) then c0 else c1, σi ⇓σ⁰

WhileFFBS: BJbKσ =ff hwhile (b) do c, σi ⇓σ

WhileTTBS: BJbKσ=tt hc, σi ⇓σ⁰

while (b) do c, σ⁰

⇓σ⁰⁰ hwhile (b) do c, σi ⇓σ⁰⁰

Formal isth , i ⇓ die kleinste Menge ¨uberCom×Σ×Σ, die unter obigen Regeln abgeschlossen ist.

Damit ergibt sich auch folgende Induktionsregel f¨urh , i ⇓ :

hc, σi ⇓σ⁰ ∀σ. P(skip, σ, σ) ∀x, a, σ. P(x := a, σ, σ[x7→ AJaKσ])

∀c₀, c1, σ, σ⁰, σ⁰⁰. hc₀, σi ⇓σ⁰∧ c1, σ⁰

⇓σ⁰⁰∧P(c0, σ, σ⁰)∧P(c1, σ⁰, σ⁰⁰)−→P(c0; c1, σ, σ⁰⁰)

∀b, c₀, c1, σ, σ⁰.BJbKσ =tt∧ hc₀, σi ⇓σ⁰∧P(c0, σ, σ⁰)−→P(if (b) then c0 else c1, σ, σ⁰)

∀b, c₀, c₁, σ, σ⁰.BJbKσ =ff∧ hc₁, σi ⇓σ⁰∧P(c₁, σ, σ⁰)−→P(if (b) then c₀ else c₁, σ, σ⁰)

∀b, c, σ. BJbKσ=ff−→P(while (b) do c, σ, σ)

∀b, c, σ, σ⁰, σ⁰⁰.BJbKσ=tt∧ hc, σi ⇓σ⁰∧

while (b) do c, σ⁰

⇓σ⁰⁰∧

P(c, σ, σ⁰)∧P(while (b) do c, σ⁰, σ⁰⁰)−→P(while (b) do c, σ, σ⁰⁰) P(c, σ, σ⁰)

(12)

Beispiel 3.

Semantik des Programms z := x; (x := y; y := z) im Zustand σ0 = ε[x7→5,y7→7,z7→0] als Ableitungsbaum:

hz := x, σ₀i ⇓σ₁ ^Ass^BS

hx := y, σ₁i ⇓σ₂ ^Ass^BS hy := z, σ₂i ⇓σ₃ ^Ass^BS hx := y; y := z, σ₁i ⇓σ₃ ^Seq^BS hz := x; (x := y; y := z), σ₀i ⇓σ₃ ^Seq^BS wobei σ₁ =σ₀[z7→5], σ₂ =σ₁[x7→7] undσ₃=σ₂[y7→5], also σ₃ =ε[x7→7,y7→5,z7→5].

Ubung:¨ Was ist der Ableitungsbaum von folgendem Programm f¨ur den Anfangszustand σ₀ =ε[x7→13, y7→5, z7→9]?

z := 0; while (y <= x) do (z := z + 1; x := x - y) Lemma 1 (Schleifenabwicklungslemma).

while (b) do c hat das gleiche Verhalten wieif (b) then (c; while (b) do c) else skip.

Beweis. Seiw=while (b) do cund w⁰ =if (b) then c; while (b) do c else skip. Zu zeigen:

hw, σi ⇓σ⁰ gilt genau dann, wennhw⁰, σi ⇓σ⁰. Beweis: Fallunterscheidung nach BJbKσ:

• FallBJbKσ =ff: Nach den Regeln der Big-Step-Semantik l¨asst sichhw, σi ⇓σ⁰ nur mit der Regel WhileFFBS ableiten (Regelinversion);hw⁰, σi ⇓σ⁰ nur mit den Regeln IfFFBS undSkipBS. Also:

BJbKσ=ff σ =σ⁰ hw, σi ⇓σ⁰ ⇔

BJbKσ=ff σ=σ⁰ hskip, σi ⇓σ⁰ w⁰, σ

⇓σ⁰

• FallBJbKσ =tt: Wieder mit Regelinversion gibt es nur die Regel_WhileTT_BS f¨urhw, σi ⇓σ⁰ und IfTTBS und_Seq_BS f¨urhw⁰, σi ⇓σ⁰. Also:

BJbKσ=tt A hc, σi ⇓σ^∗

B hw, σ^∗i ⇓σ⁰

hw, σi ⇓σ⁰ ⇔

BJbKσ =tt

A hc, σi ⇓σ^∗

B hw, σ^∗i ⇓σ⁰ hc; w, σi ⇓σ⁰ w⁰, σ

⇓σ⁰

3.2 Determinismus der Big-Step-Semantik

Eine Semantik istdeterministisch, wenn sie jedem Programm und jedem Anfangszustand maximal ein Verhalten zuordnet. F¨ur eine Big-Step-Semantik heißt dies konkret, dass dann auch die Endzust¨ande gleich sind.

Theorem 2 (Determinismus). h , i ⇓ ist deterministisch.

Beweis. Zu zeigen: Falls hc, σ₀i ⇓σ₁ undhc, σ₀i ⇓σ₂, dann giltσ₁ =σ₂.

Beweis: Induktion nachhc, σ₀i ⇓σ1 (σ2 beliebig). Damit P(c, σ0, σ1)≡ ∀σ₂. hc, σ₀i ⇓σ2 −→σ1 =σ2.

• Fall_Skip_BS: Zu zeigen: F¨ur alle σ giltP(skip, σ, σ), d.h.∀σ₂. hskip, σi ⇓σ₂ −→σ=σ₂.

Sei alsoσ2 beliebig mit hskip, σi ⇓σ2. Aus den Regeln der Big-Step-Semantik l¨asst sich dies nur mit der Regel_Skip_BS ableiten (Regelinversion). Damit folgt σ₂ =σ.

(13)

• Fall_Ass_BS: Zu zeigen: F¨ur alle x,aund σ giltP(x := a, σ, σ[x7→ AJaKσ]), d.h.

∀σ₂. hx := a, σi ⇓σ₂ −→σ[x7→ AJaKσ] =σ₂

Sei alsoσ2 beliebig mithx := a, σi ⇓σ2. Durch Regelinversion (_Ass_BS) folgtσ2=σ[x7→ AJaKσ].

• Fall_Seq_BS: Zu zeigen: F¨ur alle c0,c1, σ, σ⁰ und σ⁰⁰ mit hc₀, σi ⇓ σ⁰ und hc₁, σ⁰i ⇓ σ⁰⁰ gilt: Aus P(c₀, σ, σ⁰) und P(c₁, σ⁰, σ⁰⁰) folgt P(c₀; c₁, σ, σ⁰⁰), d.h.:

∀σ₂. hc₀, σi ⇓σ₂ −→σ⁰=σ₂

∧ ∀σ₂. c₁, σ⁰

⇓σ₂ −→σ⁰⁰=σ₂

−→ ∀σ₂. hc₀; c₁, σi ⇓σ₂ −→σ⁰⁰=σ₂

Sei also σ2 beliebig mit hc₀; c1, σi ⇓ σ2. Mit Regelinversion (SeqBS) gibt es ein σ^∗, so dass hc₀, σi ⇓σ^∗ undhc₁, σ^∗i ⇓σ2. Nach InduktionsannahmeP(c0, σ, σ⁰) folgt aushc₀, σi ⇓σ^∗, dass σ⁰ = σ^∗. Damit gilt auch hc₁, σ⁰i ⇓ σ₂ und mit der Induktionsannahme P(c₁, σ⁰, σ⁰⁰) folgt die Behauptung σ⁰⁰=σ2.

• FallIfTTBS: Zu zeigen: F¨ur alle b, c0, c1, σ und σ⁰ mit BJbKσ = tt und hc₀, σi ⇓ σ⁰ gilt: Aus P(c0, σ, σ⁰) folgt P(if (b) then c0 else c1, σ, σ⁰).

Sei also σ₂ beliebig mit hif (b) then c₀ else c₁, σi ⇓ σ₂, was nur durch die Regeln _IfTT_BS und IfFFBS ableitbar sein k¨onnte. WegenBJbKσ =ttist IfFFBS ausgeschlossen. Damit folgt dass hc₀, σi ⇓σ2 und mit der InduktionsannahmeP(c0, σ, σ⁰) die Behauptung σ⁰ =σ2.

• Fall_IfFF_BS: Analog zu_IfTT_BS.

• Fall_WhileTT_BS:

Zu zeigen: F¨ur alleb,c,σ,σ⁰ undσ⁰⁰ mit BJbKσ =tt,hc, σi ⇓σ⁰ undhwhile (b) do c, σ⁰i ⇓σ⁰⁰ gilt: Aus P(c, σ, σ⁰) und P(while (b) do c, σ⁰, σ⁰⁰) folgt P(while (b) do c, σ, σ⁰⁰).

Sei also σ2 beliebig mit hwhile (b) do c, σi ⇓σ2. Mit Regelinversion (_WhileTT_BS,BJbKσ =tt schließt _WhileFF_BS aus) gibt es ein σ^∗, so dass hc, σi ⇓ σ^∗ und hwhile (b) do c, σ^∗i ⇓ σ₂. Aus hc, σi ⇓ σ^∗ folgt mit der Induktionsannahme P(c, σ, σ⁰), dass σ⁰ = σ^∗. Damit folgt mit der Induktionsannahme P(while (b) do c, σ⁰, σ⁰⁰) aus hwhile (b) do c, σ^∗i ⇓ σ2 die Behauptung, dass σ⁰⁰=σ₂.

• Fall_WhileFF_BS: Zu zeigen: F¨ur alle b,c und σ mitBJbKσ=ffgiltP(while (b) do c, σ, σ).

Sei alsoσ2 beliebig mithwhile (b) do c, σi ⇓σ⁰⁰. Nach Regelinversion (WhileFFBS,BJbKσ=ff schließt _WhileTT_BS aus) folgt die Behauptung σ=σ2.

3.3 Small-Step-Semantik f¨ur While

Kern einer Small-Step-Semantik ist eine Ein-Schritt-Auswertungsrelationhc, σi →₁ hc⁰, σ⁰i, die f¨ur ein Programmcund Zustand σ einen einzelnen Rechenschritt beschreibt: c⁰ ist der Rest des Programms, der noch im neuen Zustand σ⁰ auszuf¨uhren verbleibt.

Definition 5 (Small-Step-Semantik f¨ur While). Die Ein-Schritt-Auswertungsrelation →₁ der Small-Step-Semantik ist induktiv ¨uber den Syntaxbaum definiert durch

(14)

AssSS:hx := a, σi →₁ hskip, σ[x7→ AJaKσ]i Seq1SS: hc₀, σi →₁ hc⁰₀, σ⁰i

hc₀; c₁, σi →₁ hc⁰₀; c₁, σ⁰i ^Seq2^SS:hskip; c, σi →₁hc, σi

IfTTSS: BJbKσ=tt

hif (b) then c₀ else c₁, σi →₁ hc₀, σi IfFFSS: BJbKσ=ff

hif (b) then c0 else c1, σi →₁ hc₁, σi

WhileSS:hwhile (b) do c, σi →₁ hif (b) then c; while (b) do c else skip, σi Definition 6 (blockiert).

Eine Konfiguration, die nicht weiter auswerten kann, istblockiert, notiert als hc, σi 6→₁.

F¨ur die Anweisungskipgibt es keine Auswertungsregel:hskip, σibezeichnet eine Endkonfiguration des Programms,σist der Endzustand. Kennzeichen einer guten Semantik ist, dass von allen (wohlgeformten) Konfigurationen nur Endkonfigurationen blockiert sind.

Definition 7 (Ableitungsfolge). EineAbleitungsfolge f¨ur γ₀ =hc, σi ist eine (endliche oder unend- liche) Folge (γ_i)_i mitγ₀→₁γ₁ →₁ γ₂ →₁ . . .. Sie istmaximal, falls (γ_i)_i unendlich ist oder das letzte γ_k keine Reduktion in →₁ besitzt. γ →ⁿ₁ γ⁰ (γ →^∗ ₁ γ⁰) bezeichne, dass es eine Ableitungsfolge mit n (endlich vielen) Schritten von γ nachγ⁰ gibt.→^∗ ₁ ist die reflexive, transitive H¨ulle von →₁.

Maximale Ableitungsfolgen beschreiben das Programmverhalten. Nichtterminierende Ausf¨uhrungen entsprechen unendlichen Ableitungsfolgen – diese habenkeinen Endzustand; γ→^∞₁ bezeichne, dass es eine unendlich lange Ableitungsfolge gibt, die inγ beginnt.

Beispiel 4. Semantik des Programmsz := x; (x := y; y := z)im Zustandσ0 =ε[x7→5,y7→7,z7→0]

als maximale Ableitungsfolge:

hz := x; (x := y; y := z), σ₀i →₁hskip; (x := y; y := z), σ₁i

→₁hx := y; y := z, σ₁i →₁hskip; y := z, σ₂i →₁ hy := z, σ₂i →₁ hskip, σ₃i

wobeiσ1=σ0[z7→5],σ2 =σ1[x7→7] undσ3 =σ2[y7→5], alsoσ3=ε[x7→7,y7→5,z7→5]. Jeder einzelne Schritt muss dabei durch einen Ableitungsbaum f¨ur→₁ gerechtfertigt werden, z. B.:

hz := x, σ₀i →₁ hskip, σ₁i ^Ass^SS

hz := x; (x := y; y := z), σ₀i →₁ hskip; (x := y; y := z), σ₁i ^Seq1^SS Beispiel 5 (Nichttermination).

Seiw=while (not (x == 1)) do x := x + 1undσn= [x7→n]. F¨urhw, σ₀i ergibt sich folgende maximale (endiche) Ableitungsfolge:

hw, σ₀i →₁h

=if

z }| {

if (not (x == 1)) then x := x + 1; w else skip, σ0i

→₁hx := x + 1; w, σ0i →₁ hskip; w, σ1i →₁ hw, σ₁i →₁hif, σ₁i →₁hskip, σ₁i

(15)

F¨urhw, σ₂i ist die maximale Ableitungsfolge¹ unendlich:

hw, σ₂i →₁ hif, σ₂i →₁ hx := x + 1; w, σ₂i →₁hskip; w, σ₃i

→₁hw, σ₃i →₁ hif, σ₃i →₁ hx := x + 1; w, σ3i →₁hskip; w, σ4i

→₁hw, σ₄i →₁ . . .

Häufig beschreiben die einzelnen Schritte maximaler Ableitungsfolgen zu detailliert, was ein Programm berechnet. Beispielsweise haben die Programm skip; skip und skip unterschiedliche maximale Ableitungsfolgen und damit eine unterschiedliche Semantik. Deswegen abstrahiert man üblicherweise von den maximalen Ableitungsfolgen und nimmt die transitive Hülle →^∗₁ zu einer Endkonfiguration beziehungsweise→^∞₁ als Semantik eines Programms.

Formal gesehen sind→^∗ ₁ und →ⁿ₁ ganz unterschiedlich definiert. Es gilt aber hc, σi→^∗₁ hc⁰, σ⁰i gdw. ∃n. hc, σi→ⁿ₁ hc⁰, σ⁰i

Deswegen werden wir im Folgenden bei Bedarf von der→^∗₁ auf→ⁿ₁ und wieder zur¨uck wechseln – unter Beachtung, dass nexistenziell quantifiziert ist.

Lemma 3 (Fortschritt). skip ist das einzige Programm, das blockiert ist.

Beweis. Zu zeigen: F¨ur alle Programme c außer skip und jeden Zustand σ gibt es c⁰ und σ⁰ mit hc, σi →₁ hc⁰, σ⁰i. Beweis mittels Induktion ¨uberc:

• Fallc=skip: Explizit ausgeschlossen.

• F¨allec=x := a,c=if (b) then c₁ else c₂ und c=while (b) do c₀:

Folgen direkt aus den RegelnAssSS,IfTTSS, IfFFSS (Fallunterscheidung nachBJbKσ) undWhileSS.

• Fallc=c1; c2: Induktionshypothesen:

(i) Falls c1 6=skip, dann gibt es c⁰₁ undσ⁰₁ mithc₁, σi →₁hc⁰₁, σ⁰₁i.

(ii) Fallsc2 6=skip, dann gibt es c⁰₂ undσ⁰₂ mithc₂, σi →₁hc⁰₂, σ⁰₂i.

Zu zeigen: Es gibt c⁰ und σ⁰ mithc₁; c2, σi →₁ hc⁰, σ⁰i.

Fallunterscheidung nachc1 =skip:

– Fallc₁ =skip: Folgt direkt aus Regel_Seq2_SS

– Fallc1 6=skip: Mit Induktionshypothese (i) gibt es c⁰₁ und σ⁰₁ mit hc₁, σi →₁ hc⁰₁, σ⁰₁i. Mit Regel _Seq1_SS folgt hc₁; c2, σi →₁ hc⁰₁; c2, σ₁⁰i.

Im Progress-Beweis wurden alle Regeln für→₁ benutzt, keine ist also überflüssig.

Theorem 4 (Determinismus). h , i →₁h , i ist deterministisch.

Beweis analog zum Determinismus f¨ur die Big-Step-Semantikh , i ⇓ (Thm. 2).

Korollar 5. F¨ur alle c undσ gibt es genau eine maximale Ableitungsfolge.

Die Existenz einer maximalen Ableitungsfolge folgt aus der Existenz unendlich langer Folgen, die Eindeutigkeit aus dem Determinismus durch Induktion.

1F¨urWhilesind maximale Ableitungsfolgen eindeutig, s. Kor. 5 unten

(16)

3.4 Aquivalenz zwischen Big-Step- und Small-Step-Semantik¨

Big-Step- und Small-Step-Semantik sind zwei Semantik-Definitionen für While. Bei der Big-Step- Semantik interessiert nur der Endzustand einer Programmausführung, während eine Ableitungsfolge in der Small-Step-Semantik zusätzlich alle einzelnen Zwischenberechnungsschritte und -zustände enthält.

Trotzdem passen beide Definitionen wie folgt zusammen, was in diesem Abschnitt bewiesen wird:

hc, σi ⇓σ⁰ genau dann, wennhc, σi→^∗₁ hskip, σ⁰i

Die Äquivalenzbeweise benötigen die beiden folgenden Lemmas für Sequenz. Gäbe es mehr Sprachkon- strukte mit einer rekursiven Regel für die Small-Step-Semantik wieSeq1SS, bräuchte man entsprechende Lemmas für jedes dieser.

Lemma 6 (Liftinglemma f¨ur Sequenz). Falls hc, σi→ⁿ₁hc⁰, σ⁰i, dannhc; c2, σi→ⁿ₁hc⁰; c2, σ⁰i.

Beweis. Induktion ¨ubern, der Induktionsschritt folgt aus der Regel_Seq1_SS.

Lemma 7 (Zerlegungslemma f¨ur Sequenz). Wenn hc₁; c2, σi→ⁿ₁hskip, σ⁰⁰i, dann gibt esi,j undσ⁰, so dasshc₁, σi→ⁱ ₁hskip, σ⁰i und hc₂, σ⁰i→^j ₁ hskip, σ⁰⁰i miti+j+ 1 =n.

Beweis. Beweis per Induktion ¨uber n(c₁ und σ beliebig):

• Basisfall n= 0: Dieser Fall ist unm¨oglich, weil c₁; c₂ 6=skip.

• Induktionsschritt n+ 1: Induktionsannahme: F¨ur allec₁undσgilt: Wennhc₁; c₂, σi→ⁿ₁hskip, σ⁰⁰i, dann gibt es i,j und σ⁰ mithc₁, σi→ⁱ ₁hskip, σ⁰i,hc₂, σ⁰i→^j ₁hskip, σ⁰⁰iund i+j+ 1 =n.

Unter der Annahme hc₁; c2, σiⁿ⁺¹→₁ hskip, σ⁰⁰i ist zu zeigen, dass esi,j und σ⁰ gibt mit hc₁, σi→ⁱ ₁hskip, σ⁰i,hc₂, σ⁰i→^j ₁ hskip, σ⁰⁰i undi+j+ 1 =n+ 1.

Beweis: Wegen hc₁; c2, σiⁿ⁺¹→₁ hskip, σ⁰⁰igibt es ein cund σ^∗, so dass hc₁; c2, σi →₁ hc, σ^∗i→ⁿ₁hskip, σ⁰⁰i.

Mit Regelinversion folgt aus hc₁; c₂, σi →₁ hc, σ^∗i, dass entweder (_Seq2_SS) c₁ = skip, c = c2, σ^∗ = σ oder (Seq1SS) c von der Form c⁰₁; c2 mit hc₁, σi →₁ hc⁰₁, σ^∗i ist. Im ersten Fall folgt die Behauptung mit der Aufteilung i = 0, j = n und σ⁰ = σ. Im anderen Fall ergibt die Induktionsannahme f¨urhc⁰₁; c2, σ^∗i→ⁿ₁ hskip, σ⁰⁰ieine Aufteilung inhc⁰₁, σ^∗i→ⁱ⁰₁ hskip, σ⁰i und hc₂, σ⁰i ^j

0

→₁ hskip, σ⁰⁰imiti⁰+j⁰+ 1 =n. Mithc₁, σi →₁hc⁰₁, σ^∗iergibt sich dann die Behauptung f¨uri=i⁰+ 1, j=j⁰ undσ⁰ =σ⁰.

Theorem 8 (Small-Step simuliert Big-Step). Aushc, σi ⇓σ⁰ folgt hc, σi→^∗₁ hskip, σ⁰i.

Beweis in der ¨Ubung.

Theorem 9 (Big-Step simuliert Small-Step). Aushc, σi→^∗₁ hskip, σ⁰ifolgt hc, σi ⇓σ⁰. Beweis. Wegen hc, σi →^∗₁ hskip, σ⁰i gibt es ein nmit hc, σi →ⁿ₁ hskip, σ⁰i. Beweis von hc, σi ⇓σ⁰ pervollst¨andiger Induktion uber¨ n(c,σ,σ⁰ beliebig):

Sein beliebig. Induktionsannahme: F¨ur allem < n undc,σ, σ⁰ gilt: Wenn hc, σi→^m₁hskip, σ⁰i, dann auchhc, σi ⇓σ⁰. Zu zeigen: Aus (i)hc, σi→ⁿ₁hskip, σ⁰i folgthc, σi ⇓σ⁰ f¨ur beliebigec,σ undσ⁰. Fallunterscheidung nachc:

• Fallc=skip: Mit (i) folgt, dassn= 0 und σ⁰ =σ.hskip, σi ⇓σ folgt aus Regel SkipBS.

(17)

• Fallc=x := a: Mit (i) folgt, dass n = 1 und σ⁰ = σ[x7→ AJaKσ]. hx := a, σi ⇓ σ[x7→ AJaKσ]

folgt aus der Regel AssBS.

• Fallc=c1; c2:

Nach dem Zerlegungslemma l¨asst sich (i) inhc₁, σi→ⁱ ₁hskip, σ^∗i undhc₂, σ^∗i→^j ₁ hskip, σ⁰i mit i+j+ 1 =naufteilen. Damit ist insbesondere i < n undj < n, d.h., die Induktionsannahme l¨asst sich auf beide Teile anwenden: hc₁, σi ⇓σ^∗ und hc₂, σ^∗i ⇓ σ⁰. Daraus folgt die Behauptung mit der RegelSeqBS.

• Fallc=if (b) then c1 else c2: Aus (i) folgt mit Regelinversion, dass n > 0 und entweder (_IfTT_SS) BJbKσ = tt und hc₁, σi ⁿ⁻¹→₁ hskip, σ⁰i oder (_IfFF_SS) BJbKσ = ff und hc₂, σi ⁿ⁻¹→₁ hskip, σ⁰i. In beiden F¨allen l¨asst sich die Induktionsannahme anwenden und die Behauptung folgt aus den RegelnIfTTBS bzw. IfFFBS.

• Fallc=while (b) do c: Aus (i) folgt mit Regelinversion (_While_SS), dassn >0 und hwhile (b) do c, σi →₁ hif (b) then c; while (b) do c else skip

| {z }

=w⁰

, σiⁿ⁻¹→₁ hskip, σ⁰i.

Wendet man die Induktionshypothese mit m = n−1 < n und c = w⁰ an, so folgt hw⁰, σi ⇓ σ⁰. Da w⁰ nach dem Schleifenabwicklungslemma (Lem. 1) in der Big-Step-Semantik ¨aquivalent zu while (b) do c ist, gilt auchhwhile (b) do c, σi ⇓σ⁰.

Korollar 10 ( ¨Aquivalenz von Big-Step- und Small-Step-Semantik).

F¨ur alle c,σ und σ⁰ gilthc, σi ⇓σ⁰ genau dann, wennhc, σi→^∗ ₁hskip, σ⁰i gilt.

3.5 Aquivalenz von Programmen¨

Zu entscheiden. ob zwei Programme äquivalent sind, ist ein wesentlicher Anwendungsbereich für Semantiken. Die bisherigen Äquivalenzbegriffe sind dafür aber i. d. R. zu feingranular, wie folgendes Beispiel zeigt:

tmp := y; y := x; x := tmp x := x - y; y := y + x; x := y - x

Beide Programme vertauschen die Inhalte vonxundy, aber das erste verwendet dazu die Hilfsvariable tmp. Demnach sind beide Programme nicht äquivalent, weil das einetmpmöglicherweise verändert, das andere aber nicht. Wird im weiteren Programmverlauf der intmpgespeicherte Wert aber nicht mehr verwendet, wäre es gerechtfertigt, beide Programme als äquivalent zu betrachten.

Definition 8 ( Äquivalenz von Programmen). Zwei Programmec1undc2sind äquivalent bezüglich der Variablen V ⊆Var, falls für alle σ gilt:

• Wennhc₁, σi ⇓σ₁ f¨ur einσ₁, dann gibt es ein σ₂ mit hc₂, σi ⇓σ₂ und σ₁(x) =σ₂(x) f¨ur alle x∈V.

• Wennhc₂, σi ⇓σ2 f¨ur einσ2, dann gibt es ein σ1 mit hc₁, σi ⇓σ1 und σ1(x) =σ2(x) f¨ur alle x∈V.

In obigem Beispiel sind beide Programme ¨aquivalent bez¨uglich der Variablen {x,y}.

Die beiden Bedingungen sind klassische Simulationsbedingungen in beide Richtungen, man kann sie auch f¨ur Small-Step-Semantiken entsprechend formulieren. Da die Big-Step-Semantik deterministisch ist, lassen sie sich wie folgt vereinfachen.

(18)

Lemma 11 ( ¨Aquivalenz f¨ur deterministische Programme). Zwei Programme c₁ und c₂ sind

¨

aquivalent bez¨uglich V genau dann, wenn

(i) c1 terminiert genau dann, wennc2 terminiert, d.h., es gibt einσ1 mithc₁, σi ⇓σ1 genau dann, wenn es ein σ₂ mithc₂, σi ⇓σ₂ gibt.

(ii) Wennhc₁, σi ⇓σ1 undhc₂, σi ⇓σ2, dann σ1(x) =σ2(x) f¨ur alle x∈V.

(19)

4 Ein Compiler f¨ ur While

Reale Rechner verarbeiten Assembler-Code und keine Syntaxbäume. Sprachen wieWhile sind damit nicht direkt auf einem solchen Rechner ausführbar, sondern müssen übersetzt werden. Die Regeln der Big-Step-Semantik (und auch der Small-Step-Semantik) lassen sich beispielsweise direkt in Prolog- Regeln konvertieren, die ein Prolog-Interpreter ausführen kann. Der für die Regeln spezialisierte Interpreter führt dann das Programm aus, übersetzt es also in eine Ausführung des Programms auf einem konkreten Rechner. Dabei wird aber das auszuführende Programm selbst nicht in eine für den Rechner geeignetere Darstellung übersetzt.

Direkter geht es, wenn man einen solchen Rechner und seine Instruktionen selbst formal modelliert und einen Übersetzer (Compiler) fürWhile-Programme schreibt, der semantisch äquivalente Programme erzeugt. In diesem Abschnitt wird dieser Ansatz für ein sehr abstraktes Modell eines solchen Rechners für die SpracheWhile ausgearbeitet.

4.1 Ein abstraktes Modell eines Rechners ASM

Der abstrakte Rechner hat einen Speicher f¨ur Daten und eine Liste von Befehlen, die er abarbeitet. In unserem einfachen Modell reichen drei Assembler-Befehle (zusammengefasst in der MengeAsm), zwei zur Kontrollflusssteuerung und eine Datenoperation.

Definition 9 (Instruktionen in ASM).

ASSN x Aexp Zuweisung

JMPk relativer Sprung (k∈Z)

JMPF kBexp bedingter, relativer Sprung (k∈Z)

Ein Assembler-Programm (ASM) P besteht aus einer unver¨anderlichen Liste der abzuarbeitenden Befehle, angefangen mit dem ersten der Liste.

Neben dem Zustand für den Variableninhalt gibt ein Programmzähler an, die wievielte Instruktion der Liste die nächste ist, die abgearbeitet werden muss. Notation für einen einzelnen Ausführungsschritt:

P ` hi, σi → hi⁰, σ⁰i. Für ein gegebenes Programm (Instruktionsliste) P transformiert die i-te Instruktion in P den Zustand σ in den Zustand σ⁰ und i⁰ bezeichnet die nächste auszuführende Instruktion.P_i bezeichne dasi-te Element vonP und ist nur definiert, wenninicht negativ und kleiner als die Länge vonP ist.

Definition 10 (Semantik von ASM).

Die SemantikP ` h, i → h , i einesASM-ProgrammsP ist durch folgende Regeln definiert.

Assn: P_i=ASSNx a

P ` hi, σi → hi+ 1, σ[x7→ AJaKσ]i ^Jmp: P_i =JMPk P ` hi, σi → hi+k, σi

JmpFT: Pi =JMPF k b BJbKσ =tt

P ` hi, σi → hi+ 1, σi ^JmpFF: Pi =JMPF k b BJbKσ=ff P ` hi, σi → hi+k, σi Wenninegativ oder größer als die Länge vonP ist, ist keine Ausführung möglich.

(20)

Die gesamte Semantik eines Programms P in einem Zustandσ ist wieder über die maximalen Ablei- tungssequenzen vonh0, σigegeben; oder aber durch die blockierten Konfigurationenhi⁰, σi, die in der transitiven HülleP ` hi, σi→ hi^∗ ⁰, σ⁰i von h0, σi aus erreichbar sind, und die Existenz unendlicher Ausführungen P ` h0, σi→.^∞

Ubung:¨ Welche Konstrukte und Regeln der Assembler-Sprache sind überflüssig und könnten durch die anderen simuliert werden?

4.2 Ein Compiler von While nach ASM

SeiP++P⁰ die Verkettung der beiden Listen P und P⁰ und |P|die L¨ange vonP.

Definition 11 (Compiler). Der Compiler vonWhilenachASMsei durch die Funktion comp definiert:

comp(skip) = []

comp(x := a) = [ASSN x a]

comp(c₁; c₂) = comp(c₁) ++ comp(c₂)

comp(if (b) then c₁ else c₂) = [JMPF k₁ b] ++ comp(c₁) ++[JMPk₂] ++ comp(c₂) wobei k₁ =|comp(c₁)|+ 2 und k₂ =|comp(c₂)|+ 1 comp(while (b) do c) = [JMPF (k+ 2)b] ++ comp(c) ++[JMP−(k+ 1)]

wobei k=|comp(c)|

Beispiel 6.

Das Kompilat des Programmsz := 0; while (y <= x) do (z := z + 1; x := x - y)ist:

[ASSN z 0, JMPF 4 (y <= x), ASSN z(z + 1), ASSN x (x - y), JMP−3]

F¨ur(if (x <= y) then x := x + y; y := x - y; x := x - y else y := x); z := 5ergibt sich folgendes Kompilat – unabh¨angig von der Klammerung der Sequenz imthen-Zweig:

[JMPF 5 (x <= y), ASSN x (x + y), ASSN y(x - y), ASSN x (x - y), JMP2, ASSN y x, ASSN z 5 ] Ubersetzt man¨ if (x <= -1) then x := -1 * x else skip, so erh¨alt man:

[JMPF 3 (x <= -1), ASSN x(-1 * x), JMP 1]

4.3 Korrektheit des Compilers

Ein Compiler soll die Semantik eines Programms nicht ver¨andern. Dadurch, dass die Semantik von Whileund ASM formal gegeben sind, l¨asst sich das auch exakt formulieren und beweisen:

• Wennhc, σi ⇓σ⁰, dann comp(c)` h0, σi→ h|comp(c)|, σ^∗ ⁰i.

• Wenn es keine Big-Step-Ableitung f¨urhc, σi gibt, dann comp(c)` h0, σi→.^∞ Theorem 12 (ASM simuliert Big-Step).

Wennhc, σi ⇓σ⁰, dann comp(c)` h0, σi→ h|comp(c)|, σ^∗ ⁰i.

(21)

Dieses Theorem folgt direkt aus folgender Verallgemeinerung, die erlaubt, dass die Maschinenbefehlsse- quenz in beliebigen Code eingebettet ist.

Lemma 13. SeienP₁ und P₂ beliebige ASM Programme.

Wennhc, σi ⇓σ⁰, dann P1++ comp(c) ++P2` h|P₁|, σi→ h|P^∗ ₁|+|comp(c)|, σ⁰i.

Beweis. Beweis durch Regelinduktion ¨uber hc, σi ⇓σ⁰,P1 und P2 beliebig. Notation:|c|=|comp(c)|

• Fall_Skip_BS: Zu zeigen:

F¨ur alle P₁ und P₂ giltP₁++ comp(skip) ++P₂ ` h|P₁|, σi→ h|P^∗ ₁|+|skip|, σi.

Trivial wegen|skip|= 0.

• FallAssBS: Zu zeigen: F¨ur alle P1 undP2 gilt

P1++ comp(x := a) ++P2 ` h|P₁|, σi→ h|P^∗ ₁|+|x := a|, σ[x7→ AJaKσ]i.

Beweis: P1++[ASSN x a] ++P2 ` h|P₁|, σi → h|P₁|+ 1, σ[x7→ AJaKσ]i nach Regel _Assn, da (P₁++[ASSN x a] ++P₂)_|P₁_|=ASSNx a.

• Fall_Seq_BS: Zu zeigen: F¨ur alle P₁ und P₂ gilt

P1++ comp(c1; c2) ++P2` h|P₁|, σi→ h|P^∗ ₁|+|c₁; c2|, σ⁰⁰i.

Induktionsannahmen: F¨ur beliebige P1 und P2 gelten P₁++ comp(c₁) ++P₂ ` h|P₁|, σi→ h|P^∗ ₁|+|c₁|, σ⁰i und P₁++ comp(c₂) ++P₂ ` h|P₁|, σ⁰i→ h|P^∗ ₁|+|c₂|, σ⁰⁰i.

Instanziiert man in der ersten Induktionsannahme P₂ mit comp(c₂) ++P₂ und P₁ der zweiten Induktionsannahme mit P₁++ comp(c₁), so gelten:

P1++ comp(c1) ++(comp(c2) ++P2)` h|P₁|, σi→ h|P^∗ ₁|+|c₁|, σ⁰i

(P1++ comp(c1)) ++ comp(c2) ++P2` h|P₁++ comp(c1)|, σ⁰i→ h|P^∗ ₁++ comp(c1)|+|c₂|, σ⁰⁰i Ausrechnen und Transitivit¨at von →^∗ liefern die Behauptung.

• Fall_IfTT_BS: Zu zeigen: F¨ur alle P₁ und P₂ gilt P₁++ comp(if (b) then c₁ else c₂) ++P₂ ` h|P₁|, σi→ h|P^∗ ₁|+|if (b) then c₁ else c₂|, σ⁰i.

Induktionsannahmen:

BJbKσ =ttund f¨ur beliebigeP₁ und P₂ gilt P₁++ comp(c₁) ++P₂ ` h|P₁|, σi→ h|P^∗ ₁|+|c₁|, σ⁰i.

Beweis mit der Induktionsannahme, bei der P1 alsP1++[JMPF(|c₁|+ 2)b] und P2 als [JMP(|c₂|+ 1)] ++ comp(c2) ++P2 instanziiert werden:

P1++[JMPF (|c₁|+ 2)b] ++ comp(c1) ++[JMP(|c₂|+ 1)] ++ comp(c2) ++P2 ` h|P₁|, σi → h|P₁|+ 1, σi→ h|P^∗ ₁|+ 1 +|c₁|, σ⁰i → h|P₁|+ 2 +|c₁|+|c₂|, σ⁰i

• FallIfFFBS: Analog zuIfTTBS.

• FallWhileTTBS: Zu zeigen: F¨ur alle P1 undP2 gilt

P₁++ comp(while (b) do c) ++P₂ ` h|P₁|, σi→ h|P^∗ ₁|+|while (b) do c|, σ⁰⁰i.

Induktionsannahmen:BJbKσ =ttund f¨ur beliebige P₁ undP₂ gelten

P₁++ comp(c) ++P₂ ` h|P₁|, σi → h|P^∗ ₁|+|c|, σ⁰i und P₁++ comp(while (b) do c) ++P₂ ` h|P₁|, σ⁰i→ h|P^∗ ₁|+|while (b) do c|, σ⁰⁰i.

Beweis mit entsprechend instanziierten Induktionshypothesen und Regel_JmpFT: P₁++[JMPF (|c|+ 2)b] ++ comp(c) ++[JMP−(|c|+ 1)] ++P₂ `

h|P₁|, σi → h|P₁|+ 1, σi→ h|P^∗ ₁|+ 1 +|c|, σ⁰i → h|P₁|, σ⁰i→ h|P^∗ ₁|+|while (b) do c|, σ⁰⁰i