Eine neue dynamisch-getypte und imperative Programmiersprache mit verz¨ogerter Auswertung

(1)

imperative Programmiersprache mit verz¨ ogerter Auswertung

Bachelorarbeit Jan van den Brand

16. Januar 2015

eingereicht bei PD Dr. David Sabel

(2)

2011 § 25 Abs. 11

Hiermit best¨ atige ich, dass ich die vorliegende Arbeit selbstst¨ andig verfasst habe und keine anderen Quellen oder Hilfsmittel als die in dieser Arbeit angegebenen verwendet habe.

Frankfurt, den 16.01.2015

Jan van den Brand

(3)

1 Einleitung 5

1.1 Ziele vonlazy Imp . . . 5

1.1.1 Funktionen . . . 5

1.1.2 Bl¨ocke, yield und return . . . 7

1.1.3 Zuweisungen . . . 8

1.1.4 Namensr¨aume und Aufl¨osung . . . 8

1.1.5 Objekte . . . 10

1.1.6 Kontrollstrukturen . . . 11

1.2 Uberblick . . . .¨ 12

2 Kernsprache 13 2.1 Syntax . . . 13

2.2 Genaue Syntax . . . 13

2.2.1 Eindeutigkeit der Grammatik . . . 15

2.3 Semantik . . . 20

2.3.1 Operationale Semantik . . . 21

2.3.2 Variablen . . . 22

2.3.4 Beispiele . . . 25

2.3.5 Eindeutigkeit der Semantik . . . 27

3 Objekte und Kontrollstrukturen 36 3.1 Syntax . . . 36

3.2 Operationale Semantik . . . 37

3.2.1 Variablen . . . 37

3.2.3 Schleifen . . . 39

4 Komplexe Objektstrukturen und Funktionen 40 4.1 Syntax . . . 40

4.2 Operationale Semantik . . . 41

5 Implementierung 43 5.1 Grundlagen zum Interpreter und Compilerbau . . . 43

5.2 Codeausf¨uhrung . . . 44

5.2.1 Zwischencode . . . 44

5.2.2 Abweichungen von FunNode zur operationalen Semantik . . . 47

5.3 Parser . . . 47

5.3.1 Lexikalische Analyse . . . 47

5.3.2 Syntax¨uberpr¨ufung und Zwischencodeerzeugung . . . 48

5.4 Codebeispiele . . . 49

5.5 Laufzeitvergleich . . . 52

6 Fazit 53

(4)

Im Rahmen dieser Bachelorarbeit wird eine neue Programmiersprache entworfen. Diese wird zun¨achst durch Beispiele beschrieben, sodass die Ziele und Schwerpunkte der Sprache bekannt sind. Die Sprache wird danach mit mathematischen Mitteln dargestellt und analysiert.

Dazu werden Grammatik und operationale Semantik der Kernsprache angegeben. Diese Kernsprache wird dann erweitert und eine allgemeine Methode beschrieben, wie die Sprache um weitere Funktionen und Datentypen erg¨anzt werden kann.

Zudem wird ein Interpreter für die neue Sprache entwickelt.¹ Dieser Interpreter ist nicht auf Laufzeit optimiert und übernimmt auch kein Speichermanagement (es ist kein Garbage Collector vorhanden). Er dient nur als Proof-of-Concept, um die Funktionalität des theoretischen Konzepts zu beweisen.

(5)

Das Ziel dieser Arbeit ist der Entwurf einer neuen objekt-orientierten imperativen high-order Sprache, die optional auch eine verzögerte Auswertung mit Referenzoptimierung (lazy-evaluation) unterstützt. Im Folgenden bezeichnen wir diese neue Sprache mit lazy Imp (en. fauler Kobold), in Anlehnung an die imperative und verzögerte Auswertung.

In diesem Kapitel beschreiben wirlazy Impzunächst informell mit Hilfe von Codebeispielen, damit die Funktionsweise bekannt ist und somit die spätere theoretische Analyse verständlicher wird.

1.1 Ziele von lazy Imp

1.1.1 Funktionen

Lazy Imp ist eine high-order Programmiersprache, das heißt Funktionen sind selbst Objekte/

Werte. Hat man zum Beispiel eine Funktion f, so bezeichnet f auch immer die Funktion, und nicht etwa das Ergebnisf().

def f u n ( )

return 3 end

a = f u n b = f u n ( )

p r i n t ( b == a ) p r i n t ( b == a ( ) )

Wertet man obigen Code aus, so enth¨alt a nun die gleiche Funktion wie fun. Die Variable b enth¨alt hingegen das Ergebnis der Funktion, also die Zahl 3. Der Code gibt demnach zuerstfalse und danntrue aus.

Natürlich ist es auch möglich Funktionen zu definieren, ohne sie in einer Variable zu speichern, um beispielsweise eine Funktion durchreturnzurückzugeben. Die Funktionsweise ist ähnlich zu Lambda-Ausdrücken.

f u n = do x -> y i e l d 2 ∗ x end

Dasyieldist zunächst wie einreturnzu verstehen, der genaue Unterschied wird später erklärt.

Dieser Code erzeugt eine Funktion, die ein Argument x erhält und 2 * x zurückgibt. Diese Funktion wird dann der Variablefunzugeordnet. Der Code ist also äquivalent zu

def f u n ( x )

y i e l d 2 ∗ x end

Weiterhin ist für Funktionen in lazy Imp besonders, dass man sie wie in Haskell die partielle Anwendung untersützen, das heißt dass sie mit zu wenigen Argumenten aufgerufen werden können.

i n c a l l b y o n e = map do x -> y i e l d x + 1 end

Seimapeine eine Funktion, die zwei Argumente erwartet - eine Funktion und eine Liste - und die Funktion auf jedes Listenelement anwendet. Die Funktionmaphat bereits die anonyme Funktion

(6)

Funktion, die eine Liste erwartet und jedes Listenelement um 1 erh¨oht. Diese neue Funktion wird ininc all by onegespeichert. Zu beachten ist hierbei aber der folgende Unterschied zuHaskell:

l i s t e = map do x -> y i e l d x + 1 end [ 1 , 2 , 3 ]

In Haskell w¨urde der ¨aquivalente Code liste = map (\x -> x+1) [1,2,3] die Liste [2,3,4]

zurückgeben. In lazy Imp hingegen wird eine Funktion zurückgegeben, die kein Argument erwartet und bei ihrer Ausführung [2,3,4] berechnet. Der Funktionsaufruf ohne Klammern erzeugt also immer eine Funktion, analog zu dem Unterschied zwischen a = fun und b = fun(). Auf diese Weise wird auch dielazy-order Auswertung realisiert.

Der Ausdruckmap(do x -> yield x + 1 end, [1,2,3])ruft die Funktionmapauf und berechnet sofort das Ergebnis,map do x -> yield x + 1 end [1,2,3]hingegen verz¨ogert die Berech- nung, bis die resultierende argumentlose Funktion aufgerufen wird.

Eine weitere M¨oglichkeit Funktionen aufzurufen ist per Attributzugriff. Betrachte dazu folgenden Code:

a = f i b o n a c c i ( 1 0 0 ) p r i n t ( a . even ) und

a = f i b o n a c c i 100 p r i n t ( a . even )

Die erste Variante berechnet direkt die 100. Fibonaccizahl und speichert sie in der Variable a.

Danach wird auf dessen Attributevenzugegriffen.

In der zweiten Variante hingegen wird der Variable a eine argumentlose Funktion zugeordnet.

Diese neue Funktion enthält aber nicht das Attribut even, sodass klar ist, dass eigentlich das Attribut des Ergebnisses vonfibonacci(100)gemeint ist. Entsprechend wird also in der zweiten Zeile die Zahl berechnet, damit auf even zugegriffen werden kann. Die Funktion wird durch das Ergebnis ersetzt, sodass spätere Zugriffe auf a keine erneute Berechnung erfordern. Es handelt sich also um eine lazy-order Auswertung, denn fibonacci(100) wird erst berechnet, wenn das Ergebnis tatsächlich benötigt wird.

Funktionen werden des Weiteren direkt aufgerufen, wenn sie der einzige Ausdruck in der Zeile sind.

def a u s g a b e ( x ) p r i n t x end

Offensichtlich steht das print xnicht f¨ur einenlazy-order Ausdruck, das Ergebnis von print x wird schließlich nirgends verwendet. Stattdessen soll einfachprint(x)ausgef¨uhrt werden.

Die Motivation hierf¨ur erfolgt in den n¨achsten Abschnitten 1.2 und 1.5.

(7)

1.1.2 Bl¨ ocke, yield und return

Eine Besonderheit vonlazy Imp ist, dass es keinen Unterschied zwischen Bl¨ocken und Funktionen gibt:

i f ( x < 0 ) do . . . end

Die Bl¨ocke in den if Konstrukten sind einfach nur anonymedo ... endFunktionen ohne Ar- gument. Entsprechend gibt es zwei verschiedene Abbruchoperatorenyield undreturn.

def f u n ( a )

i f ( a < 0 ) do return end

. . . end

returnsoll nicht nur die anonyme Funktion abbrechen, sondern auch bis aus dem Rumpf vonfun herausspringen. Dies wird realisiert, indemyieldnur die aktuelle Funktion abbricht undreturn solange zur¨uckspringt, bis eincatchgefunden wird. Obiger Code ist also ¨aquivalent zu:

f u n = do c a t c h a ->

i f ( a < 0 ) do return end

. . . end

Die Zusammenfassung von Funktionen und Bl¨ocken ist auch konsistent mit der direkten Ausf¨uhrung von Funktionen, sollten sie der einzige Ausdruck in einer Zeile sein.

a = true do

l o c a l a = f a l s e p r i n t ( a )

end p r i n t ( a )

Dieser Code gibtfalse,trueaus. Derdo ... endAusdruck definiert eine argumentlose Funk- tion, die direkt ausgef¨uhrt wird, da sie alleine steht. Im Inneren der Funktion wird eine lokale Variable adeklariert und mit false initialisiert. Der erste print Befehl gibt deshalb false aus.

Der zweite print Befehl ist aber außerhalb der Funktion, also in einem anderem Namensraum und gibt trueaus. Die argumentlose Funktion verh¨alt sich also genau wie ein Block in anderen Programmiersprachen.

Mehr zu Namensr¨aumen gibt es in 1.4.

(8)

1.1.3 Zuweisungen

Lazy Imp besitzt nur Objekte (Tabellen) und Funktionen, eine implizite Unterscheidung zwischen Referenz und Kopie, wie in J ava, P ython oder ¨Ahnlichen ist also nicht m¨oglich, da es keine Unterscheidung zwischen Objekten und primitiven Datentypen gibt.

Die Unterscheidung erfolgt stattdessen explizit durch einen Doppelpunkt:

a = true b := a c = a b = f a l s e

Nach diesem Code sind a und b beide dasselbe false Objekt und c hingegen ein anderes true Objekt.

Der Operator=ist eine Kopiezuweisung. Das Objekt inawird in Zeile 1 zu einer Kopie vontrue.

Der Operator:=ist hingegen eine direkte Referenzzuweisung, in Anlehnung an die mathematische Definition. Nach Zeile 2 zeigt die Variable b auf dasselbe Objekt wie die Variable a. Deshalb werden beide in Zeile 4 zu f alse, die Variable chingegen bleibt true, da sie nur eine Kopie des Objektes ausbbzw. aenth¨alt.

Ahnlich funktioniert die Zuweisung bei den Funktionsargumenten:¨ def f u n ( a : , b )

a = f a l s e b = f a l s e end

c = true d = true f u n ( c , d )

Nach der Ausf¨uhrung dieses Codes, w¨are c false und b weiterhin true. Man kann sich hier vorstellen, dass zu Beginn der Funktion argumentVariable = argumentaufgerufen wird, durch den Doppelpunkt hinterawird diese Zuweisung also zua: = cbzw. syntaktisch korrekta := c.

1.1.4 Namensr¨ aume und Aufl¨ osung

Die Deklaration von Variablen erfolgt implizit, das heißta = b deklariert automatisch die Vari- ablena undb, sollten sie nicht aufgel¨ost werden k¨onnen und initialisiert sie mit dem leerennil Objekt.

Eine solche automatische Deklaration erzeugt immer eine lokale Variable. Will man explizit eine lokale Variable deklarieren, erfolgt dies per local a oder local a = wert. Auf diese Weise

¨

uberschreibt man nicht ungewollt die Variableaim Namensraum dar¨uber.

Die Variablenauflösung erfolgt per Namensräumen auf einem Stack. Zuerst wird im obersten Namensraum auf dem Stack gesucht, danach wird die Suche auf den nächsten Namensraum aus- geweitet, falls keine solche Variable gefunden wurde. Zu beachten ist, das die Auflösung nicht zum Zeitpunkt der Definition einer Funktion erfolgt, sondern zum Zeitpunkt ihrer Ausführung:

i = true def f u n ( )

p r i n t ( i ) end

def funB ( )

l o c a l i = f a l s e f u n ( )

end f u n ( ) funB ( )

(9)

Dieser Code gibt zuerst true, dann false aus, da die Variable i bei der Ausf¨uhrung von fun verschieden aufgel¨ost wurde.

Will man hingegen eine Variable unbedingt im Namensraum zum Zeitpunkt der Definition aufl¨osen, so geschieht dies per^. Motivation f¨ur die Notation ist, dass man auf die im Quelltext weiter oben stehende Variable verweist.

p r i n t ( ˆ i ) end

def funB ( )

l o c a l i = f a l s e f u n ( )

end f u n ( ) funB ( )

Dieser Code gibt zwei maltrueaus, da die Auflösung beide Male die oberste Variableiverwendet und diese im Laufe des Programms verändert wurde. Dasiinfunwurde also nicht mehr zu dem lokaleniausfunBaufgelöst.

Aber Achtung:

p r i n t ( ˆ i ) end

i := f a l s e f u n ( )

Dieser Code ergibt zwei Mal true, obwohl iein false zugeordnet wurde. Der Ausdruck îwird nämlich zu dem Objekt inizum Zeitpunkt der Definition aufgelöst. Später handelt es sich um eine Referenzzuweisung zur Variablei, das Objekt, welches zuvor iniwar, wurde also nicht verändert.

Diese Art der Namensauflösung mag für viele unintuitiv wirken, da in den meisten imperativen Sprachen die Variablen immer im definierenden Namensraum aufgelöst werden. Diese neue Auflösungsvariante hat aber durchaus seine Motivation.

Es soll möglich sein, durch zusätzlichen Code, den bereits bestehenden Code zu manipulieren und zu verändern. Manche Programme sollen dem Anwender eine Anpassung an eigene Bedürfnisse ermöglichen. Der Quellcode kann aber nachträglich nicht verändert werden. Bei diesen Pro- grammen wird häufig eine Skriptsprache wie LUA verwendet, die es erlaubt, Methoden bereits bestehender Objekte zu verändern, und so dem Anwender ermöglicht, das Programm anzupassen.

In LU A hatte ich aber schon mehrfach das Problem, dass ich beim Modifizieren eines fremden Programms, nicht auf die lokalen Variablen zugreifen konnte. Man deklariert inLU A Variablen nicht als lokal, um eine Manipulation von außen zu verhindern (LU Awird gewählt, um eine Ma- nipulation des Codes zu erlauben). Die Deklaration ist nur lokal, weil die Deklaration von allen Variablen als global den Namensraum zu sehr füllen würde und man dann bei der Benennung der eigenen Variablen darauf achten müsste, nicht aus Versehen etwas zu überschreiben.

Die Variablenaufl¨osung vonlazy Imp erm¨oglicht weiterhin die Verwendung von lokalen Variablen, als auch den Zugriff auf diese Variablen von außerhalb.

(10)

1.1.5 Objekte

Objekte in lazy Imp sind Tabellen, bestehen also aus Schl¨ussel-Wert-Paaren. Der Schl¨ussel ist dabei ein Variablenname und der Wert eine weitere Tabelle. Objekte sind insofern einfach nur eine Sammlung von Variablen. Streng genommen aber kein neuer Namensraum, da auf die Variablen nur perobjekt.attributzugegriffen werden kann.

Damit eine Methode also auf das Objekt zugreifen kann, muss es als Argument ¨ubergeben werden:

o b j . add = do s e l f , o t h e r -> y i e l d s e l f. v a l u e + o t h e r . v a l u e end

Damit man nicht immerobj.add(obj, obj2)schreiben muss, gibt es dafür die verkürzte Schreib- weiseobj:add(obj2). Diese wiederum kann noch weiter verkürzt werden, indem man Punkte und Klammern weglässt: obj add obj2

Dies hat einerseits den Vorteil, dass die Programmiersprache natürlicher wirkt. Man nehme zum Beispiel den Code ”ich programmiere Haskell”. Dieser Code besitzt das Objekt ich, welches die Methodeprogrammiere besitzt und diese mit dem ArgumentHaskellausführt. Es handelt sich aber auch um einen völlig korrekten Satz, mit einer sehr ähnlichen Interpretation der Wörter.

”ich” ist das Subjekt, f¨uhrt also wie im Programm die Methode/Aktion aus, ”programmiere” ist das Pr¨adikat, beschreibt ebenso wie die Methode, was getan wird und ”Haskell” ist das Objekt, auf den die Aktion bzw. die Methode angewendet wird.

Der zweite viel wesentlichere Vorteil ist, dass man auf diese Weise beliebige Operatoren implementieren kann. Man erkennt dies bereits am simplen a + b Beispiel, welches verkürzt für a:+(b) steht. Es wird einfach nur die Methode+des Objektes inaausgeführt.

Man kann also alle m¨oglichen Operatoren definieren, indem man einfach eine Methode mit diesem Namen definiert. Man ist also nicht wie beispielsweise inC++ an eine feste Auswahl an Opera- toren gebunden.

Man beachte, dass auch Funktionen Objekte/Tabellen sind. Damit ist nicht nur die high-order Eigenschaft gemeint, sondern auch Funktionen besitzen Schl¨ussel-Wert-Paare.

Es gibt also leichte Konflikte mit der punktlosen Notation für Methoden und der Notation für die verzögerte Auswertung. Dafür gibt es die folgende Prioritätsliste:

Betrachte den Codefun varA varB

1. funbesitzt das AttributvarA, dann wirdfun:varA(varB)ausgef¨uhrt.

2. funbesitzt das Attribut nicht und ben¨otigt kein Argument.

Dann istfunein verz¨ogerter Wert, berechne also den Wert und betrachte das AttributvarA des Ergebnisses.

3. funbesitzt das Attribut nicht und ben¨otigt Argumente.

In diesem Fall ist die verz¨ogerte Auswertung vonfun(varA, varB)gemeint.

Die verzögerte Auswertung ist in imperativen Sprache wegen der Unvorhersehbarkeit sehr unge- wohnt und ist deshalb in lazy Imp nicht standardmäßig der Fall. Man nehme beispielsweise die Funktion stack.pop(), welche jedes Mal ein anderes Ergebnis liefern könnte. In lazy Imp hat deshalb die imperative Auswertung immer Vorrang und die verzögerte Auswertung wird nur verwendet, wenn der Programmierer dies explizit wünscht.

Der Codefun varA varBwird deshalb wenn m¨oglich alsfun:varA(varB)interpretiert und nicht als die ver¨ogerte Auswertung vonfun(varA,varB).

Will man die MethodevarAvonfunverz¨ogert ausf¨uhren, schreibt man stattdessenfun:varA varB

(11)

Ein Beispiele zum besseren Verst¨andnis,funsei hier eine zweistellige Funktion:

r e s u l t = f u n a r g 1 a r g 2 i f r e s u l t == o b j do

. . . end

Es gibt f¨ur die Funktion fun keine Methode namens arg1. Die Variable result ist nach der ersten Zeile also die verz¨ogerte Auswertung vonfun(arg1, arg2), demnach selbst eine Funktion.

Diese Funktion besitzt aber nicht das Attribut==, sodass in der zweiten Zeile der verz¨ogerte Wert berechnet wird und das ==des Ergebnisses verwendet wird. Wie in lazy-order wurde der Wert vonresultalso erst berechnet, wenn er ben¨otigt wurde.

Ein leeres Objekt, besitzt bei Initialisierung bereits die Variable :==(Identitätsvergleich, in An- lehnung an:=). Objekte, die keine Funktionen sind, besitzen zusätzlich die Variable==(führt den Identitätsvergleich auf alle Variablen aus).

Die Methode == ist bei Funktionen nicht vorhanden, um beim Vergleich die Ausführung von lazy-order Ausdrücken zu erzwingen. Vor allem aber ist die Frage, ob zwei Algorithmen sich für alle Eingaben gleich verhalten als Folge des Halteproblems unentscheidbar. Man kann also nicht erkennen ob zwei Funktionen sich gleich verhalten.

1.1.6 Kontrollstrukturen

if und else i f ( i > 0 ) do

. . . e l s e

. . . end

In Abschnitt 1.1.2 wurde erklärt, dass der Block hinter demifeine Funktion ist. Der Ausdruck if beschreibt also eigentlich eine Funktion, die zwei Argumente erhält. Das erste Argument ist die Bedingung und das zweite eine Funktion. Die do-end und do-else-end Ausdrücke sind Funktionen, die kein Argument erwarten, aber trotzdem mit einem Argument aufgerufen werden können. Ist dieses Argumentfalseoder das leere Objektnil, so wird derelseBlock ausgeführt, bzw gar nichts, ist kein else Block vorhanden. Ansonsten wird der erste Block vor dem else ausgeführt. Obiger Code ist also äquivalent zu:

do

. . . e l s e

. . . end( i > 0 ) Schleifen

Schleifen lassen sich vor allem durch Rekursion und ¨Ubergabe des Schleifenblocks implementieren.

Es gibt aber dennoch eine spezielle Schleife inlazy Imp , diewhileSchleife:

while ( i > 0 ) do . . . end

whileverhält sich hier effektiv wie dasif-Konstrukt. Ist also eine Funktion, die zwei Argumente erhält. Der einzige Unterschied ist hier, dass die Bedingung nicht vor dem Einsetzen ausgeführt

(12)

1.2 ¨ Uberblick

In den folgenden Kapiteln wirdlazy Imp genauer beschrieben und untersucht.

• Kernsprache

In Kapitel 2 wird die Kernsprache definiert und analysiert. Dazu wird zun¨achst die Syn- tax der Kernsprache durch eine Grammatik beschrieben und deren Eindeutigkeit bewiesen.

Danach wird auf die Semantik eingegangen und diese durch eine operationale Semantik definiert. Der Rest des Kapitels befasst sich mit der Eindeutigkeit der Semantik.

• Objekte und Kontrollstrukturen

In Kapitel 3 werden der Kernsprache Objekte, Verzweigungen und Schleifen hinzugef¨ugt.

Hier wird wie im vorherigen Kapitel zunächst die Syntax beschrieben, indem die Gram- matik der Kernsprache erweitert wird. Daraufhin wird die Semantik für die neuen Syn- taxkonstrukte durch weitere Regeln ergänzt.

• Komplexe Objektstrukturen

In Kapitel 4 wird eine allgemeine Methode beschrieben, wie sich lazy Imp durch beliebige Objekte und Funktionen erweitern lässt. Diese Methode wird dabei für das Hinzufügen von Integern, Strings und derprint-Funktion verwendet.

• Implementierung

Kapitel 5 befasst sich zunächst kurz mit dem Unterschied zwischen Interpretern und Com- pilern. Danach wird die Implementierung des lazy Imp Interpreters erläutert und anhand einiger Beispiele erklärt. Der Interpreter ist unter

http://www.ki.informatik.uni-frankfurt.de/bachelor/programme/lazyimp/ zu finden.

Zum Schluss wird derlazy ImpInterpreter mit Interpretern anderer Sprachen im Bezug auf Laufzeit verglichen.

• Fazit

Kapitel 6 fasst die Ergebnisse dieser Arbeit noch einmal zusammen. Es wird auf Probleme von lazy Imp eingegangen, die w¨ahrend der Arbeit aufgetaucht sind und eine Aussicht auf Verbesserungsm¨oglichkeiten gegeben.

(13)

Eine Kernsprache beschreibt die fundamentalsten Eigenschaften einer Sprache und bezieht sich bei lazy Imp nur auf die Aufl¨osung von Variablen, Zuweisungen und Funktionen. Andere Objekte wie Listen oder Zahlen sowie Kontrollstrukturen wie Schleifen oder if-Abfragen sind nicht vorhanden.

In diesem Kapitel wird die Syntax und Semantik der Kernsprache formal beschrieben und deren Eindeutigkeit bewiesen. Die Eindeutigkeit ist wichtig, damit es f¨ur ein Programm nicht etwa zwei verschiedene M¨oglichkeiten der Auswertung gibt.

2.1 Syntax

Zum einfacheren Parsen verwendetlazy Imp ein Semikolon, um Zeilen zu beenden. Im vorherigen Entwurf reichte auch ein Zeilenumbruch aus. Diese vom Entwurf abweichende Konvention bleibt in der gesamten restlichen Arbeit und auch in der Implementierung des Interpreters erhalten.

Die genaue Syntax der Kernsprache vonlazy Imp ist auf den ersten Blick sehr umfangreich und nicht sofort verst¨andlich. Deshalb wird zuerst eine vereinfachte Form der Syntax angegeben.

P → L;...L;

L → R |R=R |V :=R |returnR|yieldR

R → V |doV,...,V ->P end|(R... R)|R(R,...,R)|^V

L sind also einzelne Zeilen eines Programms, R sind Ausdrücke, die einen Wert zurückgeben und mitV sind beliebige Variablenausdrücke gemeint und hier nicht explizit angegeben.

Dalazy Imp mit Referenzen arbeitet, geben dieRAusdr¨ucke nicht einfach nur einen Wert zur¨uck, sondern eine Referenz auf einen Wert - daher die BenennungR.

Die Angabe dieser Grammatik ist formal nicht korrekt und soll nur die grobe Struktur von zul¨assigem Programmcode darstellen. So soll zum Beispiel der Ausdruck ”do V,...,V ->P end”

allgemein für Funktionen stehen - also auch für Funktionen ohne Argument ”doP end”, obwohl sich das Wort nicht daraus ableiten lässt.

2.2 Genaue Syntax

Die Syntax der Kernsprache l¨asst sich durch folgende Grammatik beschreiben:

Hierbei werden reguläre Ausdrücke in den Produktionsregeln verwendet. Klammern, die zu den regulären Ausdrücken gehören, also keine Terminale sind, werden größer dargestellt.

Erkl¨arungen zur verwendeten Notation:

1. ⁺ steht f¨ur beliebige Anzahl an Wiederholungen, das Wort muss aber mindestens ein mal produziert werden.

2. ^∗ steht f¨ur beliebige Anzahl an Wiederholungen, das Wort darf aber auch ¨ubersprungen werden.

3. [·] produziert das Wort ein oder kein Mal.

(14)

N = {LIN ES,LIN E,F U N DEF,RET U RN,ASSIGN, LOCAL,VAR,GLOBAL,VARPART,RVALUE,F U N, ARGDEKL,F U N CALL,ARGS,SP ACE }

T = {$, , (, ), :, ;, =, +,−, *, /} ∪ {a, ... , z, A, ... , Z, 0, ... , 9}

S = LIN ES

P = {

LIN ES →

(

LIN E;

)

⁺

LIN E → RVALUE |ASSIGN |COP Y |RET U RN RET U RN → return RVALUE |yield RVALUE

COP Y → RVALUE = RVALUE

ASSIGN → VAR := RVALUE

VAR → GLOBAL|LOCAL|VARPART

LOCAL → local VARPART

GLOBAL → $VARPART

VARPART →

((

^a|...|Z

)(

a|...|Z|0|...|9

)*

^|

[

^:

](

^+|−|*|/|=

)

⁺

)

\ {=, :=, do, end, local, catch, return, yield} RVALUE → VAR|F U N |F U N CALL |SP ACE| ^VARPART

F U N → do

[

catch

] [

ARGDEKL ->

]

LIN ES end ARGDEKL → VARPART

[

^:

] (

^,VARPART

[

^:

])*

F U N CALL → RVALUE(

[

ARGS

]

) ARGS → RVALUE

(

^,RVALUE

)*

SP ACE → (RVALUE

(

^RVALUE

)

⁺⁾

}

G = (N,T,S,P)

(15)

2.2.1 Eindeutigkeit der Grammatik

Ein Syntaxbaum ist eine M¨oglichkeit, wie man die Herleitung eines Wortes aus einer Grammatik darstellen kann. Dabei besteht jeder Knoten des Baumes aus einem (Nicht-)Terminal und besitzt als Kinder alle (Nicht-)Terminale, die daraus abgeleitet wurden.

Der Herleitungsbaum f¨ur das Worta := (b c); sieht wie folgt aus:

LINES

LINE

ASSIGN

VAR

VARPART

a

: = RVALUE

SPACE

( RVALUE

VAR

VARPART

b

RVALUE

VAR

VARPART

c

)

Die Ausf¨uhrung vonlazy Impsteht in einem engen Bezug zu obiger Grammatik, da nach und nach der Syntaxbaum reduziert wird. Im obigen Syntaxbaum, wird beispielsweise der rechte Teilbaum vonASSIGN ausgehend vonRVALUE abgearbeitet und dann dem Variablenausdruck im linken Teilbaum zugeordnet.

Für eine eindeutige Ausführung von lazy Imp ist also wichtig, dass für ein Programm (also ein Wort der Sprache) nur ein einziger Syntaxbaum existiert.

Definition 1: Eindeutigkeit einer Grammatik.

Eine Grammatik heißt eindeutig, wenn f¨ur jedes Wort der Sprache, die von der Grammatik erzeugt wird, nur eine m¨ogliche Herleitung existiert.

Satz 1: Die Grammatik der Kernsprache ist eindeutig.

Beweis: Es wird gezeigt, dass die Herleitung eines Wortes, welches aus einem bestimmten Nicht- terminal hergeleitet werden kann, bis auf dieses erste Nichtterminal eindeutig ist.

(16)

Das Wortprint(a)kann beispielsweise sowohl ausLIN E,RVALUE oderF U N CALLhergeleitet werden, aber die Herleitungen beginnend mitLIN E, die Herleitung beginnend mitRVALUE und die Herleitung beginnend mitF U N CALLsind jeweils eindeutig.

Der Beweis erfolgt per Induktion ¨uber die Anzahlnder Terminale eines Wortes.

Induktionsanfang: n= 1

Seiω ein Wort mitn= 1 Terminalen, welches aus einem beliebigen Nichtterminal der Grammatik hergeleitet wurde. Die Herleitung kann nur mit den NichtterminalenVAR,VARPART,RVALUE, ARGDEKL oder ARGS beginnen, denn die anderen Nichtterminale erzeugen nur Worte mit mehr als einem Terminal.

Beginne die Herleitung zuωmit einem dieser Nichtterminale als Startnichtterminal:

1. VARPART

Die Herleitung ist eindeutig, denn die einzige M¨oglichkeit ist die direkte Aufl¨osung von VARPART→ω.

2. VAR

Die Herleitung ist eindeutig, dennVARkann nur zuVARPART aufgelöst werden. GLOBAL und LOCAL würden wegen $ und local zu mehr als einem Nichtterminal führen. Die restliche Herleitung von ω ausVARPART ist eindeutig nach 1).

3. ARGDEKL

Die Herleitung von ARGDEKL ist eindeutig, da ARGDEKL nur zu einem einzelnen VARPART aufgelöst werden kann. Weitere VARPART oder ein : würden zu mehr als einem Terminal führen. Die Herleitung ausVARPART ist eindeutig nach 1).

4. RVALUE

F U NFUN, F U N CALL, SP ACE, ^VARPART würden alle zu mehr als einem Terminal führen. RVALUE muss also zuVARaufgelöst werden. Die weitere Herleitung ist eindeutig nach 2).

5. ARGS

Die Herleitung von ARGS ausgehend ist eindeutig, da ARGS nur zu einem einzelnen RVALUE aufgel¨ost werden kann ohne mehr als ein Terminal zu produzieren. RVALUE ist wiederum eindeutig nach 4).

Induktionsschritt:

Induktionsvorraussetzung: Sei n ∈ N derart, dass alle Worte, bestehend aus maximal n Ter- minalen, eine bis auf das Startnichtterminal eindeutige Herleitung haben. F¨ur ein gegebenes Startterminal ist die Herleitung also eindeutig.

Induktionsbehauptung: Dann haben auch alle Worte mit maximaln+ 1 Terminalen eine bis auf das Startterminal eindeutige Herleitung.

Induktionsbeweis: Seiω ein Wort bestehend ausn+ 1 Terminalen.

Man beachte, dass die Terminalfolgendo und end,def und endsowie(und)immer paarweise auftreten (siehe Regeln von F U N DEF, F U N, F U N CALL und SP ACE). Liegt ein Terminal zwischen einem solchen Paar, muss das Terminal (evtl. indirekt) durch eine der eben aufgez¨ahlten Nichtterminale erzeugt worden sein.

Es wird nun gezeigt, dass f¨ur ein gegebenes Startterminal, der Rest der Herleitung eindeutig ist.

Beginne die Herleitung vonω mit einem der folgenden Nichtterminale:

(17)

1. VARPART

Die Herleitung ist einfach nur die direkte Reduktion VARPART→ω und somit eindeutig.

2. GLOBAL

Das Nichtterminal GLOBAL kann nur zum Terminal $ und Nichtterminal VARPART aufgel¨ost werden. Der Rest des Wortesω (ohne das f¨uhrende$) besitztnTerminale und ist nach I.V. eindeutig ausVARPART herleitbar. GLOBAList also eindeutig.

3. LOCAL

LOCAL kann nur zu den Terminalenlocal und dem NichtterminalVARPART aufgel¨ost werden. Der Rest des Wortes (ohnelocal ) besitzt weniger alsn+ 1 Terminale und ist nach I.V. eindeutig aus VARPART herleitbar. LOCAList also eindeutig.

4. VAR

Beginntω mit einem$, so kann das Wort nur durchGLOBALerzeugt werden, beginnt es mit einem local , so muss das Wort durch LOCAL erzeugt werden. Genau dann, wenn ω mit keinem der beiden Teilworte beginnt, kann das Wort nur durch VARPART erzeugt werden. Zu welchem Nichtterminal VAR aufgel¨ost werden muss, ist f¨ur gegebenes ω also eindeutig bestimmt.

VARist also eindeutig, da die Herleitung aus VARPART,GLOBALundLOCALnach 1), 2) und 3) eindeutig ist.

5. ARGDEKL

, k¨onnen nicht inVARPART erzeugt werden, entsprechend werden diese Terminale direkt von ARGDEKL hergeleitet. Die Teilw¨orter zwischen (sowie vor und nach) diesen Termi- nalen werden von VARPART[:] erzeugt. Betrachte ein solches Teilwort.

Das Terminal : kann inVARPART nicht am Ende eines Wortes erzeugt werden, also muss das : Terminal am Ende eines Teilwortes von ARGDEKLerzeugt worden sein. Der Rest des Teilwortes (bzw. das gesamte Teilwort, sollte es nicht auf : enden), wird hingegen von VARPART hergeleitet. Diese Herleitung ist eindeutig nach I.V. beziehungsweise nach 1), falls keine : oder,im Wort vorkommen.

6. F U N

ω beginnt und endet offensichtlich auf einemdo-end-Paar.

Folgt in ω demdo direkt eincatch , so kann das catch nur von dem Startnichtterminal F U N erzeugt werden. Existiert in ω vor dem ersten -> Teilwort nur ein einziges do , muss es ebenfalls von dem Startnichtterminal F U N erzeugt worden sein und somit wird alles zwischen do und -> (bzwcatch und -> ) vonARGDEKLhergeleitet.

Die Herleitung durch ARGDEKL ist eindeutig nach I.V. da weniger als n+ 1 Terminale von ARGDEKLerzeugt werden.

Alles zwischen -> (oder zwischen dem ersten do , sollte kein -> vorhanden sein oder es nach einem anderendo kommen) und endmuss also vonLIN ES erzeugt werden. Dieses vonLIN ES erzeugte Unterwort hat weniger alsn+ 1 Terminale (do und endfehlen), die Herleitung ist also eindeutig nach I.V..

7. F U N CALL

ω muss auf einem )-Terminal enden. Das )-Terminal hat ein eindeutiges zugeh¨origes (- Terminal. Alles vor diesem(-Terminal muss vonRVALUEerzeugt werden und alles zwischen dem (-)-Paar muss vonARGS erzeugt werden (falls es nicht das leere Wort ist).

Da bei den Herleitungen ausgehen von RVALUE undARGS W¨orter mit weniger als n+ 1 Terminalen entstehen m¨ussen, ist deren Herleitung eindeutig nach I.V.. Somit ist auch F U N CALL eindeutig.

(18)

8. SP ACE

ω beginnt auf einem (-Terminal und endet auf einem )-Terminal. Die Leerzeichen in ω werden genau dann von derSP ACEWurzel des Herleitungsbaumes erzeugt, wenn sie nicht zwischen einem anderen(-)-Paar oder einemdo-end-Paar stehen.

Alles zwischen den Leerzeichen, die von dem Startnichtterminal erzeugt werden, muss von RVALUE hergeleitet werden. Die Herleitung dieser Teilw¨orter ist eindeutig nach I.V., da die Teilworte weniger als n+ 1 Terminale besitzen. Die Herleitung von ω ausgehend von SP ACE ist also eindeutig.

9. RVALUE

Beginntω mit einem(-Terminal, mussRVALUE zu einemSP ACEaufgel¨ost werden.

Beginnt es nicht mit einem (-Terminal aber endet auf ein )-Terminal, muss RVALUE zu einem F U N CALLaufgel¨ost werden.

Treten diese beiden F¨alle nicht ein und ω beginnt mit einem do-Terminal, muss RVALUE zu einemF U N reduziert werden.

Beginnt es hingegen mit einem^Terminal, muss die Herleitung mitRVALUE→^VARPART beginnen.

Genau dann, wenn keiner dieser F¨alle eintritt, mussRVALUE zu einemVAR werden.

Alle diese Herleitungen sind eindeutig nach 1),4),6),7) und 8) und somit ist auch RVALUE eindeutig.

10. ARGS

Die ,-Terminale in ω stehen genau dann nicht in einem do-end-Paar oder einem(-)-Paar, wenn sie direkt von dem ARG Startnichtterminal erzeugt werden. Welche ,-Terminale also von der Wurzel erzeugt werden, ist eindeutig. Alle Teilw¨orter von ω zwischen diesen ,-Terminalen m¨ussen jeweils vonRVALUE erzeugt werden. Die Herleitung ausRVALUE ist nach I.V. gegeben (die,-Terminale fehlen, Anzahl Terminale ist also kleinern+ 1). Werden keine ,-Terminale direkt von derARGS Wurzel erzeugt, erfolgt die Eindeutigkeit per 9).

11. ASSIGN

Ein := Teilwort, kann nur durchASSIGNerzeugt werden (:=ist kein g¨ultigerVARPART).

Es gibt genau ein := Teilwort inω, das nicht im Inneren einesdo-end-Paares oderdef-end- Paares enthalten ist, denn weitereASSIGNNichtterminale k¨onnen im Herleitungsbaum nur (indirekt) ¨uberF U N DEF undF U N auftreten.

Alles vor diesem, von demASSIGN Startnichtterminal erzeugten, := Teilwort muss von VAR erzeugt werden und alles nach dem := wird vonRVALUE erzeugt. Die Herleitung ausgehend vonVARundRVALUE sind nach I.V. eindeutig.

Die Herleitung beginnend mitASSIGN ist also eindeutig.

12. COP Y

Ein = Teilwort, kann nur durchCOP Y erzeugt werden (=ist kein gültigerVARPART). Es gibt genau ein = Teilwort inω, das nicht im Inneren einesdo-end-Paar oderdef-end-Paar enthalten ist, denn weitere COP Y Nichtterminale können im Herleitungsbaum nur (indirekt) überF U N DEF undF U N auftreten.

Alles vor und nach diesem, von der COP Y Wurzel erzeugten, = Teilwort muss von RVALUE erzeugt werden. Die Herleitungen ausgehend von den beidenRVALUE sind nach I.V. eindeutig.

Die Herleitung beginnend mitCOP Y ist also eindeutig.

13. RET U RN

ω beginnt mityield oder mitreturn . Alles dahinter muss vonRVALUE erzeugt werden und enth¨alt weniger alsn+ 1 weitere Terminale. Die Herleitung ist nach I.V. also eindeutig.

(19)

14. LIN E

Beginntω mitreturn oderyield , mussLIN E zuRET U RN reduziert werden.

Enth¨altωein = , das nicht zwischen einemdo-end-Paar steht, mussLIN Ezu einemCOP Y aufgel¨ost werden. Bei einem := außerhalb einesdo-end-Paares, wirdLIN EzuASSIGN.

Genau dann, wenn keiner dieser F¨alle eintritt, kann ω ausgehend von LIN E nur ¨uber RVALUE erzeugt werden.

Alle diese Herleitungen sind eindeutig nach den vorherigen F¨allen.

15. LIN ES

Genau die ;-Terminale, die nicht in einem do-end-Paar stehen, werden von dem LIN ES Startnichtterminal erzeugt.

Alle Teilworte zwischen diesen eindeutig gegebenen;-Terminalen werden vonLIN Ehergeleitet.

Nach I.V. sind diese Herleitungen eindeutig, denn die Anzahl Terminale ist durch fehlende

;kleiner alsn+ 1.

Alle Worte der Kernsprache werden mit LIN ES als Startnichtterminal gebildet. Mit dieser Festlegung des ersten Nichtterminals ist somit die Herleitung aller Worte der Kernsprache eindeutig.

Die Grammatik ist eindeutig.

In Anwendung ist es nat¨urlich m¨oglich, weitere Leerzeichen oder Klammern zu verwenden oder auch Klammern wegfallen zu lassen. Man beachte aber, dass nach einem Funktionsaufruf kein Leerzeichen gesetzt werden darf. Ansonsten kann a (b c)sowohl als normaler Funktionsaufruf wiea(b c), aber auch alslazy-order Aufruf von(a (b c))verstanden werden.

F¨ur fehlende Klammern bei einem SP ACE Ausdruck gilt, dass so geparst wird, als seien die Klammern so weit wie m¨oglich voneinander entfernt.

a b c d() wird also zu (a b c d()) und nicht etwa zu (a b c d)()

Des Weiteren ist die Grammatik auch eindeutig, wenn bei der Herleitung aus LIN ES auf das letzte LIN E kein ; folgt. F¨ur die operationale Semantik ist der Beweis der Eindeutigkeit aber einfacher, wenn immer ein ; erwartet wird. So ist n¨amlich offensichtlicher, ob ein Wort ausLIN ES oderLIN Ehergeleitet wurde.

(20)

2.3 Semantik

F¨ur die formale Beschreibung von Semantiken gibt es verschiedene Ans¨atze. Die folgenden drei sind am meisten verbreitet (siehe [6]):

1. Dieaxiomatische Semantik verwendet logische Aussagen um ein Programm zu beschreiben.

Ein Programm besitzt Axiome und der Programmablauf wird durch Schlussfolgerungen beschrieben.

2. Diedenotationale Semantikverwendet mathematische Räume um ein Programm zu beschreiben. Der Ablauf des Programms sind dann Funktionen, die Räume in andere Räume überge- hen lassen.

3. Dieoperationale Semantikdefiniert mögliche Auswertungsschritte des Programms. Der Pro- grammablauf ist dann die Ausführung solcher Schritte. Es wird des Weiteren zwischen big-step undsmall-step unterschieden. Small-step definiert kleine Auswertungsschritte, die nacheinander ausgeführt werden. Big-step hingegen wertet das gesamte Programm durch wenige (oder gar einen einzigen) großen Schritt ab.

F¨ur die Beschreibung der Semantik vonlazy Imp wird in dieser Arbeit dieoperationale Semantik verwendet. Dabei wird folgende Darstellung verwendet:

Bedingung

Aktueller Zustand =⇒ Folgezustand

Der Zustand gibt dabei die Variablenzuordnung und den aktuell zu betrachtenden Code an. Zum besseren Verst¨andnis hier ein einfaches Beispiel:

1 + 1 =⇒ 2

({}, a= 1 + 1) =⇒ ({a7→2})

Dieser Ausdruck beschreibt ”Wenn 1+1 zu 2 ausgewertet wird, wirda= 1 + 1 zu dem Zustand ausgewertet, bei dem die Variableazu 2 aufgelöst wird”. Meistens lässt sich diese Notation nicht nur als eine Implikation lesen, sondern auch als eine Folge von Ausführungen. Der vorherige Aus- druck lässt sich auch wie folgt interpretieren: ”Uma= 1 + 1 auszuwerten, werte zuerst 1 + 1 aus.

Ordne das Ergebnis dann Variableazu.”

Der Unterschied zwischen small-step und big-step Semantik sollte durch folgendes Beispiel klar werden. Beide Regeln beschreiben die Abarbeitung mehrerer Zeilen:

(Z₁, zeile1; ) =⇒ (Z₂) (Z1, zeile1;rest; ) =⇒ (Z2, rest; ) (Z1, zeile1; ) =⇒ (Z2),(Z2, rest; ) =⇒ (Z3)

(Z₁, zeile1;rest; ) =⇒ (Z₃)

Die erste Variante ist einesmall-step Semantik. Sie formt den Code in einen neuen Code um, der dann durch die Anwendung weiterer Regeln weiter ausgef¨uhrt werden kann. Die zweite Variante hingegen wertet gleich den gesamten Ausdruck aus, indem die Auswertung vonrestals eine Art rekursiver Aufruf in der Bedingung geschieht.

Dieoperationale Semantik vonlazy Imp ist einebig-step Semantik.

(21)

2.3.1 Operationale Semantik

Der Zustand des Programms wird durch einen Stackν = (ν₀, ..., ν_n) und die partiellen Funktionen ν_i und ρdargestellt. ν_i ist dabei die ite Funktion auf dem Stack, ν_n liegt ganz oben. F¨ur die Funktion gilt:

ν_i:V →R , dabei ist V die Menge der Variablen undR eine Referenzmenge.

R kann alsNbetrachtet werden und f¨ur die Speicheradresse von Werten stehen. Rdarf aber auch eine beliebige andere abz¨ahlbare Menge sein.

ρ:R→W , dabei ist W die Menge der Werte, also Funktionen und Objekte.

Anschaulich l¨ost ν die Variablen also zu einer Speicheradresse auf und ρ liest an einer gegebenen Speicheradresse den gespeicherten Wert.

Zur besseren Darstellung der operationalen Semantik werden noch einige Ausdr¨ucke und Funktio- nen definiert:

ν(v) :=νi(v), wobeii das gr¨oßtei, f¨ur dasνi(v) definiert ist.

νi

hv r i

:=ν_i⁰ mitν_i⁰(w) :=

r fallsw=v ν_i(w) sonst νhv

r i:=

(ν₀, ..., ν_n−1, ν_n[^v_r]) fallsν(v) nicht definiert.

(ν₀, ..., ν_i−1, ν_i[^v_r], ν_i+1, ..., ν_n) mit gr¨oßtemi, f¨ur dasν_i(v) definiert ist.

ρhr w i

:=ρ⁰ mitρ⁰(s) :=

w fallss=r ρ(s) sonst Des Weiteren gibt es einige interne Variablen:

jr , genau danntrue, wenn einreturnSprung ausgef¨uhrt wird.

jy , genau danntrue, wenn einyieldSprung ausgef¨uhrt wird.

jv , ist eine Globale Variable inν und enth¨alt den R¨uckgabewert vonreturnoderyield.

Der Zustand ist das Tupel σ= (ν, ρ, jy, jr). Falls jy oder jr während der Berechnung eines Teilausdruckstruewerden, bricht die Regel ab und gibt den zuletzt berechneten Zustand zusammen mit dessenν(jv) als Ergebnis aus. Zur besseren Lesbarkeit wird diese Eigenart nicht in den unteren Regeln mit aufgeführt, entsprechend werden auch jyund jrim Zustand nicht angegeben, sofern eine Regel nicht in besonderer Weise auf diese Werte eingeht. Häufig werden auchν undρ nicht explizit angegeben und stattdessenσverwendet. In diesem Fall istσ(v) := (ρ◦ν)(v).

Um bei den Regeln nicht immer den Typ mit anzugeben, stehen folgende Metavariablen immer f¨ur bestimmte Typen. Mit Typ ist hierbei gemeint, ob es sich um eine Variable handelt, einen Wert oder ein Element ausR.

r steht immer f¨ur ein Element ausR.

v steht f¨ur einen Variablennamen, aber ohne daslocal oder $ Prefix.

w steht f¨ur einen Wert, also ein Element aus W. Im Falle der Kernsprache also eine Funktion.

e steht f¨ur ein beliebigen Ausdruck, genauer gesagt ein Programm - dazu gleich mehr.

Der Hauptgedanke der Auswertung ist, alles zu einem Referenzwert auszuwerten, damit dieser dann ggf. f¨ur eine Referenzzuweisung verwendet werden kann. Die Semantik vonlazy Imperlaubt deshalb auch Referenzwerte in ihren Programmen. Genauer definiert heißt das:

Das WortP nennen wir Programm, wenn es sich durch eines der Nichtterminale der Grammatik vonlazy Imp herleiten l¨asst, wobei diese um folgende Produktionsregeln erweitert wurde:

RVALUE → REF EREN CE REF EREN CE → ein Element ausR

Die Grammatik ist mit diesen Änderungen offensichtlich weiterhin eindeutig, dennREF EREN CE kann ausschließlich zu Referenzwerten aufgelöst werden und Referenzwerte können wiederrum nur

(22)

Um die ^v Ausdrücke verarbeiten zu können, wird die Funktion ζ eingeführt. Diese ersetzt in einem Ausdruck alle ^v, die im obersten Namensraum auftauchen, durchν(v). Formal bedeutet dies:

ζ(ν, e1=e2) =ζ(ν, e1)=ζ(ν, e2) ζ(ν, e1:=e2) =ζ(ν, e1):=ζ(ν, e2)

ζ(ν, e(e₁, ..., e_n)) =ζ(ν, e)(ζ(ν, e₁), ..., ζ(ν, e_n)) ζ(ν,(e1e2...en)) = (ζ(ν, e1)ζ(ν, e2)...ζ(ν, en))

ζ(ν, e₁;...;e_n; ) =ζ(ν, e₁);...;ζ(ν, e_n);

ζ(ν,^v) =ν(v) ζ(ν, v) =v ζ(ν,local v) =local v ζ(ν,do ... end) =do ... end

Manche Regeln der lazy Imp Semantik erfordern die Auswertung von Unterausdr¨ucken, deshalb ist folgende Regel vorhanden:

Referenz

(ν, ρ, r) =⇒ (ν, ρ, r)

Ein Referenzwert muss nicht ausgewertet werden, denn er ist bereits ausgewertet. Diese Regel ist nur vorhanden, um Unterausdr¨ucke, die nur ein Referenzwert sind, auswerten zu k¨onnen.

2.3.2 Variablen

Kopiezuweisung

KZuweisung (ν, ρ, e2) =⇒ (ν⁰, ρ⁰, r2),(ν⁰, ρ⁰, e1) =⇒ (ν⁰⁰, ρ⁰⁰, r1), ρ⁰⁰(r2) =w (ν, ρ, e1=e2) =⇒ (ν⁰⁰, ρ⁰⁰[^r_w¹], r1)

Diese Regel beschreibt, dass zuerst die rechte Seite der Zuweisung ausgeführt wird. Danach wird die linke Seite ausgeführt undρso verändert, dass die linke Speicheradresse auf dem gleichen Wert wie die rechten Speicheradresse zeigt.

Referenzzuweisung

RZuweisung (ν, ρ, e) =⇒ (ν⁰, ρ⁰, r) (ν, ρ, v:=e) =⇒ (ν⁰[^v_r], ρ⁰, r)

RZLokal

(ν, ρ, e) =⇒ (ν⁰, ρ⁰, r) ν_n⁰(v) nicht definiert, ν⁰⁰= (ν₀⁰, ..., ν_n−1⁰ , ν_n⁰[^v_r]) (ν, ρ,local v:=e) =⇒ (ν⁰⁰, ρ⁰, r)

RZGlobal

(ν, ρ, e) =⇒ (ν⁰, ρ⁰, r) ν⁰⁰= (ν₀⁰[^$v_r], ν⁰₁, ..., ν_n−1⁰ ,) (ν, ρ,$v:=e) =⇒ (ν⁰⁰, ρ⁰, r)

Hier wird ebenfalls die rechte Seite zuerst ausgef¨uhrt und der resultierende Referenzwert der Variable auf der linken Seite zugeordnet.

(23)

return, yield

Return (ν, ρ, e) =⇒ (ν⁰, ρ⁰, r)

(ν, ρ,return e) =⇒ (ν⁰[ ^jv_r ], ρ⁰, true, true, r)

Yield (ν, ρ, e) =⇒ (ν⁰, ρ⁰, r)

(ν, ρ,return e) =⇒ (ν⁰[ ^jv_r ], ρ⁰, true, f alse, r)

Return und Yield werten den darauf folgenden Ausdruck aus und speichern ihn unter jv. Des Weiteren wird jrbeziehungsweise jy gesetzt, damit der restliche Code ¨ubersprungen wird.

Auslesen

VarDekl

ν(v) nicht definiert, ρ(r) nicht definiert (ν, ρ, v) =⇒ (ν[^v_r], ρ[_nil^r ], r)

LokalVarDekl

ν_n(v) nicht definiert, ρ(r) nicht definiert, ν⁰= (ν0, ..., ν_n−1, νn[^v_r]) (ν, ρ,local v) =⇒ (ν⁰, ρ[_nil^r ], r)

GlobalDekl

ν₀($v) nicht definiert, ρ(r) nicht definiert, ν⁰ = (ν0[^$v_r], ν1, ..., νn) (ν, ρ,$v) =⇒ (ν⁰, ρ⁰[_nil^r ], r)

Sollte die Variable noch nicht deklariert sein, wird sie angelegt und mit einer Referenz auf eine neuenil-Kopie initialisiert. Da es in der Kernsprache bis auf Funktionen noch keine Objekte gibt, ist mitnilerst einmal die Funktiondo yield nil; endgemeint. Sp¨ater istnilein eigenst¨andiges Objekt.

Var ν(v) =r (σ, v) =⇒ (σ, r)

GlobalVar ν0($v) =r (σ,$v) =⇒ (σ, r)

Sind die Variablen hingegen deklariert, werden sie einfach ¨uber dieν Funktion ausgelesen.

(24)

2.3.3 Funktionen

Definition

FErzeugung ρ(r) nicht definiert, ζ(ν, e2) =e⁰ (ν, ρ,do [catch] e₁ -> e₂ end) =⇒ (ν, ρ[ ^r

do [catch]e1 -> e⁰ end], r) e1 kann hierbei mehrere oder auch keine Argumente repr¨asentieren.

Im Fallee1=ist mit ”doe1->e2 end” ein ”doe2 end” gemeint.

Diese Regel legt ein neues Funktionsobjekt an und gibt den neuen Referenzwert auf die Funktion zur¨uck.

FVerz¨ogert

(ν, ρ, e₀) =⇒ (ν⁰, ρ⁰, r)

ρ⁰(r) =do [catch]v1[:], ..., vn[:] -> e end

(ν⁰, ρ⁰, e1) =⇒ (ν¹, ρ¹, r1)...(ν^k−1, ρ^k−1, e_k−1) =⇒ (ν^k, ρ^k, rk)

(ν^k, ρ^k,do vk+1:, ..., vn:-> yield r(r1, ..., rk, vk+1, ..., vn) end) =⇒ (ν⁰⁰, ρ⁰⁰, r⁰⁰)) (ν, ρ, (e₀ e₁e₂...e_k)) =⇒ (ν⁰⁰, ρ⁰⁰, r⁰⁰)

Dieser Schritt mag etwas unintuitiv wirken, denn diee_i werden ausgewertet, obwohl diese Schreibweise f¨urlazy-order steht. Die Auswertung hat aber einen guten Grund:

fun fun2(a,b)soll fun2 direkt ausführen undfunverzögert auswerten. Soll der gesamte Ausdruck verzögert ausgewertet werden, verwendet man stattdessen:

fun (fun2 a b) Aufruf

FAusf¨uhrung

(ν, ρ, e₀) =⇒ (ν⁰, ρ⁰, r)

ρ⁰(r) =do [catch]v1[:], ..., vn[:] -> e end,

(ν⁰, ρ⁰, e₁) =⇒ (ν¹, ρ¹, r₁), ...,(νⁿ⁻¹, ρⁿ⁻¹, e_n) =⇒ (νⁿ, ρⁿ, r_n) ν^push= ((νⁿ)0, ...,(νⁿ)m,{}),

(ν^push, ρⁿ,local v1[:] =r1) =⇒ (ν⁰¹, ρ⁰¹), ...,

(ν⁰ⁿ⁻¹, ρ⁰ⁿ⁻¹,local vn[:] =rn) =⇒ (ν⁰ⁿ, ρ⁰ⁿ) (ν⁰ⁿ, ρ⁰ⁿ, e) =⇒ (ν⁰⁰, ρ⁰⁰, jy, jr, r⁰⁰), ν^pop= (ν₀⁰⁰, ..., ν_m⁰⁰)

(ν, ρ, e0(e1, ...en)) =⇒ (ν^pop, ρ⁰⁰, f alse, jr, ν₀⁰⁰⁰(jv))

Dieser Regel beschreibt, dass zuerst die Argumentausdr¨ucke nacheinander ausgewertet werden.

Danach wird ein neuer Namensraum auf den Stack gelegt und die Argumentsvariablen belegt.

Zuletzt wird dann der Funktionsrumpf ausgef¨uhrt und der neue Namensraum wieder vom Stack entfernt.

Sollte die Funktion einencatch modifier haben, so wird auch jrim Ergebnis auf f alsegesetzt.

Wird jr bei der Auswertung eines local vi = ri zu true, so wird hier nicht wie bei anderen semantischen Regeln direkt abgebrochen! Stattdessen wird trotzdem ν^pop = (ν0, ..., νm) f¨ur den zuletzt erhaltenen (ν, ρ, jy, true) Status angewendet und stattdessen (ν^pop, ρ, jy, true, v^pop(jv)) zur¨uckgegeben.

Diese Regel lässt sich wie FErzeugung für n = 0 auch auf Funktionen, die kein Argument benötigen, anwenden.

Zeilen

FAufImplizitA

e1=do [catch] e⁰ end,(σ, e1) =⇒ (σ⁰, r1), (σ⁰, r1()) =⇒ (σ⁰⁰, r2)

(σ⁰⁰, e₂;...;e_n) =⇒ (σ⁰⁰⁰, r₃) (σ, e₁;e₂;...;e_n; ) =⇒ (σ⁰⁰⁰[_r^jv

3], r₃)

e₁ kann hierbei mehrere oder auch keine Argumente repr¨asentieren.

Im Fallee₁=ist mit ”doe₁->e₂ end” ein ”doe₂ end” gemeint.

Zum Schluss der Auswertung wird das zuletzt erhaltene Ergebnis der jv Variable zugewiesen, sodass Funktionen ohneyieldoderreturn, den zuletzt berechneten Wert zur¨uckgeben.

(25)

FAufImplizitB

e₁= (e⁰₁ e⁰₂ ... e⁰_n), (σ, e1) =⇒ (σ⁰, r1), (σ⁰, r1()) =⇒ (σ⁰⁰, r2) (σ⁰⁰, e₂;...;e_n) =⇒ (σ⁰⁰⁰, r₃) (σ, e₁;e₂;...;e_n; ) =⇒ (σ⁰⁰⁰[_r^jv

3], r₃)

FAufImplizitC

e1=v odere1= $v, (σ, e1) =⇒ (σ⁰, r1), (σ⁰, r1()) =⇒ (σ⁰⁰, r2) (σ⁰⁰, e₂;...;e_n) =⇒ (σ⁰⁰⁰, r₃) (σ, e₁;e₂;...;e_n; ) =⇒ (σ⁰⁰⁰[_r^jv

3], r₃)

FAufImplizitD

ρ(r) =do [catch] e end, (σ⁰, r1()) =⇒ (σ⁰⁰) (σ⁰⁰, e2;...;en) =⇒ (σ⁰⁰⁰, r3) (σ, r1;e2;...;en; ) =⇒ (σ⁰⁰⁰[_r^jv

3], r3)

Diese Regeln besagen, dass zuerst die erste Zeile des Programms ausgeführt wird. Sollte diese Zeile eine Funktion ohne Argumente zurückliefern, so kann diese direkt ausgeführt werden. Be- dingung dafür ist, dass die ausgeführte Zeile einF U N,SP ACE,VARoder^VARPART Ausdruck war.

F¨ur alle anderen Worte ist folgende Regel wichtig:

MultiLine

FAufImplizitA-FAufImplizitDlassen sich nicht anwenden, (σ, e1) =⇒ (σ⁰, r1)

(σ⁰, e₂;...;e_n; ) =⇒ (σ⁰⁰, r₂) (σ, e₁;...;e_n; ) =⇒ (σ⁰⁰[_r^jv

2], r₂)

Diese Regel f¨uhrt einfach nur die erste Zeile und danach das Restprogramm aus.

2.3.4 Beispiele

Das erste Beispiel soll die Funktionsweise von jrund jy verdeutlichen:

Multiline Yield

Var ν(a) = 1

(ν = ({a7→1)}), ρ,a) =⇒ (ν= ({a7→1)}), ρ,1)

(ν= ({a7→1)}), ρ,yield a) =⇒ (ν = ({a7→1, jv7→1}), ρ, true, f alse,1) (ν= ({a7→1)}), ρ,yield a; b;) =⇒ (ν= ({a7→1, jv7→1}), ρ, true, f alse,1) Wie inMultiLinebeschrieben, wird zuerst die erste Zeile ausgeführt. Danach sollten eigentlich die restlichen Zeilen ausgeführt werden, aber das Zwischenergebnis hat für jy den Wert true.

Entsprechend wird die Regel abgebrochen und dieses Zwischenergebnis zur¨uckgegeben.

Das n¨achste Beispiel geht etwas n¨aher auf die Kopiezuweisung und Deklaration von Variablen ein.

(26)

2 Kernsprache

ManbeachtedasKommaamEndederoberstenReduktion!DiebeidenoberenAuswertungensindbeideTeilderBedingungf¨urdiedritteReduktion. KZuweisung

FErzeugungρ(1)nichtdefiniert,ζ(ν,yieldy;)=yieldy; (ν=({}),ρ={},dox:,y:->yieldy;end)=⇒(ν=({}),ρ={17→dox:,y:->yieldy;end},1) VarDeklρ(2)nichtdefiniert (ν=({}),ρ={17→dox:,y:->yieldy;end},a)=⇒(ν={a7→2},ρ={17→dox:,y:->yieldy;end, 27→dox:->yieldnil;end} w=ν(2)=dox:,y:->yieldy;end (ν=({}),ρ={},a:=dox:,y:->yieldy;end)=⇒(ν=({a7→2}),ρ={17→dox:,y:->yieldy;end, 27→dox:,y:->yieldy;end},2) (ν=({}),ρ={},a=dox:,y:->yieldy;end;)=⇒(ν=({a7→2, jv7→2}),ρ={17→dox:,y:->yieldy;end, 27→dox:,y:->yieldy;end}) WahlderverwendetensemantischenRegelnlässtsichauchineinemBaumdarstellen.DabeiistjedeverwendeteRegeleinKnotenunddie dieinderBedingungverwendetwurden,sinddieKinder. SemantikbaumfürdasvorherigeBeispielsiehtzumBeispielwiefolgtaus: MultiLine KZuweisung FErzeugungVarDekl ArtderDarstellungfunktioniertnichtbeismall-stepSemantiken.BeidiesenSemantikenkönnennacheinandermehrereRegelnangewendet erden,umProgrammeSchrittfürSchrittumzuformenundsoeinenAusdruckauszuwerten.DieKindereinesKnotenmüsstenalsoeineFolgevon sein,wobeijedeRegelwiederFolgenvonRegelnalsKinderbesitzt. derSemantikvonlazyImpfunktioniertdieseDarstellung,daimmernureineRegelfürdieAuswertungeinesAusdrucksangewendetwird.Alle eiterenRegeln,diezurAuswertungverwendetwerden,werdenindenBedingungenausgeführt-siesindalsowiederumKinderdervorherigenRegel keineFolgenglieder. dieseArtderDarstellungfürdieSemantikvonlazyImpmöglichist,istfürspätereInduktionsbeweisenachderTiefediesesBaumesnötig.

(27)

2.3.5 Eindeutigkeit der Semantik

Definition und Vor¨uberlegung

Definition 2: Eindeutigkeit einer Semantik.

Eine Semantik heißt eindeutig, wenn f¨ur jeden ZustandZ und jedes ProgrammP gilt:

(Z, P) =⇒ (ZA, PA) und (Z, P) =⇒ (ZB, PB) dann gilt (Z_A, P_A) = (Z_B, P_B)

Anders ausgedrückt bedeutet dies, dass für jedes (Z, P) maximal ein mögliches Ergebnis der Auswertung existiert.

Dies ist für die Semantik von lazy Imp nicht gegeben, denn manche Regeln sind nicht deter- ministisch. Die Bedingung ”ρ(r) ist nicht definiert” in den RegelnVarDekl, LokalVarDekl, GlobalVarDekl und FErzeugung schreibt nämlich nicht vor, wie das r ∈ R zu wählen ist.

Entsprechend k¨onnen zwei Auswertungen des Programms verschiedenerw¨ahlen, sodass die Funk- tionenν undρnicht eindeutig festgelegt sind.

Dies ist nicht weiter schlimm, bedenkt man, dass R effektiv die Menge der Speicheradressen repräsentiert. Es ist nicht wichtig, wo im Speicher ein Wert gespeichert wird, es ist nur wichtig, welche Variablen vonν zur gleichen Adresse aufgelöst werden und dassν◦τ sich unabhängig von der Wahl der Speicheradresse, gleich verhält.

Da der Speicherort eines Wertes nicht wichtig ist, kann man den Begriff der Eindeutigkeit für lazy Imp ein wenig verallgemeinern. Wir wollen die Auswertung eindeutig nennen, wenn sich Zustände und resultierendes Programm nur durch die Referenzwerte unterscheiden. Des Weiteren soll man diesen Unterschied durch eine Neuordnung der Referenzwerte (Neuordnung des Speichers) aufgehoben werden. Dazu definieren wir zunächst folgende Notation:

Definition 3: Seiβ:R→Reine Funktion undP ein Programm. Dann istβ[P] das Programm, bei dem alle ReferenzwerterinP durchβ(r) ersetzt wurden. Formal istβ[·] also definiert als:

β[e1=e2] =β[e1]=β[e2] β[e1:=e2] =β[e1]:=β[e2] β[e(e1, ..., e2)] =β[e](β[e1], ..., β[e2]) β[(e1 e2...en)] = (β[e1] β[e2]...β[en])

β[e₁;...;e_n; ] =β[e₁];...;β[e_n];

β[^v] =^v β[v] =v β[r] =β(r) β[local v] =local v

β[do e₁ -> e₂ end] =do e₁ -> β[e₂] end Seif eine Funktion, dann istβ[f](x) :=β[f(x)], das heißtβ[f] =β[·]◦f. Darauf basierend l¨asst sich folgende ¨Aquivalentsrelation definieren:

Definition 4: semantisch ¨aquivalent,≡⊂ {(ν, ρ, P)}² (νA, ρA, PA)≡(νB, ρB, PB) :⇔

Es existiert eine Bijektionβ :R→Rmit

1. β◦νiA=νiB für allei(also für alle Namensräume), 2. β[ρA] =ρB◦β und

(28)

Satz 2: ≡ist eine ¨Aquivalenzrelation.

1. Reflexiv:

F¨urβ =idgilt

β◦νi=νi f¨ur alle partielle Funktionenνi:V →R, β[P] =P f¨ur alleP und somit auch

β[ρ] =ρ=ρ◦β f¨ur alleρ.

⇒F¨ur alle (ν, ρ, P) gilt also (ν, ρ, P)≡(ν, ρ, P).

2. Symmetrisch:

Sei (ν_A, ρ_A, P_A)≡(ν_B, ρ_B, P_B) undβ die entsprechende Bijektion, dann gilt f¨ur α=β⁻¹: ν_iA=α◦β◦ν_iA=α◦ν_iB,

α[β[P]] =P f¨ur alleP, dennα[β[r]] =α(β(r)) =rf¨ur aller∈R. Somit gilt auch α[ρB](r) =α[β[ρA]](r) =α[β[ρA(r)]] =ρA(r)

⇒Es gilt (νB, ρB, PB)≡(νA, ρA, PA) 3. Transitiv:

Sei (νA, ρA, PA)≡(νB, ρB, PB) mitβ und (νB, ρB, PB)≡(νC, ρC, PC) mit γ, dann gilt f¨urα=β◦γ:

α◦νiA =β◦γ◦νiA=β◦νiB =νiC, α[ρA] =β[γ[ρA]] =β[ρB] =ρC, α[PA] =β[γ[PA]] =β[PB] =PC

⇒(ν_A, ρ_A, P_A)≡(ν_C, ρ_C, P_C)

Definition 5: zul¨assiger auszuwertender Ausdruck

Ein Tupel (ν, ρ, ω) nennen wir einen zul¨assigen auszuwertenden Ausdruck, wenn gilt:

1. Bild(ν)⊂Def(ρ)

2. Alle Referenzwerter, die in Worten aus Bild(ρ) auftauchen, liegen inDef(ρ).

3. Alle Referenzwerter, die inω auftauchen, liegen inDef(ρ).

Mit anderen Worten: (ν, ρ, ω) enthält keine Referenzwerte, die nicht aufgelöst werden können.

Definition 6: erweiterte Eindeutigkeit

Die Semantik vonlazy Imp heißt erweitert eindeutig, wenn gilt:

F¨ur alle zul¨assigen auszuwertenden Ausdrucke (ν, ρ, ω) und zwei endliche Auswertungen (ν, ρ, P) =⇒ (νA, ρA, PA) und

(ν, ρ, P) =⇒ (νB, ρB, PB)

=⇒(ν_A, ρ_A, P_A)≡(ν_B, ρ_B, P_B)

Die erweiterte Eindeutigkeit ist also die klassische Eindeutigkeit bezüglich der semantischen Äqui- valenz (≡) für endliche Auswertungen.

Die Einschränkung auf endliche Auswertungen ist wichtig, für unendliche Auswertungen ist lazy Imp tatsächlich nicht eindeutig. Man betrachte z.B. ein Programm, dass unendliche lange läuft und einfach nur Speicher allokiert (man betrachte R = N). Einerseits kann der Speicher

”nach” der Ausführung als voll betrachtet werden, wenn bei der i-ten Allokation ρ(i) definiert wird. Es gilt also für alle r∈Rdassr∈Def(ρ). Andererseits könnte bei der Ausführung auch für diei-te Allokationρ(2i) definiert werden, sodass nochr∈R existieren mitr /∈Def(ρ).

(29)

Eindeutigkeit von lazy Imp

Um die Eindeutigkeit der Semantik zu beweisen, wird zuerst folgende ¨Uberlegung gemacht:

Wir erlauben Referenzwerte als Teil der Syntax, das heißt man f¨ugt folgende Produktionsregeln der Grammatik hinzu:

RVALUE → REF EREN CE REF EREN CE → ein Element ausR

Dann lassen sich die Auswertungsregeln der Semantik immer nur auf bestimmte Worte der Gram- matik anwenden.

Auswertungsregeln Nichtterminal

Referenz REF EREN CE

KZuweisung COP Y

RZuweisung,RZLokal,RZGlobal ASSIGN

Return, Yield RET U RN

VarDekl, LokalVarDekl, VAR Var,LokalVar,

GlobalVar,GlobalVarDekl,

FErzeugung F U N

FVerz¨ogert SP ACE

FAusf¨uhrung CALL

FAufImplizitA,FAufImplizitB, LIN ES FAufImplizitC,FAufImplizitD,

MultiLine

Umgekehrt lassen sich die Worte, die von obigen Nichtterminalen herleiten lassen, nur von den entsprechenden Regeln auswerten.

Es gibt aber auch kein Wort, das durch mehr als eines dieser Nichtterminale hergeleitet werden kann - ansonsten w¨are die Grammatik n¨amlich nicht eindeutig.

Seiω ein Wort, dass sich von mindestens zwei der obigen Nichtterminale (ausgenommenLIN ES) herleiten lässt, dann gäbe es fürω mehr als eine mögliche Herleitung ausgehend von LIN E.

Mindestens zwei der folgenden Herleitungsanfänge müssten dannω erzeugen können:

LIN E→COP Y; LIN E→RVALUE;→F U N;

LIN E→RET U RN; LIN E→RVALUE;→VAR;

LIN E→ASSIGN; LIN E→RVALUE;→SP ACE;

LIN E→RVALUE;→CALL;

LIN E→RVALUE;→REF EREN CE;

Das ist ein Widerspruch zum Beweis der Eindeutigkeit der Grammatik. Dort wurde gezeigt, dass f¨ur ein beliebiges festes Startnichtterminal die Herleitung eindeutig ist.

Worteω, die sich ausLIN ESherleiten lassen, k¨onnen nicht aus anderen Nichtterminalen hergeleitet werden, da nurLIN ESdie ; Terminale erzeugt.

(30)

Offensichtlich gilt weiterhin, dass aus den Gruppen von Regeln, die f¨ur ein Nichtterminal anwendbar sind, f¨ur jedes Wort immer maximal eine dieser Regeln anwendbar ist.

Insgesamt bedeutet dies, das f¨ur jedes auszuwertende Wort, die erste anzuwendende Regel eindeutig vorgegeben ist.

Es liegt nahe, daraus direkt die (erweiterte) Eindeutigkeit der Semantik zu folgern, schließlich ist die zu verwendende Regel fest vorgegeben. Es ist aber nicht gezeigt, dass das auszuwertende Wort eindeutig ist. In den Bedingungen werden z.B. Teilworte ausgewertet, die Wahl dieser Teilworte muss auch eindeutig bestimmt sein.

Es bleibt also noch mehr zu beweisen.

Satz 3: Verwendet man bei VarDekl, LokalDekl, GlobalVarDekl und FErzeugung statt ”ρ(r) nicht definiert” die Bedingung ”kleinstesrmitρ(r) nicht definiert”, so ist die Seman- tik eindeutig bez¨uglich einer Wohlordnung<aufR.

R ist eine abzählbare Menge und somit wohl geordnet. Es existiert oBdA eine totale Ordnung, bei der jede nicht-leere Menge ein kleinstes Element existiert. Als eine abzählbare Menge existiert eine Bijektionf von Rauf eine Teilmenge von Nund somit lässt sich eine solche Ordnung durch r1< r2:⇐⇒f(r1)< f(r2) induzieren.

Beweis zu Satz 3: Der Beweis erfolgt per Induktion nach der Tiefe des Semantikbaumes. Es wird für Auswertungen, deren Semantikbaum Tiefenbesitzt, gezeigt, dass sie die einzige mögliche Auswertung für ihren Startzustand und ihr Startwort sind.

Induktionsanfang: n= 0

Sei (ν, ρ, ω) =⇒ (ν⁰, ρ⁰, ω⁰) eine Auswertung dessen Semantikbaum die Tiefe 0 besitzt. Dann war die Auswertung eine der folgenden Regeln:

1. Reference

Da nichts ge¨andert wird, ist das Auswertungsergebnis offensichtlich eindeutig.

2. Var

Diese Regel lässt sich nicht gleichzeitig mit VarDekl anwenden, denn fürVar mussν(r) definiert sein, fürVarDekl hingegen nicht.

Da ν und v = ω vorgegeben sind, ist r = ν(v) eindeutig bestimmt. Somit ist (ν, ρ, r) eindeutig bestimmt.

3. VarDekl

Als wohlgeordnete Menge, besitzt jede nichtleere Teilmenge vonRein eindeutig bestimmtes kleinstes Element. Somit existiert ein eindeutig bestimmtes r unter allen r ∈ R mit ρ(r) nicht definiert. (ν, ρ, v) ist gegeben und somit (ν[^v_r], ρ[_nil^r ], r) eindeutig bestimmt.

4. LokalVar

Diese Regel lässt sich nicht gleichzeitig mitLokalVarDeklanwenden, denn fürLokalVar mussν(r) definiert sein, fürLokalVarDeklhingegen nicht.

ν und somitνn sind gegeben. v ist ebenfalls gegeben, da es sich einfach nur um das Suffix des auszuwertenden Wortes handelt. Somit muss auch r=νn(v) eindeutig bestimmt sein, weshalb es nur ein m¨ogliches Ergebnis (ν, ρ, r) der Auswertung gibt.

5. LokalVarDekl

r ist wie in VarDekl eindeutig festgelegt. Der Stack ν und somit die Funktionen νi sind gegeben, sodass ν⁰ eindeutig ist. Entsprechend ist (ν⁰, ρ[_nil^r ], r) eindeutig bestimmt.

6. GlobalVar

Analog zuLokalVarnur mit Index 0 anstelle vonn.