Prototypische Validierung eines parametrischen polymorphen Typsystems f¨ur eine Kernsprache von Haskell

(1)

Prototypische Validierung eines parametrischen polymorphen Typsystems f¨ ur eine Kernsprache

von Haskell

Frederik Harwath 26. Juni 2008

Bachelorarbeit zur Erlangung des Titels Bachelor of Science/Informatik

am Institut f¨ur Informatik im Fachbereich Informatik und Mathematik der Johann Wolfgang von Goethe Universit¨at, Frankfurt am Main

eingereicht bei

Prof. Dr. Manfred Schmidt-Schauß

Professur f¨ur K¨unstliche Intelligenz und Softwaretechnologie Abgabedatum: 30.06.2008

Frederik Harwath Matrikelnummer: 3144934

Obermark 6 63571 Gelnhausen

(2)

Hiermit versichere ich, dass die vorliegende Arbeit von mir selbst¨andig und ohne Zuhilfenahme anderer Quellen oder Hilfsmittel, als der in der Arbeit angegebenen, verfasst wurde.

Gelnhausen, 30.06.2008

Frederik Harwath

(3)

Inhaltsverzeichnis

1 Einleitung 3

2 Grundlagen 4

2.1 Ungetypterλ-Kalk¨ul . . . 4

2.2 Getypteλ-Kalk¨ule . . . 6

2.2.1 Letrec-Ausdr¨ucke . . . 7

2.2.2 Typinferenz . . . 8

2.2.3 Polymorphie . . . 8

2.3 Haskell . . . 9

2.3.1 Datentyp Deklarationen . . . 10

2.3.2 Funktionsdefinitionen . . . 11

2.3.3 Typklassen . . . 12

2.3.4 Seiteneffekte in Haskell . . . 12

2.3.5 Monaden . . . 13

3 Der Kalk¨ul L_{P LC} 15 3.1 Syntax . . . 15

3.2 Typkonsistenzregeln . . . 15

3.2.1 Einschr¨ankungen f¨ur Typen von Anwendungen . . . 16

3.2.2 Einschr¨ankungen f¨ur Typen von Abstraktionen . . . 16

3.2.3 Einschränkungen für Typen von Let-Ausdrücken . . . 17

3.2.4 Einschränkungen für Typen von Case-Ausdrücken . . . . 17

3.2.5 seqund Konstruktoranwendungen . . . 17

3.3 Unabh¨angigkeitseigenschaften . . . 18

3.4 Operationale Semantik . . . 19

3.5 Reduktion und Typen . . . 19

3.6 let-Regeln . . . 20

3.6.1 (llet-in) . . . 20

3.6.2 (llet-e) . . . 20

3.6.3 (lapp) . . . 21

3.7 Rule (lbeta) . . . 21

3.7.1 Typ-Instanziierung vor (lbeta) . . . 21

3.7.2 Anwendung von (lbeta) . . . 21

3.8 Rule (cp) . . . 22

3.9 Rule (case) . . . 22

3.10 Rule (abs) . . . 22

4 Implementierung 23 4.1 Aufbau der Implementierung . . . 23

4.2 Definitions . . . 23

4.3 Substitution . . . 25

4.3.1 Substitutionen mit eingeschr¨anktem Bereich . . . 25

4.3.2 Substitution mit Umbenennung . . . 26

4.4 Typecheck . . . 26

4.4.1 Anwendungen . . . 26

4.4.2 Case . . . 28

4.5 Eval . . . 30

4.5.1 Verteilung von Allquantoren . . . 31

(4)

4.5.2 (cp) . . . 33 4.6 Schnittstellen . . . 33 4.6.1 Benutzung . . . 34

5 Zusammenfassung 35

5.1 Fazit . . . 35

(5)

1 Einleitung

Die vorliegende Ausarbeitung ist Teil meiner Bachelorarbeit, die ich im Som- mersemester 2008 an der Professur für Künstliche Intelligenz und Softwaretech- nologie am Institut für Informatik der Johann Wolfgang von Goethe Universität Frankfurt am Main absolviert habe.

Ziel der Arbeit war die prototypische Implementierung und experimentelle Über- prüfung eines Lambda Kalküls LP LC, der in [SSS] beschrieben wird.

Der Kalkül wurde entwickelt, um Beweismethoden derKontextuellen Äquivalenz aus ungetypten Lambda Kalkülen auf Kalküle mit parametrisch polymorphem Typsystem zu übertragen. Solche Kalküle dienen als Grundlage von funktio- nalen Programmiersprachen, wie beispielsweise Haskell. L_{P LC} modelliert die Reduktionsregeln und das Typsystem von Haskell 98 ohne Typklassen. Für das Typsystem werden zwei Repräsentation vorgestellt. Einmal erfolgt die Darstel- lung in der üblicheren Form von Inferenzregeln, die es erlauben, für einen gegebenen Ausdruck einen Typ zu berechnen. Die alternative Präsentation des Typsystems ergänzt alle Unterausdrücke eines Ausdrucks um Typmarkierun- gen und formuliert Konsistenzregeln, die diese zu erfüllen haben, um zulässig zu sein. Die Auswertung der Ausdrücke ist mittels einer Operationalen Small- Step Semantik beschrieben. Dabei ist es notwendig, dass die Typmarkierungen während der Auswertung umgeschrieben werden, so dass die Zulässigkeit der Typmarkierungen nicht verletzt wird. Das Ziel dieser Bachelorarbeit bestand darin, zu überprüfen, ob die Typänderungen, die in [SSS] beschrieben werden, dieser Anforderung genügen.

Zu diesem Zweck sollte der Kalk¨ul in ein Programm umgesetzt werden. Als Im- plementierungssprache wurde dabei die Funktionale Programmiersprache Has- kell vorgegeben. Verwendet wurde dabei derGlasgow Haskell Compiler[GHC08].

Es sollten Datenstrukturen zur Repräsentation der markierten Ausdrücke entwickelt werden. Diese Datenstrukturen sollten genutzt werden, um die Konsis- tenzregeln und anschließend die Auswertung inklusive der Typänderungen zu implementieren. Letztendlich sollte die Implementierung getestet werden und optional die Ein- und Ausgabeschnittstellen verbessert werden, so dass die Aus- drücke beispielsweise direkt aus einer Textdatei eingelesen werden können.

Die Ausarbeitung ist wie folgt strukturiert: Der erste Abschnitt bietet einen Uberblick ¨¨ uber grundlegende Begriffe, die im Kontext der Arbeit wichtig sind (λ-Kalk¨ule und Funktionale Programmierung in Haskell).

Daraufhin werden die Definitionen des Kalküls aus [SSS] wiedergegeben. Im nächsten Abschnitt wird die Implementierung des Programms beschrieben. Hier- bei werden vor allem die Teile der Implementierung betrachtet, die sich nicht in offensichtlicher Weise aus den Kalkülregeln ergaben. Es wird auch auf Pro- bleme eingegangen, die sich bei der Implementierung zeigten und die Ein- und Ausgabe Schnittstellen des Programms werden beschrieben. Abschließend folgt noch eine bewertende Zusammenfassung der Bachelorarbeit.

(6)

2 Grundlagen

Im folgenden Abschnitt sollen einige Hintergründe der vorliegenden Arbeit vorgestellt werden.λ-Kalküle sind formale Systeme, deren zugrundeliegendes Prin- zip die funktionale Abstraktion ist. Eingeführt wurden λ-Kalküle von Alonzo Church¹in den späten 1920ern um grundlegende Fragen der Berechenbarkeit zu untersuchen. Besondere Bedeutung kommt ihnen im Bereich der Semantik von Programmiersprachen zu, da einλ-Kalkül als einfaches Modell einer Program- miersprache gedeutet werden kann, das mathematische Untersuchungen zulässt.

Die Darstellung in diesem Abschnitt ist sehr verk¨urzt und stellt λ-Kalk¨ule aus einer Programmiersprachen-Perspektive vor.²

2.1 Ungetypter λ-Kalk¨ ul

Wenn man von dem ungetyptenλ-Kalk¨ul spricht, ist zumeist das im Folgenden sehr knapp beschriebene formale System gemeint. Ein Ausdruck des λ-Kalk¨uls ist von der Form

E ::= x|(λx.E)|(EE))

, wobei x ein beliebiger Bezeichner für eine Variable ist. Die Ausdrücke der Form (λx.E) korrespondieren zu der Definition einer Funktion in einer Pro- grammiersprache, die Ausdrücke der Form (EE) entsprechen der Funktionsan- wendung auf ein Argument. Eine Variable ist in einem Ausdruck entwederfrei oder durch ein λ gebunden. Ein Ausdruck, der keine freien Variablen enthält, wird auch Kombinator genannt. Die freien Variablen eines Ausdrucks sind in- duktiv definiert:

F V(x) =X F V(λx.E) =F V(E)\ {x}

F V(EE⁰) =F V(E)∪F V(E⁰)

Auf diesen Ausdr¨ucken definiert nun eine Regel, die sogenannte β-Reduktion, den Effekt der Anwendung

(λx.E)E⁰→[E/x]E⁰

[E/x]E⁰ ist der Ausdruck, der ausE⁰ hervorgeht, in dem alle freien vorkommen vonxin E⁰ durchE ersetzt werden. (λx.E)E⁰ wird auch alsRedex (von engl.

reducible expression,

”reduzierbarer Ausdruck“) bezeichnet.

DieAuswertung eines Ausdrucks kann nun erfolgen, in dem sukzessive in einem Ausdruck ein Redex gesucht wird undβ-Reduktion auf den Redex angewandt wird, bis ein Wert d.h. eine Normalform erreicht ist. Da ein Ausdruck mehr als einen Redex enthalten kann, ist nicht offensichtlich, in welcher Reihenfolge diese Auswertung erfolgen soll. Der Ausdruck ((λx.(λy.y) x)(λu.(λv.v v) u)) ist beispielsweise selbst ein Redex und enth¨alt zwei weitere Redexe (λy.y) x und (λv.v v)u. Wird immer zuerst der am weitesten links außen liegende Re- dex reduziert, bis eine Abstraktion erreicht ist, die keine Anwendungen mehr

1siehe z.B. [Chu41]

2So lange nichts abweichendes angegeben ist, beruhen die Abschnitte ¨uberλ-Kalk¨ule auf der Darstellung aus [Han04]

(7)

als Unterterme enthält (eine mögliche Normalform), spricht man von einerNor- malordnungsreduktion. Hier würde alsoβ-Reduktion auf den gesamten Ausdruck angewendet werden und den Ausdruck ((λy.y)(λu.(λv.v v) u)) ergeben, dann (λu.(λv.v v)u) und zuletzt (λu.u u). Reduziert man stattdessen, bis ein beliebiger Ausdruck, der keine Anwendung ist, erreicht ist, spricht man von einer call-by-name Reduktion - hier entfiele also der letzte Reduktionsschritt. Eine solche Reduktions-Strategien nennt man auch nicht-strikt. Bei einer strikten Auswertung wird das Argument in einer Anwendung immer ausgewertet. Eine Variante dercall-by-name Auswertung ist diecall-by-need Auswertung, bei der Teilausdrücke bei der Reduktion eines Ausdrucks höchstens einmal ausgewertet werden.

Obwohl derλ-Kalkül über keine anderen Konstrukte zur Darstellung von Daten und erst recht über keine Kontrollstrukturen, wie sie aus imperativen Program- miersprachen bekannt sind, verfügt, können doch alle Turing-berechenbaren Funktionen in ihm dargestellt werden.

Unbeschränkte Rekursion ist mit Hilfe von Fixpunkt-Kombinatoren verfügbar, die hier aber nicht näher betrachtet werden. Daten wie Zahlen oder Boole- sche Werte werden ebenfalls als Funktionen repräsentiert. Ein einfaches Bei- spiel soll dies veranschaulichen und zugleich exemplarisch die Auswertung eines Ausdrucks beschreiben. Das Beispiel zeigt, wie Wahrheitswerte und Funktionen uber diesen dargestellt werden k¨¨ onnen.

T rue:= (λt.(λf.t)) F alse:= (λt.(λf.f)) And:= (λa.(λb.((a b)F alse)))

If := (λp.(λt.(λf.((p t)f))))

Der Übersichtlichkeit halber sollen diese Namen für dieλ-Ausdrücke im folgenden Beispiel so lange wie möglich in offensichtlicher Weise verwendet werden.

Außerdem werden einige Klammern, die nach der obigen Beschreibung der Syn- tax vorhanden sein m¨ussten, eingespart.f a bsoll dabei immer(f a) bbedeuten.

If p t f reduziert also zu t, wenn p gleich T rue ist und zu f, wenn p gleich F alse ist. Nun kann man beispielsweise Ausdr¨ucke, wie If (And T rue F alse)F alse T rue- was, um einen Vergleich zu einer bekannten Programmiersprache zu ziehen, zu dem Java Ausdruckif (true && false){false }else{true}korrespondiert und auch ein entsprechendes Ergebnis liefern sollte - mit der Normalordnungsreduktion so auswerten. 7→^d deutet hierbei daraufhin, dass eine der obigen Definitionen eingesetzt wurde, 7→^β heißt, dass β-Reduktion angewandt wurde.

(8)

If (And T rue F alse)F alse T rue

7→d (λp.λt.λf.p t f) (And T rue F alse)F alse T rue 7→β (λt.λf.(And T rue F alse)t f)F alse T rue

7→β (λf.(And T rue F alse)F alse f)T rue 7→β (And T rue F alse)F alse T rue 7→d ((λa.λb.a b F alse)T rue F alse)F alse T rue

7→β ((λb.T rue b F alse)F alse)F alse T rue 7→β (T rue F alse F alse)F alse T rue 7→d ((λt.λf.t)F alse F alse)F alse T rue

7→β ((λf.F alse)F alse)F alse T rue 7→β F alse F alse T rue 7→d (λt.λf.f)F alse T rue

7→β (λf.f)T rue 7→β T rue

T rue ist eine Normalform, also endet die Auswertung mit dem zu erwartenden Ergebnis.

Auch wenn diese Kodierungen von aussagenlogischen Funktionen im puren λ- Kalk¨ul aus theoretischer Sicht interessant sind, liegt es bei der Verwendung als Grundlage einer Programmiersprache nahe, den Kalk¨ul um spezielle Datentypen zu erweitern.

2.2 Getypte λ-Kalk¨ ule

In Programmiersprachen sind Typen ein Mittel, um Programme der statischen Untersuchung auf Fehler, beispielsweise durch inkonsistente Verwendung von Funktionen auf Daten, zug¨anglich zu machen. Als Grundlage getypter Program- miersprachen bietet es sich daher auch an, getypte λ-Kalk¨ule zu betrachten.

Die ursprüngliche Motivation zur Entwicklung dieser Kalküle entstand nicht aus dem Verlangen, eine Grundlage für eine Programmiersprache zu erschaffen, sondern war viel mehr darin begründet, dass man versuchte bestimmte Parado- xien des ungetyptenλ-Kalküls zu vermeiden, in dem nicht mehr alle syntaktisch denkbaren Ausdrücke auch als Ausdrücke des Kalküls zulässig sind. Betrachtet werden also nur noch Ausdrücke, die einen zulässigen Typ haben.

Im einfachsten Fall, demeinfach getyptenλ-Kalk¨ul, ist ein TypT dabei von der Form:

T ::= 0 |T →T

0 bezeichnet einen Grundtypen - in theoretischen Betrachtungen geht man oft- mals nur von der Existenz eines Grundtypen aus.

(9)

Ein Ausdruck hat nun also immer einen bestimmten Typ:

E ::= x::T | (λx::T.E) ::T | (E E) ::T)

Die getypten λ-Ausdr¨ucke sind nun die Elemente der Menge S{Λτ|τ ist ein Typ}, wobei die Λτ wie folgt definiert sind:

x::τ ∈Λ_τ

(M :: (τ⁰→τ)N ::τ⁰)∈Λτ

(λx::α.M ::β)∈Λτ, mit τ =α→β

Auf den getypten Ausdrücken kann man entsprechend dem ungetypten Kalkül β-Reduktion etc. definieren. Nicht zu allen ungetypten Ausdrücken existieren entsprechende getypte Ausdrücke. Während die ungetypte Identität λ x.x für jeden Typ τ eine getypte Entsprechung λx:: τ.x:: τ hat, ist es beispielsweise nicht möglich einen Typ für die Selbstanwendung λx.xx zu finden. x müsste zugleich einen Typ τ, wie auch einen Typ τ →τ⁰ zugewiesen bekommen und das ist nicht möglich. Ebenso gibt es keinen getypten Fixpunkt Kombinator und somit enthält der einfach getypteλ-Kalkül keine Möglichkeit, Rekursion zu realisieren. Damit ist die Ausdrucksstärke des Kalküls gegenüber dem ungetypten Kalkül stark eingeschränkt.

Getypteλ-Kalküle bilden die Grundlage von Programmiersprachen wie ML oder Haskell. Die Kalküle sind aber gegenüber dem einfach getyptenλ-Kalkül deut- lich erweitert.

2.2.1 Letrec-Ausdr¨ucke

Eine wesentliche Erweiterung stellt das Hinzufügen vonLetrec Ausdrücken zu einem getypten Kalkül dar. EinLetrecstellt nebenλ-Abstraktionen eine weitere Form dar, Variablen in einem Ausdruck zu binden. Syntaktisch kann dies (ohne Typen geschrieben) etwa so aussehen

let v0=e0, ..., vn=en in e

. Der Ausdruck ist so zu verstehen, dass die Variableviineund in allenejan den Ausdruckeigebunden ist, füri, j= 1, . . . , n. Der Kalkül muss um entsprechende Reduktionsregeln erweitert werden. Außer einer Möglichkeit, Ausdrücken nicht nur ”lokal“ Namen zu geben hält damit u.a. auch die Möglichkeit rekursiver Funktionsdefinitionen wieder Einzug in den Kalkül. Letrec Ausdrücke können auch genutzt werden, um dasSharingin Sprachen mitcall-by-need Auswertung zu realisieren.

Weiter oben wurde von einem Grundtypen ausgegangen. In einem anderen Kalkül könnte es zum Beispiel Grundtypen für Zahlen oder boolesche Werte geben. Zu diesen Grundtypen bedarf es dann noch Regeln, um Werte dieses Typs einzuführen und zu eliminieren. Für einen Typ Bool kann beispielsweise die Syntax für Ausdrücke um nullstelligeDatenkonstrukoren bzw. Konstanten T rue::BoolundF alse::Boolerweitert werden. Ausdrücke mit TypN at, der natürliche Zahlen in Peano-Kodierung repräsentiert, könnten über einen null- stelligen Datenkonstruktor N ull :: N at, der für die Zahl 0 steht, und einen einstelligen Konstruktor Succ:: (N at → N at), der als Argument einen Aus- druck vom Typ N at bekommt und den Nachfolger dieser Zahl repräsentiert,

(10)

eingeführt werden. Die Zwei wäre in dieser Kodierung also durch den Ausdruck (Succ(Succ N ull) ::N at) ::N atdarstellbar. Neben speziellen Sprachkonstruk- ten zur Eliminierung von bestimmten Grundtypen (z.B. if ... then ... else für Bool) bietet sich vor allem in Kalkülen, die als Grundlage einer Programmier- sprache dienen sollen, an, eine einheitliches Konstrukt zur Fallunterscheidung in Abhängigkeit von der Form eines konstruierten Ausdrucks, einzuführen. Dazu kann z.B. für jeden Typτ ein Ausdruck (case e::τ of(C0x0,0 . . . x_0,ar(C₀₎)→ e0 :: σ, ...,(Cn xn,0 . . . x_n,ar(C_n₎) → en :: σ) :: σ eingeführt werden, mit der Interpretation, dass dercase Ausdruck zu (λxi,0. . . . λxi,ar₍_Ci₎.ei)t0 . . . tar₍_Ci₎

reduziert, wenn e von der Form (Ci t0 . . . tar(C_i)) ist, wobei ar(Ci) die Zahl der Argumente des i. Konstruktors angibt und davon ausgegangen wird, dass dienKonstruktoren von τ von 0 bisndurchnummeriert sind.

Neben der endlichen Menge an interpretierten Grundtypen wird für gewöhn- lich noch eine unendliche Menge von uninterpretierten Typen, sogenannten Typvariablen zu den zulässigen Typformen hinzugefügt. Die Typvariablen dienen als Platzhalter für beliebige andere Typen. Ein Typ, der Typvariablen enthält, kann durch eineTypsubstitution, d.h. eine Funktion, die Typvariablen auf Typen abbildet, instanziiert werden, in dem die Typvariablen in dem Typ durch ihr Bild unter der Typsubstitution ersetzt werden.

2.2.2 Typinferenz

Die explizite Angabe eines Typen für jeden Unterausdruck ist in Programmier- sprachen, die auf getyptenλ-Kalkülen beruhen, normalerweise nicht nötig. Als Alternative verwenden Sprachen wie ML und Haskell einen Algorithmus zur Typrekonstruktion. Das Typsystem ist dabei über Inferenzregeln definiert, die es erlauben aus den bekannten Grundtypen auf die Typen ganzer Ausdrücke zu schließen. Dadurch können Ausdrücke, wie im ungetypten Kalkül, ganz ohne Typmarkierungen geschrieben werden. Ein Typsystem dieser Art wird für gewöhnlich nach Roger Hindley und Robin Milner, die beide an entsprechenden Algorithmen zur Typberechnung gearbeitet haben, alsHindley-Milner Typsys- tem bezeichnet.

2.2.3 Polymorphie

Nach Christopher Strachey [Str67] werden Funktionen, die mit unterschied- lichen Typen verwendet werden k¨onnen, ebenso wie die Typsysteme, die die Definition solcher Funktionen erlauben, als polymorph bezeichnet.

Er unterschied dabei zwei Formen der Polymorphie. Bei der ad hoc Poly- morphie ist eine Funktion über mehreren Typen definiert, verhält sich dabei aber für jeden Typ anders. Programmiersprachen bieten beispielsweise oft die Möglichkeit, Funktionen zuuberladen.¨

Bei der parametrischen Polymorphie ist eine Funktion für unterschiedliche Typen verwendbar, wenn ihre Definition unabhängig von den konkret verwendeten Typen ist. Angenommen man will - die Existenz der obigen Grundtypen vorausgesetzt - eine Funktion definieren, die als erstes Argument eine Funktion bekommt, die sie zwei mal auf ihr zweites Argument anwendet³ . Ohne die Möglichkeit polymorpher Funktionsdefinitionen muss für jeden Typ eine eigene

3Das Beispiel stammt aus [Pie02]

(11)

Funktion definiert werden:

let doubleN at= (λf.λx.f (f x)) :: ((N at→N at)→N at) doubleBool= (λf.λx.f (f x)) :: ((Bool→Bool)→Bool) a=doubleN at g N ull::N at

b=doubleBool f T rue::Bool g=. . .

f =. . . in . . .

Die beiden Funktionen doubleN atunddoubleBool sind gleich bis auf die Typ- markierungen. Die sogenannte Let-Polymorphie, die erstmalig im Typsystem von ML eingef¨uhrt wurde, erlaubt parametrisch polymorphe Funktionsdefini- tionen in let-Ausdr¨ucken:

let double= (λf.λx.f (f x)) :: (∀a.(a−> a)−> a) a=double g N ull::N at

b=double f T rue::Bool g=. . .

f =. . . in . . .

DieLet-Polymorphieerlaubt es, zu einer großen Zahl an ungetypten Ausdrücken entsprechende getypte Ausdrücke zu konstruieren. Außerdem bleibt die Typ- Inferenz entscheidbar. Das ist für andere polymorph-getypte λ-Kalküle nicht zwingend der Fall.

2.3 Haskell

Um die Umsetzung der skizzierten Konzepte in einer konkreten Programmier- sprache noch zu verdeutlichen soll ein ¨Uberblick ¨uber die Sprache Haskell gegeben werden. Außerdem ist Haskell die Implementierungssprache des Programms, das im Rahmen dieser Bachelorarbeit entwickelt wurde und daher bietet es sich an, einige Haskell-spezifische Begriffe im folgenden vorzustellen.

Haskell ist eine Programmiersprache, die auf einem λ-Kalkül mit call-by-need Reduktion und parametrisch-polymorphen Typsystem aufbaut. Dieser Kalkül wird alsKernsprache bezeichnet. Haskell bietet dem Programmierer jedoch vie- le notationelle Vereinfachungen gegenüber dieser, die in die Kernsprache über- setzt werden. Wenn hier von Haskell die Rede ist, so ist damit, bis auf eine kleine Ausnahme, die Sprache gemeint, wie sie im Haskell 98 Report [Jon03]

beschrieben ist.

Zur Illustration der Sprache soll ein einfaches Programm dienen, das arith- metische Ausdrücke von der Standard Eingabe des Systems einliest und aus- wertet. Die Ausdrücke beinhalten dabei Zahlenwerte, Addition, Multiplikation und einen Ausdruck, um Variablen an einen Ausdruck zu binden. Ein Has- kell Programm besteht aus Modulen. In dem Beispiel existieren drei Module, Lang.Expressions,Lang.Eval undMain. Die erwähnte Abweichung vom Haskell 98 Sprachstandard beruht nun darin, dass dieser nur einen flachen Namensraum

(12)

für Module vorsieht, hier aber die gebräuchliche Erweiterung um hierarchische Namensräume vorausgesetzt wird. In größeren Programmen ist es aus Gründen der Übersichtlichkeit von Vorteil, die Module in einem hierarchischen Namens- raum anzuordnen. Da von der Möglichkeit im Implementierungs-Teil der Ba- chelorarbeit Gebrauch gemacht wurde, sollte auch das Beispiel an dieser Stelle das Prinzip erklären. Die ModuleLang.Eval undLang.Expressions wären also im Programmverzeichnis in einem gemeinsamen Unterverzeichnis Lang untergebracht. Ein Modul besteht aus einer Menge von Gleichungen, die Datentypen und Funktionen definieren.

2.3.1 Datentyp Deklarationen

m o d u l e L a n g . E x p r e s s i o n s w h e r e

d a t a E x p r e s s i o n = Val Int

| P l u s E x p r e s s i o n E x p r e s s i o n

| Mul E x p r e s s i o n E x p r e s s i o n

| Let B i n d i n g E x p r e s s i o n

| Var V a r N a m e

d e r i v i n g ( Show , R e a d ) t y p e V a r N a m e = S t r i n g

d a t a B i n d i n g = V a r N a m e := E x p r e s s i o n d e r i v i n g R e a d

i n s t a n c e S h o w B i n d i n g w h e r e

s h o w ( x := e ) = x ++ " := " ++ s h o w e

Abbildung 1: Haskell Beispiel, Modul Lang.Expressions

In Abbildung 1 ist das ModulLang.Expressions abgebildet. Um die arithmeti- schen Ausdrücke darzustellen, soll ein neuer Datentyp deklariert werden. Dies geschieht in Haskell mit demdataSchlüsselwort, indem die möglichen Konstruk- toren des Datentyps getrennt durch|mit den jeweiligen Typen ihrer Argumente aufgezählt werden. Ein Ausdruck des Typs Expression kann also ein Zahlen- wert sein, beispielsweise (Val 1), die Summe zweier andere Ausdrücke, z.B.

(Plus (Val 1) (Val 2))oder ihr Produkt z.B.(Mul (Plus (Val 1) (Val 2)) (Val 2)). Außerdem gibt es Variablen und einen Ausdruck, der eine Variable in einem Unterausdruck bindet:(Let ((Var ”x”) := (Val 10)) (Plus (Var ”x”) (Val 2))). Um eine Bindung zu repr¨asentieren dient hier der DatentypBinding mit dem Infix-Konstruktor:=.

Mit dem Schlüsselworttype werden Typsynonyme deklariert - ein Variablenna- me soll hier also nichts anderes als ein String sein. Datentypen können auch über Typen parametrisiert werden. Beispielsweise wird in Haskell für Berechnungen, die ein optionales Ergebnis vom Typaliefern, der DatentypMaybe a = Just a

| Nothing verwendet.

Ein anderes Beispiel ist der Listentyp.[a]ist eine Liste mit Elementen vom Typ a. Die zugeh¨origen Konstruktoren des Listentyps sind[]::(List a)- die leere Lis- te,Nil genannt - und der Infix-Konstruktor(:)::(a→[a]→a) -cons genannt.

x:xs ist eine Liste, die als erstes Elementxund als restliche Elemente die Liste xs hat. Eine Liste mit den Zahlen 1,2,3 vom Typ [Int] kann also konstruiert werden als 1:2:3:[]. Da Listen eine zentrale Datenstruktur in Haskell sind, wird

(13)

auch die abk¨urzende Schreibweise[1,2,3] unterst¨utzt.

Fallunterscheidungen über Datentypen, die mit data deklariert wurden, sind uber¨ caseAusdrücke möglich.

2.3.2 Funktionsdefinitionen

m o d u l e L a n g . E v a l ( e v a l ) w h e r e i m p o r t L a n g . E x p r e s s i o n s

e v a l :: E x p r e s s i o n - > [ B i n d i n g ] - > Int e v a l ( Val v ) bs = v

e v a l ( P l u s v v ’) bs = ( e v a l v bs ) + ( e v a l v ’ bs ) e v a l ( Mul v v ’) bs = ( e v a l v bs ) * ( e v a l v ’ bs ) e v a l ( Let b e ’) bs =

let bs ’ = b : bs in e v a l e ’ bs ’ e v a l ( Var x ) b o u n d =

c a s e ( l o o k u p B x b o u n d ) of ( J u s t e ) - > e v a l e b o u n d

N o t h i n g - > e r r o r ( " V a r i a b l e n i c h t g e b u n d e n : " ++ s h o w x )

l o o k u p B :: V a r N a m e - > [ B i n d i n g ] - > M a y b e E x p r e s s i o n l o o k u p B v (( v ’ := e ): bs )

| v == v ’ = J u s t e

| o t h e r w i s e = l o o k u p B v bs l o o k u p B _ [] = N o t h i n g

Abbildung 2: Haskell Beispiel, Modul Eval.Eval

Abbildung 2 zeigt das ModulLang.Eval. Typmarkierungen sind in Haskell nur in wenigen Ausnahmefällen nötig, können aber zur Dokumentation an alle Aus- drücke geschrieben werden. Bei der Definition der Funktioneval wurde hiervon gebrauch gemacht. Die Funktion bekommt also einen Ausdruck vom Typ Ex- pression und eine Liste vom Typ[Binding] und wertet den Ausdruck zu einer Zahl vom TypInt aus. Funktionsdefinitionen können auf mehrere Gleichungen verteilt werden. Die Definition der Auswertungsfunktion eval zeigt, wie dabei pattern matching (

”Mustervergleich“) verwendet werden kann, um die Funktion in Abhängigkeit von der Gestalt des Ausdrucks zu definieren. Ist der Ausdruck von der Form (Val v) wird einfach die Zahl v zurückgegeben, für (P lus e e⁰) und (M ul e e⁰) werden die Ausdrücke e und e’ rekursiv ausgewertet und die Ergebnisse addiert/multipliziert. Für den Ausdruck (Let b e) wird die Bindung b zu der Liste der gebundenen Variablen bs hinzugefügt und der Ausdruck e ausgewertet. Für eine Variable (V ar x) wird in der Liste der gebundenen Va- riablen nachgesehen, an welchen Ausdruckxgebunden ist und dieser Ausdruck wird dann ausgewertet. Dazu wird die FunktionlookupBverwendet, die rekursiv die Liste durchläuft, um die Bindung zu finden. Dabei wird neben der Fallun- terscheidung über die Struktur der Liste auch noch eine zweite Möglichkeit zur Fallunterscheidung bei Funktionsdefinitionen genutzt, sogenannteGuards. Diese erlauben, eine Fallunterscheidung in Abhängigkeit von einem booleschen Aus- druck: Ist die gebundene Variable v⁰ im betrachteten Element der Liste gleich

(14)

zu der gesuchten Variable v (v == v⁰ = . . .), so gib den gebunden Ausdruck zur¨uck, ansonsten (otherwise . . .) suche im Rest der Liste weiter.

2.3.3 Typklassen

Typklassen⁴ bieten eine M¨oglichkeit, ¨uberladene Funktionen in Haskell zu definieren. Eine Typklasse besteht aus den Typsignaturen mehrerer Funktionen.

Ein Typ kann zu einerInstanz der Typklasse gemacht werden, in dem Imple- mentierungen dieser Funktionen f¨ur den Typen angegeben werden.

Haskell verwendet mehrere vordefinierte Typklassen. Die Show Typklasse ver- eint beispielsweise alle Typena, die als Zeichenkette darstellbar sind, für die es also eine Funktionshow gibt, die zu einem Ausdruck vom Typ aeinen String erzeugt. Eine Typklassendeklaration für Show könnte (hier im Vergleich zu der eigentlich Definition in Haskell verkürzt) so aussehen:

c l a s s S h o w a w h e r e

s h o w :: a - > S t r i n g

In Abbildung 1 auf Seite 10 ist unten eine Show-Instanz für denBinding Typ angegeben. Für bestimmte Standard-Typklassen können diese Instanzen auto- matisch abgeleitet werden, dafür dienen die deriving . . . Zeilen unterhalb der anderen Datentyp-Deklarationen.

Typklassen verbinden in Haskell ad hoc Polymorphie mit parametrischer Poly- morphie. Sie erlauben eine beschr¨ankte Quantifizierung in polymorphen Typen.

Beispielsweise kann das t im Typ des Ausdrucks (λx → λy → if (x ==

y) then x else y) :: (Eq t) ⇒ (t → t → t) jeder Typ sein, so lange es für diesen Typen eine Eq Instanz gibt, wobei Eq die Typen enthält, für die ein Gleichheitstest (==) ::a→a→Booldefiniert ist.

2.3.4 Seiteneffekte in Haskell

Die bisherigen Funktionsdefinitionen waren referentiell Transparent und frei von Seiteneffekten. Für eine bestimmte Eingabe liefern sie immer das gleiche Ergeb- nis und haben keinerlei Auswirkungen auf das System, auf dem sie ausgeführt werden - sie geben keine Zeichen auf dem Bildschirm aus, lesen keine Zeichen von der Tastatur, übertragen keine Daten über ein Netzwerk u.s.w. . Funktio- nen, die neben dem Wert, den sie berechnen, solche Effekte verursachen, haben in Haskell eine gewisse Sonderrolle. Für solche Effekte ist es in der Regel wichtig, dass sie in einer bestimmten Reihenfolge ausgeführt werden. Da die Auswertung von Ausdrücken in Haskell nicht-strikt erfolgt, ist jedoch keine kla- re Reihenfolge der Auswertung gegeben. Angenommen, es gäbe eine Funktion printLine::String→(), die als Seiteneffekt Zeichenketten auf dem Bildschirm ausgibt. In einer strikten Sprache würde die Auswertung vonxs = [ printLine

”Hallo”, printLine ”Welt”] die Zeichenkette

”Hallo Welt“ ausgeben. In einer nicht-strikten Sprache k¨onnte durchaus gar keine Ausgabe erfolgen, wenn xs z.B nur in dem Ausdrucklength xs auftritt, weil die Liste dann gar nicht ausgewertet wird, da die length Funktion die L¨ange einer Liste berechnet, ohne deren Elemente auszuwerten⁵.

Um also Seiteneffekte in einer nicht-strikten Sprache wie Haskell verwenden zu

4[WB89]

5Das Beispiel ist frei ¨ubernommen aus [Pey01]

(15)

m o d u l e M a i n w h e r e

i m p o r t L a n g . E x p r e s s i o n s i m p o r t E v a l . E v a l

m a i n = e v a l L o o p

e v a l L o o p = do e x p r < - g e t L i n e

p u t S t r L n ( s h o w ( e v a l (( r e a d e x p r ):: E x p r e s s i o n ) [ ] ) ) e v a l L o o p

e v a l L o o p 2 = do e x p r < - g e t L i n e

p u t S t r L n ( s h o w ( e v a l (( r e a d e x p r ):: E x p r e s s i o n ) [ ] ) ) e v a l L o o p

Abbildung 3: Haskell Beispiel, Modul Main

können, bedarf es einer Möglichkeit, eine Reihenfolge der Auswertung festzulegen. Abbildung 3 zeigt dasMain Modul des Beispiel Programms. Jedes Haskell Programm verfügt normalerweise über ein solches Hauptmodul mit einer Funk- tionmain::(IO a). Der IO Typ kann so verstanden werden:type IO a = World

→(a, World). Ein Wert vom TypIO aist also eine Funktion, die einen Zustand der Welt nimmt, eine Aktion ausführt und einen Wert vom Typ a, sowie einen neuen Zustand der Welt zurückgibt. Die main Funktion ist die einzige Stelle in einem Haskell Programm, an der normalerweise IO Aktionen ausgeführt werden können. Beispielsweise existieren in Haskell die FunktionenputChar::Char→ IO (), die einen Buchstaben auf dem Bildschirm ausgibt und nur den trivia- len Wert () zurückgibt, undgetChar::IO Char, die einen Buchstaben von der Standard-Eingabe liest. Eine sequentielle Komposition von solchen IO Aktionen wird über den Kombinator (>>=) ::IO a→(a→IO b)→IO b erreicht. Er nimmt das Ergebnis der ersten IO Aktion und reicht es an die zweite Funktion weiter. Um also einen Buchstaben zu lesen und gleich wieder auszugeben, könnte man schreibengetChar >>=putChar. Außerdem existiert noch ein Kombina- tor (>>) ::IO a→IO b→IO b, der das Ergebnis der ersten Aktion verwirft und ein Kombinator return:: a→IO a, der nur einen Wert zurückgibt, aber keinen Seiteneffekt verursacht.

Mit diesen Kombinatoren ist es möglich, eine Auswertungsreihenfolge für Ak- tionen festzulegen. Die Funktion evalLoop zeigt, wie mit Hilfe der Kombina- toren für unser Beispiel eine Funktion definiert werden kann, die jeweils einen ExpressionAusdruck von der Tastatur liest und das Ergebnis der Auswertung ausgibt.evalLoop2 zeigt die gleiche Funktion indo-Notation, die es erlaubt solche Aktionssequenzen übersichtlicher zu schreiben. Diese Notation wird intern in die Kombinatordarstellung übersetzt.

2.3.5 Monaden

Tatsächlich gibt es andere Fälle als die Ein- und Ausgabe, in denen die obigen Kombinatoren nützlich sein können, um funktionale Programme zu strukturie- ren. In Haskell existiert daher eine TypklasseMonad, die wie folgt definiert ist

6:

c l a s s M o n a d m w h e r e 6siehe z.B. [Pey01]

(16)

( > >=) :: f o r a l l a b . m a - > ( a - > m b ) - > m b ( > >) :: f o r a l l a b . m a - > m b - > m b

r e t u r n :: a - > m a f a i l :: S t r i n g - > m a

Einen Typ, der eine Instanz dieser Klasse besitzt, so dass die folgenden Glei- chungen erf¨ullt sind

r e t u r n a > >= k == k a m > >= r e t u r n == m

m > >= (\ x - > k x > >= h ) == ( m > >= k ) > >= h

nennt man, angelehnt an ein Konzept aus dem mathematischen Gebiet der Ka- tegorientheorie, eine Monade. Die Funktion fail in der Klasse Monad ist nicht bestandteil des mathematischen Konzepts der Monade. Sie dient zum signa- lisieren von Fehlern. In der IO Monade f¨uhrt f ail dazu, dass eine Exception ausgel¨ost wird.

Eine M onad-Instanz kann beispielsweise für den weiter oben erwähnten Typ M aybe definiert werden, wobei (>>) durch (>>=) ausgedrückt werden kann und daher nicht angegeben werden muss:

i n s t a n c e M o n a d M a y b e w h e r e J u s t x > >= f = f x N o t h i n g > >= _ = N o t h i n g r e t u r n x = J u s t x f a i l _ = N o t h i n g

Wenn also z.B. in einer mit (>>=) verknüpften Sequenz von Anwendungen der obigen lookupB Funktion, ein Lookup N othing ergibt, also fehlschlägt, wäre das Endergebnis der BerechnungN othing.

(17)

3 Der Kalk¨ ul L

P LC

Die folgenden Ausführungen geben den, zum Verständnis der Bachelorarbeit notwendigen Teil von [SSS] wieder. Dabei handelt es sich im wesentlichen um eine Übersetzung der für diese Arbeit relevanten Teile des Papiers, wobei ich einige Kürzung vorgenommen habe, wo es mir unangemessen schien den Detail- grad der Ausführungen beizubehalten. Insbesondere wurden alle Beschreibun- gen des nicht-deterministischenambOperators nicht in diese Zusammenfassung

¨

ubernommen, da dieser nach Übereinkunft mit der Professur auch nicht in der Implementierung der Kalkül Regeln berücksichtigt wurde. Bei LP LC handelt es sich um einen λ-Kalkül mit letrec, case und Konstruktoren, sowie einem parametrisch-polymorphen Typsystem.

3.1 Syntax

Die Syntax der Ausdrücke wird durch die Grammatik in Abbildung 4 beschrieben. Die ci sind hierbei die Datenkonstruktoren, Alti ist die zugehörige Case Alternative. Es wird angenommen, dass der Grundtyp Bool mit den 0-ären Konstruktoren bzw. Konstanten T rue, F alse existiert, sowie Listen mit der KonstanteN il und dem binären KonstruktorConsals Daten- und [.] als Typ- konstruktor.

Case_K ist das zum TypkonstruktorK gehörige Case-Konstrukt. Dabei müssen die Alternativen zu allen Konstruktoren angegeben werden. Letrec ist ein rekursives Let, wobei jede VariableV_i durch das Letrec in allen AusdrückenE_i und in Egebunden wird.

E ::=V |(E E)|λV.E |(seqE E)

| (letrecV1=E1, . . . , Vn=En inE)

| (c_i E₁. . . E_ar(c_i₎)

| (case_K E Alt₁. . . Alt_n) n=|DK| Alti::= ((ci V1. . . Var(c_i))→E)

Abbildung 4: Syntax von Ausdr¨ucken

Abbildung 5 zeigt den Aufbau der Typen, wobei X Typvariablen sind und K Typkonstrutoren. Jedem Typ kann ein Allquantor∀X1, . . . , X_n.T vorangestellt werden, der die Variablen X_i in T bindet.

T ::= X | (T →T)|(K T1. . . Tar(K)) Abbildung 5: Syntax der quantor-freien Typen

3.2 Typkonsistenzregeln

[SSS] enthält zwei unterschiedliche, äquivalente Formulierungen des Typsys- tems von LP LC. Die erste dieser beiden Formulierung besteht aus Typinferenz Regeln. Auf diese wird hier nicht eingegangen, da sie keine unmittelbare Relevanz für diese Arbeit hat.

(18)

Statt dessen soll an dieser Stelle nur die zweite Repräsentation des Typsystems vorgestellt werden. Die Ausdrücke und alle Unterausdrücke in dem Kalkül werden hierbei um Typmarkierungen erweitert. Jede Typmarkierung ist gültig, so lange sie bestimmte Typkonsistenzregeln einhält, die im Folgenden vorgestellt werden.

Jede Variable hat einen festen Typ und kommt in einem Ausdruck und allen Unterausdrücken nur mit genau diesem Typ vor. Umbenennungen gebundener Variablen dürfen deren Typ nicht verändern.

Beispiel 1 Der Typ der Komposition ist (.):: ∀a, b, c.(b→ c)→(a→b)→ a→c. Eine zul¨assige Typmarkierung w¨are:

(λf :: (b→c)→(λg:: (a₁ →b)−>(λx::a₂ →(f :: (b→c)(g:: (a₁→b)x::

a₂) ::b) ::c) :: (∀a₂.(a₂→c))) :: (∀a₁.(((a₁→b)→a₁)→c))) :: (∀a, b, c.((b→ c)−>(((a→b)→a)→c)))

Eine Typsubstitution ρ ist eine Funktion, die Typvariablen durch Typen ersetzt. Dom(ρ) := {X | ρ(X) 6= X}, Cod(ρ) := {ρ(x) | x ∈ Dom(ρ)} und VCod(ρ) := S

X∈Dom(ρ)FVtype(ρ(X)). Eine Substitution ρ ist frisch, genau dann, wenn Dom(ρ)∩ VCod(ρ) = ∅. Der Typ ∀Y.T⁰ ist eine Instanz des Typen ∀X.T, genau dann, wenn es ein σ mit Dom(σ) ⊆ X, σT = T⁰ und Y ⊆ VCod(σ)\FVtype(∀X.T). Nun k¨onnen die eigentlichen Konsistenzregeln formuliert werden.

3.2.1 Einschr¨ankungen f¨ur Typen von Anwendungen

s::∀X.S t::∀Y.T (s t) ::∀Z.R

es gibt eine frische Substitutionρ, so dass gilt Dom(ρ) =X ∪ Y,

Z= VCod(ρ)\FVtype(∀X.S,∀Y.T) ρ(S) =S1→R, ρ(T) =S1

Bei gegebenen Typmarkierungen f¨urs,tund (s t) ist die frische Substitutionρ eindeutig festgelegt.⁷

3.2.2 Einschr¨ankungen f¨ur Typen von Abstraktionen

Eine Abstraktion (λx.s) muss wie folgt getypt sein λ(x:: S1).(s::∀X.S3) ::

∀Y.S1→S2, wobei

• der TypS1 vonxquantor-frei sein muss,

• eine Substitutionρmit Dom(ρ) =X undρ(S₃) =S₂existieren muss.

• Y = FV_type(S₁ → S₂) \ Z gelten muss, mit Z :=

S

z::Tz∈FV(λx.s)(FV_type(T_z)).

Grundsätzlich können Typvariablen in FVtype(∀Y.S1 → S2) auch durch einen Quantor in einem übergeordneten Ausdruck gebunden sein.

F¨ur eine geschlossene Abstraktion k¨onnte ein allgemeinerer Typ erzwungen werden, in dem verlangt wird, dassY =FVtype(S1→S2).

7Diese Regel wurde gegen¨uber der Formulierung hier durch ein Ergebnis der Tests bei der Implementierung leicht abge¨andert. Siehe hierzu Abschnitt 4.4.1 auf Seite 26.

(19)

Die Monomorpie Einschränkung des Let Polymorphismus ist eine Kombination der obigen Einschränkungen für den Typ vonxund der Behandlung des∀-Typs und des Argumentestin der Anwendung (s t).

3.2.3 Einschränkungen für Typen von Let-Ausdrücken

F¨ur die Typmarkierung eines Let-Ausdrucks (letrec Env in s :: ∀X.T1) ::

(∀Y.T₂) m¨ussen die folgenden Bedingungen erf¨ullt sein:

1. Es existiert eine injektive, frische Substitution ρ:Y → X, die Typvaria- blen nur durch Typvariablen ersetzt, so dass Dom(ρ) =Y,ρ(T₂) =T₁und somit auchρY ⊆ X. Bei einer korrekten Typmarkierung kann auch stets ρY =X erreicht werden.

2. In jeder Bindung x=rist der Typ von xeine Instanz des Typen vonr.

3.2.4 Einschränkungen für Typen von Case-Ausdrücken

Um die Typeinschränkungen für Case Ausdrücke zu beschreiben, bietet es sich an, die Case Alternativen als Abstraktionen (c_K,i x_i,1. . . x_i,m_i)→t_i zu schreiben.c_K,i:λx_i,1, . . . , x_i,m_i.t_i.

Eincase-Ausdruck

(caseK (s::∀Z.Ts) ofalt1::∀U1.S1, . . . ,altk ::∀Uk.Sk) ::∀Y.T unterliegt den folgenden Typeinschr¨ankungen:

1. Es muss eine frische Substitutionµmit Dom(µ) =Zexistieren, so dass gilt µ(Ts) = (K Ts,1. . . Ts,k), mit k=ar(K). Seiρ= [Ts,1/X1, . . . , Ts,k/Xk] wobei dieX1, . . . , Xk die Typ Variablen aller Datenkonstruktoren vonK sind.

2. Jede Alternative (c_K,i x_i,1. . . x_i,m_i) → t_i unterliegt den gleichen Ein- schr¨ankungen, wie die Abstraktionλx_i,1, . . . , x_i,m_i.t_i, wobei die x_i,j entsprechende Typenρ(T_K,i,j) haben, d.h. der Typ vonc_K,i an dieser Stelle ist eine Instanz des Konstruktors instanziiert mitρ.

3. Für jede Alternative des Case-Ausdrucks muss der Typ der Anwendung (λxi,1, . . . , xi,m_i.ti)y1. . . yn) ::∀Y.T die Einschränkungen für Anwendun- gen erfüllen, wobeiyj ::∀Z⁰.ρ(TK,i,j) undZ⁰= VCod(ρ)\ Y.

Die Einschränkung auf monomorphen Gebrauch von gebundenen Variablen in Abstraktionen durch den Let-Polymorphismus gilt auch für die Alternativen in Case Ausdrücken.

3.2.5 seqund Konstruktoranwendungen

Andere Arten von vordefinierten Konstrukten k¨onnen wie Konstanten behandelt werden, z.B. kann seq als Konstruktor vom Typ ∀a.a → a → a betrachtet werden.

(20)

Für den konstruierten Ausdruck (c_K,i s₁. . . s_m_i) kann eine sinnvoller Typ mit Hilfe der obigen Konsistenzregeln wie folgt bestimmt werden, in dem der Ausdruck wie eine verschachtelte Anwendung behandelt wird: Der Typ der Konstruktorinstanz cK,i muss eine Instanz des Konstruktortyps sein, also ein ρ(TK,i,1 → . . . → TK,i,m_i → TK,i,m_i+1), für eine Substitution ρ, so dass Dom(ρ) = {X1, . . . , Xn}. Die Typen in ρ(TK,i,j) müssen selbst Instanzen der entsprechenden Typen vonsj sein.

Definition 1 Wenn ein Ausdruck t :: T alle obigen Typ-Einschränkungen erfüllt, heißt die Typmarkierung zulässig (engl.admissible) und der Ausdruck wohl-getypt (engl.well-typed).

Es kann mehr als eine zul¨assige Typmarkierung f¨ur einen Ausdruck geben.

Definition 2 Eine Typ-Instanz eines Ausdrucks t : ∀X.T mit einer frischen Typ-Substitution ρ mit Dom(ρ)⊆ X wird wie folgt konstruiert: Die Typen der Unterausdrücke von t werden entsprechend instanziiert. Dies kann von oben herab geschehen, wobei möglicherweise Variablen durch entsprechende frische Variablen des instanziierten Typen ersetzt werden müssen.

Definition 3 EineTyp Instanz einer Anwendung ((λx.s)t)mit einer Abstrak- tion als Teilausdruck ist ebenfalls definiert, wobei der Unterausdruck (λx.s) in eingeschränkter Weise instanziiert werden kann, so dass nur Instanziierungen erlaubt sind, die den Typ der Anwendung nicht ändern. Strenger formuliert, unter Verwendung der Notation aus den Einschränkungen für Anwendungstypen, wobei (λx.s) ::∀X.S die Abstraktion ist und ρ die Substitution aus der Regel, bedeutet dies, dass nur die Substitutionρ⁰ :=ρ_|X verwendet wird.

Eine uneingeschränkte Instanziierung von Unterausdrücken kann zu nicht zulässigen Typmarkierungen führen.

3.3 Unabh¨ angigkeitseigenschaften

Bei der Reduktion spielen noch zwei weitere Eigenschaften von Typmarkierun- gen eine wichtige Rolle. Das Typsystem erlaubt, dass ein Allquantor in bestimmten Situationen verschoben werden kann. Beispielsweise kann der Typ eines Tu- pels (s1::a, s2::a) :: (∀a.(a, a)) generalisiert werden, in dem der Allquantor in den Typ vons₁ unds₂verschoben wird.

Der Satz hält dies für Datenkonstruktoren im allgemeinen fest, der nächste Satz beinhaltet eine entsprechende Aussage fürLetrecAusdrücke.

Satz 4 Sei (c t₁ . . . t_n) ein Ausdruck vom Typ ∀X.(K S₁. . . S_k) und c ein Konstruktor vom Typ∀Y.R1→. . .→Rn→(K Y1. . . Yk)mitY ={Y1. . . Yk}.

Dann k¨onnen im Ausdruck (c t1 . . . tn) die ti unabh¨angig getypt werden: mit µ = [S1/Y1, . . . , Sk/Yk] ergibt sich t1 :: ∀X1.T1, . . . , tn :: ∀Xn.Tn, wobei Ti = ρiµ(Ri) und ρi Umbenennungen der VariablenX mit frischen Variablen sind, so dassρi({X1, . . . , Xn}) =Xi.

Satz 5 Sei (letrec x1 = s1, . . . , xn = sn in s) ein Ausdruck vom Typ

∀X1, . . . Xm.T und sei ∀Yi.Ti vom Typ si, f¨ur i = 1, . . . , n. Dann k¨onnen die

(21)

Typen s_i, i = 1, . . . , n verallgemeinert werden, in dem die X_i wie folgt umbenannt und der∀-Quantor verschoben wird: Die neuen Typen T_i⁰ von x_i,s_i und s sind durch eine Substitution ρi ={X1 7→ Xi,1, . . . , xm 7→Xi,m} umbenannte Kopien, wobei Xi,j frische Variablen sind und der ∀-Quantor verteilt wird:

Der Typ von si ist also letztendlich ∀X1,i, . . . Xn,i,Yi.T_i⁰ und das ∀X1, . . . Xm- Pr¨afix kann auch dem Typen von s vorangestellt werden. Der Typ des Letrec Ausdrucks selbst ¨andert sich nicht.

3.4 Operationale Semantik

(s t)^S∨T → (s^S t)^V

(letrec Env int)^T → (letrecEnv int^S)^V

(letrec x=s,Env inC[x^S]) → (letrecx=s^S,Env inC[x^V]) (letrec x=s, y=C[x^S],Env inr) → (letrecx=s^S, y=C[x^V],Env inr)

wennC[x]6=x

(seqs t)^S∨T → (seqs^S t)^V

(case s alts)^S∨T → (cases^S alts)^V S∨T bedeutet MarkierungS oderT.

Abbildung 6: Redex-Suche mit Markierungen

Der call-by-need KalkülLP LChat die folgenden Primitiven: Binäre Anwendung, Rekursives let, lambda, Konstruktoren case, seqund ambmit einer Normal- ordnungsreduktion, die Auswertung bis auf eine Schwache Kopf-Normalform (WHNF, von engl. Weak Head Normal Form) definiert. Der Kalkül wird fast ungetypt beschrieben und Typen werden nur erwähnt, wo es notwendig ist.

L_{P LC} ist nicht-deterministisch.

Zur Suche des Normalordnungsredex werden MarkierungenS, T verwendet, wo- beiT den ¨außeren Ausdruck (engl.Top Term),S eine Reduktion in einem Un- terausdruck (engl.Subterm Reduction) undV einen bereits durch die Reduktion besuchten Ausdruck (engl.visited) bezeichnet.

Der Markierungsalgorithmus in Abbildung ?? wendet die gegebenen Regeln erschöpfend an. Er schlägt fehl, wenn eine Schleife festgestellt wird (wenn ein zu besuchender Ausdruck bereits mit einem V markiert ist) und ist erfolg- reich, wenn keine weiteren Regeln mehr angewendet werden können. Wenn der Markierungs-Algorithmus auf Kontexte angewendet wird, dann werden die Kon- texte, in denen das Loch mit S, T oder V markiert ist, Reduktionskontexte genannt.

In Abbildung 7 auf der n¨achsten Seite ist ein CV-Ausdruck ein Ausdruck der Form (c x1. . . xn), so dasscein Konstruktor ist und diexi Variablen. EinWert ist eine Abstraktion oder ein Konstruktor-Ausdruck (c t1. . . tn).

Die Regeln der Normalordnungsreduktion sind für Ausdrucke ohne Typen in Ab- bildung 7 auf der nächsten Seite dargestellt, wobei angenommen wird, dass der Markierungsalgorithmus zuvor angewandt wurde. Die Übertragung der Typisie- rung auf das Ergebnis ist in den meisten Fällen offensichtlich. Die Sonderfälle werden im nächsten Abschnitt behandelt.

(22)

(lbeta) C[((λx.s)^S r)]→C[(letrecx=rins)]

(cp) (letrecx=v^S inC[x^V])→(letrecx=v inC[v])

wobeiv eine Abstraktion, Variable oder ein CV-Ausdruck ist (abs) (letrecx= (c t1. . . tn)^S,Env inr)→

(letrecx1=t1, . . . , xn=tn, x= (c x1. . . xn),Env inr) nur wenn (c t1. . . tn) kein CV-Ausdruck ist.xisind frische Variablen.

(case) C[(case (c t₁. . . t_n)^S. . .((c y₁. . . y_n)→s). . .)]

→C[(letrecy1=t1, . . . , yn =tn ins)]

(seq) C[(seqv^S t)]→C[t] wennv ein Wert ist (llet-e) (letrecEnv1, x= (letrecEnv2 ins)^S int)

→(letrecEnv1,Env2, x=sint) (llet-in) (letrecEnv1 in(letrecEnv2ins)^S)

→(letrecEnv1,Env2 ins)

(lapp) C[((letrecEnv ins)^S t)]→C[((letrecEnv in(s t))]

(lseq) C[(seq(letrecEnv ins)^S t)]→C[(letrecEnv in(seqs t))]

(lcase) C[(case (letrecEnv int)^S alts)]

→C[(letrecEnv in(caset alts))]

Abbildung 7: Normalordnungsregeln

Eine Schwache Kopf-Normalform ist ein Wert v oder ein Ausdruck (letrecEnv inv), wobeiv ein Wert ist.

3.5 Reduktion und Typen

Die Reduktion behält den Typ eines Ausdrucks bei oder verallgemeinert diesen und somit können wohl-getypte Ausdrücke keine dynamischen Typfehler erzeu- gen.

Dazu darf der Typ eines Redex sich nicht ver¨andern oder muss verallgemeinert werden und die Bindungs Struktur eines Typs muss intakt bleiben, d.h. es d¨urfen keine Typvariablen eingefangen werden.

3.6 let-Regeln

Die Unabh¨angigkeitseigenschaften erlauben es, davon auszugehen, dass in einem Ausdruck (letrec Env in s) der Typ von s und der Typ des gesamten Ausdrucks gleich sind.

3.6.1 (llet-in)

(letrecEnv₁ in(letrecEnv₂ ins))→(letrecEnv₁,Env₂ ins)

Wenn der mittlere letrec-Ausdruck einen ∀-Typ hat, dann werden die darin

(23)

gebundenen Typvariablen unter einen Allquantor im Typ des äußerenletrec- Ausdrucks verschoben. Die Typen der letrec-Ausdrücke bleiben dabei gleich oder werden verallgemeinert und die Typeinschränkungen sind somit für den resultierenden letrec-Ausdruck weiterhin erfüllt.

3.6.2 (llet-e)

(letrec Env₁, x = (letrec Env₂ in s :: ∀Y.T⁰) :: ∀X.T in t) → (letrecEnv₁, x=s::∀Y.T⁰,Env₂ int)

Zuerst muss die Verallgemeinerung, die durch Satz 5 beschrieben wird auf den letrec-Ausdruck angewendet werden, der an xgebunden ist, so dass der All- quantor auf die Typen in der Umgebung des innerenletrec-Ausdrucks verteilt wird und dadurch∀X.T und∀Y.T⁰ der gleiche Typ sind und keine Typvariable ausX in Env2 auftaucht. Dann kann der Reduktionsschritt durchgef¨uhrt werden.

Der Typ vonxund des daran gebundenen Ausdrucks wird beibehalten und die Typeinschr¨ankungen werden also durch die Reduktion nicht verletzt.

3.6.3 (lapp)

((letrecEnv ins::∀X.S) :: (∀X.S) t::T)

→ (letrecEnv in((s::∀X.S)t::T))

wobei wieder die Unabh¨angigkeitseigenschaften ausgenutzt werden, um die∀- gebundenen Typvariablen zu verteilen.

Die anderen Regeln entsprechen (lapp)

3.7 Rule (lbeta)

Die Regel (lbeta) verlangt nach einer Vorverarbeitung der Typen. Dabei wird der Typ der Abstraktion an den verwendeten Typ der rechten Seite der Anwendung angepasst. Im Gegensatz zu den Regeln (llet-e) und (lapp) wird der Typ hier also spezialisiert.

3.7.1 Typ-Instanziierung vor (lbeta)

F¨ur gegebene Ausdr¨ucke λx.s :: ∀X.S, t :: ∀Y.T, mit S =Sx →Ss, so dass die Anwendung den Typ ((λx.s)t) ::∀Z.R hat, muss zuerst der TypS_x vonx instanziiert werden, um ihn an den verwendeten Typ anzupassen.

Sei U := FV_type(S_x)∩ X. Wenn U = ∅, dann ist nichts zu tun. Sonst, sei ρ die Substitution, die nach den Einschränkungen für Anwendungstypen existiert, mit Dom(ρ) = X ∪ Y,Z = VCod(ρ) \ FV_type(∀X.S,∀Y.T), so dass ρ(S) =S₁ → R, ρ(T) =S₁. Nun seiρ⁰ :=ρ_|U.ρ⁰ wird für die Instanziierung des Typs von x und des Körpers der Abstraktion d.h. s genutzt. Die Instan- ziierung ist mit einer Umbenennung von x nach x⁰ :: ρ⁰(S1) in s verbunden.

Ebenso muss für alle anderen Variablen verfahren werden, deren Typ einen Typ ausU enthält - was lediglich für Variablen der Fall sein kann, die insgebunden sind. Diese kombinierte Instanziierung ist möglich, da der Typ vonxrespektive x⁰ monomorph innerhalb des Körpers der Abstraktion ist. Der Ausdruck bleibt wohl-getypt. Der Typ der Anwendung ((λx.s) t) ist durch die Instanziierung

(24)

nicht betroffen.

Es gibt drei F¨alle, die eine Instanziierung n¨otig machen:

1. Die Anwendung ist im Eingabe-Ausdruck

2. Die Anwendung wurde durch ein (cp) erzeugt, so dass die Abstraktion an die Position der Funktion kopiert wurde

3. Die Abstraktion wurde durch ein (lapp) erzeugt 3.7.2 Anwendung von (lbeta)

(lbeta) wird erst angewendet, nach dem die Instanziierung durchgef¨uhrt wurde.

Sei die Applikation (λx.s::∀X.S t::∀Y.T).ρ⁰, das weiter oben definiert wurde, ist eine injektive Substitution von Typvariablen zu Typvariablen. Das Ergebnis ist (letrecx=tins), wobei die Typanpassung wie folgt aussieht:xist getypt wie in der Abstraktion, die Typvariablen inU :=FVtype(Sx)∩ X sind im äußeren letrec gebunden. Mit den Unabhängigkeitseigenschaften ist es später wieder möglich die Quantoren zu verteilen undxwieder polymorph zu machen.

3.8 Rule (cp)

(letrecx::S₁=t::S₂ inC[x::S₁])

→ (letrecx=tinC[t⁰::S₂]).

Hier ist t⁰ eine α-umbenannte Kopie von t wobei die Typen ebenfalls kopiert undα-umbenannt werden, falls notwendig.

3.9 Rule (case)

(case_K (c_K,i s₁. . . s_n) of(c_K,ix₁. . . x_n)→t_i, . . . alts)

→ (λx₁. . . x_n.t_i)s₁. . . s_n)→(letrecx₁=s₁, . . . x_n=s_n int_i).

Der Zwischenschritt vereinfacht es, die Behandlung der Typen zu erkl¨aren, die wie folgt aussieht: Wenn (c_K,i s₁. . . s_n) einen∀-quantifizierten Typ hat, dann ist es erlaubt die Typ-Variablen aller s_i unabh¨angig zu machen, sofern diese in (cK,i s1. . . sn) gebunden werden.

Die Typen der Unterausdrückesi haben ihre eigenen Allquantoren für die un- abhängigen Typvariablen. Die Behandlung der Typen und die weiteren Schritte entsprechen einemn-fachen (lbeta) mit darauffolgenden (llet-in) Reduktionen.

3.10 Rule (abs)

Die Reduktion ist (letrec x = (c t₁. . . t_n),Env in r) → (letrec x₁ = t₁, . . . , x_n = t_n, x = (c x₁. . . x_n),Env in r). Hier wird davon ausgegangen, dass die Typen der x_i die gleichen sind, wie die Typen der entsprechenden t_i, i = 1, . . . , n, und die Unabh¨angigkeitseigenschaft auf den Let-Ausdruck angewandt wurde, wobei eine (llet-e) Reduktion eingeschoben wurde.

Dann haben (c t1. . . tn) und (c x1. . . xn) korrespondierende Typen und die Bindungsstruktur wird nicht verletzt.

(25)

4 Implementierung

Die Aufgabenstellung der Bachelorarbeit sah vor, dass zuerst eine Datenstruk- tur zur Darstellung der mit Typen markierten Ausdrücke des parametrisch- polymorphen λ-Kalküls zu implementieren sei. Für diese Datenstruktur sollte daraufhin eine Überprüfung der Typkonsistenzregeln und Reduktion einschließ- lich der Typänderungen in ein Programm überführt werden. Die Implementie- rung sollte mit einer hinreichenden Zahl an Testausdrücken überprüft werden.

Optional sollte ein Parser f¨ur die Ausdr¨ucke entwickelt werden.

Als Implementierungssprache wurde Haskell vorgegeben. Alle Aufgaben wurden von mir bearbeitet. Die nichtdeterministischen Bestandteile des Kalküls wurden nach Absprache bei der Implementierung des Programms nicht berücksichtigt, da sie für die experimentelle Untersuchung des Typsystems nicht wesentlich sind.

Im folgenden Abschnitt sollen die Struktur und ausgew¨ahlte Teile des Pro- gramms vorgestellt werden. Insbesondere werde ich versuchen, dabei zu doku- mentieren, an welchen Stellen Probleme bei der Implementierung aufgetreten sind.

4.1 Aufbau der Implementierung

Wie alle modernen Programmiersprachen verfügt Haskell über ein hierarchisches Modulsystem. Die Implementierung macht von diesem zur Strukturierung des Programms Gebrauch. Neben Modulen, die Tests des Programmes enthalten und die im Namensraum T est.∗ untergebracht sind, besteht die wesentliche Funktionalität des Programms aus den Modulen im NamensraumInterpreter.

4.2 Definitions

Aus dem Modul Definitions sollen hier hauptsächlich die Datentypen für Ausdrücke und Typmarkierungen vorgestellt werden. Abgesehen davon, dass dessen Entwurf natürlich wesentliche Voraussetzung für die Erfüllung der weiterführenden Aufgaben war, handelte es sich dabei auch selbst um einen expliziten Bestandteil der Aufgabenstellung.

Dabei konnte die Syntax der Ausdrücke (siehe Abbildung 4 auf Seite 15) auf eine sehr direkte Weise auf drei Haskell Datentypen - Expr, CaseAlternative für Case-Alternativen und Binding für Bindungen von Variablen in Let- Ausdrücken - übertragen werden. Diese sind in Abbildung 8 auf der nächsten Seite dargestellt. Da die Formulierung des Typsystems über Konsistenzregeln als Grundlage für die Implementierung diente, ist jeder Ausdruck zusätzlich mit einer Typmarkierung versehen. Für die Darstellung der Typmarkierungen dient der Datentyp T ypeM ark aus Abbildung 9 auf der nächsten Seite. Auch dieser konnte unmittelbar aus der formalen Beschreibung in [SSS]

”uber-¨ setzt“ werden. T V x ist dabei eine Typvariable x, T F n t t⁰ ist der spezielle Typkonstruktor für Funktionstypen t → t⁰, T C c ts ein beliebiger anderer Typkonstruktor (c t₁· · ·t_n), wobei diet₁,· · ·, t_n die Elemente der Listet_ssind undU niversalQ tvs tmein Allquantor ist, der alle Typvariablen austvsintm bindet. Die Menge der Typkonstruktoren und zugehörigen Datenkonstruktoren wird im Code festgelegt. Für jeden Typkonstruktor enthält die Liste typeCon- structors ein Tupel, das dem Typ seine Typvariablen zuordnet (für Listen ist

(26)

d a t a E x p r = V V a r i a b l e

| App E x p r E x p r T y p e M a r k

| Abs V a r i a b l e E x p r T y p e M a r k

| Seq E x p r E x p r T y p e M a r k

| L e t r e c [ B i n d ] E x p r T y p e M a r k

| C C o n s t r u c t o r N a m e [ E x p r ] T y p e M a r k

| C a s e C o n s t r u c t o r N a m e E x p r [ C a s e A l t e r n a t i v e ] T y p e M a r k d e r i v i n g ( Show , Eq )

d a t a C a s e A l t e r n a t i v e = Alt C o n s t r u c t o r N a m e [ V a r i a b l e ] E x p r T y p e M a r k t y p e C o n s t r u c t o r N a m e = S t r i n g

d a t a B i n d = V a r i a b l e :=: E x p r d e r i v i n g ( Show , Eq )

Abbildung 8: Datentypen für Ausdrücke des Kalküls

d a t a T y p e M a r k

= TV T y p e V a r i a b l e

| TFn T y p e M a r k T y p e M a r k

| TC S t r i n g [ T y p e M a r k ]

| U n i v e r s a l Q [ T y p e V a r i a b l e ] T y p e M a r k d e r i v i n g ( Show , Eq )

t y p e T y p e V a r i a b l e = S t r i n g

Abbildung 9: Haskell Typ f¨ur Typmarkierungen

dies z.B. List a).

t y p e C o n s t r u c t o r s = [( " B o o l " , []) , ( " L i s t " , [ " a " ]) , ( " Nat " , [ ] ) ]

Eine entsprechende Liste ordnet einem Typ seine Datenkonstruktoren mit den jeweiligen Typen ihrer Argumente zu, wobei vorausgesetzt wird, dass die Typ- variablen in den Datenkonstruktoren genau die gleichen Bezeichnungen haben, wie in den Typkonstruktoren.

d a t a C o n s t r u c t o r s = [( " B o o l " , [( " T r u e " , []) , ( " F a l s e " , [])]) ,

( " L i s t " , [( " C o n s " , [( TV " a " ) , ( TC " L i s t " [ ( TV " a " )])]) , ( " Nil " , [])]) ,

( " Nat " , [( " S " , [ TC " Nat " []]) , ( " Z " , [ ] ) ] ) ]

Sowohl der Typcheck, als auch die Reduktion, sind innerhalb einer beliebigen State Monade implementiert. Beide Funktionen haben also einen Zustand, der in diesem Modul in Form des Environment Typs definiert ist. Dieser dient unter anderem dazu, während der jeweiligen Berechnung über die verwendeten Varia- blen in einem Ausdruck (bzw. Typvariablen in einem Typ) Buch zu führen und ermöglichen somit die Generierung frischer Variablennamen, wie sie an mehreren Stellen benötigt wird.

(27)

4.3 Substitution

Neben dem Datentyp für Substitutionen und den zugehörigen Funktionen zur Konstruktion und Anwendung dieser, enthält dieses Modul vor allem auch die Implementierung des Unifikationsalgorithmus. Diese ist angelehnt an die Imple- mentierung aus [Pie02] und wurde nur um eine Dekomposition von Datenkon- struktoren erweitert. Die Unifikation erhält einen “Constraint Stack” und berechnet einen allgemeinsten Unifikator, der die dadurch definierten Constraints einhält.

u n i f y [] = r e t u r n Set . e m p t y u n i f y ( c@ ( t : - > t ’): cs )

| t == t ’ = u n i f y cs

| i s T V t && n o t O c c u r s t t ’ = a d d S u b ( t v V a r t ) t ’ cs

| i s T V t ’ && n o t O c c u r s t ’ t = a d d S u b ( t v V a r t ’) t cs

| i s T F n t && i s T F n t ’ = let ( TFn a b ) = t ( TFn a ’ b ’) = t ’

in u n i f y (( a : - > a ’ ) : ( b : - > b ’): cs )

| i s T C t && i s T C t ’ && t c N a m e t == t c N a m e t ’ =

let cs ’ = ( z i p W i t h (: - >) ( t c T y p e s t ) ( t c T y p e s t ’ ) ) + + cs in u n i f y cs ’

| o t h e r w i s e = a b o r t " F a i l e d to u n i f y c o n s t r a i n t s "

w h e r e a d d S u b tv t cs =

do let ds = ( tv : - > t ) c = ( TV tv ) : - > t

s < - u n i f y ( a p p l y S u b T o C s ds cs ) r e t u r n $ Set . i n s e r t ds s a p p l y S u b T o C s s cs =

[ ( a p p l y D s s t : - > a p p l y D s s t ’) | ( t : - > t ’) < - cs ] n o t O c c u r s tv t = n o t M e m b e r ( t v V a r tv ) ( f r e e t v s t )

Die Unifikation selbst wurde also auf die ¨ubliche Weise in ein Programm umgesetzt. Die Anforderungen an die Substitutionen, die in den Typkonsistenzregeln verlangt werden, erlauben es jedoch nicht, diese in direkter Weise mittels Uni- fikation zu bestimmen.

4.3.1 Substitutionen mit eingeschr¨anktem Bereich

Jede der Typkonsistenzregeln fordert die Existenz einer Typsubstitution mit einem bestimmten Bereich A, die Einschränkungen bezüglich der Bilder be- stimmter Typvariablen genügen muss.

Die Unifikation findet eine Substitution, die die Einschränkungen erfüllt, sofern diese existiert. Welche Typvariablen dabei aber konkret abgebildet werden, ist davon abhängig, wie die Einschränkungen in den Unifikationsalgorithmus ein- gegeben werden. Daher reicht die Überprüfung des Bereichs der berechneten Substitution nicht, da dies dazu führen könnte, dass zulässige Typmarkierun- gen abgelehnt werden, weil die Unifikation eine falsche Substitution bestimmt.

Statt dessen muss erzwungen werden, dass die Unifikation nur Substitutionen mit einem bestimmten Bereich berechnet. Das Problem wird sp¨ater in Beispiel