• Keine Ergebnisse gefunden

Statische Semantikanalyse

Aus den Formeln der statischen Semantikdefinition werden durch das Werkzeug Satanic (SDL to ASM nearly immaculate converter) [Pie00] eine Reihe von Kimwitu++-Dateien erzeugt, die zusammen genommen einen Übersetzer von der abstrakten Syntax 0 in die abstrakte Syntax 1 bilden.

Die Übersetzung der Textdateien aus Tabelle 7 in Kimwitu++ funktioniert auf folgende Wei-se:

• Die Bedingungen (sem-cond0.txt und sem-cond1.txt) werden in Unparse-Regeln übertra-gen.

• Die Transformationen (sem-trans.txt) werden in Kimwitu++-Rewrite-Regeln übersetzt.

• Aus den Funktionsdefinitionen (sem2-fun.txt und sem3-fun.txt) werden C++-Funktionen generiert.

• Aus der Mapping-Funktion und der Kompilationsfunktion (sem-map.txt und sem-com-pile.txt) werden ebenfalls C++-Funktionen generiert.

Im Rahmen dieser Arbeit zeigte sich, dass die in [Pie00] entwickelten Generatoren zwar für die dort verwendete SDL-Teilsprache RSDL ausreichend waren, für die formale Definition von SDL aber nicht mehr. Exemplarisch werden im folgenden einige der Probleme und ihre Lösung vorgestellt.

9.4.1 Freie Variablen in Quantisierungen und Set-Comprehension-Ausdrücken

Die Formeln des verwendeten ASM-Kalküls erlauben die Verwendung von Quantisierungen (Existenz- und All-Aussagen) sowie von set comprehensions (Konstruktion einer Menge aus ei-ner anderen durch Angabe eines charakteristischen Prädikats).

Beispiel 46. In folgender Funktion werden die Variablen possibleResultSet und resultSet durch einen set-comprehension-Ausdruck definiert. In letzterer Initialisierung ist wiederum eine Allquantisierung enthalten.

getBindingListSet0(c: CONTEXT0): BINDINGLIST0-set =def let nameList = c.nameList0 in

let possibleBindingListSet = nameList.possibleBindingListSet0 in

let possibleResultSet = {pbl ∈ possibleBindingListSet: isSatisfyStaticCondition0(pbl, c)} in let resultSet = {r ∈possibleResultSet: ∀r’ ∈ possibleResultSet: r ≠ r’ ⇒

mismatchNumber0(r, c) ≤ mismatchNumber0(r’, c)} in if |resultSet| = 1 then resultSet

elseif |resultSet| = 0 then ∅

elseif (∀bl1, bl2 ∈ resultSet: i∈1..bl1.length: bl1[i].s-ENTITYDEFINITION0.entityKind0 ≠ literal representSameDynamicOpSig0(bl1[i].s-ENTITYDEFINITION0,

bl2[i].s-ENTITYDEFINITION0)) then resultSet

else ∅ endif endlet

Zur Übersetzung nach C++ werden sowohl die Quantisierungen als auch die Set-Comprehensi-on-Ausdrücke in Funktorklassen übertragen. Die Grundmenge (im Beispiel possibleBindingListSet für die Initialisierung von possibleResultSet) wird als Kimwitu++-Lis-te repräsentiert. Die FilKimwitu++-Lis-terbedingung wird in eine Methode operator() einer Klasse generiert.

Zur Berechnung eines Set-Comprehension-Ausdrucks wird nun die Methode filter der Kimwi-tu++-Liste aufgerufen und ihr eine Instanz der Filterklasse übergeben.

Diese Methode operator() der Filterklasse erhält als Argument das jeweils aktuelle Element der Grundmenge (pbl für die Initialisierung von possibleResultSet). Zur Berechnung des

Aus-drucks sind aber unter Umständen weitere Variablen nötig, die aus Sicht des Set-Comprehensi-on-Ausdrucks dann freie Variablen sind (im Beispiel die Variable c). Diese Variablen sind lediglich in der Umgebung des Set-Comprehension-Ausdrucks gebunden. Da C++ aber keine verschachtelten Funktionsdefinitionen erlaubt, muss ein spezieller Übergabemechanismus für die freien Variablen eingeführt werden: sie werden an den Konstruktor der Funktorklasse über-geben.

Zur Ermittlung freier Variablen bildet nun Satanic eine Liste der durch die Quantifizierung/

Set-Comprehension gebundenen Variablen, sowie eine Liste aller verwendeten Variablen. Die Differenzmenge dieser Listen ist die Liste der freien Variablen.

In der ursprünglichen Version von Satanic wurde nicht berücksichtigt, dass diese Ausdrücke auch verschachtelt sein können. So ist die Variable r’ in der Initialisierung von resultSet eine ge-bundene Variable, wenn sie innerhalb der Allquantifizierung auftaucht. Ansonsten wäre sie eine freie Variable. Statt dessen hat Satanic diese Variable aus Sicht des Set-Comprehension-Aus-drucks als frei betrachtet – der generierte C++-Code lies sich dann nicht übersetzen, weil eine C++-Variable rPRIME im Kontext des Ausdrucks nicht definiert war. Zur Korrektur dieses Pro-blems musste also berücksichtigt werden, dass die Liste der freien Variablen sich während der Traversierung des Ausdrucks ändern kann.

Beispiel 47. Aus der Initialisierung von resultSet wird nun folgender Code generiert:

v_resultSet = unique(v_possibleResultSet->filter(pred_qboo(v_c, v_possibleResultSet)));

Die Klasse pred_qboo ist hierbei die Filterklasse. Sie ist definiert als

struct pred_qboo : public unaere_funktion<AS0_rule, bool> { AS0_rule v_c;

AS0_rule v_possibleResultSet;

pred_qboo(AS0_rule c, AS0_rule possibleResultSet):

v_c(c), v_possibleResultSet(possibleResultSet){ } bool operator()(AS0_rule)const;

};

Die Methode operator() schließlich ist definiert als

bool pred_qboo::operator()(AS0_rule v_r) const {

return AS_eq_nil(v_possibleResultSet->filter(pred_dwno(v_c, v_r)));

}

Dabei wurde für die All-Quantifizierung in negierter Form das Prädikat pred_dwno gene-riert. Die Quantifizierung ist also erfüllt, wenn das Filtern der negierten Bedingung eine leere Liste ergibt.

9.4.2 Typisierung von Funktionen und Variablen

In den Formeln der Semantikdefinition sind viele Konstrukte nicht typisiert. Explizite Typde-klarationen gibt es lediglich für Funktionssignaturen. In vielen Fällen ist diese Typisierung auch ausreichend, da im generierten Kimwitu-Code und dem daraus entstehenden C++-Code die Ty-pisierung sogar schwächer ist als die deklarierten Typen in der formalen Semantik: Alle Kno-tentypen der abstakten Syntax 0 werden in C++ durch den Typ AS0_rule repräsentiert, alle Knotentypen der abstrakten Syntax 1 durch den Typ AS1_rule.

Wird nun der Code einer Funktion generiert, so müssen in der Deklaration der Funktion in C++ gültige C++-Typen verwendet werden. Der Generator Satanic verwendet hierzu eine Heu-ristik: Fängt der Typ mit einem Kleiner-Zeichen an, wird der Typ AS0_rule ausgegeben. Fängt er mit einem Großbuchstaben an, wird der Typ AS1_rule ausgegeben.

Diese Heuristik hat sich als unzureichend erwiesen, und wurde deshalb auf die folgende Wei-se verbesWei-sert:

• Ist der Parameter- oder Ergebnistyp BOOLEAN oder NAT, werden die C++-Typen bool oder int ausgegeben.

• Ist der Parametertyp eine Vereinigung mehrerer Typen, dann wird die Heuristik auf die Teil-mengen der Vereinigung angewendet, die dann im Sinne der Heuristik ein einheitliches Ergebnis liefern müssen.

Auch mit diesen Verbesserungen gab es zahlreiche Typfehler im generierten C++. Diese Fehler resultieren vor allem daraus, dass auch innerhalb einer Funktion Typnamen verwendet werden müssen.

Beispiel 48. In einer let-Anweisung muss die gebundene Variable deklariert werden, etwa für

let c = allDynamicCandidates(procedure) in let c1 = matchingCandidates(c, values) in

bestMatch(c1) endlet

In diesem Ausdruck müssen für die ASM-Variablen c und c1 C++-Variablen deklariert wer-den. Diese müssen den gleichen Typ haben wie der Rückgabetyp von allDynamicCandidates und matchingCandidates.

Beispiel 49. In einem set-comprehension-Ausdruck muss für die Laufvariable eine C++-Vari-able deklariert werden. Gegeben sei etwa der Ausdruck

{ p | p Operation-signature:

p.s-Operation-name = procedure.s-Operation-name }

In diesem Ausdruck muss für die Variable p eine C++-Variable deklariert werden, die für jedes Element aus der Domäne Operation-signature immer wieder neu belegt wird, um den Testausdruck zu berechnen.

Zur Deklarierung dieser Variablen wurde in [Pie00] eine Heuristik eingesetzt, nach der der Typ solcher Variablen gleich dem zuletzt deklarierten Typ (also in der Regel gleich dem Rückgabe-typ der aktuellen Funktion) ist. Es zeigte sich, dass diese Heuristik in vielen Fällen ungeeignet war. Sie wurde deshalb auf die folgende Weise verbessert:

• Wird in einem set-comprehension-Ausdruck über eine Domäne iteriert, so wird der Typ die-ser Domäne zur Deklaration der Laufvariable verwendet.

• Für jede Funktion wird ihr Rückgabetyp aufgezeichnet, und zwar durch Generierung von C++-Makros. Für Beispiel 48 würde für die Funktion allDynamicCandidates das Makro

#define allDynamicCandidates_AS AS1_rule

generiert werden, da die Rückgabewerte dieser Funktion Knoten der abstrakten Syntax 1 sind. Muss nun eine let-Variable deklariert werden, deren Wert durch einen Funktionsruf entsteht, so kann diese Variable durch Verwendung des Alias-Namens für den Funktionstyp deklariert werden, für das Beispiel also

allDynamicCandidates_AS v_c = all_DynamicCandidates(v_procedure);

(Zur Übersetzung von ASM-Variablennamen in C++ wird der Präfix v_ generiert).

Leider zeigte sich, dass auch mit diesen neuen Heuristiken noch nicht alle Typfehler behoben werden können. Verbleibende Probleme entstehen unter anderem durch folgende Konstrukte:

• Manche Funktionen haben einen polymorphen Rückgabetyp. Beispielsweise gibt die Funk-tion take ein beliebiges Element einer Menge zurück. Dieses Element hat dann den Typ, den alle Elemente der Menge haben. Der Rückgabetyp der Funktion hängt also vom

Argu-menttyp ab.

• Die Ermittlung des Ausdrucks eines Typs erfolgt lediglich für Funktionen. So ist in Beispiel 49 der Typ des Ausdrucks p.s-Operation-name AS1_rule, da auf ein Feld der abstrakten Syntax zugegriffen wird. Da es sich aber nicht um einen Funktionsruf handelt, kann auch die Heuristik für Funktionsrufe nicht verwendet werden. Zwar wäre es möglich, in diesem Fall die Heuristik zu erweitern – allerdings gibt es viele weitere Ausdrücke, für die dann ebenfalls Heuristiken gefunden werden müssten.

Zur Vereinfachung des Problems wurde deshalb von Polymorphie und Überladung in C++ Ge-brauch gemacht. Es wurde eine Klasse ASUNKNOWN_rule definiert, die polymorph Werte so-wohl vom Typ AS0_rule als auch vom Typ AS1_rule aufnehmen kann:

struct ASUNKNOWN_rule{

AS0_rule as0;

AS1_rule as1;

ASUNKNOWN_rule():as0(0),as1(0){}

ASUNKNOWN_rule(AS0_rule r):as0(r),as1(0){}

ASUNKNOWN_rule(AS1_rule r):as0(0),as1(r){}

// default copy ctor does the right thing

operator AS0_rule()const {assert(as0);return as0;}

operator AS1_rule()const {assert(as1);return as1;}

ASUNKNOWN_rule* operator->(){return this;}

ASUNKNOWN_rule filter(filtUc);

ASUNKNOWN_rule filter(filt0c);

ASUNKNOWN_rule map(mapUc){abort();}

ASUNKNOWN_rule map(map0c){abort();}

int length();

};

Diese Klasse wird überall dort eingesetzt, wo eine Typermittlung nicht möglich ist. Wenngleich damit eine Reihe von Typfehlern beseitigt werden konnten, wurde nun eine Reihe von Funkti-onsaufrufen nun mehrdeutig: Es gibt in dieser Klasse Konvertierungsoperatoren sowohl für AS0_rule als auch für AS1_rule. Ist eine Funktion für beide abstrakte Syntaxbäume definiert, erklärt der C++-Compiler den Ruf als mehrdeutig.

Zur Lösung dieses Problems müssen zu den vorhandenen überladenen Funktionen weitere hinzugefügt werden.

Beispiel 50. Zur Auswahl eines beliebigen Elements aus einer Menge ist die Funktion take in zwei Varianten definiert:

AS0_rule take(AS0_rule);

AS1_rule take(AS1_rule);

Wird ein Wert vom Typ ASUNKNOWN_rule an take übergeben, meldet der C++-Compiler eine Mehrdeutigkeit. Durch Einführung der Funktion

ASUNKNOWN_rule take(ASUNKNOWN_rule r) {

if(r.as0)

return take(r.as0);

else

return take(r.as1);

}

kann diese Mehrdeutigkeit beseitigt werden: Die zusätzliche überladene Funktion kann ge-rufen werden, ohne einen nutzerdefinierten Konvertierungsoperator zu verwenden, und wird damit vom Compiler bevorzugt. Die Implementierung der Funktion entscheidet dynamisch anhand des Inhalts des ASUNKNOWN_rule-Objekts, welche der take-Versionen gerufen werden soll.

In vielen Fällen muss der Rückgabewert dieser zusätzlichen Funktionen wiederum ASUNKNOWN_rule sein (so wie im Beispiel).

Durch Kombination dieser Techniken ist es möglich, die C++-Typfehler sämtlich zu beseiti-gen.