Genereller Ansatz:

(1)

Genereller Ansatz:

• Wir betrachten Basis-Blöcke vor der Registerverteilung:

A

=

_a

+

_I; D1

=

_M

[

_A

]

; D2

=

_D₁

+

2;

B

=

_b

+

4;

M

[

_B

] =

_D₂

• Wir fassen diese als Folge von Bäumen auf. Wurzeln:

• Werte, die mehrmals verwendet werden;

• Variablen, die am Ende des Blocks lebendig sind;

(2)

= M

+

2 M

b 4 +

a I

(3)

Idee:

Beschreibe den Effekt einer Instruktion als Ersetzungsregel auf Bäumen:

Die Instruktion: R = _M[_A + 2 + _D]; entspricht zum Beispiel:

+

I +

M R

(4)

linke Seite Ergebnisregister(klasse)

rechte Seite berechneter Wert für Ergebnisregister innere Knoten • Load M

• Arithmetik

Blätter • Argumentregister(klassen)

• Konstanten(klasse)

Die Grundidee erweitern wir (evt.) um eine Store-Operation.

Für die Instruktion: M[_A + 2 + _D] = _R;

(5)

+

I +

A 2

M R

=

S

(6)

Spezifikation des Instruktionssatzes:

(1) verfügbare Registerklassen // Nichtterminale (2) Operatoren und Konstantenklassen // Terminale

(3) Instruktionen // Regeln

==⇒ reguläre Baumgrammatik

(7)

Triviales Beispiel:

Loads : Comps : Moves :

D → _M

[

_A

]

_D → _c _D → _A D → _M

[

_A

+

_A

]

_D → _D

+

_{D A} → _D

• Registerklassen D (Data) und A (Address).

• Arithmetik wird nur für Daten unterstützt ...

• Laden nur für Adressen :-)

(8)

Target: M [ A + c ]

Aufgabe:

Finde Folge von Regelanwendungen, die das Target aus einem Nichtterminal erzeugt ...

D

(9)

Target: M [ A + c ]

Aufgabe:

M A

(10)

Target: M [ A + c ]

Aufgabe:

M D

(11)

Target: M [ A + c ]

Aufgabe:

+ M

D D

(12)

Target: M [ A + c ]

Aufgabe:

+ A

M

D

(13)

Target: M [ A + c ]

Aufgabe:

+ A

M

c

(14)

Die umgekehrte Folge der Regelanwendungen liefert eine geeignete Instruktionsfolge :-)

Verschiedene Ableitungen liefern verschiedene Folgen ...

Problem:

→ Wie durchsuchen wir systematisch die Menge aller Ableitungen ?

→ Wie finden wir die beste ??

(15)

Beobachtung:

• Nichtterminale stehen stets an den Blättern.

• Statt eine Ableitung für das Target topdown zu raten, sammeln wir sämtliche Möglichkeiten bottom-up auf

==⇒ Tree parsing

• Dazu lesen wir die Regeln von rechts nach links ...

+ M

(16)

Beobachtung:

==⇒ Tree parsing

+ M

A, D

(17)

Beobachtung:

==⇒ Tree parsing

+ M

A, D A, D

(18)

Beobachtung:

==⇒ Tree parsing

+ M

A, D A, D A, D, A + _A

(19)

Beobachtung:

==⇒ Tree parsing

+ M

A, D A, D A, D

A, D, A + _A

(20)

Für jeden Teilbaum t des Targets sammeln wir die Menge Q

(

_t

)

⊆ {_S} ∪ ^Reg ∪ ^Term

Reg die Menge der Registerklassen,

Term die Menge der Teilbäume rechter Seiten — auf mit:

Q

(

_t

) =

{_s | _s ⇒^∗ _t} Diese ergeben sich zu:

Q

(

_R

) =

^Move {_R} Q

(

_c

) =

^Move {_c}

Q

(

_a

(

_t₁, . . . , tk

)) =

^Move {_s

=

_a

(

_s₁, . . . , sk

)

∈ ^Term | _s_i ∈ _Q

(

_t_i

)}

(21)

Die Hilfsfunktion Move bildet den Abschluss unter Regelanwendungen:

Move

(

_L

)

⊇ _L

Move

(

_L

)

⊇ {_R ∈ Reg | ∃ _s ∈ _L : R → _s}

Die kleinste Lösung dieses Constraint-Systems lässt sich aus der Grammatik in linearer Zeit berechnen :-)

// Im Beispiel haben wir in Q

(

_t

)

auf s verzichtet, // falls s kein echter Teilterm einer rechten Seite ist :-)

(22)

Auswahlkriterien:

• Länge des Codes;

• Laufzeit der Ausführung;

• Parallelisierbarkeit;

• ...

Achtung:

Die Laufzeit von Instruktionen kann vom Kontext abhängen !!?

Vereinfachung:

Jede Instruktion r habe Kosten c

[

_r

]

.

(23)

c Instruktion 0 3 D → _M

[

_A

+

_A

]

1 2 D → _M

[

_A

]

2 1 D → _D

+

_D 3 1 D → _c

4 1 D → _A 5 1 A → _D

Aufgabe:

Wähle eine Instruktionsfolge mit minimalen Kosten !

(24)

Idee:

Sammle Ableitungen bottom-up auf unter

∗ Kostenkalkulation und

∗ Auswahl.

... im Beispiel:

+ M

A⁰, D¹

(25)

Idee:

∗ Auswahl.

... im Beispiel:

+ M

A⁰, D¹ A², D¹

(26)

Idee:

∗ Auswahl.

... im Beispiel:

+ M

A⁰, D¹ A², D¹ A⁴, D³, A + _A²

(27)

Idee:

∗ Auswahl.

... im Beispiel:

+ M

A⁰, D¹ A², D¹ A⁴, D³, A + _A² A⁶, D⁵

(28)

Idee:

∗ Auswahl.

... im Beispiel:

+ M

A⁰, D¹ A², D¹ A⁴, D³, A + _A² A⁶, D⁵ ⁰

(29)

Idee:

∗ Auswahl.

... im Beispiel:

+ M

A⁰, D¹ A², D¹ A⁴, D³, A

+

_A² A⁶, D⁵ ⁰

(30)

Idee:

∗ Auswahl.

... im Beispiel:

+ A⁶, D⁵ M⁰

A⁴, D³, A

+

_A² A² ^5,3, D¹ A⁰ , D¹

(31)

Kostenkalkulation:

c_t

[

_s

] =

_c_t₁

[

_s₁

] +

. . .

+

_c_t_k

[

_s_k

]

falls s

=

_a

(

_s₁, . . . , s_k

)

, t

=

_a

(

_t₁, . . . , t_k

)

c_t

[

_R

] =

_F {_c

[

_R, _s

] +

_c_t

[

_s

]

| _s ∈ _Q

(

_t

)}

wobei

c

[

_R,_s

]

≤ _c

[

_r

]

falls r : R → _s c

[

_R,_s

]

≤ _c

[

_r

] +

_c

[

_R⁰, s

]

falls r : R → _R⁰

Das Constraint-System für c

[

_R, _s

]

kann in Zeit O(_n · log n) gelöst werden — falls n die Anzahl der Paare R, s ist :-) Für jedes R,s liefert die Fixpunkt-Berechnung eine Folge:

(32)

Mithilfe der π

[

_R, _s

]

lässt sich eine billigste Ableitung topdown rekonstruieren :-)

Im Beispiel:

D2

=

_c;

A2

=

_D₂;

D1

=

_M

[

_A₁

+

_A₂

]

; mit Kosten 5 . Die Alternative:

D2

=

_c;

D3

=

_A₁;

D4

=

_D₃

+

_D₂; A2

=

_D₄;

(33)

Diskussion:

• Die Code-Erzeugung muss schnell gehn :-)

• Anstelle für jeden Knoten neu zu überprüfen, wie die Regeln zusammen passen, kann die Berechnung auch in einen

endlichen Automaten kompiliert werden :-))

Ein deterministischer endlicher Baumautomat (DTA) A besteht aus:

Q == endliche Menge von Zuständen Σ == Operatoren und Konstanten δ_a == Übergangsfunktion für a ∈ ^Σ

(34)

Dabei ist:

δ_c _: _Q _falls _c _Konstante δ_a _: _Q^k → _Q falls a k-stellig

Beispiel:

Q

=

{0, 1, 2} _F

=

{0} Σ

=

{_a,_b, :}

δ_a

=

0 δ_b

=

1

δ_:

(

_s₁, s2

) = (

_s₁

+

_s₂

)

%3

(35)

1

0 1

1 2

1 0 : :

: a

b b

b

Der Zustand an einem Knoten a ergibt sich aus den Zuständen der Kinder mittels δ_a _(-:

Q

(

_c

) =

^δ_c

(36)

Die von A definierte Sprache (oder: Menge von Bäumen) ist:

L(_A

) =

{_t | _Q

(

_t

)

∈ _F}

... in unserer Anwendung:

Q == Teilmengen von Reg ∪ ^Term ∪ {_S}

// I.a. werden nicht sämtiche Teilmengen benötigt :-)

F == gewünschter Effekt

δ_R == Move{_R}

δ_c == ^Move{_c}

(37)

... im Beispiel:

δ_c

=

{_A, _D}

=

_q₀

=

^δ_A

=

^δ_D

δ₊

(

_q₀,q0

) =

{_A, _D, _A

+

_A}

=

_q₁

=

^δ₊

(

_q₀, _

)

=

^δ₊

(

_,q0

)

δ_M

(

_q₀

) =

{_A, _D}

=

_q₀

=

^δ_M

(

_q₁

)

Um die Anzahl der Zustände zu reduzieren, haben wir die

(38)

Integration der Kostenberechnung:

Problem:

Kosten können (im Prinzip) beliebig groß werden ;-(

Unser FTA besitzt aber nur endlich viele Zustände :-((

Idee:

Pelegri-Lopart 1988

Betrachte nicht absolute Kosten — sondern relative !!!

(39)

Eduardo Pelegri-Llopart, Sun Microsystems, Inc.