Goal Orderings

(1)

1

Reasonable & Forced

Goal Orderings

und ihr Gebrauch bei

Agenda -unterstütztes Planen

Gegeben:

Menge von Zielen Gesucht:

Ordnungsrelation über Teilmengen dieser Zielmenge

Ziel:

Effektives Planen bei voneinander

abhängigen Teilzielen mit Hilfe einer Goal-

Agenda

(2)

3

0 Gliederung

1. Ordnungs-Relationen zwischen atomaren Zielen

2. Methoden zur Berechnung von Goal Orderings

3. Benutzung einer Goal-Agenda 4. Empirische Ergebnisse

1 Ordnungs-Relationen zwischen atomaren Zielen

• Annahmen:

(

O,I,G

^), ^A,B ^ɽ

G

atomare Ziele

Gültiger Plan (Sequenz von Aktionen) existiert

Planer verwirklicht A ĺ s(A,¬B)

• 3 Möglichkeiten in s(A,¬B) :

Es existiert ein in s(A,¬B) ausführbarer Plan, der B verwirklicht, ohne A zu löschen.

Es exisitiert kein in s(A,¬B) ausführbarer Plan, der B verwirklicht. ->Deadlock

Es exisitiert nur ein Plan, der A (vorübergehend) löscht, bevor er B verwirklichen kann.

(3)

5

1.1 Forced Ordering

• Es exisitiert kein in s(A,¬B) ausführbarer Plan, der B verwirklicht. ->Deadlock

ŹPlaner ist gezwungen (“forced”), B vor oder gleichzeitig mit A zu verwirklichen.

B f A gdw. Für alle Zustände s(A,¬B) gilt: Es gibt keinen in s(A,¬B) ausführbaren Plan (Sequenz von Aktionen aus O), der B verwirklicht:

^A ^, ^B ^: ^P

^O

^: ^B ^result ⁽ ^s ⁽ ^A ^, ^B ^), ^P

^O

⁾

(1)

s

1.2 Reasonable Ordering

• Es exisitiert nur ein Plan, der A (vorübergehend) löschen muss, bevor er B verwirklichen kann.

ŹEs ist angemessener (“reasonable”), B vor oder gleichzeitig mit A zu verwirklichen, um nicht- optimale Pläne zu vermeiden.

B r A gdw. Für alle Zustände s(A,¬B) gilt: Es gibt keinen in s(A,¬B) ausführbaren Plan (Sequenz von Aktionen aus =alle Aktionen, die A nicht löschen) der B verwirklicht:

^A ^, ^B ^: ^P

^O

^: ^B ^result ⁽ ^s ⁽ ^A ^, ^B ^), ^P

^O

⁾

(5)

s

OA

(4)

7

1.3 Forced und Reasonable Orderings als Entscheidungsprobleme

• Angenommen es exisitieren Zustände s(A,¬B) Gilt B f A? ɽ PSPACE - hard Gilt B r A? ɽ PSPACE - hard

• Das Finden von Reasonable und Forced

Ordering-Relationen zwischen atomaren Zielen ist mindestens so schwer wie das zu Grunde liegende Planungsproblem selbst!

???

2 Methoden zur Berechnung von Goal Orderings

• Definieren neuer Ordnungsrelationen, die in Polynomialzeit entscheidbar sind und

möglichst eine hinreichende Bedingung für die Existenz von Reasonable oder Forced Ordering – Relationen darstellen.

• Approximation von Reasonable Goal Ordering:

e „efficient ordering“, basierend auf GRAPHPLAN

h „heuristic ordering“, basierend auf einer

heuristischen Methode

(5)

9

2.1 Reasonable Goal Orderings basierend auf GRAPHPLAN

• Gegeben: (

O,I,G

^), ^A,B ^ɽ

G

• Ziel: mehr Wissen über s(A,¬B) erlangen

• Teilmenge F von Atomen bestimmen, für die gilt:

• GRAPHPLAN (GP) erstellen

False set von A bestimmen: alle Atome, die mit Aktionen aus

O

von I aus erreichbar sind und nicht gleichzeitig mit A erfüllt sein können, sich also mit A ausschließen:

^

| " "

`

(7a)

: p pmutexmit AwennPlangraf leveled off

A

F

GP

s ( A , B ) F

2.1 Reasonable Goal Orderings basierend auf GRAPHPLAN

• „Efficient Ordering“ e

B e A gdw. Alle Aktionen des bzgl. A reduzierten Action set (alle Aktionen, die A nicht löschen) fügen entweder B nicht hinzu oder, wenn doch, dann haben sie eine Vorbedingung, die im False set

von A liegt:

(6)

• B e A => B r A

• e ist in Polynomialzeit entscheidbar

O

A

F

GP

z

o_A O_A : B add(o_A) pre(o_A) F_GP^A

(6)

11

• I ={on(a,table), clear(a), on(b,table), clear(b), on(c,table), clear(c)}

• G ={on(a,b), on(b,c)}

• O ={

push(x,y):

holding(x) clear(y) ĺ ADD on(x,y) clear(x) DEL holding(x) clear(y)

pop(x,y):

clear(x) on(x,y) ĺ ADD clear(y) holding(x) DEL on(x,y) clear(x)

}

2.1.1 Beispiel e: blocksworld

2.2 Reasonable Goal Orderings basierend auf einer heuristischen Methode

• Direkte Analyse (DA) der Aktionen

• Plangraf nicht nötig!

• Anfangswert von F ( ) sind alle Atome, die immer dann, wenn A hinzugefügt wird, gelöscht werden:

(7b)

• approximierte Fixpunkt-Reduktion von F und von : Alle Atome, die mit Aktionen aus dann doch noch erreichbar sind - im Sinne von possibly achievable (8) –, werden aus F entfernt.

s(A, B) F

( )

,

) (

o add A O o

DAA del o

F

O

A

O

A

(7)

13

2.2.1 Fixpunkt-Reduktion

^ `

*

, }

} } : _ { |: ( ) }

} { :

{ )

, ( {

_ ){

_ (

_ | ( )

: :

O F return

false erreicht

fixp O o F pre o O

f F

F

then O

f pA if F f for

true erreicht

fixp erreicht fixp

whilefixp Oerreichto F falsepre o O

F F

A A

DAA

z

• Ziel:

– Am Ende befinden sich in F* nur noch die Atome, die nicht von s(A,¬B) aus erreichbar sind ohne A zu löschen.

– Im reduzierten Action set O* befinden sich am Ende alle die Aktionen, die nach s(A,¬B) anwendbar sind, ohne A zu löschen.

– Nun kann sicher gesagt werden, ob ein Ziel mit diesen Akitonen noch erreicht werden kann. Wenn nicht:

-> reasonable ordering!!

2.2.1 Fixpunkt-Reduktion

(8)

15

• „heuristic ordering“

B h A gdw.B ist nicht erreichbar – im Sinne von possibly achievable – mit Hilfe von Aktionen des bzgl. A reduzierten Action set O* (Resultat der Fixpunkt-Berechnung):

(9)

• B h A => B r A

2.2.2 Heuristic Ordering

) , ( B O

^*

pA

• op1: ĺ add{A} del{C,D}

• op2: ĺ add{A,C} del{D}

• op3: {C} ĺ add{D}

• op4: {D} ĺ add{B}

• Gilt B h A?

2.2.3 Beispiel Fixpunkt-Reduktion

(9)

17

• on(a,b) h on(b,c) ?

• Nach Fixpunkt-Reduktion bzgl. on(b,c):

F* = {holding(b), clear(c)}

O* = {push(a,b), push(c,a), push(c,b), pop(a,b), pop(a,c), pop(b,a)}

• Test: pA(on(a,b),O*)?

ĺ on(a,b) ɽadd(push(a,b)) ĺ pre(push(a,b)) =

holding(a) ɽ add(pop(a,b)) clear(b) ɽ add(pop(a,b))

• pA(on(a,b),O*) ĺ ¬ (on(a,b) h on(b,c))

2.2.4 Beispiel h - blocksworld

• on(b,c) h on(a,b) ?

• Nach Fixpunkt-Reduktion bzgl. on(a,b):

F* = {holding(a), clear(b)}

O* = {push(b,c), push(b,a), push(c,a), pop(a,c), pop(c,a), pop(c,b)}

• Test: pA(on(b,c),O*)?

ĺ on(b,c) ɽadd(push(b,c)) ĺ pre(push(b,c)) =

clear(c) ɽadd(pop(a,c)) holding(b) ɽ add(pop(b,?))

2.2.4 Beispiel h - blocksworld

(10)

19

• Keine Bemühungen, Approximationen speziell für Forced Goal Orderings zu finden

• Gründe:

r Abschätzung für f

=> e und h grobe Abschätzung für f

Viele Benchmark-Planprobleme beinhalten ausschließlich invertierbare Aktionen. D. h., jede Aktion lässt sich rückgängig machen. Es gibt keine „Deadlocks“ (Zustände, von denen aus keine Aktionen mehr anwendbar sind, die zum Ziel führen).

-> „invertible Probleme“

Nicht-triviales forced-ordering B f A impliziert jedoch die Existenz von Deadlocks.

=> Die meisten interessierenden Probleme sind deadlock- und damit forced ordering-frei

2.3 Forced Goal Orderings

• Zerlegung der Zielmenge in disjunkte Teilmengen

• Planer läuft auf diesen sequentiell geordneten Teilproblemen

• Gesamtplan ist dann Verkettung der Teilpläne

3 Benutzung einer Goal Agenda

(11)

21

1. Zielanalyse

• Jedes Paar A,B ɽ

G

wird auf Ordnungsrelation hin untersucht:

A B oder B A oder beides oder keines

2. Zielmenge G in kleinere Mengen entsprechend diesen Relationen zerlegen und entsprechend den Relationen ordnen

Ziel: Sequenz von Zielmengen (Goal-Agenda G)

G = G

(10)

3.1 Erstellen einer Goal Agenda

n j i j

i G

G G

mit G

G _i _j

n i

i

n , z , 1d , d

,...,

1

• Gerichteter Graph G:=(V,E)

• V:= G

• E:={(A,B) ɽ G ^x G | ^A ^B}

• Bsp: G = {A,B,C,D,E}, A B, B C, B D 3.1 Goal Graph G

A

C B

(12)

23

1. Transitive Hülle G* von G berechnen

=>

2. Für jeden Knoten A die in G* ausgehenden und eingehenden Kanten zählen

• G-sep: Menge der unverbundenen Knoten

• Übrige Mengen beinhalten alle Knoten mit dem selben Grad d(A) = A_in – A_out

3. Ordnen dieser Mengen nach ansteigenden Grad =>

gewünschte Sequenz:

-3 -1 2 G-sep

{A}ĺ {B} ĺ {C,D} {E}

3.2 Berechnung der Goal Agenda

A

E D

C B

A

E D

C B

3.2 Erweiterung von Goal Orderings für Zielmengen

• Geg.:

(

O,I,G

^),

G , G

• Ziel: Erweiterung von e auf E

(11a,b)

und h auf H

O*

^(11c,d)

{ ,..., }

} ,...,

{ A

₁

A

_n

B

₁

B

_k

} ,..., {A₁ A_n

F

GP

O

_{_A₁_,..._A_n_}

} ,..., {A₁ A_n

FDA

(13)

25

3.2.1 Ordering E

gdw. ein von keiner Aktion aus dem reduzierten Action- set bzgl. der Menge A hinzugefügt werden kann oder, wenn doch, dann liegt eine

Vorbedingung der Aktion, die B hinzufügt, im False set der Menge A:

} ,..., {

} ,...,

{ B

₁

B

_k

d E A

₁

A

_n

z

{1,..., }: _{ ₁_,..., _}: ( ) ( ) ^{ ¹^,..., ⁿ^}

n

A A j GP

A

A B add o pre o F

O o k

j

B

j

3.2.1 Ordering H

gdw. Es existiert ein , das mit Aktionen aus O* ^nicht

erreichbar (pA) ist:

} ,..., {

} ,...,

{ B

₁

B

_k

d H A

₁

A

_n

*) , ( :

} ,..., 1

{ k pA B O

j _j

B

j

(14)

27

3.3 Der Agenda-driven planning Algorithmus

• Geg.: ( O,I,G ), Goal Agenda , G

• Idee: Planer wird initialisiert mit G

• Planer löst Problem G

• Führt Plan aus

• Neuer Initialzustand

• Neues Problem G G

• Allgemein: G , G=G

• Plan für ( O,I,G ) = , , … ,

Gn

G₁,..., G_i

I

₁ ₁ G₁

)

, ,

( O I

₁ ₁

P

1

) ,

(

₁ ₁

2

result I P I

ⁱ

j

G G

1

2 1

2

) , ,

( O I

₂ ₂

ⁱ

j j

i G

1

P

k

P

2

P

1

j 1 j

k G

3.3 Der Agenda-driven planning Algorithmus

• No-ops-first (GRAPHPLAN-feature)

(Algorithmus versucht zuerst Ziele zu erreichen, indem er sie, wenn möglich, auf „wahr“ lässt, sie also wenn sie bereits erreicht sind nicht zu zerstören)

• Reasonable ordering bietet Algorithmus bereits eine solche Sortierung, so dass dieses feature optimal ausgenutzt werden kann

• Was den Algorithmus also auszeichnet, ist das

Berechnen einer Sequenz sondierter Teilpläne, die einen Zustandsübergang von I nach G liefern („Soundness“:

„Korrektheit“)

• „Vollständigkeit“ bei Problemen ohne Deadlocks gewährleistet.

(15)

29

3.3 Der Agenda-driven planning Algorithmus

• Vollständigkeit dennoch nicht allgemein garantierbar:

O= { op1:{C} ĺ add {B} del {D}

op2:{D} ĺ add {E}

op3:{E} ĺ add {F}

op4:{F} ĺ add {A} } I = {C,D}, G= {A,B}

B h A ? F = Ø O* = Ø

pA(B,O*)? Nein!

Bh A ableitbar!

Falsch! B nach A erreichbar!

Ah B ? F* = {D}

O* = {op3, op4}

pA(A,O*)? Ja, op4

A h B nicht ableitbar!

Falsch! A f B!

CA B A B

C

AC B

B A C

AB C CB

A BC

A A BC

A B A

(16)

31

4 Empirische Ergebnisse

• IPP –Planer

• Beide Methoden implementiert als sogenannten Goal Agenda Manager (GAM)

• IPP-Planning-Algorithmus: Lösen von Teilproblemen und Konkatenation von Teilplänen ergibt Gesamtplan

• IPP-domain-Kollektion: 48 Domains

• Goal orderings ließen sich für 10 Domains ableiten

• GAM fand fast alle reasonable orderings

4.1 Vergleich e und h in Blocksworld- Domain

0.36 1.74 4.85 11.38 6.91

160.00 840.42 - 19

39 59 79 800

3200 7200 12800 Stack_20

Stack_40 Stack_60 Stack_80

0.07 0.11 0.22 0.35 0.35 0.58 0.88 0.69

1.45 4.85 14.18 12.95 44.93 97.11 1

5 7 11 11 6 9 162

242 450 722 722 1250 1800 Bw_large_a

Bw_large_b Bw_large_c Bw_large_d Bw_large_e Bw_large_f Bw_large_g

CPU(h) CPU(e)

#agenda entries

#actions Problem

(17)

33

4.1 Vergleich e und h in anderen Domain

0.01 0.09 0.09 0.02

0.19 0.22 2/1

2/1 2/1 26

114 122 Glass1 (glassworld)

Glass2 (glassworld) Glass3 (glassworld)

0.12 1.0

1/4 104

Sched6 (scheduling)

0.01 0.01 0.06 0.03

0.03 0.14 1/3

6/5 6/5 15

15 43 Wood1 (woodshop) Wood2 (woodshop) Wood3 (woodshop)

0.03 0.09

2/1 61

Bull (Bulldozer)

CPU(h) CPU(e)

#agenda entries

#actions Problem (Domain)

4.2 Einfluss von Goal Orderings auf die Performance von IPP in Verbindung mit

RIFO –Blocks-World

0.74 0.86 7.34 11.62 11.14 - +GAM

0.58 0.55 2.42 3.74 3.99 -

+GAM+RIFO 0.7

26.71 - - - - 12

22(18) 48 54 52 90 162

242 450 722 722 1250 Bw_large_a

Bw_large_b Bw_large_c Bw_large_d Bw_large_e Bw_large_f

IPP Plan length

#actions SATPLAN

• RIFO: heuristische Analyse-Methode, die IPP befähigt, irrelevante Aktionen und irrelevante Initial-Fakten aus dem Planning-Problem zu entfernen

(18)

35

4.2 Einfluss von Goal Orderings auf die Performance von IPP in Verbindung mit

RIFO – Türme von Hanoi

0.02 0.07 0.25 3.10 88.45 2339.94 0.02

0.08 0.33 1.57 9.71 69.44 21

48 90 150 231 336 2

3 4 5 6 7

+GAM IPP

#actions Scheiben

• Türme von Hanoi EINZIGE gefundene Domäne, wo Erweiterung von IPP um GAM zu

schlechteren Ergebnissen führte!!

5 Zusammenfassung

• Ziel war: Planer mit zusätzlichen Informationen über die Reihenfolge der Ziele zu unterstützen

• Berechnung in Polynomialzeit

• Entwickelte Methoden für STRIPS und ADL

• „Soundness“ immer und „Completeness“ bei Deadlock- freien Problemen (also für reasonable ordering)

gewährleistet

• e m. H. Plangraf, h m. H. Direkte Analyse der Aktionen

• e schlechtere Performance als h ansonsten gleich gut

• Goal Agenda Manager verbessert i. A. signifikant die Leistung von IPP

(19)

37

Literatur

• Koehler, Jana; Hoffmann, Jörg: On

Reasonable and Forced Goal Orderings and their Use in an Agenda-Driven

Planning Algorithm

(20)

Forced Goal Ordering: B≤_f A⇔∀s(A,¬B):¬∃P^O:B∈result(s(A,¬B),P^O) (1)

Plan: P^O = o₁,...,o_n ,o∈O (2)

result:



 ∪ − ⊆

= ss add o del o ifotherwisepre o s o

s

result( , ) ( ( )) ( ) ( )

) ), ,...

, ( ( :

) ,..., ,

(s o₁ o_n result result s o o_n ₁ o_n

result = ₋ (3)

reduziertes Action set bzgl. A: Ô_A ={ô∈Ô^| Â∉^del⁽ô⁾} (4) Reasonable Goal Ordering: B≤r A⇔ ∀s(A^,¬B)^:¬∃PÔÂ ^:B∈result⁽s⁽A^,¬B^),PÔÂ⁾ (5) Efficient Goal Ordering: B≤_e A⇔ ∀o_A∈O_A:B∈add(o_A)⇒pre(o_A)∩F_GPÂ ≠Ο/ (6) False set von A (m. H. von GRAFPL.): F_GPÂ :={p|pmutexmitAwennPlangraf "leveled off"} (7a) False set von A (m. H. von Direkte Analyse): ^F^DAÂ ^:⁼_o_∈_O_,_A

I

_∈_add^del₍_o₎⁽^o⁾^(7b)

Possibly achievable: pA(p,O)⇔∃o∈O:p∈add(o)∧∀p′∈pre(o):∃o′∈O:p′∈add(o′) (8) (Alle Atome, die add-Effekte von Aktionen sind, deren Vorbedingungen ebenfalls add- Effekte sind, heißen possibly achievable)

Fixpunkt-Reduktion:

{ }

*

, }

} } :_ { |: ( ) }

} { :

{ ) , ( {

_ ){

_ (

_ | ( )

: :

O returnF

false erreicht

fixp O o F preo O

f F F

then O f pA if F f for

true erreicht fixp erreicht fixp

whilefixp Oerreichto F falsepreo O

F F

A A

DAA

= ∩ ≠∅

−

=

−

=

∈

¬ − = ∩ = ≠∅

=

Heuristic Goal Ordering:B≤_h A⇔ ¬pA(B,O^*) (9)

Goal Agenda: G G mit G G G_i G_j i j i j n

n i

i

n = ∩ =∅ ≠ ≤ ≤

=

, 1 , ,

,...,

1

1 U ⁽¹⁰⁾

False set (≤E): ^F^{A¹^,...,A^}^: {^p^|^pîst^mutex^mit^wenigstensêinemÂi^wenn^Plangraph ^"^leveled ôff^"}

GP ⁿ = (11a)

Reduziertes Action set (≤E): O_{_A₁_,..._A_n_} ={o∈O|∀i∈{1,...n}:A_i∉del(o)} (11b)

False set (≤H): ^F^DA^{^A¹^,...,^Aⁿ^}^:⁼

U

_i ^F^DA^Aⁱ (11c)

{

^∃ ^∈ ^∈ ^∨ ^∩ ^≠^∅

}

−

= | {1,..., }: ( ) ( )

: _{ _,..., _} ^{ ^,..., ^}

* 1

1 o i n A del o F preo

O

O _A _A_n _i _DA^A ^Aⁿ (11d)

Efficient Goal set Ordering:

∅

≠

∩

⇒

∈

∀

∈

∃

⇔

≤ ₁ _{ _,..., _} ^{ ^,..., ^}

1,..., } { ,..., } {1,..., }: 1 : ( ) ( ) ¹

{B B_k _E A A_n j k o O_A _A_n B_j add o preo F_GP^A ^Aⁿ (12)

(21)

Beispielrechnung zu 2.1.1 Beispiel ≤e: blocksworld

Test 1: Gilt on(a,b) ≤e on(b,c)?

1. False set von on(b,c):

Wenn b auf c steht, kann nicht gleichzeitig c frei sein, b oder c gehalten werden, b auf dem Tisch stehen, b auf a, a auf c oder c auf b stehen.

2. Reduziertes action set von on(b,c):

Alle anwendbaren Aktionen aus O, außer b von c runter nehmen, zerstören den Zustand, b steht auf c, nicht.

3. Testen, ob on(a,b) ≤e on(b,c) gilt:

• Welche Aktionen aus O_on₍_b_,_c₎ haben on(a,b) in ihrer add-Liste?

o push(a,b) Wenn b auf c steht, lässt sich on(a,b) dadurch verwirklichen, dass a auf b gestellt wird.

• Hat push(a,b) Vorbedingungen, die nicht gleichzeitig mit on(b,c) gelten können, also im False Set von on(b,c) sind?

o Pre(push(a,b)) = {hold(a), clear(b)} ⊄ F_GP^on⁽^b^,^c⁾, also NEIN!

Vorbedingungen der Aktion(en), die on(a,b) erfüllt, schließen sich nicht mit on(b,c) aus.

• on(a,b) ≤e on(b,c) NICHT ableitbar!

Test 2: Gilt on(b,c) ≤e on(a,b)?

1. False set von on(a,b):

2. Reduziertes action set von on(b,c):

3. Testen, ob on(b,c) ≤e on(a,b) gilt:

• Welche Aktionen aus O_on₍_a_,_b₎ haben on(b,c) in ihrer add-Liste?

o push(b,c)

• Hat push(b,c) Vorbedingungen, die nicht gleichzeitig mit on(a,b) gelten können, also im False Set von on(a,b) sind?

o Pre(push(b,c)) = {hold(b), clear(c)} → hold(b) ∈ F_GP^on⁽^b^,^c⁾, also JA!

• on(b,c) ≤e on(a,b) ableitbar!

Fazit: es ist effektiver, erst b auf c zu stellen und danach a auf b (on(b,c) ≤e on(a,b)), da, wenn zuerst on(a,b) gilt, dieses zwischenzeitlich wieder gelöscht werden müsste.

{

( ), ( ), ( ), ( , ), ( , ), ( , ), ( , )

}

) ,

(^b^c clear c hold b hold c on b table on b a on a c on c b

on

FGP =

{

( , )

}

) ,

( O pop b c

O_on _b_c = −

{

( ), ( ), ( ), ( , ), ( , ), ( , ), ( , )

}

) ,

(^a^b clear a hold b hold a on a table on b a on a c on c b

on

FGP ⁼

{

⁽ ^, ⁾

}

) ,

( O pop a b

O_on _a_b = −

(22)

Beispielrechnung zu 2.2.3 Beispiel Fixpunktreduktion

Gilt B ≤h A?

{ }

ist erfüllbar

* O aus Aktionen mit

B da ,

zerstören nicht

A die Aktionen, n

anwendbare aus

A von die beinhaltet

*

O 2. { 1, 2, 3, 4}

löschen zu

A ohne sind erreichbar aus

A nicht von die

Atome, die

beinhaltet

* F 1.

JA!

? achievable possibly

O aus Aktionen mit

D Ist

? ) , ( . 3

3 , 2 , 1 A

von ActionSet s

Reduzierte 2.

) ( FalseSet

1.

*

*) ( ,

*

A B

op op op op O

D F

F O D pA

op op op O

D o

del F

F

h

o abb A O o DAA

≤/

⇒

=

⇒

∅

=

−

=

⇒

=

∈

Goal Orderings

Reasonable & Forced

Goal Orderings

und ihr Gebrauch bei

Agenda -unterstütztes Planen

Gegeben:

Menge von Zielen Gesucht:

Ordnungsrelation über Teilmengen dieser Zielmenge

Ziel:

Effektives Planen bei voneinander

abhängigen Teilzielen mit Hilfe einer Goal-

Agenda

0 Gliederung

1. Ordnungs-Relationen zwischen atomaren Zielen

2. Methoden zur Berechnung von Goal Orderings

3. Benutzung einer Goal-Agenda 4. Empirische Ergebnisse

1 Ordnungs-Relationen zwischen atomaren Zielen

• Annahmen:

O,I,G

G

• 3 Möglichkeiten in s(A,¬B) :

1.1 Forced Ordering

A , B : P

: B result ( s ( A , B ), P

)

s    

1.2 Reasonable Ordering

A , B : P

: B result ( s ( A , B ), P

)

s    

1.3 Forced und Reasonable Orderings als Entscheidungsprobleme

• Angenommen es exisitieren Zustände s(A,¬B) Gilt B  f A? ɽ PSPACE - hard Gilt B  r A? ɽ PSPACE - hard

• Das Finden von Reasonable und Forced

Ordering-Relationen zwischen atomaren Zielen ist mindestens so schwer wie das zu Grunde liegende Planungsproblem selbst!

???

2 Methoden zur Berechnung von Goal Orderings

• Definieren neuer Ordnungsrelationen, die in Polynomialzeit entscheidbar sind und

möglichst eine hinreichende Bedingung für die Existenz von Reasonable oder Forced Ordering – Relationen darstellen.

• Approximation von Reasonable Goal Ordering:

  e „efficient ordering“, basierend auf GRAPHPLAN

  h „heuristic ordering“, basierend auf einer

heuristischen Methode

2.1 Reasonable Goal Orderings basierend auf GRAPHPLAN

O,I,G

G

O

^

`

F





 s ( A , B ) F

2.1 Reasonable Goal Orderings basierend auf GRAPHPLAN

O

F

• I ={on(a,table), clear(a), on(b,table), clear(b), on(c,table), clear(c)}

• G ={on(a,b), on(b,c)}

• O ={

push(x,y):

pop(x,y):

}

2.1.1 Beispiel  e: blocksworld

2.2 Reasonable Goal Orderings basierend auf einer heuristischen Methode

O

O

2.2.1 Fixpunkt-Reduktion

^ `

• Ziel:

-> reasonable ordering!!

2.2.1 Fixpunkt-Reduktion

• „heuristic ordering“

B  h A gdw.B ist nicht erreichbar – im Sinne von possibly achievable – mit Hilfe von Aktionen des bzgl. A reduzierten Action set O* (Resultat der Fixpunkt-Berechnung):

(9)

• B  h A => B  r A

2.2.2 Heuristic Ordering

) , ( B O

 pA

• op1: ĺ add{A} del{C,D}

• op2: ĺ add{A,C} del{D}

^A ^, ^B ^: ^P

^: ^B ^result ⁽ ^s ⁽ ^A ^, ^B ^), ^P

⁾

s

^A ^, ^B ^: ^P

^: ^B ^result ⁽ ^s ⁽ ^A ^, ^B ^), ^P

⁾

s

• Angenommen es exisitieren Zustände s(A,¬B) Gilt B f A? ɽ PSPACE - hard Gilt B r A? ɽ PSPACE - hard

e „efficient ordering“, basierend auf GRAPHPLAN

h „heuristic ordering“, basierend auf einer

s ( A , B ) F

2.1.1 Beispiel e: blocksworld

B h A gdw.B ist nicht erreichbar – im Sinne von possibly achievable – mit Hilfe von Aktionen des bzgl. A reduzierten Action set O* (Resultat der Fixpunkt-Berechnung):

• B h A => B r A

pA

• Gilt B h A?

2.2.4 Beispiel h - blocksworld

2.2.4 Beispiel h - blocksworld

• E:={(A,B) ɽ G ^x G | ^A ^B}

• Bsp: G = {A,B,C,D,E}, A B, B C, B D 3.1 Goal Graph G

• Ziel: Erweiterung von e auf E

und h auf H

{ ,..., }

3.2.1 Ordering E

3.2.1 Ordering H

gdw. Es existiert ein , das mit Aktionen aus O* ^nicht