Constraint-Programmierung Vorlesung Sommersemester 2009, 2012

(1)

Constraint-Programmierung Vorlesung

Sommersemester 2009, 2012

Johannes Waldmann, HTWK Leipzig

31. M ¨arz 2014

(2)

Constraint-Programmierung—Beispiel

(set-logic QF_NIA)(set-option :produce-models true) (declare-fun P () Int) (declare-fun Q () Int)

(declare-fun R () Int) (declare-fun S () Int) (assert (and (< 0 P) (<= 0 Q) (< 0 R) (<= 0 S))) (assert (> (+ (* P S) Q) (+ (* R Q) S)))

(check-sat)(get-value (P Q R S))

I Constraint-System=eine pr ¨adikatenlogische FormelF

I L ¨osung=Modell vonF (=StrukurM, in derF wahr ist)

I CP ist eine Form derdeklarativenProgrammierung.

I Vorteil: Benutzung von allgemeinen Suchverfahren (bereichs-, aber nicht anwendungsspezifisch).

(3)

Industrielle Anwendungen der CP

I Verifikation von Schaltkreisen

(bevorman diese tats ¨achlich produziert)

F =S-Implementierung(x)6=S-Spezifikation(x)

wennF unerf ¨ullbar (¬∃x), dann Implementierung korrekt

I Verifikation von Software durchmodel checking:

Programmzust ände abstrahieren durch Zustandspr ädikate, Programmabl äufe durch endliche Automaten.

z. B. Static Driver Verifierhttp://research.

microsoft.com/en-us/projects/slam/

benutzt Constraint-Solver Z3http://research.

microsoft.com/en-us/um/redmond/projects/z3/

(4)

Industrielle Anwendungen der CP

automatische Analyse des Resourcenverbrauchs von Programmen

I Termination (jede Rechnung h ¨alt)

I Komplexit ¨at (. . . nachO(n²)Schritten) mittelsBewertungenvon Programmzust ¨anden:

I W :Zustandsmenge→N

I wennz₁→z₂, dannW(z₁)>W(z₂).

Parameter der Bewertung werden durch Constraint-System beschrieben.

(5)

CP-Anwendung: Polynom-Interpretationen

I Berechnungsmodell: Wortersetzung (≈Turingmaschine)

I Programm:ab →ba(≈Bubble-Sort)

Beispiel-Rechnung:abab→baab→baba→bbaa

I BewertungW durch lineare Funktionen

fa(x) =Px +Q,f_b(x) =Rx +SmitP,Q,R,S∈N W(abab) =f_a(f_b(f_a(f_b(0)))), . . .

I monoton:x >y ⇒f_a(x)>f_a(y)∧f_b(x)>f_b(y)

I kompatibel mit Programm:fa(f_b(x)>f_b(fa(x))

I resultierendes Constraint-System f ¨urP,Q,R,S,

I L ¨osung mittels Z3

(6)

Wettbewerbe f ¨ur Constraint-Solver

I f ¨ur aussagenlogische Formeln:

http://www.satcompetition.org/

(SAT=satisfiability)

I f ¨ur pr ¨adikatenlogische Formeln

http://smtcomp.sourceforge.net/

(SMT=satisfiability modulo theories)

Theorien:Zmit≤, Plus, Mal;Rmit≤, Plus; . . .

I Termination und Komplexit ¨at

http://www.termination-portal.org/wiki/

Termination_Competition

(7)

Gliederung der Vorlesung

I Aussagenlogik

I CNF-SAT-Constraints (Normalf., Tseitin-Transformation)

I DPLL-Solver, Backtracking und Lernen

I ROBDDs (Entscheidungsdiagramme)

I Pr ¨adikatenlogik (konjunktive Constraints)

I Finite-Domain-Constraints

I naive L ¨osungsverfahren, Konsistenzbegriffe

I lineare Gleichungen, Ungleichungen, Polynomgleichungen

I Termgleichungen, Unifikation

I Kombinationen

I Kodierungen nach CNF-SAT (FD, Zahlen)

I SMT, DPLL(T)

(8)

Organisatorisches

I jede Woche 1 Vorlesung+1 ¨Ubung

I Ubungsaufgaben (teilw. autotool)¨

I Projektarbeit (?), Klausur (?) m ¨ogl. Projektthemen:

I SAT-Kodierungen (Testf ¨alle f ¨ur eine Bibliothek, die von A.

Bau entwickelt wird)

I SAT zum L ¨osen von Endspielproblemen (http://senseis.xmp.net/?Havannah)

I Generierung von SMT-Benchmarks aus Terminationsproblemen

I Test und Erweiterung eines SMT-Solvers

https://github.com/jwaldmann/satchmo-smt

(9)

Literatur

I Krzysztof Apt:Principles of Constraint Programming, http://www.cambridge.org/catalogue/

catalogue.asp?isbn=9780521825832

I Daniel Kroening, Ofer Strichman:Decision Procedures, Springer 2008.

http://www.decision-procedures.org/

I Petra Hofstedt, Armin Wolf: Einf ¨uhrung in die Constraint-Programmierung, Springer 2007.

http://www.springerlink.com/content/

978-3-540-23184-4/

I Uwe Sch ¨oning: Logik f ¨ur Informatiker, Spektrum Akad.

Verlag, 2000.

(10)

Aussagenlogik: Syntax

aussagenlogische Formel:

I elementar: Variablev₁, . . .

I zusammengesetzt: durch Operatoren

I einstellig: Negation

I zweistellig: Konjunktion, Disjunktion, Implikation, Aquivalenz¨

(11)

Aussagenlogik: Semantik

I WertebereichB={0,1}, Halbring(B,∨,∧,0,1) Ubung: weitere Halbringe mit 2 Elementen?¨

I Belegungist Abbildungb:V →B

I Werteiner FormelF unter Belegungb: val(F,b)

I wenn val(F,b) =1, dann istbeinModellvonF, Schreibweise:b |=F

I ModellmengeMod(F) ={b|b|=F}

I F erf ¨ullbar, wenn Mod(F)6=∅

I Modellmenge einerFormelmenge:

Mod(M) ={b| ∀F ∈M :b|=F}

(12)

Der Folgerungsbegriff

eine FormelF folgt auseiner FormelmengeM:

I Notation:M |=F, Definition: Mod(M)⊆Mod(F) Beispiele/ ¨Ubung (beweise!)

I {x,¬y} |=x∨y

I ∀M : (Mod(M) =∅) ⇐⇒ (∀F :M |=F).

(aus einer widerspr ¨uchlichen Formelmenge folgt jede Formel)

I ∀M,F : (M|=F) ⇐⇒ (Mod(M) =Mod(M∪ {F})) (Hinzunahme einer Folgerung ¨andert die Modellmenge nicht)

(13)

Normalformen (DNF, CNF)

Definitionen:

I Variable:v₁, . . .

I Literal:v oder¬v

I DNF-Klausel: Konjunktion von Literalen

I DNF-Formel: Disjunktion von DNF-Klauseln

I CNF-Klausel: Disjunktion von Literalen

I CNF-Formel: Konjunktion von CNF-Klauseln

Disjunktion als Implikation: diese Formeln sind ¨aquivalent:

I (x₁∧. . .∧x_m)→(y₁∨. . .∨y_n)

I (¬x₁∨. . .∨ ¬x_m∨y₁∨. . .∨y_n)

(14)

Modellierung durch SAT

gesucht ist Kanten-2-F ¨arbung desK5ohne einfarbigenK3.

I Aussagenvariablenf_i,j =Kante(i,j)ist rot (sonst blau).

I Constraints:

∀p:∀q:∀r : (p<q∧q<r)⇒((f_p,q∨f_q,r ∨f_p,r)∧. . .) das ist ein Beispiel f ¨ur ein Ramsey-Problem

(F. P. Ramsey, 1903–1930)http://www-groups.dcs.

st-and.ac.uk/˜history/Biographies/Ramsey.html diese sind schwer, z. B. ist bis heute unbekannt: gibt es eine Kanten-2-F ¨arbung desK₄₃ ohne einfarbigenK₅?

http:

//www1.combinatorics.org/Surveys/ds1/sur.pdf

(15)

Benutzung von SAT-Solvern

Eingabeformat: SAT-Problem in CNF:

I Variable=positive nat ¨urliche Zahl

I Literal=ganze Zahl (6=0, mit Vorzeichen)

I Klausel=Zeile, abgeschlossen durch 0.

I Programm=Header

p cnf <#Variablen> <#Klauseln>, dann Klauseln Beispiel

p cnf 5 3 1 -5 4 0 -1 5 3 4 0 -3 -4 0

L ¨oser:minisat input.cnf output.text

(16)

Aquivalenzen ¨

Def: FormelnF undGheißen ¨aquivalent, wenn Mod(F) =Mod(G).

Satz: zu jeder FormelF existiert ¨aquivalente FormelGin DNF.

Satz: zu jeder FormelF existiert ¨aquivalente FormelG⁰ in CNF.

aber . . . wie groß sind diese Normalformen?

(17)

Erf ¨ullbarkeits- ¨ Aquivalenz

Def:F undG erf ¨ullbarkeits ¨aquivalent, wenn Mod(F)6=∅ ⇐⇒ Mod(G)6=∅.

Satz: es gibt einen Polynomialzeit-Algorithmus, der zu jeder FormelF eine erf ¨ullbarkeits ¨aquivalente CNF-FormelG berechnet.

also auch|G|=Poly(|F|)

(18)

Tseitin-Transformation

GegebenF, gesucht erf ¨ullbarkeits ¨aquivalentesGin CNF.

BerechneGmit Var(F)⊆Var(G)und

∀b:b|=F ⇐⇒ ∃b⁰ :b⊆b⁰∧b⁰|=G.

Plan:

I f ür jeden nicht-Blatt-TeilbaumT des Syntaxbaumes vonF eine zus ätzliche Variablen_T einf ühren,

I wobei gelten soll:∀b⁰ :val(n_T,b⁰) =val(T,b).

Realisierung:

I falls (Bsp.)T =L∨R, dannn_T ↔(n_L∨n_R)als CNF-Constraintsystem

I jedes solche System hat≤8 Klauseln mit 3 Literalen, es sind ingesamt|F|solche Systeme.

(19)

Tseitin-Transformation ( ¨ Ubung)

Ubungen (Hausaufgabe):¨

I transformiere(x₁↔x₂)↔(x₃↔x₄) nach Tseitin-Algorithmus.

I Halb-Adder (2 Eing ¨angex,y, 2 Ausg ¨anger,c) (r ↔(¬(x ↔y)))∧(c↔(x ∧y))

I Voll-Adder (3 Eing ¨ange, 2 Ausg ¨ange)

(20)

Beispiele zur SAT-Modellierung

I Hausaufgabe (leicht):N-Damen-Problem

I Hausaufgabe (schwer): R ¨osselsprung (=Hamiltonkreis)

I vonnVariablen sind genauk wahr (bei Formelgr ¨oße

∼n·k)

I Puzzles ausLogisch(Dt. R ¨atselverlag)

I Puzzles vonhttp://www.janko.at/

Vorgehen bei Modellierung:

I welches sind die Variablen, was ist deren Bedeutung?

(Wie rekonstruiert man eine L ¨osung aus der Belegung, die der Solver liefert?)

I welches sind die Constraints?

wie stellt man sie in CNF dar?

(21)

SAT-Kodierungen

Weil SAT NP-vollst ändig ist ( Ü: Definition) kann man jedes Problem aus NP nach SAT übersetzen,

d.h. in Polynomialzeit eine Formel konstruieren, die genau dann erf üllbar ist, wenn das Problem eine L ösung hat — und man kann aus der erf üllenden Belegung eine L ösung rekonstruieren.

Beispiele:

I Independent Set (Schach:n-Damen-Problem)

I Vertex Cover (Varianten-Damen-Problem)

I Hamiltonkreis (Schach: R ¨osselsprung)

(22)

SAT-Kodierung: Independent Set

Def: GraphG= (V,E), MengeM ⊆V heißt unabh ¨angig, falls

∀x,y ∈M :xy ∈/ E.

Entscheidungsproblem:

I Eingabe:(G,k)

I Frage: existiert unabh ¨angige MengeM inGmit|M| ≥k?

Optimierungsproblem:

I Eingabe:G

I Ausgabe: m ¨oglichst große unabh ¨angige Menge inG Ist das Optimierungsproblem schwieriger (aufwendiger) als das Entscheidungsproblem? (Hier: nein.)

(23)

SAT-Kodierung: Anzahl-Constraints

count_≥k(p₁, . . . ,p_n) =wenigstensk dernVariablen sind wahr.

I Fallunterscheidung nach der ersten Variable:

count_≥k₊₁(p₁,p₂, . . . ,p_n)

=p₁∧count_≥k(p₂, . . . ,p_n)∨count_≥k+1(p₂, . . . ,p_n).

I Induktionsanf ¨ange?

I Implementierung mit Hilfsvariablen f ¨ur jeden Teilausdruck (entspricht Tseitin-Transformation), insgesamtk·nviele.

( ¨Ubung: definiere count_=k,count_≤k)

Anwendung: gr ¨oßte unabh. Menge von Springern?

(24)

SAT-Kodierung: Vertex Cover

I Def: GraphG= (V,E),

MengeM⊆V heißt Knoten ¨uberdeckung, falls∀x ∈V \M:∃y ∈M :xy ∈E.

I Entscheidungsproblem:(G,k), Frage: . . .|M| ≤k

I ”Anwendung“: kleinstes Vertex Cover von Damen auf Schachbrett

I Anwendung: Plazierung von Versorgungs- oder Uberwachungsknoten in einem Netzwerk¨

(25)

SAT-Kodierung: Hamiltonkreis

I Def: GraphG= (V,E)mitV ={v₁, . . . ,v_n}, Permutationπ :{1, . . . ,n} → {1, . . . ,n}bestimmt Hamiltonkreis, wenn und

v_π(1)v_π(2)∈E, . . . ,v_π(n−1)v_π(n)∈E,v_π(n)v_π(1) ∈E.

I SAT-Kodierung: benutzt Variablenp(i,j)↔π(i) =j.

Welche Constraints sind daf ¨ur n ¨otig?

I Anwendung: R ¨osselsprung auf Schachbrett

(26)

SAT-Kodierung: F ¨arbung von Graphen

I Knotenf ¨arbung

Ubung: Definiere¨ chromatische Zahlχ(G)

Ubung: welche Aussage kann man (mit polynomiellem¨ Aufwand in|G|undc) SAT-kodieren, welche nicht:

χ(G)≤c, χ(G)≥c

I Kantenf ¨arbung (Ramsey-Probleme)

Def:R(s₁, . . . ,sc) :=min{n|jede Kanten-c-F ¨arbung des K_nenth ¨alt einenK_s₁ der Farbe 1 oder . . . oder einenK_s_c der Farbec }.

U: beweise mittels SAT-Kodierung:¨ R(4,4)≥18, R(3,3,3)≥17 (und Gleichheit durch Nachdenken)

(27)

Suche nach symmetrischen L ¨osungen

falls ein Problem zu groß f ¨ur den Solver ist:

I weitere Constraints hinzuf ¨ugen . . .

I die effektiv die Anzahl der Variablen verkleinern.

I d. h.: nur nach symmetrischen L ¨osungen suchen.

Def (allgemein):f ist Symmetrie vonM, fallsf(M)∼M.

Beispiel: rotationssymmetrische Aufstellungen von Figuren auf Schachbrett (Vertex Cover, Hamiltonkreis).

(28)

Neue Schranke f ¨ur Van der Waerdens Funktion

W(r,k) =die gr ößte Zahln, f ür die es einer-F ärbung von [1,2, . . . ,n]gibt ohne einfarbige arithmetische Folge.

Satz ( ¨uberhaupt nicht trivial): alle diese Zahlen sind endlich.

Einige Schranken erst vor kurzer Zeit verbessert, durch

SAT-Kodierung, siehe Heule, M. J. H:Improving the Odds: New Lower Bounds for Van der Waerden Numbers.March 4, 2008.

http:

//www.st.ewi.tudelft.nl/sat/slides/waerden.pdf

(29)

Uberblick ¨

Softwarepaketsatchmo(SAT encoding monad) https://github.com/jwaldmann/satchmo

I kapselt zugrundeliegenden Solver (minisat)

I (monadische) Verwaltung von Variablen (State), Klauseln (Writer) und Belegungen (Reader)

I boolesche Unbekannte, Kombinatoren

I Relationen, Graphen

I Zahlen (un ¨ar, bin ¨ar), Polynome

vergleichbar:http://rise4fun.com/Z3Py ( ¨Ubung: Unterschiede?)

(30)

Technische Grundlagen

I Datentypen f ¨ur Literal, Klausel, Formel

I Solver als externer Prozeß:

I Renderer f ¨ur Dimacs-Format

I Aufruf eines externen Solvers (minisat)

I Parser f ¨ur Ausgabe des Solvers

I oderSolver ¨uber API:

I Klauseln in RAM schreiben

I Solver aufrufen

I Belegung aus RAM auslesen

(31)

Automatische Hilfsvariablen

im Quelltext: Haskell-Namen (x), f ¨ur Solver: Nummern (1) import Satchmo.Boolean

import Satchmo.Solve test :: IO ( Maybe Bool ) test = solve $ do

x <- boolean -- Allokation einer Variablen assert [ not x ]

return $ decode x Realisierung:

I boolean :: SAT Boolean(ist Aktion)

I automatisches Weiterz ¨ahlen (StateMonad f ¨ur Nummer)

I WriterMonad f ¨ur CNF (Klauseln)

I ReaderMonad f ¨ur Resultat (Belegung)

(32)

Realisierung logischer Funktionen

and :: [ Boolean ] -> SAT Boolean and xs = do

y <- boolean -- Hilfsvariable lt. Tseitin forM xs $ \ x -> do

assert [ not y, x ] assert $ y : map not xs return y

Ubung:¨

I Typ vonforM(benutze:i forMinghcioder http://haskell.org/hoogle/)

I or

I xor(Anzahl derTrueist ungerade)

(33)

Dekodierung mit Typklassen

I Typklasse Decode

I feste Instanz (Satchmo.Boolean→Prelude.Bool)

I generische Instanzen (Paare, Listen, Arrays, Maps) (vereinfachte Darstellung)

type Decoder a = Reader (Map Literal Bool) a class Decode c a where

decode :: c -> Decoder a

instance Decode Boolean Bool where

decode x = ... -- benutzt Minisat-API instance (Decode c a) => Decode [c] [a] where

decode xs = forM xs decode

(34)

Relationen

relation :: ( Ix a, Ix b )

=> ((a,b),(a,b)) -> SAT ( Relation a b ) instance (Ix a, Ix b) =>

Decode ( Relation a b ) ( Array (a,b) Bool ) product :: ..=> Relation a b -> Relation b c

-> SAT ( Relation a c )

implies :: ..=> Relation a b -> Relation a b -> SAT Boolean

Anwendungen:

transitive r = do

r2 <- product r r ; implies r2 r Ubung: eine schwach zusammenh ¨angende Relation;¨ eine s.z. Halbordnung, die keine totale Ordnung ist.

(35)

SAT-Solver in Paketmanagern

I installierte Pakete:A.2,. . .

I zu installierende Pakete:B, . . .

I verf ¨ugbare Pakete (auf Server):B.3,B.4,. . .

I Abh ¨angigkeiten:B.3 erfordertC(≥1.5),. . .

I Konflikte:C.1.5#A(<2.1),. . . gesucht: konfliktfreier Install-Plan

I Michael Schr ¨oder:Using SAT for Package Dependencies, FOSDEM 2008

http://en.opensuse.org/openSUSE:

Libzypp_satsolver

I Mancoosi (managing software complexity) http://www.mancoosi.org/(2008-2011)

(36)

Pentomino

Es gibt 12Pentominos: zusammenh ¨angende Figuren aus je 5 Einheitsquadraten.

(Henry Ernest Dudeny, 1907; Solomon W. Golomb, 197*)

I Kann man damit ein Schachbrett ohne das 2×2-Mittelquadrat ¨uberdecken?

(und viele ¨ahnliche Fragen dieser Art.) L ¨osung durch SAT-Modellierung.

Variablen? Constraints?

(37)

Schwierige F ¨alle f ¨ur die SAT-Kodierung

I wenn das Problem nicht in NP ist, dann hat es keine polynomiell große Kodierung.

I wahrscheinliche Beispiele: Suchprobleme mit

(exponentiell) tiefen B ¨aumen, z. B. Verschiebepuzzles (Rushhour, Atomix, Lunar Lockout (?))

I Markus Holzer, Stefan Schwoon:Assembling Molecules in Atomix in Hard, TCS 2003,http://dblp.uni-trier.

de/rec/bibtex/journals/tcs/HolzerS04

I PSPACE-hardness ist offen f ¨ur Lunar Lockout

(38)

Uberblick ¨

Spezifikation:

I Eingabe: eine Formel in CNF

I Ausgabe:

I eine erf ¨ullende Belegung

I oderein Beweis f ¨ur Nichterf ¨ullbarkeit Verfahren:

I evolution ¨ar (Genotyp=Belegung)

I lokale Suche (Walksat)

I DPLL (Davis, Putnam, Logeman, Loveland)

(39)

Evolution ¨are Algorithmen f ¨ur SAT

I Genotyp: Bitfolge[x₁, . . . ,xn]fester L ¨ange

I Ph ¨anotyp: Belegungb={(v₁,x₁), . . . ,(vn,xn)}

I Fitness: z. B. Anzahl der vonberf ¨ullten Klauseln

I Operatoren:

I Mutation: einige Bits ¨andern

I Kreuzung: one/two-point crossover?

Problem: starke Abh ¨angigkeit von Variablenreihenfolge

(40)

Lokale Suche (GSat, Walksat)

Bart Selman, Cornell University, Henry Kautz, University of Washington

http://www.cs.rochester.edu/u/kautz/walksat/

Algorithmus:

I beginne mit zuf ¨alliger Belegung

I wiederhole: ändere das Bit, das die Fitness am st ärksten erh öht

Problem: lokale Optima — L ¨osung: Mutationen.

(41)

DPLL

Davis, Putnam (1960), Logeman, Loveland (1962) Zustand=partielle Belegung

I Decide: eine Variable belegen

I Propagate: alle Schlußfolgerungen ziehen

Beispiel: Klauselx1∨x3, partielle Belegungx1=0, Folgerung:x₃=1

I beiKonflikt(widerspr ¨uchliche Folgerungen)

I Backtrack (zu letztem Decide)

I Backjump (zu fr ¨uherem Decide)

(42)

DPLL: Heuristiken, Modifikationen

I Wahl der n ¨achsten Entscheidungsvariablen (am h ¨aufigsten in aktuellen Konflikten)

I Lernen von Konflikt-Klauseln (erlaubt Backjump)

I Vorverarbeitung (Variablen und Klauseln eliminieren) alles vorbildlich implementiert und dokumentiert in Minisat http://minisat.se/(seit ca. 2005 sehr starker Solver)

(43)

Beweise f ¨ur Nichterf ¨ullbarkeit

I bisher: Interesse an erf ¨ullender Belegungm∈Mod(F)(=

L ¨osung einer Anwendungsaufgabe)

I jetzt: Interesse an Mod(F) =∅.

Anwendungen: SchaltkreisC erf ¨ullt SpezifikationS ⇐⇒

Mod(C(x)6=S(x)) =∅.

Solver rechnet lange, evtl. Hardwarefehler usw.

I m∈Mod(F)kann man leicht pr ¨ufen (unabh ¨angig von der Herleitung)

I wie pr ¨uft man Mod(F) =∅?

(wie sieht einZertifikatdaf ¨ur aus?)

(44)

Resolution

I ein Resolutions-Schritt:

(x₁∨. . .∨x_m∨y),(¬y∨z₁∨. . .∨z_n) x₁∨. . .∨x_m∨z₁∨. . .∨z_n

I Sprechweise: KlauselCentsteht, indem KlauselnC₁,C₂ nach nach der gemeinsamen Variableny resolviert werden,

I Schreibweise:C =C₁⊕_yC₂

I Satz:{C₁,C₂} |=C₁⊕_y C₂.

(45)

Resolution und Unerf ¨ullbarkeit

Satz:F in CNF nicht erf ¨ullbar ⇐⇒ es gibt eine Resolutions-Ableitungder leeren Klausel.

Beweis:

I Korrektheit (⇐): ¨Ubung.

I Vollst ¨andigkeit (⇒): Induktion nach|Var(F)|

dabei Induktionsschritt:

I betrachteF mit Variablen{x₁, . . . ,x_n+1}.

I KonstruiereF₀(bzw.F₁) ausF durch

”Belegen vonx_n+1mit 0 (bzw. 1) “ (d. h. Streichen von Literalen und Klauseln)

I Zeige, daßF₀undF₁unerf ¨ullbar sind.

I wende Induktionsannahme an.

(46)

Resolution, Bemerkungen

I es gibt nicht erf ¨ullbareF mit (exponentiell) großen

Resolutionsbeweisen (sonst w ¨are NP=co-NP, das glaubt niemand)

I vollst ¨andige Resolution einer Variableny als Preprocessing-Schritt

I Unit Propagation kann man als Resolution auffassen

I moderne SAT-Solver k önnen Resolutions-Beweise f ür Unerf üllbarkeit ausgeben

I komprimiertes Format f ¨ur solche Beweise (RUP—reverse unit propagation) wird bei “certified unsat track” der SAT-competitions verwendet (evtl. ¨Ubung)

(47)

DPLL: Lernen von Konfliktklauseln

bei jedem Konflikt:

I (minimale) Ursache (d. h. partielle Belegung) feststellen

I Implementierung: (partieller) Implikationsgraph

I Knoten: Literal mit decision-level

I Kanten: Unit-Progagation-Schritte

I Negation der Konfliktursache als neue Klausel hinzuf ¨ugen conflict-driven backtracking:

I Backjump zum zweit-tiefsten decision level der gelernten Konfliktklausel

(48)

Vorverarbeitung

Niklas E ´en, Armin Biere:Effective Preprocessing in SAT Through Variable and Clause Elimination.SAT 2005: 61-75 http://dx.doi.org/10.1007/11499107_5

http://minisat.se/downloads/SatELite.pdf

I clause distribution:

Elimination einer Variableny durch vollst ¨andige Resolution (Fourier-Motzkin-Verfahren):

jede KlauselC3y resolvieren gegen jede KlauselC⁰ 3y, Originale l ¨oschen

I self-subsumption resolution (evtl. ¨Ubung)

Implementierung muß Subsumption von Klauseln sehr schnell feststellen (wennC₁⊆C₂, kannC₂entfernt werden)

(49)

Reverse Unit Propagation

E.Goldberg, Y.Novikov.Verification of proofs of unsatisfiability for CNF formulas.Design, Automation and Test in Europe.

2003, March 3-7,pp.886-891http:

//eigold.tripod.com/papers/proof_verif.pdf

(50)

Motivation

gesucht ist eine Datenstruktur, die eine aussagenlogische Formelkanonischrepr ¨asentiert und f ¨ur die aussagenlog.

Operationeneffizientausf ¨uhrbar sind.

Ans ¨atze:

I FormelF selbst?

I Modellmenge Mod(F)als Menge von Belegungen?

L ¨osung: bessere Darstellung f ¨ur Mod(F)

Literatur: Kroening, Strichman: Decision Procedures, 2.4.

(51)

Darstellung von Modellmengen

Ordnung auf Variablen festlegen:x₁<x₂< . . . <x_n und dann bin ¨arer Entscheidungsbaum:

I Bl ¨atter: 0, 1

repr ¨asentiert leere (bzw. volle) Modellmenge∅bzw.{∅}

I innere Knotent

I Variablev

I Kinder (B ¨aume)l,r

alle Variablen inl undr sind gr ¨oßer alsv repr ¨asentiert Modellmenge

[t] ={{(v,0)} ∪b|b ∈[l]} ∪ {{(v,1)} ∪b|b∈[r]}

F ¨ur jede FormelF existiert BaumB mit[B] =Mod(F).

(52)

Entscheidungsb ¨aume mit Sharing

ausgehend von eben definiertem Baum: konstruiere DAG (gerichteten kreisfreien Graphen):

I Bl ¨atter zusammenfassen: nur zwei Bl ¨atter 0,1

I alle Knoten mit gleichem(v,l,r)zusammenfassen

I alle Knoten mit(v,l,r)undl=r durchl ersetzen reduziertes geordnetes bin ¨ares Entscheidungsdiagramm (ROBDD)

Randal E. Bryant.Graph-Based Algorithms for Boolean Function Manipulation. IEEE Transactions on Computers, C-35(8):677-691, 1986

(53)

Eigenschaften von ROBDDs

I kanonisch

I Erf ¨ullbarkeit, Allgemeing ¨ultigkeit trivial

I Operationen? (folgende Folien)

I Gr ¨oße ist abh ¨angig von Variablenreihenfolge (Beispiel)

I es gibt Formeln, f ¨ur die jede Variablenreihenfolge ein exponentiell großes ROBDD liefert (Beispiel)

(54)

Operationen mit ROBDDs

bin ¨are boolesche Operationf:

I auf Bl ¨attern 0,1 Wert ausrechnen

I auf Knoten mit gleichen Variablen: gemeins.

Fallunterscheidung

I auf Knoten mit versch. Variablen: Fallunterscheidung in kleinerer Variablen

der Trick ist: dynamische Optimierung (d. h. von unten nach oben ausrechnen und Ergebnisse merken).

ergibt Laufzeit f ¨urf(s,t)vonO(|s| · |t|).

⇒worst-case-Laufzeit f ¨ur Konstruktion eines ROBDD zu einer Formel: exponentiell

(55)

OBDD-Anwendung: Modelle z ¨ahlen

typische Anwendung von OBDD . . .

I nichtErf ¨ullbarkeit (, denn . . . )

I sondern das Z ¨ahlen von Modellen:

|Mod(0)|=0,|Mod(1)|=1,

diese Zahlen bottom-up dranschreiben: Linearzeit dabei beachten, daß bei der Konstruktion evtl. Variablen verschwunden sind

(56)

ROBBD-Implementierungen

import qualified Prelude ; import OBDD import qualified Data.Set as S

let t = or [ unit "x" Prelude.True , unit "y" Prelude.False ] number_of_models (S.fromList ["x", "y"]) t http://hackage.haskell.org/package/obdd-0.2

I Namen der Prelude-Funktionen f ¨urBoolwerden verwendet f ¨urOBDD v

I viele denkbare Verbesserungen, z. B. Cache f ¨ur alle Teilformeln und Teil-DAGs

(57)

Plan

(f ¨ur den Rest der Vorlesung)

I Pr ¨adikatenlogik (Syntax, Semantik)

I konjunktive Constraints in verschiedenen Bereichen z. B. Terme, Gleichungen und Ungleichungen auf Zahlen (ganze, rationale, reelle).

I beliebige Boolesche Verkn ¨upfungen SAT moduloT (=SMT), DPLL(T)

I Bit-blasting (SMT→SAT)

(58)

Syntax der Pr ¨adikatenlogik

I Signatur

I Relations-

I Pr ¨adikatsymbole

I Term (Funktionssymbolen mit Argumenten)

I Formel

I Relationssymbol mit Argumenten,

I Boolesche Verkn ¨upfungen davon

I Quantoren

gebundenes und freies Vorkommen von Variablen

(59)

Semantik der Pr ¨adikatenlogik

I Universum, Funktion, Relation,

I Struktur, die zu einer Signatur paßt

I Belegung, Interpretation

I Wert

I eines Terms

I einer Formel

in einer Struktur, unter einer Belegung die Modell-Relation(S,b)|=F

Erf ¨ullbarkeit, Allgemeing ¨ultigkeit (Def, Bsp)

(60)

Unentscheidbarkeit

(Alonzo Church 1938, Alan Turing 1937) Das folgende Problem ist nicht entscheidbar:

I Eingabe: eine PL-FormelF

I Ausgabe:Ja, gdw.F allgemeing ¨ultig ist.

Beweis: man kodiert das Halteproblem f ¨ur ein universelles Berechnungsmodell als eine logische Formel.

F ¨ur Turingmaschinen braucht man daf ¨ur

”nur“eine zweistellige Funktion

f(i,t) =der Inhalt von Zelleizur Zeitt.

Beachte: durch diese mathematische Fragestellung (von David Hilbert, 1928) wurde die Wissenschaft der Informatik

begr ¨undet.

(61)

Folgerungen aus Unentscheidbarkeit

I Einschr ¨ankung des Universums

( ¨aquivalent: Erweiterung jeder Formel um Axiome, die das gew ¨unschte Universum festlegen)

I Einschr ¨ankung der Formelsyntax

I nur bestimmte Quantoren, nur an bestimmten Stellen (im einfachsten Fall: gar keine)

I nur bestimmte Verkn ¨upfungen

(Negation nur f ¨ur atomare Formeln, Verkn ¨upfung nur durch

∧)

(62)

Einf ¨uhrung

I Signatur:

I Funktionssymbole beliebig

I Relationssymbol nur=

I Universum: Terme (d.h. Leibniz-Axiom f ¨ur=)

I Formel: Konjunktion von Gleichungen (zwischen Termen mit Variablen)

Anwendungen: Verarbeitung symbolischer Ausdr ¨ucke

I logische Programmierung (Prolog)

I Typpr ¨ufung, Typinferenz (f ¨ur polymorphe Funktionen)

(63)

Unifikation—Begriffe

I SignaturΣ = Σ₀∪. . .Σ_k,

I Term(Σ,V)ist kleinste MengeT mitV ⊆T und

∀0≤i ≤k,f ∈Σi,t₁∈T, . . . ,t_i ∈T :f(t₁, . . . ,t_i)∈T.

I Substitution: partielle Abbildungσ :V →Term(Σ,V), so daß keinv ∈domσin imgσ vorkommt,

I Substitutionσ auf Termt anwenden:tσ

I Produkt von Substitutionen: so definiert, daß t(σ₁◦σ2) = (tσ₁)σ2

(64)

Unifikation—Definition

Unifikationsproblem

I Eingabe: Termet₁,t₂∈Term(Σ,V)

I Ausgabe: eine allgemeinster Unifikator (mgu): Substitution σ mitt₁σ =t₂σ.

allgemeinst=minimal bzgl. der Pr ¨a-Ordnung σ1≤σ2 ⇐⇒ ∃τ :σ1◦τ =σ2

Satz: jedes Unifikationsproblem ist entweder gar nicht oder bis auf Umbenennung eindeutig l ¨osbar

(65)

Unifikation—Algorithmus

mgu(s,t)nach Fallunterscheidung

I sist Variable: . . .

I t ist Variable: symmetrisch

I s=f(s₁,s₂)undt =g(t₁,t₂): . . . Bemerkungen:

I korrekt, ¨ubersichtlich, aber nicht effizient,

I es gibt Unif.-Probl. mit exponentiell großer L ¨osung,

I eine komprimierte Darstellung davon kann man aber in Polynomialzeit ausrechnen.

(66)

Ubung zur Pr ¨adikaten-Logik ¨

I Die folgende FormelE ist erf ¨ullbar.

(∀x :P(x,f(x)))∧(∀y :¬P(y,y))

∧(∀u:∀v :∀w : ((P(u,v)∧P(v,w))→P(u,w)) Bestimmen Sie ein Modell mit m ¨oglichst kleinem Universum.

I Geben Sie eine (kleine) erf ¨ullbare FormelF an, so daß jedes Modell vonF wenigstens 5 Elemente enth ¨alt.

I Beweisen Sie: Erf ¨ullbarkeit ist bereits f ¨ur Formeln ohne Funktionssymbole unentscheidbar.

Geben Sie dazu ein Verfahren an, das aus einer beliebigen FormelF eine FormelG ohne Funktionssymboleerzeugt, so daß gilt:F besitzt Modell ⇐⇒ Gbesitzt Modell.

Hinweis: zus ¨atzliche Relationssymbole.

Wenden Sie das Verfahren auf die o.g. FormelE (und das von Ihnen gefundene Modell) an.

I Beweisen Sie, daß Erf üllbarkeit und Allgemeing ültigkeit entscheidbar sind f ür Formeln,

I die nur nullstellige Rel.-Symbole und keine Fkt.-Symbole enthalten,

I die nur einstellige Rel.-Symbole und keine Fkt.-Symbole enthalten.

Hinweis: es gen ¨ugt, endliche Modelle bis zu einer gewissen Gr ¨oße zu betrachten.

(vgl. Uwe Sch ¨oning: Logik f ¨ur Informatiker, Spektrum)

(67)

Ubung zu Termgleichungen ¨

I sind die Substitutionenσ1={X 7→Y}undσ2={Y 7→X} vergleichbar bzgl.≤?

I ≤auf Substitutionen ist keine Halbordnung.

Die durch≤definierte ¨Aquivalenzrelation ist . . .

I vervollst ¨andigen Sie den Unifikationsalgorithmus,

vergleichen Sie mithttp://dfa.imn.htwk-leipzig.

de/cgi-bin/gitweb.cgi?p=ws11-cb.git;a=blob;

f=kw56/Type/Constraint.hs;hb=master

I wenden Sie den Algorithmus an zur L ¨osung von

f(X₁,f(X₂,f(X₃,a))) =f(f(X₂,X₂),f(f(X₃,X₃),f(a,a)))

(68)

Syntax, Semantik

I lin. (Un-)Gleichungssystem→(Constraint∧)^∗Constraint

I Constraint→Ausdruck Relsym Ausdruck

I Relsym→ = | ≤ | ≥

I Ausdruck→(Zahl·Unbekannte+)^∗ Zahl

Beispiel: 4y ≤x∧4x ≤y −3∧x +y ≥1∧x−y ≥2

Semantik: Wertebereich f ¨ur Unbekannte (und Ausdr ¨ucke) istQ oderZ

(69)

Normalformen

I Beispiel:

4y ≤x∧4x ≤y−3∧x+y ≥1∧x −y ≥2

I Normalform:V

i

P

ja_i,jx_j ≥b_i

x −4y ≥ 0 . . .

I Matrixform:Ax^T ≥b^T Aist linearer Operator.

L ¨osung von linearen (Un-)Gl.-Sys. mit Methoden der linearen Algebra

(70)

Hintergr ¨unde

Warum funktioniert das alles?

I lineares Gleichungssystem:

L ¨osungsmenge ist (verschobener)Unterraum, endliche Dimension

I lineares Ungleichungssystem:

L ösungsmenge istSimplex(Durchschnitt von Halbr äumen, konvex), endlich viele Seitenfl ächen

Wann funktioniert es nicht mehr?

I nicht linear: keine Ebenen

I nicht rational, sondern ganzzahlig: L ¨ucken

(71)

Lineare Gleichungssysteme

L ¨osung nach Gauß-Verfahren:

I eine Gleichung nach einer Variablen umstellen,

I diese Variable aus den anderen Gleichungen eliminieren (=Dimension des L ¨osungsraumes verkleinern)

vgl. mit Elimination einer Variablen im Unifikations-Algorithmus

(72)

Lineare Ungleichungen und Optimierung

Entscheidungsproblem:

I Eingabe: Constraintsystem,

I gesucht: eine erf ¨ullende Belegung Optimierungsproblem:

I Eingabe: Constraintsystem undZielfunktion(linearer Ausdruck in Unbekannten)

I gesucht: eine optimale erf üllende Belegung (d. h. mit gr ößtm öglichem Wert der Zielfunktion)

Standard-Form des Opt.-Problems:

A·x^T =b,x^T ≥0, minimierec·x^T.

U: reduziere OP auf Standard-OP, reduziere EP auf OP¨

(73)

L ¨osungsverfahren f ¨ur lin. Ungl.-Sys.

I Simplex-Verfahren (f ¨ur OP)

Schritte wie bei Gauß-Verfahren f ¨ur Gleichungssysteme (=

entlang einer Randfl ¨ache des Simplex zu einer besseren L ¨osung laufen)

Einzelheiten siehe Vorlesung Numerik/Optimierung exponentielle Laufzeit im schlechtesten Fall (selten)

I Ellipsoid-Verfahren (f ¨ur OP): polynomiell

I Fourier-Motzkin-Verfahren (f ¨ur EP)

vgl. mit Elimination durch vollst ¨andige Resolution exponentielle Laufzeit (h ¨aufig)

(74)

Fourier-Motzkin-Verfahren

Def.: eine Ungls. ist inx-Normalform, wenn jede Ungl.

I die Form

”x (≤ | ≥) (Ausdruck ohnex)“ hat

I oderx nicht enth ¨alt.

Satz: jedes Ungls. besitzt ¨aquivalentex-Normalform.

Def: f ¨ur Ungls.U inx-Normalform:

U_x^↓:={A|(x ≥A)∈U}, U_x^↑ :={B|(x ≤B)∈U}, U_x⁻={C |C∈U,Centh ¨altx nicht}.

Def: (x-Eliminations-Schritt) f ¨urUinx-Normalform:

U→_x {A≤B|A∈U_x^↓,B ∈U_x^↑} ∪U_x⁻

Satz: (Uerf ¨ullbar undU→_x V) ⇐⇒ (V erf ¨ullbar).

FM-Verfahren: Variablen nacheinander eliminieren.

(75)

(Mixed) Integer Programming

I “linear program”: lineares Ungleichungssystem mit Unbekannten ausQ

I “integer program”: lineares Ungleichungssystem, mit Unbekannten ausZ

I “mixed integer program”: lineares Ungleichungssystem, mit Unbekannten ausQundZ

LP ist in P (Ellipsoid-Verfahren), aber IP ist NP-vollst ¨andig:

I SAT≤_P IP,

I jedes IP besitzt obere Schranke f ür Gr öße einer L ösung;

deswegen gibt es keinen effizienten Algorithmus (falls P6=NP)

(76)

SAT als IP

gesucht ist FunktionT :CNF→IP mit

I T ist in Polynomialzeit berechenbar

I ∀F ∈CNF:F erf üllbar ⇐⇒ T(F)l ösbar L ösungsidee:

I Variablen vonT(F) =Variablen vonF

I Wertebereich der Variablen ist{0,1}

I Negation durch Subtraktion, Oder durch Addition, Wahrheit durch≥1

(77)

Travelling Salesman als MIP

(dieses Bsp. aus Papadimitriou und Steiglitz:

Combinatorial Optimization, Prentice Hall 1982) Travelling Salesman:

I Instanz: Gewichtew:{1, . . . ,n}²→R≥0∪ {+∞}und Schrankes ∈R≥0

I L ¨osung: Rundreise mit Gesamtkosten≤s Ansatz zur Modellierung:

I Variablenx_i,j ∈ {0,1}, Bedeutung:x_i,j =1 ⇐⇒ Kante (i,j)kommt in Rundreise vor

I Zielfunktion?

I Constraints — reicht das:P

ix_i,j =1,P

jx_i,j =1 ?

(78)

Travelling Salesman als MIP (II)

Miller, Tucker, Zemlin:Integer Programming Formulation and Travelling Salesman ProblemJACM 7(1960) 326–329

I zus ¨atzliche Variablenu₁, . . . ,un∈R

I ConstraintsC: ∀1≤i 6=j ≤n:u_i−u_j+nx_i,j ≤n−1 Ubung: beweise¨

I f ¨ur jede Rundreise gibt es eine Belegung deru_i, dieC erf ¨ullt.

I aus jeder L ¨osung vonCkann man eine Rundreise rekonstruieren.

Was ist die anschauliche Bedeutung deru_i?

(79)

min und max als MIP

I kann man den Max-Operator durch lin. Ungln simulieren?

(gibt es ¨aq. Formulierung zu max(x,y) =z?)

I Ansatz:x ≤z∧y ≤z∧(x =z∨y =z), aber dasoderist verboten.

Idee zur Simulation vonA≤B∨C≤D:

I neue Variablef ∈ {0,1}

I ConstraintA≤B+. . .∧C≤D+. . .

I funktioniert aber nur . . .

(80)

Ubungen zu lin. Gl./Ungl. ¨

I lin. Gl. und Gauß-Verfahren in GF(2)

(=der K ¨orper mit Grundbereich{0,1}und Addition XOR und Multiplikation AND)

I lin. Ungl. mit CLP l ¨osen

https://projects.coin-or.org/Clp

I (mixed) integer programming mit CBC

http://www.coin-or.org/projects/Cbc.xml z. B. TSP, min/max-Probleme

(81)

Motivation, Definition

viele Scheduling-Probleme enthalten:

I T ¨atigkeiti dauertd_i Stunden

I i muß beendet sein, bevorj beginnt.

das f ¨uhrt zu Constraintsystem:

I Unbekannte:t_i =Beginn voni

I Constraints:t_j ≥t_i+d_i

STM-LIB-LogikQF_IDL, QF_RDL:

boolesche Kombination von

Unbekannte≥Unbekannte+Konstante

(82)

L ¨osung von Differenz-Constraints

I (sp ¨ater:) Boolesche Kombinationen werden durch DPLL(T) behandelt,

I (jetzt:) der Theorie-L ¨oser behandelt Konjunktionen von Differenz-Konstraints.

I deren L ¨osbarkeit ist in Polynomialzeit entscheidbar,

I Hilfsmittel: Graphentheorie (k ¨urzeste Wege), schon lange bekannt (Bellman 1958, Ford 1960),

(83)

Constraint-Graphen f ¨ur IDL

F ¨ur gegebenes IDL-SystemSkonstruiere gerichteten kantenbewerteten GraphenG

I Knoteni=Unbekanntet_i

I gewichtete Kantei →^d j, falls Constraintt_i+d ≥t_j beachte: Gewichted k ¨onnen negativ sein. (wenn nicht:

Problem ist trivial l ¨osbar)

Satz:S l ¨osbar ⇐⇒ Gbesitzt keinen gerichteten Kreis mit negativem Gewicht.

Implementierung: Information ¨uber Existenz eines solchen Kreises f ¨allt bei einem anderen Algorithmus mit ab.

(84)

K ¨urzeste Wege in Graphen

(single-source shortest paths)

I Eingabe:

I gerichteter GraphG= (V,E)

I Kantengewichtew :E→R

I Startknotens∈V

I Ausgabe: FunktionD:V →Rmit∀x ∈V :D(x) = minimales Gewicht eines Pfades vonsnachx

¨aquivalent: Eingabe ist Matrixw :V×V →R∪ {+∞}

bei (vonserreichbaren) negativen Kreisen gibt esx mit D(x) =−∞

(85)

L ¨osungsidee

iterativer Algorithmus mitZustand d:V →R∪ {+∞}.

d(s) :=0,∀x 6=s:d(x) := +∞

whilees gibt eine Kantei^w→^i,j j mitd(i) +w_i,j <d(j) d(j) :=d(i) +w_i,j

jederzeit gilt dieInvariante:

I ∀x ∈V: es gibt einen Weg vonsnachx mit Gewichtd(x)

I ∀x ∈V :D(x)≤d(x).

verbleibende Fragen:

I Korrektheit (falls Termination)

I Auswahl der Kante (aus mehreren Kandidaten)

I Termination, Laufzeit

(86)

Laufzeit

exponentiell viele Relaxations-Schritte:

s p q t

4 2 1

0 0 0

besser:

I Bellman-Ford (polynomiell)

fori from 1 to|V|: jede Kantee∈E einmal entspannen dann testen, ob alle Kanten entspannt sind.

(d. h.d(j)≥d(i) +w_i,j)

Wenn nein, dann existiert negativer Kreis. (Beweis?)

I Dijkstra (schneller, aber nur bei Gewichten≥0 korrekt)

(87)

Hilberts 10. Problem

Entscheidung der L ¨osbarkeit einer diophantischen Gleichung.

Eine diophantische Gleichung mit irgendwelchen Unbekannten und mit ganzen rationalen Zahlkoefficienten sei vorgelegt: man soll ein Verfahren angeben, nach welchem sich mittels einer endlichen Anzahl von Operationen entscheiden l ¨asst, ob die Gleichung in ganzen rationalen Zahlen l ¨osbar ist.

(Vortrag vor dem Intl. Mathematikerkongreß 1900, Paris) http://www.mathematik.uni-bielefeld.de/

˜kersten/hilbert/rede.html

(88)

Probleme als Motor und Indikator des Fortschritts in der Wissenschaft

I Solange ein Wissenszweig Ueberfluß an Problemen bietet, ist er lebenskr ¨aftig; Mangel an Problemen bedeutet

Absterben oder Aufh ¨oren der selbstst ¨andigen Entwickelung.

I . . . denn das Klare und leicht Faßliche zieht uns an, das Verwickelte schreckt uns ab.

I Ein mathematisches Problem sei ferner schwierig, damit es uns reizt, und dennoch nicht v ¨ollig unzug ¨anglich, damit es unserer Anstrengung nicht spotte . . .

Hilbert 1900. — (vgl. auchMillenium Problems http://www.claymath.org/millennium/)

(89)

Beispiele f. Polynomgleichungen

Einzelbeispiele:

I x²−3x +2=0

I (x−1)·(x−2) =0 Verkn ¨upfungen:

I Kodierung vonP =0∨Q=0∨R=0 durcheine Gleichung: . . .

I Kodierung vonP =0∧Q=0∧R=0 durcheine Gleichung: . . .

Teilbereiche:

I Kodierung vonx ∈R∧x ≥0

I Kodierung vonx ∈Z∧x ≥0

(90)

Geschichte

L ¨osbarkeit in reellen Zahlen: ist entscheidbar

I Polynom in einer Variablen: Descartes 1637, Fourier 1831, Sturm 1835, Sylvester 1853

I Polynom in mehreren Variablen:

I Tarski≈1930

I Collins 1975 (cylindrical algebraic decomposition) L ¨osbarbeit in ganzen Zahlen: ist nicht entscheidbar

I Fragestellung: Hilbert 1900

I Beweis: Davis, Robinson, Matiyasevich 1970

(91)

Polynomgleichungen ¨uber R

I jedes Polynom von ungeradem Grad besitzt wenigstens eine reelle Nullstelle (folgt aus Stetigkeit)

I . . . diese ist f ¨ur Grad>4 nicht immer durch

Wurzelausdr ¨ucke darstellbar (folgt aus Galois-Theorie) . . . trotzdem kann man reelle Nullstellenz ¨ahlen!

I Sturmsche Kette:p₀=P,p₁=P⁰,p_i+2=−rem(p_i,p_i+1)

I σ(P,x) :=Anzahl der Vorzeichenwechsel in [p₀(x),p₁(x), . . .]

I Satz:|{x |P(x) =0∧a<x ≤b}|=σ(P,a)−σ(P,b)

(92)

Quantoren-Elimination ¨uber R

I Sturmsche Ketten verallgemeinern f ¨ur Polynome in mehreren Variablen

I Variablen der Reihe nach entfernen

I Realisierung durch

I Tarski (1930): Laufzeit exp(exp(. . .(|V|). . .))

I Collins (1975): QEPCAD (cyclindrical algebraic decomposition)

Laufzeit exp(exp(|V|))

implementiert in modernen Computeralgebra-Systemen, vgl.http://www.singular.uni-kl.de/Manual/3-1-3/

sing_1815.htm

(93)

Polynomgleichungen ¨uber Z

Def: eine MengeM ⊆Z^k heißtdiophantisch, wenn ein PolynomPmit Koeffizienten inZexistiert, so daßM =

{(x₁, . . . ,x_i)| ∃x_i+1∈Z, . . . ,x_k ∈Z:P(x₁, . . . ,x_k) =0}

Beispiele:

I Menge der Quadratzahlen (leicht)

I Menge der nat ¨urlichen Zahlen (schwer)

I Menge der Zweierpotenzen (sehr schwer)

I Menge der Primzahlen?

Abschluß-Eigenschaften? (Durchschnitt, Vereinigung, . . . )

(94)

Diophantische Mengen

Satz (Davis, Matiyasevich, Putnam, Robinson;≈1970) M diophantisch ⇐⇒ Mist rekursiv aufz ¨ahlbar http://logic.pdmi.ras.ru/˜yumat/H10Pbook/

positive Werte dieses Polynoms=Menge der Primzahlen (k +2)(1–(wz+h+j–q)²–((gk+2g+k+1)(h+j) +h–z)²–(2n+ p+q+z–e)²–(16(k+1)³(k+2)(n+1)²+1–f²)²–(e³(e+2)(a+ 1)²+1–o²)²–((a²–1)y²+1–x²)²–(16r²y⁴(a²–1) +1–u²)²–(((a+ u²(u²–a))²–1)(n+4dy)²+1–(x+cu)²)²–(n+l+v–y)²–((a²–1)l²+ 1–m²)²–(ai+k+1–l–i)²–(p+l(a–n–1) +b(2an+

2a–n²–2n–2)–m)²–(q+y(a–p–1) +s(2ap+2a–p²–2p–2)–x)²–(z+ pl(a–p) +t(2ap–p²–1)–pm)²)

(challenge: . . . find some)http://primes.utm.edu/

glossary/xpage/MatijasevicPoly.html

(95)

Definition, Resultate

(nach Moj˙zesz Presburger, 1904–1943)

I Pr ¨adikatenlogik (d. h. alle Quantoren∀,∃, alle Booleschen Verkn ¨upfungen)

I Signatur: Fun.-Symbole 0,1,+, Rel.-Symbole=, <,≤

I interpretiert in der Struktur der nat ¨urlichen Zahlen Resultate:

I Presburger 1929: Allgemeing ¨ultigkeit und Erf ¨ullbarkeit solcher Formeln sind entscheidbar

I Fischer und Rabin 1974: Entscheidungsproblem hat Komplexit ¨at∈Ω(2²ⁿ) (untere Schranke! selten!)

(96)

Beispiele f. Presburger-Formeln

Beispiele:

I es gibt eine gerade Zahl:∃x :∃y :x =y +y

I jede Zahl ist gerade oder ungerade: . . . definierbare Funktionen und Relationen:

I Minimum, Maximum

I Differenz? Produkt?

I kleiner-als (<) nur mit Gleichheit (=)?

I 0, 1, 2, 4, 8, . . .x =2^k durch eine Formel der Gr ¨oßeO(k) kann man noch gr ¨oßere Zahlen durch kleine Formeln

definieren?

(97)

Entscheidungsverfahren (Ansatz)

Def.: MengeM⊂N^k heißtP-definierbar

⇐⇒ es gibt eine P-FormelF so daßM =Mod(F)

wobei Mod(F) :={m∈N^k | {x₁7→m₁, . . . ,x_k 7→m_k} |=F} f ¨urF mit freien Var.x₁, . . . ,x_k,

Satz: jede solche Modellmenge Mod(F)isteffektiv regul ¨ar:

I es gibt einen Algorithmus, der zu jeder P-FormelF . . .

I . . . einen endl. AutomatenAkonstruiert mit Lang(A) =Kodierung von Mod(F)

Folgerung: Allgemeing ¨ultigkeit ist entscheidbar:

Lang(A) =∅gdw. Mod(F) =∅gdw.F ist widerspr ¨uchlich gdw.

¬F ist allgemeing ¨ultig.

(98)

Entscheidungsverfahren (Kodierung)

Kodierung ist n ¨otig,

denn Mod(F)⊆N^k, aber Lang(A)⊆Σ^∗. w ¨ahlenΣ ={0,1}^k, benutze Ideen:

I Kodierung einer Zahl: bin ¨ar (LSB links) c(3) =11,c(13) =1011

I Kodierung eines Tupels: durch Stapeln c(3,13) = (1,1)(1,0)(0,1)(0,1) Beispiele: Automat oder reg. Ausdruck f ¨ur

I {c(x)|x ist gerade},{c(x)|x ist durch 3 teilbar},

I {c(x,y)|x+x =y},{c(x,y,z)|x+y =z},

I {c(x,y)|x ≤y},{c(x,y)|x <y}

(99)

Formeln und Modellmengen

Idee: logische Verkn ¨upfungen⇒passende Operationen auf (kodierten) Modellmengen

I Mod(False) =∅, Mod(¬F) =. . .

I Mod(F₁∧F₂) =Mod(F₁)∩Mod(F₂)

I Mod(∃x_i.F) =proj_i(Mod(F))

Projektion entlangi-ter Komponente:proj_i :N^k →N^k−1: (x₁, . . . ,x_k)7→(x₁, . . . ,x_i−1,x_x+1, . . . ,x_k)

zu zeigen ist, daß sich diese Operationen effektiv realisieren lassen (wobei Ein- und Ausgabe durch endl. Automaten dargestellt werden)

U: warum werden andere Verkn ¨upfungen nicht ben ¨otigt?¨

(100)

Automaten (Definition)

Def:A= (Σ,Q,I, δ,F)mit

I AlphabetΣ, ZustandsmengeQ,

I Initialzust ¨andeI ⊆Q, Finalzust ¨andeF ⊆Q,

I Ubergangsrelationen (f. Buchstaben)¨ δ: Σ→Q×Q.

daraus abgeleitet:

I Ubergangsrelation f. Wort¨ w =w1. . .wn∈Σ^∗: δ⁰(w) =δ(w₁)◦. . .◦δ(wn)

I Aakzeptiertw gdw.∃p∈I:∃q∈F :δ⁰(w)(p,q)

I Menge (Sprache) der akzeptierten W ¨orter:

Lang(A) ={w |Aakzeptiertw}={w |I◦δ⁰(w)◦F^T 6=∅}

(101)

Automaten (Operationen: Durchschnitt)

Eingabe:A₁= (Σ,Q₁,I₁, δ1,F₁),A₂= (Σ,Q₂,I₂, δ2,F₂), Ausgabe:Amit Lang(A) =Lang(A₁)∩Lang(A₂)

L ¨osung durch Kreuzprodukt-Konstruktion:A= (Σ,Q,I, δ,F)mit

I Q=Q₁×Q₂(daher der Name)

I I=I₁×I₂,F =F₁×F₂

I δ(c)((p₁,p₂),(q₁,q₂)) =. . . Korrektheit:

∀w ∈Σ^∗:w ∈Lang(A) ⇐⇒ w ∈Lang(A₁)∧w ∈Lang(A₂) Komplexit ¨at:|Q|=|Q₁| · |Q₂|(hier: Zeit=Platz)

(102)

Automaten (Operationen: Komplement)

Eingabe:A₁= (Σ,Q₁,I₁, δ1,F₁),

Ausgabe:Amit Lang(A) = Σ^∗\Lang(A₁)

L ¨osung durch Potenzmengen-Konstruktion:A= (Σ,Q,I, δ,F) mit

I Q=2^Q¹ (daher der Name)

I I={I₁},F =2^Q¹^\F¹

I δ(c)(M) =. . .

Korrektheit:∀w ∈Σ^∗ :w ∈Lang(A) ⇐⇒ w ∈/Lang(A₁) Komplexit ¨at:|Q|=2^|Q¹^|(hier: Zeit=Platz)

(103)

Automaten (Operationen: Projektion)

Eingabe: AutomatA₁= (Σ^k,Q₁,I₁, δ1,F₁), Zahli Ausgabe:Amit Lang(A) =Lang(proj_i(A₁)) L ¨osung:A= (Σ^k−1,Q,I, δ,F)mit

I Q=Q₁,I=I₁,F =F₁

I δ(c)(p,q) =. . .

Korrektheit:∀w ∈Σ^∗ :w ∈Lang(A) ⇐⇒ wLang(proj_i(A1)) Komplexit ¨at:|Q|=|Q₁|(hier: Zeit=Platz)

(104)

Zusammenfassung Entscheidbarkeit

durch Automaten-Operationen sind realisierbar:

I elementare Relationen (x+y =z)

I Quantoren und logische Verkn ¨upfungen Folgerungen

I zu jeder Presburger-FormelF kann ein AutomatA konstruiert werden mit Mod(F) =Lang(A).

I Allgemeing ültigkeit, Erf üllbarkeit, Widerspr üchlichkeit von Presburger-Formel ist entscheidbar.

die Komplexit ¨at des hier angegeben Entscheidungsverfahrens ist hoch, geht das besser?

(105)

Eine untere Schranke

Fischer und Rabin 1974:http://www.lcs.mit.edu/

publications/pubs/ps/MIT-LCS-TM-043.ps F ¨urjedesEntscheidungsverfahrenE

f ¨ur Presburger-Arithmetik existiert eine FormelF, so daßE(F)wenigstens 2²^|F^| Rechenschritte ben ¨otigt.

Beweis-Plan: Diagonalisierung (vgl. Halteproblem):

wende solch ein Entscheidungsverfahren

”auf sich selbst“ an.

Dazu ist Kodierung n ¨otig (Turing-Programm↔Zahl)

(106)

Untere Schranke

F ¨ur MaschineM und Eingabex sowie Funktionf :N→N(z. B.

n7→2²ⁿ) konstruiere FormelD(M,x)mit

I D(M,x) ⇐⇒ MaschineM h ¨alt bei Eingabex in≤f(|x|) Schritten.

I D(M,x)ist klein und kann schnell berechnet werden.

F ¨ur jedes EntscheidungsverfahrenE f ¨ur Presburger-Arithmetik:

I konstruiere ProgrammE₀(x):

ifE(¬D(x,x))then stop else Endlosschleife.

I Beweise: RechnungE₀(E₀)h ¨alt nach>f(|E₀|)Schritten.

bleibt zu zeigen, daß man solcheDkonstruieren kann.