Vorlesung Einf¨ uhrung
in die
Mathematische Optimierung (Wintersemester 2019/20)
Kapitel 2: Konvexe Mengen und Kegel
Volker Kaibel
Otto-von-Guericke Universit¨at Magdeburg
(Version vom 21. Dezember 2019)
Gliederung
Konvexe Mengen und Polyeder
Kegel
Polare Kegel
Polyedrische Kegel
Konvexe Mengen
Definition 2.1
Eine MengeX ⊆Rn heißt konvex, falls f¨ur allex,y∈X λx+ (1−λ)y ∈ X
f¨ur alle0≤λ≤1gilt.
konvex nicht konvex
◮ Eine Menge ist genau dann konvex, wenn sie mit je zwei Punkten auch deren Verbindungstrecke enth¨alt.
◮ Konvexe Mengen sind (weg-)zusammenh¨angend.
Konvexe Funktionen auf konvexen Mengen
Definition 2.2
SeiX ⊆Rn konvex. Eine Funktionf :X →Rheißt konvex/konkav, wenn f¨ur allex,y ∈X und0≤λ≤1
f(λx+ (1−λ)y) ≤ / ≥ λf(x) + (1−λ)f(y) gilt.
Bemerkung 2.3
Nimmt eine konvexe/konkave Funktion auf einer konvexen Menge in einem Punkt ein lokales Minimum/Maximum an, so nimmt sie dort auch ihr globales Minimum/Maximum an.
(Beweis wie Beweis von Bem. 1.8.)
Niveaumengen
Beobachtung 2.4
Istf :Rn→Rkonvex, so ist f¨ur jedes α∈Rdie Menge {x ∈Rn : f(x)≤α}
konvex.
Ellipsoide
Bemerkung 2.5
F¨ur eine positiv definite symmetrische MatrixQ ∈Rn×n und z ∈Rn ist das vonQ definierteEllipsoid
Ell(z,Q) :={x∈Rn|(x−z)TQ−1(x−z)≤1} mit Zentrumz konvex (und kompakt).
Ellipsoide und B¨alle
◮ Das einfachste Ellipoid ist der Ball
B(z,#) := Ell(#2In,z) ={x∈Rn| ||x−z||≤#} vom Radius#>0um z ∈Rn.
◮ Spalten vonC ∈Rn×n: Mit Quadratwurzeln der Eigenwerte skalierte Orthonormalbasis aus Eigenvektoren von Q
◮ Dann ist Ell(Q,z) =C ·B(On,1) +z (Spalten von C: Halbachsen von Ell(Q,z)).
Schnitte konvexer Mengen
Beobachtung 2.6
IstI eine Indexmenge (beliebiger Kardinalit¨at), und sindXi ⊆Rn konvexe Mengen (i ∈I), so ist auch ihre Schnittmenge
!
i∈I
Xi
konvex.
Konvexe H¨ullen
Definition 2.7 F¨urX ⊆Rn heißt
convX :=∩{X′ ⊆Rn|X ⊆X′,X′ konvex}
diekonvexe H¨ullevon X.
◮ Lineare H¨ulle:
linX :=∩{L⊆Rn|X ⊆L,L linearer Unterraum}
◮ Affine H¨ulle:
affX :=∩{A⊆Rn|X ⊆A,Aaffiner Unterraum}
Kombinationen
F¨urx(1), . . . ,x(r) ∈Rn und λ1, . . . ,λr ∈Rist
"r
i=1
λix(i)
einelineare Kombination vonx(1), . . . ,x(r).
◮ Falls #r
i=1λi = 1:affine Kombination
◮ Falls λ1, . . . ,λr ≥0:konische Kombination
◮ Konische affine Kombinationen: konvexe Kombinationen Bemerkung 2.8
Die konvexe / lineare / affine H¨ulle vonX ⊆Rnist die Menge aller konvexen /linearen / affinen Kombinationen von (endlich vielen) Punkten ausX.
Halbr¨aume, Hyperebenen
Definition 2.9
F¨ura∈Rn\ {On}und β ∈Rheißen
H≤(a,β) := {x∈Rn : 〈a,x〉 ≤β} und
H=(a,β) := {x∈Rn : 〈a,x〉=β}
der von(a,β) definierte (affine) Halbraum bzw. die von(a,β) definierte (affine) Hyperebene (fallsβ = 0:linear).
Beobachtung 2.10
◮ Halbr¨aume sind konvex (und abgeschlossen).
◮ Hyperebenen sind konvex.
◮ Affine Unterr¨aume sind konvex.
◮ Die Schnittmenge beliebig vieler Halbr¨aume ist konvex.
Polyeder
Definition 2.11
Eine TeilmengeP ⊆Rn heißt ein (konvexes) Polyeder, wenn P die Schnittmengeendlich vieleraffiner Halbr¨aume ist.
◮ P =∅und P =Rn (Schnitt ¨uber leerer Indexmenge) sind Polyeder
◮ Affine Unterr¨aume sind Polyeder.
Beobachtung 2.12
1. Polyeder sind konvex und (topologisch) abgeschlossen.
2. Die Menge P≤(A,b) :={x ∈Rn : Ax ≤b} der zul¨assigen L¨osungen eines linearen Optimierungsproblems ist ein Polyeder.
Polyeder: Beispiele
Minkowski-Summen und Skalierungen
Definition 2.13
F¨ur MengenX1, . . . ,Xq⊆Rn heisst
"q
i=1
Xi =X1+· · ·+Xq:=$"q
i=1
x(i):x(i) ∈Xi f¨ur alle i ∈[q]%
dieMinkowski-Summevon X1, . . . ,Xq.
Bemerkung 2.14
Minkowski-Summen und Skalierungen konvexer Mengen sind konvex.
(X ⊆Rn,α∈R:αX :={αx|x ∈X} Skalierungvon X)
Trenns¨atze f¨ur konvexe Mengen
Satz 2.15
SindX ⊆Rn konvex und abgeschlossen und y ∈Rn\X, so gibt es a∈Rn\ {On}und ε>0mit 〈a,x〉 ≤ 〈a,y〉 −εf¨ur alle x∈X.
Bemerkung 2.16
F¨ur jede konvexe MengeX ⊆Rn ist auch der topologische Abschlusscl(X) vonX konvex.
Satz 2.17
SindX,Y ⊆Rn konvexe Mengen mit X∩Y =∅, so gibt es a∈Rn\ {On}mit 〈a,x〉 ≤ 〈a,y〉f¨ur alle x ∈X,y ∈Y.
Schnitte von Halbr¨aumen
Korollar 2.18
Der topologische Abschluss einer konvexen Menge ist der Schnitt aller sie enthaltenden Halbr¨aume.
Bemerkung 2.19
Die Schnittmengen (beliebig vieler) Halbr¨aume sind also genau die abgeschlossenen konvexen Mengen.
(Die Schnittmengenendlich vieler Halbr¨aume sind die Polyeder.)
Kegel
Definition 2.20
Eine TeilmengeK ⊆Rn heißt Kegel, wennK ∕=∅ist und f¨ur alle x∈K und α≥0auch αx ∈K ist.
n+:={x ∈Rn : x≥On}
konvexer Kegel nicht konvexer Kegel
Eigenschaften von Kegeln
Bemerkung 2.21
IstI eine Indexmenge (beliebiger Kardinalit¨at), und sindKi ⊆Rn Kegel (i ∈I), so ist auch die Schnittmenge&
i∈IKi ein Kegel.
Bemerkung 2.22
Eine nicht leere Menge∅∕=K ⊆Rn ist genau dann ein konvexer Kegel, wennK alle konischen Kombinationen von Elementen ausK enth¨alt.
Wichtige Kegel
◮ Dernicht-negative Orthant
Rn+ :={x∈Rn|x≥On}.
◮ DerKegel der positiv-semidefiniten Matrizen
k+:={A∈ k|Apositiv semidefinit},
wobei k der k(k+1)2 -dimensionale Unterraum der symmetrischen Matizen in Rk×k ist.
◮ Rn+ und k+ sind konvex und abgeschlossen.
Trennsatz f¨ur konvexe Kegel
Satz 2.23
SindK ⊆Rn ein abgeschlossener konvexer Kegel undy ∈Rn\K ein Punkt außerhalb vonK, so gibt es a∈Rn mit
〈a,x〉 ≤0 f¨ur alle x ∈K und 〈a,y〉= 1.
Konische H¨ullen
Definition 2.24
F¨urX ⊆Rn ist die konische H¨ullevon X
coneX :=∩{K ⊆Rn|X ⊆K,K Kegel}.
Bemerkung 2.25
coneX ={αx|x ∈X,α≥0}∪{On}
Bemerkung 2.26
◮ F¨ur alleX ⊆Rn ist coneX ein Kegel.
◮ F¨ur konvexe Mengen X ist coneX ein konvexer Kegel.
Konvex-konische H¨ullen
Definition 2.27 F¨urX ⊆Rn ist
cconeX :=∩{K ⊆Rn|X ⊆K,K konvexer Kegel} diekonvex-konische H¨ullevon X.
Bemerkung 2.28
F¨ur alleX ⊆Rn ist cconeX . . .
◮ . . . ein konvexer Kegel.
◮ . . . die Menge aller konischen Kombinationen von Elementen ausX.
Endlich erzeugte Kegel
Definition 2.29
Ein Kegel istendlich erzeugt, wenn er
cconeX ='"
x∈X
λxx((λx ≥0 f¨ur alle x∈X)
f¨ur eineendliche Menge X ⊆Rnist.
IstX ⊆Rn sogar linear unabh¨angig, so heißt cconeX ein simplizialerKegel.
Bemerkung 2.30
Endlich erzeugte Kegel sind konvex.
Satz von Carath´eodory
Satz 2.31
SindX ⊆Rn undx ∈cconeX, so gibt es eine linear unabh¨angige TeilmengeX˜ ⊆X von X mit x∈ccone ˜X (insbesondere: |X˜|≤n).
Satz 2.32
Endlich erzeugte Kegel sind konvex und abgeschlossen.
Polare von Kegeln
Definition 2.33
F¨ur einen KegelK ⊆Rn heißt
K◦ := {y∈Rn : 〈y,x〉 ≤0 f¨ur alle x ∈K} der zuK polare Kegel.
Eigenschaften von Polaren
Bemerkung 2.34
F¨ur zwei KegelK1⊆K2 gilt K1◦ ⊇K2◦.
Bemerkung 2.35
F¨ur einen KegelK ⊆Rn istcl(K) ein Kegel mit K◦ = (cl(K))◦.
Bemerkung 2.36
Die Polaren von Kegeln sind konvexe abgeschlossene Kegel.
Bemerkung 2.37
F¨urX ⊆Rn ist (cconeX)◦={y ∈Rn|〈x,y〉 ≤0f¨ur alle x ∈X}. Satz 2.38
F¨ur jeden abgeschlossenen konvexen KegelK giltK◦◦=K.
Polare von Schnitten
Satz 2.39
SindK1, . . . ,Kq⊆Rnkonvexe Kegel mit
K1∩*!q
i=2
int(Ki)+
∕=∅, (1)
so ist
*!q
i=1
Ki
+◦
=
"q
i=1
Ki◦. (2)
(int(X): Menge der inneren Punkte vonX ⊆Rn)
Polyederische Kegel
Definition 2.40
Einpolyedrischer Kegel ist ein Kegel, der ein Polyeder ist.
Eigenschaften polyedrischer Kegel, Beispiele
Bemerkung 2.41
Eine MengeK ⊆Rn ist genau dann ein polyedrischer Kegel, wenn es eine MatrixA∈Rm×n gibt mit K = P≤(A,On).
Bemerkung 2.42
Polyedrische Kegel sind konvex und abgeschlossen.
Bemerkung 2.43
Die Polaren von endlich erzeugten Kegeln sind polyedrische Kegel.
Polare von polyedrischen Kegeln
Satz 2.44
F¨ur den polaren Kegel eines polyedrische KegelsK = P≤(A,Om) (mitA∈Rm×n) gilt
K◦= ccone{A1,!, . . . ,Am,!}.
Insbesondere: Die Polaren von polyedrischen Kegeln sind endlich erzeugt.
Korollar 2.45
SindK1, . . . ,Kq⊆Rnpolyedrische Kegel, so ist (&q
i=1Ki)◦ =#q i=1Ki◦.
Farkas-Lemma
Lemma 2.46
SindA∈Rm×n und b∈Rm so, dass P≤(A,b) =∅ gilt, so gibt es λ∈Rm+ mit λTA=OTn und 〈λ,b〉=−1.
Satz 2.47
F¨ur alleA∈Rm×n undb ∈Rm gilt: Entweder ist {x ∈Rn|Ax ≤b}∕=∅ oder es ist
{y ∈Rm|ATy =On,〈b,y〉=−1,y ≥Om}∕=∅ (aber nicht beides).
Polyedrische vs. endlich erzeugte Kegel
Lemma 2.48
Jeder polyedrische Kegel ist endlich erzeugt.
Satz 2.49
Ein Kegel ist genau dann polyedrisch, wenn er endlich erzeugt ist.
Verst¨arkung von Lemma 2.48
Definition
F¨ur jede MatrixM ∈Rm×n:
◮ δ(M) ={detMI×J|I ⊆[m],J ⊆[n],|I|=|J|}∪{0,1}
◮ ∆(M) ={pq|p,q ∈δ(M)∪(−δ(M)),q ∕= 0}
Lemma 2.48!
F¨ur jede MatrixA∈Rm×n gibt es X ⊆∆(A)n,|X|<∞ mit P≤(A,O) = ccone(X).
F¨ur den Beweis von Lemma 2.48
!Per Induktion nachp = 0,1, . . .:
F¨ur alleB ∈Rp×n und C ∈Rq×n (mitp+q ≥1,n≥1) und A=*
B C
+
∈R(p+q)×n, existiertX ⊆∆(A)n,|X|<∞ mit K :={x ∈Rn|Bx ≤Op,Cx =Oq}= cconeX.
Lemma 2.48a
SeienB ∈Rp×n,C ∈Rq×n (mitp+q ≥1,n ≥1), A=*B
C
+∈R(p+q)×n und K :={x∈Rn|Bx ≤Op,Cx =Oq}.
1. Falls dim(ker(A))≥dim(ker(C))−1:
Es gibt X ⊆∆(A)n,|X|<∞ mitK = cconeX. 2. Andernfalls: Es gibt z ∈ker(C) mitz ∕∈K,−z ∕∈K.
Illustration 1 des Beweises von Lemma 2.48a
ker (C)
O
U = ker (C)∩ker (B) y
a
〈a,y〉a
u
1
〈a,y〉y
u′
Illustration 2 des Beweises von Lemma 2.48a
ker (C)
BT
L⊥∩ker(C)
z
K
U = ker (C)∩ker (B)
Illustration des Induktionsschritts (Beweis Lemma 2.48
!)
ker (C)
K
z
−z K
xx
x+λ!z
x+µ!(−z)