Modelle
Wissensentdeckung in Datenbanken
Modellklassen, Verlustfunktionen
Nico Piatkowski und Uwe Ligges
Informatik—Künstliche Intelligenz Computergestützte Statistik Technische Universität Dortmund
02.05.2017
Modelle
Literatur
Trevor Hastie, Robert Tibshirani, Jerome Friedman. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd edition. Springer Series in Statistics.
Springer. 2009
Im Moodle zum Download verfügbar.
Jorge Nocedal. Stephen Wright. Numerical Optimization.
2nd edition. Springer Series in Operations Research and Financial Engineering. Springer-Verlag New York. 2006
In der Zentralbibliothek verfügbar.
Modelle
Daten—und dann?
Personendaten Medizinische Daten Konto- und Zahlungsdaten Verbindungsdaten
Soziale Netzwerke
Modelle
Realisierung von Zufallsvektoren X
X =
⎛ ⎜⎜
⎜⎜ ⎜⎜
⎜⎜ ⎜⎜
⎜⎜ ⎜
⎝
Alter Geschlecht Krankheitstage
Medikation Kontostand
Kredite Webseiten
. . .
⎞ ⎟⎟
⎟⎟ ⎟⎟
⎟⎟ ⎟⎟
⎟⎟ ⎟
⎠
Modelle
Begriffe
Daten D = {( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N )}
Realisierungen von Zufallsvariable X mit n-dimensionaler Domäne X Multimenge; # D ( x, y ) ∶ X × Y → N Messfehler, Rauschen ∼ P
Fehlende Werte; x i ∈ X i ∪ { ? } , 1 ≤ i ≤ n Modell f aus Modellklasse M
Funktionen M ⊆ F
Koeffizienten / Parameter M ⊆ R d Datenpunkte M ⊆ D , M ⊆ X × Y
Verlustfunktion (Güte) ` ∶ ( f; D) ↦ R
Modelle
Begriffe
Daten D = {( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N )}
Realisierungen von Zufallsvariable X mit n-dimensionaler Domäne X Multimenge; # D ( x, y ) ∶ X × Y → N Messfehler, Rauschen ∼ P
Fehlende Werte; x i ∈ X i ∪ { ? } , 1 ≤ i ≤ n Modell f aus Modellklasse M
Funktionen M ⊆ F
Koeffizienten / Parameter M ⊆ R d Datenpunkte M ⊆ D , M ⊆ X × Y
Verlustfunktion (Güte) ` ∶ ( f; D) ↦ R
Modelle
Begriffe
Daten D = {( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N )}
Realisierungen von Zufallsvariable X mit n-dimensionaler Domäne X Multimenge; # D ( x, y ) ∶ X × Y → N Messfehler, Rauschen ∼ P
Fehlende Werte; x i ∈ X i ∪ { ? } , 1 ≤ i ≤ n Modell f aus Modellklasse M
Funktionen M ⊆ F
Koeffizienten / Parameter M ⊆ R d Datenpunkte M ⊆ D , M ⊆ X × Y
Verlustfunktion (Güte) ` ∶ ( f; D) ↦ R
Modelle
Allgemeines Vorgehen
Daten D = {( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N )}
Datenpunkt x ∈ X , Label (Klasse) y ∈ Y Modelle M
Modell “lernen”, Datenanalyse, ..
f ∗ = arg min
f∈M ` ( f ; D)
Modellanwendung, “Vorhersage”, ..
ˆ
y = f ∗ ( x )
Modelle
Allgemeines Vorgehen
Daten D = {( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N )}
Datenpunkt x ∈ X , Label (Klasse) y ∈ Y Modelle M
Modell “lernen”, Datenanalyse, ..
f ∗ = arg min
f∈M ` ( f ; D)
Modellanwendung, “Vorhersage”, ..
ˆ
y = f ∗ ( x )
Modelle
Allgemeines Vorgehen
Daten D = {( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N )}
Datenpunkt x ∈ X , Label (Klasse) y ∈ Y Modelle M
Modell “lernen”, Datenanalyse, ..
f ∗ = arg min
f∈M ` ( f ; D)
Modellanwendung, “Vorhersage”, ..
ˆ
y = f ∗ ( x )
-1 -0.5 0 0.5 1
-1 -0.5 0 0.5 1
Function value
z
T0 T1 T2 T3 T4
Modelle
Modellklassen M
f ∶ X → Y Linear
f ( x ) = β 0 + ⟨ β, x ⟩
Polynom f ( x ) = β 0 + ∑ n
i=1 β i x i + ∑ n
i=1
∑ n
j=1 β i,j x i x j + ∑ n
i=1
∑ n j=1
∑ n
k=1 β i,j,k x i x j x k + . . . Trigonometrisch/Periodisch
f ( x ) = ∑ k
i=0 θ i cos ( i arccos (⟨ β i , x ⟩))
-1 -0.5 0 0.5 1
-1 -0.5 0 0.5 1
Function value
z
T0 T1 T2 T3 T4
Modelle
Modellklassen M
f ∶ X → Y Linear
f ( x ) = β 0 + ⟨ β, x ⟩
Polynom
f ( x ) = β 0 + ∑ n
i=1 β i x i + ∑ n
i=1
∑ n
j=1 β i,j x i x j + ∑ n
i=1
∑ n j=1
∑ n
k=1 β i,j,k x i x j x k + . . . Trigonometrisch/Periodisch
f ( x ) = ∑ k
i=0 θ i cos ( i arccos (⟨ β i , x ⟩))
-1 -0.5 0 0.5 1
-1 -0.5 0 0.5 1
Function value
z
T0 T1 T2 T3 T4