Concept learning -

(1)

Concept Learning Machine Learning– WS 2011/2012

Machine Learning

-

Concept learning

Vorlesung

(2)

• Lernen von Beispielen

• Lernen und Suchen

• Hypothesen erstellen

• Version Space und Candidate Elimination

• Beispiele auswählen

• Bias

Überblick

Übersicht

(3)

Trainingsbeispiele

•Wie lautet das allgemeine Konzept?

(4)

Trainingsbeispiele

•Wie lautet das allgemeine Konzept?

•Wann besuche ich die Vorlesung?

Vorlesung besuchen

(5)

Hypothesen

• Wie kann man solche Konzepte darstellen?

• Hier als Menge von Constraints.

• Jeder Constraint beschreibt:

• Einen genauen Wert (e.g.Temp = Warm)

• Keine Einschränkung (e.g. Temp = ?)

• Kein Wert erlaubt (e.g. Temp = Ø)

(6)

Hypothesen

Ein Beispiel für eine Hypothese:

Sky, Temp, Humid, Wind, Water, Forecast {<Sunny, ?, ?, Strong, ?, Same>}

(7)

Hypothesen

Damit gibt es eine Menge von Hypothesen

• Ein Konzept lernen kann man interpretieren als

“die richtige” Hypothese zu finden.

• Eine Hypothese finden, die passend zu allen Beispieldaten (Trainingsinstanzen) ist.

(8)

Hypothesen

Damit gibt es eine Menge von Hypothesen

• Ein Konzept lernen bedeutet also

“die richtige” Hypothese zu finden.

(9)

Prototypische Konzeptlernenaufgabe

Gegeben:

• Instanzen X: Mit Werten für Sky, Hummid etc.

• Zielfunktion c: Vorlesung besuchen: X → {0,1}

• Hypothesen H: E.g.:

• (?, Cold, High, ?,?,?)

• Trainingsbeispiele D: positive und negative Beispiele der Zielfunktion. (x, c(x), y,c(y), ...)

Gesucht:

• Eine Hypothese h in H mit h(x) =c(x) für alle x in D

(10)

(11)

Instanzen und Hypothesen

(12)

Find-S Algorithmus

(13)

Find-S Algorithmus

(14)

Find-S Algorithmus

(15)

Find-S Algorithmus

(16)

Find-S Algorithmus

(17)

Find-S Algorithmus

(18)

Find-S Algorithmus

(19)

Find-S Algorithmus

(20)

Nachteile des Find-S Algorithmus

•Man kann nicht entscheiden:

• ob dass Konzept gelernt wurde.

•ob die Trainingsbeispiele inkonsistent sind.

•Find S wählt immer die maximal eingeschränkteste

Hypothese h, die mit allen positiven Beispielen konsistent ist.

(21)

Version Space

•Eine Hypothese ist konsistent mit einer Menge von Trainingsbeispielen, wenn h(x) = c(x) für alle

Trainingsbeispiele gilt.

•Der Version Space VS_H,D zu einer Hypothesenmenge H und Trainingsbeispielen D ist die Teilmenge von

Hypothesen in H, die konsistent zu D ist.

(22)

List-Then-Eliminate Algorithmus

(23)

Version Space

(24)

Version Space

(25)

Candidate Elimination Algorithmus

(26)

Candidate Elimination Algorithmus

(27)

Candidate Elimination Algorithmus

(28)

Beispiel

S : {<Ø, Ø,Ø,Ø,Ø, Ø>}

G: {<?,?,?,?,?,?>}

(29)

Beispiel

S₁ : {<Sunny, Warm, Normal, Strong, Warm, Same>}

G₁: {<?,?,?,?,?,?>}

(30)

Beispiel

S₂ : {<Sunny, Warm, ?, Strong, Warm, Same>}

G₂: {<?,?,?,?,?,?>}

(31)

Beispiel

S₃ : {<Sunny, Warm, ?, Strong, Warm, Same>}

G₃{<Sunny,?,?,?,?,?> <?,Warm, ?,?,?,?> <?,?,Normal,?,?,?> <?,?,?,Light, ?,?> <?,?,?,?, Cool,?> <?,?,?,?,?,Same>}

G₂: {<?,?,?,?,?,?>}

(32)

Beispiel

G₃{<Sunny,?,?,?,?,?> <?,Warm, ?,?,?,?> <?,?,?,?,?,Same>}

G₂: {<?,?,?,?,?,?>}

(33)

Beispiel

G₃{<Sunny,?,?,?,?,?> <?,Warm, ?,?,?,?><?,?,?,?,?,Same>}

(34)

Beispiel

S₄ : {<Sunny, Warm, ?, Strong, ?, ?>}

G₃{<Sunny,?,?,?,?,?> <?,Warm, ?,?,?,?><?,?,?,?,?,Same>}

(35)

Beispiel

S₄ : {<Sunny, Warm, ?, Strong, ?, ?>}

G₄{<Sunny,?,?,?,?,?> <?,Warm, ?,?,?,?>}

(36)

Beispiel

(37)

Klassifizieren bei Mehrdeutigkeit

(Rainy, Cold, Normal, Light, Warm, Same) (Sunny, Warm, Normal, Strong, Cool, Change)

(38)

Klassifizieren bei Mehrdeutigkeit

(Sunny, Warm, Normal, Light, Warm, Same) (Sunny, Cold, Normal, Light, Cold, Same)

(39)

Klassifizieren bei Mehrdeutigkeit

Selbst wenn keine Eindeutige Zuordnung möglich ist, kann eine Wahrscheinlichkeit angegeben werden.

Bias: Wir nehmen an, dass das Konzept c als Konjunktion von Literalen dargestellt werden kann.

(40)

Welches Trainingsbeispiel als nächstes?

(41)

Welches Trainingsbeispiel als nächstes?

(Sunny, Warm, Normal, Light, Warm, Same)

(42)

Wie gut ist Candidate Elimination?

(43)

Wie gut ist Candidate Elimination?

•Konvergiert gegen die richtige Hypothese!

•Gibt immer die verbleibende Mehrdeutigkeit (Ambiguität) an.

(44)

Wie gut ist Candidate Elimination?

•Konvergiert gegen die richtige Hypothese!

•Gibt immer die verbleibende Mehrdeutigkeit (Ambiguität) an.

Falls keine Fehler in den Trainingsdaten sind und die richtige Hypothese in H enthalten ist.

(45)

Bias

Wie garantieren wir, dass die richtige Hypothese in unserem Hypothesenraum enthalten ist?

Was ist mit (Sky = Sunny) or (Sky = Cloudy)?

Was mit (Sky = Sunny) or (Water = Cold)?

(46)

Bias

Was ist mit (Sky = Sunny) or (Sky = Cloudy)?

Was mit (Sky = Sunny) or (Water = Cold)?

Die folgenden Überlegungen sind gültig für alle induktiven Lernverfahren!

(47)

Bias

Was ist mit (Sky = Sunny) or (Sky = Cloudy)

(48)

Ein unvoreingenommener Lerner

(49)

An unbiased Learner

(50)

An unbiased Learner

Jede mögliche Hypothese ist im Hypothesenraum H enthalten.

Es gibt in dem Beispiel 96 verschiedene Belegungen für die sechs Attribute. (3*2*2*2*2*2=96)

Damit gibt es 2⁹⁶verschiedene Hypothesen.

(51)

A unbiased Learner

Wie viele Trainingsbeispiele werden benötigt um die richtige Hypothese zu ermitteln?

(52)

A unbiased Learner

Wie viele Trainingsbeispiele werden benötigt um die richtige Hypothese zu ermitteln?

96 verschiedene (also alle Instanzen!)

(53)

Unbiased Learning

Mitchell:

„A learner that makes no a priori assumption regarding the identity of the target concept has no rational basis for

classifying any unseen instances“

(54)

Unbiased Learning

Kann man Wahrscheinlichkeiten für die unbekannten Instanzen angeben?

(55)

Candidate Elimination Algorithmus

(56)

Candidate Elimination Algorithmus

(57)

Inductive Bias

Das Induktive Bias ist eine minimale Menge von Annahmen bezüglich der Zielfunktion c.

(58)

Inductive Bias

(59)

Concept learning -

-

Concept learning

Überblick

Trainingsbeispiele

Trainingsbeispiele

Hypothesen

Hypothesen

Hypothesen

Hypothesen

Prototypische Konzeptlernenaufgabe

Instanzen und Hypothesen

Find-S Algorithmus

Find-S Algorithmus

Find-S Algorithmus

Find-S Algorithmus

Find-S Algorithmus

Find-S Algorithmus

Find-S Algorithmus

Find-S Algorithmus

Nachteile des Find-S Algorithmus

Version Space

List-Then-Eliminate Algorithmus

Version Space

Version Space

Candidate Elimination Algorithmus

Candidate Elimination Algorithmus

Candidate Elimination Algorithmus

Beispiel

Beispiel

Beispiel

Beispiel

Beispiel

Beispiel

Beispiel

Beispiel

Beispiel

Klassifizieren bei Mehrdeutigkeit

Klassifizieren bei Mehrdeutigkeit

Klassifizieren bei Mehrdeutigkeit

Welches Trainingsbeispiel als nächstes?

Welches Trainingsbeispiel als nächstes?

Wie gut ist Candidate Elimination?

Wie gut ist Candidate Elimination?

Wie gut ist Candidate Elimination?

Bias

Bias

Bias

Ein unvoreingenommener Lerner

An unbiased Learner

An unbiased Learner

A unbiased Learner

A unbiased Learner

Unbiased Learning

Unbiased Learning

Candidate Elimination Algorithmus

Candidate Elimination Algorithmus

Inductive Bias

Inductive Bias

Three Learners with different Biases