• Keine Ergebnisse gefunden

Klassifikation

N/A
N/A
Protected

Academic year: 2022

Aktie "Klassifikation"

Copied!
14
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Dr. Benjamin Roth & Annemarie Friedrich

Centrum für Infomations- und Sprachverarbeitung LMU München

WS 2016/2017

Einführung in die Computerlinguistik

Maschinelles Lernen

(2)

Maschinelles Lernen

 Einführung (heute)

Attribute

Klassifikation vs. Clustering

Evaluation von Algorithmen

 Algorithmen

K-means

Entscheidungsbäume

Naive Bayes (& Sprachmodelle)

(3)

Klassifikation

(4)

Mustererkennung (pattern recognition)

Kamera

Welches Obst / Gemüse?

Was sind mögliche

Erkennungsmerkmale?

(5)

Mustererkennung (pattern recognition)

Merkmale/Attribute:

Farbe

Größe

Form

Classifier

Beispiele:

Attribute/Werte + richtige Klasse

Algorithmus

(Maschinelles Lernen)

neues

Objekt Zitrone (80%)

Birne (20%)

(6)

Maschinelles Lernen

 Prinzip: lerne aus Mustern von linguistischer Information ...

Sprachmodelle (welche Sätze sind okay in einer natürlichen Sprache?)

Parse-Bäume (finde automatisch den besten Baum für einen Satz)

Übersetzungsmodelle

Textkategorien (Text  Nachrichten, Prosa, Gedicht, Spam, e-Mail, ... ?)

 Grundsätzlich: je zahlreicher und informativer die Daten, desto besser

(7)

Klassifikation

 überwachtes Lernen (supervised)

 Algorithmus lernt Funktion 𝑥 → 𝑦 aus annotierten Daten < 𝑥𝑖 = Merkmale (features), 𝑦𝑖 = Klasse>

Beispiel:

Klassen: e-Mail vs. Spam

Merkmale: Wörter der Mail (lemmatisiert)

Klassifikator lernt z.B., dass Vorkommen von „hot girl“

eher auf Spam hinweist.

(8)

Training und Evaluation

 Trainingsdaten  werden benutzt, um den Klassifikator zu trainieren (zu erstellen)

 Testdaten  Klassifikator wird auf diese Daten

angewendet und Ergebnis der Vorhersage wird mit den tatsächlichen Labels verglichen

 oft auch noch: Entwicklungsdaten (development set)

 keine Überschneidung zwischen diesen Datensets!!

(9)

Evaluation

 Testdaten: Auswertung des Klassifikationsergebnisses

hier: 100 Test-Instanzen

e-Mail Spam

e-Mail 58 21

Spam 9 12

tatsächliche Klasse

automatisch zugewiesene Klasse

richtig falsch

 Accuracy: % der Testinstanzen, die richtig klassifiziert wurden

Accuracy im Beispiel?

(10)

Precision

 Wie sehr kann ich dem Klassifikator trauen, wenn er eine Mail als Spam klassifiziert?

 Precision wird pro Klasse berechnet

𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 𝐾 = 𝑟𝑖𝑐ℎ𝑡𝑖𝑔 𝑎𝑙𝑠 𝐾 𝑘𝑙𝑎𝑠𝑠𝑖𝑓𝑖𝑧𝑖𝑒𝑟𝑡𝑒 𝐼𝑛𝑠𝑡𝑎𝑛𝑧𝑒𝑛 𝑎𝑙𝑙𝑒 𝑎𝑙𝑠 𝐾 𝑘𝑙𝑎𝑠𝑠𝑖𝑓𝑖𝑧𝑖𝑒𝑟𝑡𝑒𝑛 𝐼𝑛𝑠𝑡𝑎𝑛𝑧𝑒𝑛

Precision(e-Mail)?

Precision(Spam)?

e-Mail Spam

e-Mail 58 21

Spam 9 12

tatsächliche Klasse

automatisch zugewiesene Klasse

(11)

Recall

 Wie viele der tatsächlichen Spam-Mails findet der Klassifikator?

 Recall wird pro Klasse berechnet

𝑅𝑒𝑐𝑎𝑙𝑙 𝐾 = 𝑟𝑖𝑐ℎ𝑡𝑖𝑔 𝑎𝑙𝑠 𝐾 𝑘𝑙𝑎𝑠𝑠𝑖𝑓𝑖𝑧𝑖𝑒𝑟𝑡𝑒 𝐼𝑛𝑠𝑡𝑎𝑛𝑧𝑒𝑛 𝑎𝑙𝑙𝑒 𝐼𝑛𝑠𝑡𝑎𝑛𝑧𝑒𝑛, 𝑑𝑖𝑒 𝑡𝑎𝑡𝑠ä𝑐ℎ𝑙𝑖𝑐ℎ 𝐾 𝑠𝑖𝑛𝑑

Recall(e-Mail)?

Recall(Spam)?

e-Mail Spam

e-Mail 58 21

Spam 9 12

tatsächliche Klasse

automatisch zugewiesene Klasse

(12)

Precision-Recall Trade-Off

verschiedene Algorithmen oder verschiedene Einstellungen resultieren in unterschiedlichen Werten für Precision + Recall

Algorithmus 1

Recall Precision

Algorithmus 2

Algorithmus 3 1.0

1.0 0.0 0.0

(13)

Precision-Recall Trade-Off

verschiedene Algorithmen oder verschiedene Einstellungen resultieren in unterschiedlichen Werten für Precision + Recall

Recall Precision

1.0

1.0 0.0 0.0

(14)

F1-Measure

 ein Score, der zur Evaluation genutzt werden kann

 harmonischer Mittelwert von Precision und Recall

• 𝐹

1

= 2∗𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛∗𝑅𝑒𝑐𝑎𝑙𝑙 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛+𝑅𝑒𝑐𝑎𝑙𝑙

Alternativen: Precision und Recall können auch anders gewichtet werden (Fβ)

Referenzen

ÄHNLICHE DOKUMENTE

Two search engines A and B perform a search on the same collection. Each engine returns the top 30 documents for a single query in ranked order by their relevance. The following

Weder die Seiko Epson Corporation noch eine ihrer Tochtergesellschaften haften für Schäden, Verluste oder Kosten des Käufers oder von Dritten infolge von Unfall, Fehlgebrauch sowie

Wie viel kg der Grundstoffe

Aufgabe 2: Eine andere Bakterienkultur, die auch 1 g wiegt, verdoppelt sich nur jede zweite Stunde.. Auf wie viel Gramm sind die Bakterien nach 6

Sehr umfassende Anstrengungen sind gemacht werden, haltbare Trockenplatten und haltbare sensible Positivpapiere zu liefern, die in Bezug auf Sicherheit und Schönheit der Resultate

[r]

Doch kann die Ausmündung des Schieber- kanals nicht immer gleich a’ gemacht werden, weil in der Mittellage der Dampfkanal dicht geschlossen bleiben muss, damit die beiden

Man hat angenommen, dass die Ausflussmengen von Wasser und Dampf, wenn sie jede für sich ausfliessen, sich summiren, wenn man ein Gemenge beider von je demselben Grade einspritzt