• Keine Ergebnisse gefunden

Der Shortest Path Subsequence Kernel Ein Tree Kernel für ein Relation Extraction System

N/A
N/A
Protected

Academic year: 2022

Aktie "Der Shortest Path Subsequence Kernel Ein Tree Kernel für ein Relation Extraction System"

Copied!
1
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Der Shortest Path Subsequence Kernel

Ein Tree Kernel für ein Relation Extraction System

Student Norman Süsstrunk

Referent Prof. Martin Studer

Korreferent Prof. Albert Weichselbraun Master Research Unit Software and Systems, HTW Chur

In dieser Arbeit wurde eine Relation Extraction System als Komponente für ein umfangreiches NLP- und Information Retrieval System entwickelt.

Relation Extraction bezeichnet die Erkennung von semantischen Beziehungen zwischen Named Entities innerhalb von natürlichsprachigem Text. Eine Named Entity beschreibt die textliche Nennung eines realen Objektes. Die aktuellen Forschung auf dem Gebiet des Information Retrievals zeigen, dass die Verwendung von Support Vector Machines für unterschiedliche Klassifikationsprobleme sehr gute Ergebnisse liefert.

Eine Support Vector Machine löst ein Klassifikationsproblem auf der Grundlage eines Kernels, welcher die Ähnlichkeit zwischen den zu klassifizierenden Instanzen beschreibt. Ein solcher Kernel kann für den Vergleich von unterschiedlichsten Strukturen verwendet werden.

Diese Eigenschaft hat zu der Entwicklung und Erforschung von unterschiedlichen Tree Kernel geführt. Die Relation Extraktion kann als Klassifikationsproblem aufgefasst werden, welches mittels einer Support Vector Machine gelöst werden kann. Die syntaktische Struktur eines Satzes, welcher eine Relation beschreibt, wird mittels eines Dependency Tree beschrieben. Für die SVM wird dann ein Tree Kernel definiert, welcher solche Baumstrukturen in der Form des Dependency Tree verwendet, um die Ähnlichkeit zwischen Relation zu berechnen.

In dieser Arbeit wurden die nötigen Grundlagen erarbeitet, welche zu der Entwicklung des Shortest Path Subsequence Kernel geführt haben. In Java wurde anschliessend eine Komponente entwickelt, welche den Kernel für eine bestehende SVM-Software implementiert. Eine Evaluation des entwickelten Systemes mit einem Korpus zeigt, dass der entwickelte Kernel für die Relation Extraction vielversprechende Resultate liefert.

Annotierte Relation in einem Dependency Tree

Die Projektarbeit wurde im Rahmen des Master-Studienganges Master of Science in Engineering (MSE) an der Hochschule für Technik und Wirtschaft HTW Chur erstellt.

Referenzen

ÄHNLICHE DOKUMENTE

The above experiments on some data sets indicate that the kernel-based estimation method is efficient on some data sets with similar or even higher precision than the prevalently used

SUSE weit verbreitet im deutschsprachigen Raum Debian frei, sehr stabil, langer Updatezyklus Ubuntu anfängerfreundlich, vielsprachig Knoppix bekannte Live-Distribution

• Dateisysteme erstellt man normalerweise auf einer Blockgerätedatei (z.B. einer Partition /dev/sda1 oder einem USB-Stick /dev/sdd), da der Kernel nur solche speziellen Dateien für

M. Theoretical foundations of the potential function method in pattern recognition learning. A training algorithm for optimal margin classiers. In Fifth Annual Workshop on COLT

do not span the whole space (e.g. the dimension of the space is higher as the number of the data points). It will be important later for the feature spaces.. Why is it so? Proof

The risk-neutral den- sity is approximated by a weighted kernel density estimator with varying unknown weights for different observations, and the subjective density is approximated

Conversion characters declare the type of character expected or the way a character string is expected to be terminated. iRMK ™ Kernel Reference Manual.. A value of type i

The information returned includes the name of each registered kernel server, a status of either loaded (indicating that the kernel server is loaded and running in the kernel) or