• Keine Ergebnisse gefunden

Einführung in die Computerlinguistik

N/A
N/A
Protected

Academic year: 2022

Aktie "Einführung in die Computerlinguistik"

Copied!
11
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Einführung in die Computerlinguistik

Morphologische Verarbeitung - realisierungsbasierte Ansätze -

DATR

21.6.2010

Wiebke Petersen

(2)

Grundmodelle der generativen

Morphologie

(3)

Transduktoren

(4)

Problem: Defaults und

Neutralisierungen (Synkretismen)

(5)

Nichtkonkatenative Morphologie (Ablaut)

Ablaut kann nicht als phonologische Regularität beschrieben

werden, vergleiche: stoßen – stieß vs. biegen - bog

(6)

Problem: Nichtlokale Abhängigkeiten

(7)

DATR:

• Evans & Gazdar 1996: Lexikonrepräsentation

• Nicht-monotone Vererbungshierarchie

(8)

DATR-Theorien

WATEN:

<form präs sg eins> == w a t e

<form präs pl zwei> == w a t e t .

WATEN: <form präs sg eins> ? w a t e

DATR-Knoten (Wissen ist in Knoten repräsentiert):

Anfrage:

(9)

Vererbung über Pfade

WATEN:

<form> == <wurzel> <endung>

<wurzel> == w a t

<endung sg zwei> == e s t

<endung sg> == e

<endung pl zwei> == e t

<endung> == e n

<endung präs sg drei> == e t

<endung präs> == <endung>

<endung impf> == e t <endung>

.

WATEN: <form präs sg eins> ?

(10)

Defaults und Neutralisierung

VERB:

<form> == "<wurzel>" "<endung>"

<endung sg zwei> == e s t

<endung sg> == e

<endung pl zwei> == e t

<endung> == e n

<endung präs sg drei> == e t

<endung präs> == "<endung>"

<endung impf> == e t "<endung>"

.

WATEN:

< > == VERB

<wurzel> == w a t .

(11)

Nichtkonkatenative Morphologie

VERB:

<form> == "<wurzel>" "<endung>"

<form part> == g e "<wurzel>" "<endung part>"

<stamm präs> == "<wurzel präs>"

<stamm impf> == "<wurzel impf>" e t

<endung sg zwei> == e s t

<endung sg> == e

<endung pl zwei> == e t

<endung> == e n

<endung präs sg drei> == e t

<endung präs> == "<endung>"

<endung impf> == e t "<endung>"

<endung part> == e t .

Referenzen

ÄHNLICHE DOKUMENTE

Die Bedeutung der Computerlinguistik für die Entwicklung praktischer sprachverarbeitender Systeme (etwa für maschinelle Übersetzung, Spracherkennung und

• Für Beschreibung von Phänomenen für einzelne Wörter reichen Textkorpora mit 60 Millionen Wörtern aus.. • Konkordanz (oft: KWIC, Key Word In Context. Ein

regelmäÿige aktive Teilnahme an beiden Terminen (maximal 4 Fehltermine), Ausnahmen müssen im Vorfeld verhandelt werden.. wöchentliche, kleine Hausaufgabe (Bearbeitungszeit max.

Wäre L regulär, dann müÿte es für genügend lange Worte die geforderte pumpbare Zerlegung geben: aber.. 1 das pumpbare Teilwort kann nicht nur aus a's bestehen, sonst würden beim

Wäre L regulär, dann müÿte es für genügend lange Worte die geforderte pumpbare Zerlegung geben: aber. 1 das pumpbare Teilwort kann nicht nur aus a's bestehen, sonst würden beim

setzt voraus, dass die Grammatik in Chomsky-Normalform ist wird auch CKY-Parser

eine Computerdemonstration oder die Anleitung einer Gruppenaufgabe. • Jedes Referat wird im Vorfeld

Ein endlicher Automat ist deterministisch, wenn es, egal in welchem Zustand des Automaten man sich gerade befindet, für jede Eingabe aus dem Alphabet, immer einen eindeutigen