• Keine Ergebnisse gefunden

Einführung in die Computerlinguistik Chart-Parsing

N/A
N/A
Protected

Academic year: 2022

Aktie "Einführung in die Computerlinguistik Chart-Parsing"

Copied!
6
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Einführung in die Computerlinguistik Chart-Parsing

Dozentin: Wiebke Petersen 21.12.2009

(2)

Naives Parsen ⇒ redundante Berechnungen

P=

S NP VP VP V VP V NP V calls

NP Peter NP Mary

Mary calls Peter

S S

NP VP S NP Peter

VP S NP VP

S NP Mary

VP S NP Mary

VP V

S NP Mary

VP V calls

S NP Mary

VP

S NP Mary

VP V NP

S NP Mary

VP V calls

NP

S NP Mary

VP V calls

NP Peter

(3)

Dynamische Programmierung

Ziel: Parsing-Methode,

die einmal berechnete Teilbäume speichert und nicht erneut berechnet

kein Problem mit Linksrekursion hat

⇒ Chart-Parser speichern Zwischenergebnisse in einer Chart Chart-Parser: CYK (Cocke-Younger-Kasami)

setzt voraus, dass die Grammatik in Chomsky-Normalform ist wird auch CKY-Parser genannt

(4)

Chomsky-Normalform

Denition 1

Eine Grammatik ist inChomsky-Normalform (CNF), wenn alle Regeln die Gestalt

1 A→a

2 A→BC

mit A,B,C ∈T und a∈Σhaben (und gegebenenfalls S →, dann aber ohne S in den rechten Regelseiten).

Theorem 2

Zu jeder kontextfreien Sprache gibt es eine Grammatik in Chomsky-Normalform, die sie generiert.

Was sind die charakteristischen Eigenschaften einer Grammatik in CNF?

(5)

Jede kontextfreie Sprache kann durch eine Grammatik in Chomsky-Normalform generiert werden

3 Umwandlungsschritte

1 Eliminierung der Regeln der Form A→B.

Ersetze diese Regel durch alle Regeln A→β, für die es eine Regel B→β gibt.

2 Anpassen der Grammatik, so dass Terminale nur in Regeln der Form A→a vorkommen.

Einfügen eines Dummy-Nichtterminalen für jeden Terminalen, der in einer falschen Regel steht.

3 Eliminierung der Regeln der Form A→B1B2. . .Bn mit n ≥3.

Wiederholtes Einfügen eines Dummy-Nichtterminalen für jedes Cluster B2. . .Bn.

(6)

CYK-Parser

Demo von Roy Mennicke

http://www.informatik.uni-leipzig.de/alg/lehre/ss08/

AUTO-SPRACHEN/Java-Applets/CYK-Algorithmus.html Wandelt Grammatiken in CNF um, beschreibt detailliert die Umwandlung und den CYK-Algorithmus.

Demo von Martin Lazarov

http://homepages.uni-tuebingen.de/student/martin.

lazarov/demos/cky.html

Erlaubt die Eingabe von Grammatiken mit komplexen Terminal- und Nichtterminalsymbolen (z.B., Maria, NP)

Exorciser

Zeigt die implizit erzeugten Derivationsbäume an.

Referenzen

ÄHNLICHE DOKUMENTE

Eine Phrasenstrukturregel legt fest, aus welchen Konstituenten eine Phrase aufgebaut ist (hierarchische Struktur, direkte Dominanz). und sie legt die Reihenfolge der Konstituenten

setzt voraus, dass die Grammatik in Chomsky-Normalform ist wird auch CKY-Parser genannt. Wiebke Petersen Einführung CL (WiSe

eine Computerdemonstration oder die Anleitung einer Gruppenaufgabe. • Jedes Referat wird im Vorfeld

Ein endlicher Automat ist deterministisch, wenn es, egal in welchem Zustand des Automaten man sich gerade befindet, für jede Eingabe aus dem Alphabet, immer einen eindeutigen

Theorem: Any context-free language can be generated by a context-free grammar in Chomsky normal form.. “Can transform any CFG into Chomsky

Finden Sie eine kontextfreie Grammatik, für welche die Ausführung beider Schritte in umgekehr- ter Reihenfolge nicht zu einer reduzierten Grammatik führt.. Übungsaufgaben, Folien

Die Bedeutung der Computerlinguistik für die Entwicklung praktischer sprachverarbeitender Systeme (etwa für maschinelle Übersetzung, Spracherkennung und

Situation 2: es gibt keine noch nicht geprüfte Reduktionsmöglichkeit, aber ein neues Element kann geshiftet werden (Stack 1 enthält mind. 1 Element). Æ neues Element