• Keine Ergebnisse gefunden

2. Herangehensweise bei der Textzusammenfassung

N/A
N/A
Protected

Academic year: 2022

Aktie "2. Herangehensweise bei der Textzusammenfassung"

Copied!
12
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Textzusammenfassung

(2)

Gliederung

1. Wozu Textzusammenfassung?

2. Herangehensweise bei der Textzusammenfassung

3. statistische Herangehensweisen

4. linguistische Herangehensweisen

5. Probleme der Textzusammenfassung

6. Beispiel und Übung

(3)

Wozu Textzusammenfassung?

„Informationsflut“ durch Verbreitung des Internets

Unmöglich alle relevanten Texte zu einem Thema zu erarbeiten

Lösung: automatische Zusammenfassung eines oder

mehrerer Texte

(4)

Herangehensweise bei der Textzusammenfassung

Aspekte der Textzusamenfassung:

Extract vs. Abstract (Extract: Sammlung von Sätzen des Originaltextes, Abstract: eigener Text)

Allgemein vs. nutzerorientiert

Informativ vs. Indikativ (Informativ: länger, auch Ergebnisse des Textes, Indikativ: kürzer, keine Ergebnisse)

Zusammenfassung eines vs. Zusammenfassung mehrerer Texte

(5)

Herangehensweise bei der Textzusammenfassung

Grundsätzliche Vorgehensweise:

1. Identifikation relevanter Textteile

2. Textstellen in Textteilen isolieren

3. Zusammenfassung durch Zusammenfügung der Textstellen erstellen

Identifikation der relevanten Textteile durch statistische

oder linguistische Methoden

(6)

Statistische Herangehensweisen

Gewichtungswerte ermitteln durch:

Schlüsselwort- / Schlüsselphrasen-Methode (Autor gibt wichtige Fakten durch bestimmte Wörter / Phrasen zu erkennen)

Positionsmethode (Sätze in bestimmten Positionen wichtiger bspw. die ersten / letzten Sätze eines Textes, Überschriften)

Worthäufigkeit (häufige Worte abzüglich Stoppworte müssen wichtig sein)

Satzlänge (Lange Sätze wichtiger als kurze)

(7)

Statistische Herangehensweise

Linguistische Erfodernisse bei den statischen Methoden:

Morphologie: Erkennen von Wortgrenzen und Worten

Lexikographie: Zuordnen von Worten zu Wortliste

Syntax: Erkennen von Satzgrenzen

(8)

Linguistische Herangehensweise

Gewichtungswerte ermitteln durch:

Beziehungen zwischen Sätzen: Sätze die starken Bezug zu (vielen) anderen Sätzen haben sind wichtiger

Linguistische Erfordernisse bei der linguistischen Methode:

Morphologie: Erkennen von Wortgrenzen und Worten

Lexikographie: Zuordnen von Worten zu Wortliste

Syntax: Erkennen von Satzgrenzen und -strukturen

Semantik: Erkennen von semantischen Beziehungen zwischen Sätzen

(9)

Probleme der Textzusammenfassung

Isolation von relevanten Textteilen und –stellen:

funktioniert einigermaßen

Probleme mit Ungenauigkeiten bei statistischen Methoden

Probleme mit der Erkennung semantischer und syntaktischer Strukturen bei den linguistischen Methoden

Zusammenfassung durch Zusammenfügen relevanter Textstellen erstellen: problematisch

Semantische und syntaktische Probleme bei der Generierung

(10)

Beispiel: SweSum

(11)

Übung

Gehen Sie auf die Seite http://swesum.nada.kth.se/index- eng-adv.html

Kopieren Sie beispielsweise den Text „Mamaia.txt“ in das Textfenster und experimentieren Sie mit den

verschiedenen Einstellmöglichkeiten herum.

Was fällt Ihnen auf?

Welche Ihrer Meinung nach wichtigen Fakten fehlen in

(12)

Quellen

http://archiv.tu-

chemnitz.de/pub/2006/0118/data/Diplomarbeit_Endversio n.pdf

http://www.cl.uni-

heidelberg.de/courses/archiv/ws06/ecl/folien/f_a22.pdf

http://swesum.nada.kth.se/index-eng-adv.html

Referenzen

ÄHNLICHE DOKUMENTE

Nachdem Chichibio meint, dass Kraniche nur ein Bein hätten, soll er am nächsten Tag seinem Herrn, der wegen des Gastes keinen Streit mehr will, Kraniche mit einem Bein

Die folgenden drei Tabellen können dir helfen, einfache Sätze im Englischen zu bilden und dabei die Formen von to be in Aussagesätzen, Fragen und Verneinungen richtig zu

freuen, Knospe, Fenster, Mauer, Lokomotive, er raste, Achtung, backen, Unglück, Schmetterling, Karpfen, Dienstag, musste. C) Setze in die Mehrzahl und bilde je einen Satz!.. 1. D)

Zukünftiges Ziel des ForschungsproJekts ISt es, die hier vorgestellten Sprachverhaltensda- ten nicht nur zu konsolidieren, sondern sie im Rahmen einer umfassenderen Theone der

„Finally, the prediction was confirmed that subjects should be faster to judge a Statement as plausible when it was not presented than to recognize it when it was presented"

(2) Der Transformation kann eine Passivtransformation vorausgehen. x ) Zur Auslassung des Erstnomens vgl.. Syntagmen mit infiniten Verbalformen als Transformate von

In dieser zweiten Lesart ist es also nur für wenige Jäger wahr, daß sie sowohl in den Wald gegangen sind als auch einen Hasen geschossen haben, unabhängig von denen, die zwar in

Durch welche Merkmale unterscheiden sich drogengefährdete oder drogenabhängige Jugendliche von ihren Altersgenossen2. Nennen Sie die zwei grundsätzlichen Strategien