• Keine Ergebnisse gefunden

Kap. 5 Tries, digitale Suchbäume, Sorted frequency trees

N/A
N/A
Protected

Academic year: 2022

Aktie "Kap. 5 Tries, digitale Suchbäume, Sorted frequency trees"

Copied!
7
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Kap. 5 Tries, digitale Suchbäume, Sorted frequency trees

Tries: Trie ist Spezialfall von Positionsbaum für Text = Menge von Wörtern, die mit blank abgeschlossen sind, d.h.

- keineWiederholungen

- kein Wort ist Präfix eines anderen.

- Info am Blatt: Rest des Wortes, sonstige Information, z.B. Stamm, Etymologie, Synonyma, ..., Bedeutung Notation:

f(k) : Häufigkeit des Wortes in Knoten k

h(k) : Höhe des Knotens k von Wurzel gezählt f(k) • h(k) : Anzahl Suchschritte

(2)

2

(3)

Übergang zu digitalem Suchbaum:

Für 10 häufigste Wörter:

im Trie im dig.

Suchbaum

f (k)h(k) 190623

f (k)h(k) 108560

Idee: wie Trie, aber häufigstes Wort jedes Unterbaums in Wurzel!

(4)

4 1732

1062 1344 1727 1093 97

67 30

17 15

568 57

25 39 43 09 18 12

50 69

74 76

38 18

53

(5)

0

0 0

1

1 1

A digital search tree for the 31 most common English words,

Digitaler Suchbaum für Binärform von Wörtern,

häufigstes Wort in Wurzel

(6)

6

Sorted frequency tree THE 15568 OF 9767 AND 7638 TO 5739

A 5074

IN 4312 THAT 3017 IS 2509 FOR 1869 AS 1853

- einfügen nach absteigender Häufigkeit

- Knoten-Inhalt bestimmt Such- und Einfügpfad

(7)

Vergleich:

1. Trie: eindeutig, Info nur in Blättern, sortiert 2. Digitaler Suchbaum:

- eindeutig modulo gleichhäufiger Wörter - Info in Zwischenknoten

- Wurzel enthält häufigstes Wort im Baum - Baum nicht sortiert, aber

: x  y⋜

- Verarbeitung, Ausgabe in Sortierreihenfolge?

3. Sorted frequency tree:

- Struktur abhängig von Einfügereihenfolge bei gleichhäufigen Wörtern

- sortiert

LB x

yRB

Referenzen

ÄHNLICHE DOKUMENTE

Damit enth¨ alt eine abgeschlossene Menge jeden

o  Falls die Suche in einem BlaS endet, müssen für alle Zeichen in denen der Suchschlüssel und der Schlüssel des BlaSes.. übereinsHmmen neue innere Knoten

Die Abbildung 1 zeigt ein Beispiel für einen Patricia-Trie (eine Erläuterung was ein Patricia-Trie ist, befindet sich am Ende des Übungsblattes).. Gehen Sie davon aus, dass wir

The United States and Iraq share a strong interest in Iraq becoming a strong and sovereign state that is secure within its borders, contributes to regional stability and security

You can’t assign over the value of passed reference to make it point to a different object upon return, but since any copy of the reference is just as good as the original in terms

Mache einen Screenshot/ Foto von deinem höchsten Level und schicke es dem Lehrer per

Mache einen Scan/ Foto von deinem Ergebnis und schicke es dem Lehrer per E-Mail

Formally, we could say that your algorithm must be a polynomial time algorithm, i.e., there must be a polynomial p ∈ R [T ] such that your algorithm terminates its search for each