• Keine Ergebnisse gefunden

Dokumentdistanz L¨osungen+ ¨Ubungen

N/A
N/A
Protected

Academic year: 2021

Aktie "Dokumentdistanz L¨osungen+ ¨Ubungen"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Dokumentdistanz L¨osungen+ Ubungen¨ Gross- und Kleinschreibung sowie Satzzeichen sind nicht zu ber¨ucksichtigen.

Aufgabe 1

Wort d1 d2

der 0 1

die 2 1

flieht 0 1

jagt 1 0

katze 1 1

maus 1 1

vor 0 1

dist(d1, d2) = arccos d1·d2

|d1| · |d2| = arccos 4

√7·√

6 = 51.89

Aufgabe 2

Wort d1 d2

distanz 1 1

dokumente 1 0

er 0 1

hatte 0 1

keine 0 1

seinem 0 1

text 1 1

zu 0 1

dist(d1, d2) = arccos d1·d2

|d1| · |d2| = arccos 2

√3·√

7 = 64.12

Wort d1 d3

den 0 1

distanz 1 0

dokumente 1 1

er 0 1

ur 0 1

im 0 1

ordner 0 1

speichert 0 1

text 1 1

dist(d1, d3) = arccos d1·d3

|d1| · |d3| = arccos 2

√3·√

8 = 65.91

Dokument 1 liegt n¨aher bei den Suchbegriffen als Dokument 2.

Aufgabe 3

Die Dokumentdistanz bleibt gleich.

1

(2)

Aufgabe 4

• Auffinden von Dokumenten (Datenbanken, Internet)

• Erkennung von Plagiaten

• automatische Klassifikation von Dokumenten

2

Referenzen

ÄHNLICHE DOKUMENTE

Starte Maxima durch einen Doppelklick (XMaxima oder wxMaxima) oder oder in Shell (Befehlsinterpreter) mit dem Befehl maxima?. Die Versionsnummer und der Prompt (Ein-

Nat¨ urlich muss man die Zeichen in der untersten Zeile weder kennen noch angeben... Deshalb ist eine Codierung mit weniger als 4 Byte

• minimal Intensit¨ at (schwarz): t¨ urkis Somit sind die Tulpen blau.

• Wenn die zu sortierenden Daten bereits (teilweise) sortiert sind und noch gen¨ ugend Arbeitsspeicher f¨ ur eine Kopie des Arrays vorhanden ist, sollte man Mergesort ver-

(d) Die Geheimtextzeichen, die sich jeweils im Abstand von n Zeichen befinden, sind mit dem gleichen Schl¨ usselbuchstaben verschl¨ usselt worden und k¨ onnen wie eine

Wie ver¨ andert sich die Dokumentdistanz zwischen zwei Dokumenten, wenn man in einem der Dokumente willk¨ urlich jedes Wort verdoppelt. (a) Die Dokumentdistanz wird

Welches der folgenden Dokumente m¨ usste eine Suchmaschine zuerst pr¨ asentieren, wenn sie den Dokumentwinkel als ¨ Ahnlichkeitsmass verwendet.. (a) ” Er hatte keine Distanz zu

Beim Suchen von Schl¨ usseln in einer Hashtabelle ben¨ otigt man bei einer guten Hashfunk- tionen (wenige Kollisionen) konstante Rechenzeit zum Auffinden eines Werts. Im Gegensatz