• Keine Ergebnisse gefunden

Information Retrieval

N/A
N/A
Protected

Academic year: 2021

Aktie "Information Retrieval"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zur Vorlesung

Information Retrieval

(WS 2008 / 2009, LV-Nr. 36 600)

im Studiengang Informationswissenschaft Montag, 2. Februar 2009

Prof. Dr. Christian Wolff

Professur für Medieninformatik

Institut für Medien-, Informations- und Kulturwissenschaft

Allgemeine Hinweise

1. Bearbeitungszeit: 90 Minuten.

2. Maximal erreichbare Punktzahl: 90. Zu Ihrer Orientierung sind die erreich- baren Punkte bei jeder Frage genannt – bitte teilen Sie die Arbeitszeit ent- sprechend ein.

3. Schreiben Sie Ihren Namen, Vornamen, Studiengang (B.A. / Mag.) und Studienfach sowie Ihre Matrikelnummer (oder eine frei wählba- re ID) leserlich auf alle Klausurbögen, die Sie für Ihre Lösung verwenden - bevor Sie mit der Bearbeitung beginnen! Blätter ohne diese Angaben kön- nen nicht gewertet werden.

4. Verwenden Sie nur die bereitgestellten Klausurbögen.

5. Haken Sie ggf. nach Bearbeitung die Aufgaben auf der Angabe ab, um si- cherzustellen, dass Sie keine Frage ausgelassen haben.

6. Benutzen Sie keine Bleistifte, keine rotschreibenden Stifte und kein TippEx (oder ähnliche Produkte).

7. Es sind keine weiteren Unterlagen (Skripte, Vorlesungsmitschriften, etc.) zugelassen.

8. Wenden Sie sich bei Unklarheiten in den Aufgabenstellungen immer an die Aufsichtsführenden. Hinweise und Hilfestellungen werden dann, falls erfor- derlich, offiziell für den gesamten Hörsaal durchgegeben. Aussagen unter

„vier Augen“ sind ohne Gewähr.

9. Geben Sie keine mehrdeutigen (oder mehrere) Lösungen an. In solchen Fällen wird stets die Lösung mit der geringeren Punktzahl gewertet. Eine richtige und eine falsche Lösung zu einer Aufgabe ergeben also null Punkte.

10. Formulieren Sie Ihre Antworten (ggf. knapp) aus; die bloße Nennung von Stichwörtern kann als Antwort nicht gewertet werden!

11. Verändern Sie die Aufgabenstellung nicht, um Sie an Ihre Lösung „anzu- passen“. Lösungen, die sich nicht an die vorgegebenen Aufgabenstellungen halten, werden mit null Punkten bewertet.

Medieninformatik

(2)

Klausur Information Retrieval Montag, 2. Februar 2009

2

Medieninformatik

Fragen Punkte

1. Beschreiben und erläutern Sie die wichtigsten Teilaufgaben im Information Retrieval und stellen sie den Dokumentationspro- zess grafisch dar.

15

2. Was versteht man unter einem Retrievalmodell? Wie lässt es sich formalisieren?

10

3. Erläutern Sie anhand eines selbst gewählten Beispiels, wie im Booleschen Retrievalmodell eine Anfrage, die als Ausdruck der Booleschen Logik repräsentiert ist, abgearbeitet werden kann.

Das Beispiel sollte aus einer Anfrage mit wenigstens zwei unter- schiedlichen Booleschen Operatoren sowie aus einer invertierten Datei bestehen.

12

4. Erläutern Sie das Grundprinzip des Vektorraummodells und be- nennen Sie je zwei Vor- und Nachteile dieses Modells

12

5. Erläutern Sie den Unterschied zwischen Klassifikation und Clus- tering von Dokumenten.

5

6. Bei der Indexierung von Texten können Terme aus dem Doku- menttext oder aus einer externen Wissensquelle stammen. Die Zuordnung von Begriff zu Dokument kann intellektuell oder au- tomatisch erfolgen. Geben Sie je ein Beispiel für eine der vier Kombinationsmöglichkeiten.

8

7. In einem Retrievalexperiment mit einem Information Retrieval- System auf der Basis des Vektorraummodells werden bei einem cut off-Wert von 50 ein recall von 0,2 und eine precision von 0,4 für eine Treffermenge berechnet.

• Erläutern Sie die Begriffe cut off-Wert, recall und precision!

• Wie viele relevante Dokumente gibt es in der Dokumentkol- lektion bzw. in der Treffermenge des Benutzers?

8

8. Erläutern Sie das Evaluationsmaß der Mean Average Precision (Erklärung, Vorteile, Einsatzbereiche).

8

9. Wodurch unterscheiden sich Suchmaschinen für das WWW von

„traditionellen“ Retrievalsystemen, wie sie z. B. im Bereich der Fachinformation zum Einsatz kommen – erläutern Sie vier we- sentliche Merkmale.

12

Summe 90

Referenzen

ÄHNLICHE DOKUMENTE

Diese gebeugten Formen wären zwar in einer Suche als Zeichenkette leichter zu finden, aber das Volumen des Thesaurus würde so anschwellen, dass er nicht mehr praktisch

This paper deals with a study conducted by the Operations Research Division of the Lockheed Aircraft Corporation (California Division) with the specific intent

Distinguished from Pamphlet (which see) in having been issued originally in a larger publication. The handling of data in a sequential fashion. A publication issued in

Die Verringerung auf Rang 2 machte mit dem QR-Verfahren eine Ver¨ anderung von 52% n¨ otig, mit der Singul¨ arwertzerlegung l¨ asst sich dies auch mit einer um 10% geringeren ¨

In einem Retrievalexperiment mit einem Information Retrieval-System auf der Basis des Vektorraummodells werden bei einem cut off-Wert von 20 ein recall von 0,1 und eine precision

 Effektivität eines Indexing Systems wird bestimmt über:..  Indexing exhaustivity: Erfassungsgrad der Dokumententhemen in

Given a query melody, the system searches similar melodies in XML-based music documents using the geometric hashing algorithm [Wo97]1. Figure 1 shows the overall process of the

  April 2019 fand das erste Symposium Information Science Trends: Search Engines and Information Retrieval, ausgerichtet vom European Chapter der Association for In- formation