• Keine Ergebnisse gefunden

Information Retrieval

N/A
N/A
Protected

Academic year: 2021

Aktie "Information Retrieval"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Klausur zur Vorlesung

Information Retrieval

(WS 2009 / 2010, LV-Nr. 36 600)

im Studiengang Informationswissenschaft Mittwoch, 10. Februar 2010

Prof. Dr. Christian Wolff

Professur für Medieninformatik

Institut für Medien-, Informations- und Kulturwissenschaft

Allgemeine Hinweise

1. Bearbeitungszeit: 90 Minuten.

2. Maximal erreichbare Punktzahl: 90. Zu Ihrer Orientierung sind die erreichbaren Punk- te bei jeder Frage genannt – bitte teilen Sie die Arbeitszeit entsprechend ein.

3. Schreiben Sie Ihren Namen, Vornamen, Studiengang (B.A. / Mag.) und Studienfach sowie Ihre Matrikelnummer (oder eine frei wählbare ID) le- serlich auf alle Klausurbögen, die Sie für Ihre Lösung verwenden - bevor Sie mit der Bearbeitung beginnen! Blätter ohne diese Angaben können nicht gewertet werden.

4. Verwenden Sie nur die bereitgestellten Klausurbögen.

5. Haken Sie ggf. nach Bearbeitung die Aufgaben auf der Angabe ab, um sicherzustel- len, dass Sie keine Frage ausgelassen haben.

6. Benutzen Sie keine Bleistifte, keine rotschreibenden Stifte und kein Tip- pEx (oder ähnliche Produkte).

7. Es sind keine weiteren Unterlagen (Skripte, Vorlesungsmitschriften, etc.) zugelassen.

8. Wenden Sie sich bei Unklarheiten in den Aufgabenstellungen immer an die Auf- sichtsführenden. Hinweise und Hilfestellungen werden dann, falls erforderlich, offizi- ell für den gesamten Hörsaal durchgegeben. Aussagen unter „vier Augen“ sind ohne Gewähr.

9. Geben Sie keine mehrdeutigen (oder mehrere) Lösungen an. In solchen Fällen wird stets die Lösung mit der geringeren Punktzahl gewertet. Eine richtige und eine falsche Lösung zu einer Aufgabe ergeben also null Punkte.

10. Formulieren Sie Ihre Antworten (ggf. knapp) aus; die bloße Nennung von Stichwör- tern kann als Antwort nicht gewertet werden!

11. Verändern Sie die Aufgabenstellung nicht, um Sie an Ihre Lösung „anzupassen“.

Lösungen, die sich nicht an die vorgegebenen Aufgabenstellungen halten, werden mit null Punkten bewertet.

Medieninformatik

(2)

Klausur Information Retrieval Mittwoch, 10. Februar 2010

2

Medieninformatik

Fragen Punkte

1. Erläutern Sie an einem konkreten Beispiel die Vielfalt der mit einer informatio- nellen Einheit potenziell verbundenen Fragestellungen und erklären Sie auf die- ser Basis Besonderheiten des Information Retrieval im Unterschied zu Daten- banken.

12

2. [Aus Anlass der heutigen Abschiedsvorlesung von Rainer Kuhlen]

Beschreiben Sie anhand des Modells von Kuhlen Transformationsprozesse zwi- schen Wissen und Information und erläutern Sie an einem konkreten Beispiel, welche Rolle Information Retrieval-Systeme spielen.

12

3. Auf welchen Prinzipien baut das Boolesche Retrievalmodell auf? Erklären Sie Stärken und Schwächen an einem konkreten Beispielszenario.

14

4. Was versteht man unter relevance feedback und warum läßt sich durch diese Technik die Retrievaleffektivität verbessern?

8

5. Nennen und erläutern Sie zwei Kriterien, nach denen man Clustering- Algorithmen kategorisieren kann.

6

6. In einem Retrievalexperiment mit einem Information Retrieval-System auf der Basis des Vektorraummodells werden bei einem cut off-Wert von 20 ein recall von 0,1 und eine precision von 0,6 für eine Treffermenge zu einer Suchanfrage ermittelt.

• Erläutern Sie die Begriffe cut off-Wert, recall und precision!

• Wie viele relevante Dokumente gibt es in der Dokumentkollektion insge- samt bzw. in der Treffermenge des Benutzers?

8

7. Erläutern Sie das Grundprinzip und Arbeitsweise des latent semantic indexing. 10 8. Welche Faktoren beeinflussen bei der Indexierung die Auswahl und Gewich-

tung geeigneter Terme? Nennen Sie fünf wesentliche Faktoren.

10

9. Lohnt sich die Arbeit mit mehr als einer Suchmaschine bei der Recherche im offenen Web?

Welche Alternativen zu klassischen Suchmaschinen wie Google bieten sich an?

10

Summe 90

Referenzen

ÄHNLICHE DOKUMENTE

 Effektivität eines Indexing Systems wird bestimmt über:..  Indexing exhaustivity: Erfassungsgrad der Dokumententhemen in

Given a query melody, the system searches similar melodies in XML-based music documents using the geometric hashing algorithm [Wo97]1. Figure 1 shows the overall process of the

Distinguished from Pamphlet (which see) in having been issued originally in a larger publication. The handling of data in a sequential fashion. A publication issued in

Diese gebeugten Formen wären zwar in einer Suche als Zeichenkette leichter zu finden, aber das Volumen des Thesaurus würde so anschwellen, dass er nicht mehr praktisch

This paper deals with a study conducted by the Operations Research Division of the Lockheed Aircraft Corporation (California Division) with the specific intent

Die Verringerung auf Rang 2 machte mit dem QR-Verfahren eine Ver¨ anderung von 52% n¨ otig, mit der Singul¨ arwertzerlegung l¨ asst sich dies auch mit einer um 10% geringeren ¨

In einem Retrievalexperiment mit einem Information Retrieval- System auf der Basis des Vektorraummodells werden bei einem cut off-Wert von 50 ein recall von 0,2 und eine precision von

  April 2019 fand das erste Symposium Information Science Trends: Search Engines and Information Retrieval, ausgerichtet vom European Chapter der Association for In- formation