7 Berücksichtigung der Nutzungsszenarien
7.2 Zufriedenheit des Nutzers als oberste Priorität
7.2.2 Adaption im Information Retrieval
Adaptive Mensch-‐‑Maschine-‐‑Interaktion ist unter der Prämisse sinnvoll, dass ein Nut-‐‑
zer ein bestimmtes Ziel hat, das er mit Hilfe eines Systems erreichen will. Davon ist bei der Informationssuche in der Wikipedia auszugehen16 (siehe dazu ab Kapitel 5.3). Un-‐‑
ter Umständen gelingt ihm die Zielerreichung zunächst nicht (z.B. durch Selektions-‐‑
probleme [Morita und Shinoda, 1994; Wu und Wu, 2011]), dann ist es hilfreich, das System ist mit Möglichkeiten ausgestattet, um dem Nutzer helfen zu können. Dazu muss es das Ziel des Nutzers kennen und wissen, wie es reagieren kann, um ihn bei der Zielerreichung zu unterstützen. Dabei spielt es zunächst eine untergeordnete Rolle, um welche Art Informationssystem es sich dabei handelt: sowohl im E-‐‑Learning, als auch bei Informationssystemen wie Stadtführern auf dem Smartphone, Systemen zur Unterstützung des Alltags (z.B. Gesundheitsratgeber) oder Wissensdatenbanken, wie der Wikipedia, ist die Hilfe zur Zielerreichung (bzw. der besseren und einfacheren Zielerreichung) sinnvoll.
7.2.2 Adaption im Information Retrieval
Die Idee, die Inhalte bzw. Auswahl und Präsentation der vorhandenen Inhalte adaptiv und dem Kontext entsprechend zu gestalten, ist nicht neu. Durch die unüberschaubare Menge an Informationen motiviert gibt es bereits einige Ansätze, das Information Ret-‐‑
rieval durch adaptives Verhalten eines Systems zu verbessern [z.B. Hu et al., 2009; So-‐‑
mol et al., 1999; Morita und Shinoda, 1994].
Im Wesentlichen kann im Information Retrieval die Anpassung auf drei Ebenen statt-‐‑
finden: erstens bei der Formulierung der Query (das Problem des unscharfen Informa-‐‑
tionsbedürfnisses und des Informationsverlustes durch die Verbalisierung desselben berücksichtigend), zweitens auf der Ebene des Dokumentenabgleichs (z.B. durch se-‐‑
mantische Erweiterungen oder Disambiguierung von Anfragetermen durch Berück-‐‑
16 Sowohl inhaltlich als auch nicht-informationsbezogen.
sichtigung des semantischen Kontextes) oder drittens bei der Präsentation der Ergeb-‐‑
nisse (wobei hier bei der aktuellen Forschungslage der Schwerpunkt tendenziell mehr auf der Gestaltung von Ergebnislisten im Sinne des Dokumenten-‐‑Rankings liegt, denn auf der Präsentation der Inhalte selbst).
Ein konkreter Ansatz zur Adaptivität im Information Retrieval ist, dass das System sich vorangegangene Anfragen merkt und so semantische Disambiguierung von An-‐‑
fragetermen unterstützen kann. Lau, Bruza und Song [Lau et al., 2008] verwenden hierzu eine logikbasierte believe-‐‑revison. Das bedeutet, dass das „Umfeld“ des Nutzers im Sinne seiner bisherigen Aktivitäten, seinem Wissen (sofern bekannt) und der durch-‐‑
suchten Domain unter der Anwendung von Logik in die Interpretation der Suchterme mit einbezogen wird. So erreichen die Autoren bessere Ergebnisse als mit vergleichba-‐‑
ren, nicht adaptiven Vorgehensweisen.
Abbildung 7-‐‑1 zeigt einen Überblick über den Aufbau eines adaptiven Information Retrieval Systems. Zwischen der Anfrage des Nutzers und den Informationsobjekten steht außer einem matching meachanism noch ein learning meachnism, der auf Basis eines Nutzer-‐‑Profils und dem Feedback die Retrieval-‐‑Situation berücksichtigt, damit den matching mechanism dementsprechend beeinflusst und – wie sich zeigte – verbessert [Lau et al., 2008].
Abbildung 7-1 Überblick über ein adaptive gestaltetes Information Retrieval System [Lau et al., 2008, S.4]
Crestiani und van Rijsbergen [Crestani und van Rijsbergen, 1997] entwickelten auf der Basis logischer und konzeptueller Beziehungen ein Modell, das sie im Rahmen eines adaptiven Information Retrieval Systems implementierten. Sie testeten verschiedene Lernalgorithmen zur Verbesserung der Retrieval Ergebnisse und erzielten damit eine deutlich bessere Bewertung der Treffermenge durch die Nutzer. Die Adaption findet hier ebenfalls vor allem in einer Anpassung bzw. Erweiterung der Query und damit einem genaueren und adaptiven matching mit der Dokumentenmenge statt.
Shen [Shen, 2007] stellt in den Mittelpunkt ihrer Forschung die Frage nach einem aktu-‐‑
alisierbaren Nutzermodell, das notwendige Informationen über den Kontext des Nut-‐‑
zers liefern soll, um eine Personalisierung der Suche zu ermöglichen. In ihrem Frame-‐‑
work verwendet sie die Interaktion des Nutzers mit dem System im Sinne von Implicit Relevance Feedback (hier vor allem clickthrough), um sofort auf Veränderungen des Nut-‐‑
zerkontexts reagieren zu können und die Suche anzupassen. Dabei kommen vor allem statistische Sprachmodelle zum Einsatz, anhand derer zum Beispiel die bereits betrach-‐‑
teten Dokumente oder vorangegangene Anfragen mit in die Suche einbezogen werden können (query expansion). So kann das Ranking der Antwort-‐‑Dokumente entsprechend überarbeitet werden. Es gelang Shen, eine Client-‐‑seitige Anwendung zu implementie-‐‑
ren, die durch eine Abspeicherung des bisherigen (semantischen) Nutzerkontexts auf Basis vorangegangener querys und verwendeter Dokumente jeweils ein re-‐‑ranking der von einer Web-‐‑Suchmaschine gelieferten Dokumente durchführt. Bei einer Vergleichs-‐‑
studie ließ sich feststellen, dass die überarbeitete Reihenfolge der Ergebnisse Verbesse-‐‑
rungen gegenüber dem ursprünglichen Ranking von Google zeigte.
Einen ähnlichen Ansatz verfolgen auch Wilrich et al. [Wilrich et al., 2006], die speziell im Bereich der digitalen Bibliotheken untersuchten, in wie weit die Erstellung eines Nutzerprofils, das vor allem die Metadaten der bereits besuchten Dokumente berück-‐‑
sichtigt, die Suchergebnisse für den Nutzer personalisiert und verbessert. Ein großer Vorteil hierbei ist, dass die Dokumente in digitalen Bibliotheken in der Regel mit sehr guten Metadatensätzen ausgestattet sind. Die umfangreichen Informationen über die Inhalte erleichtern eine Präzisierung der Auswahl. Diese Arbeiten machen deutlich, dass Adaption mit ausreichend Wissen über den Nutzer, hier vor allem über den se-‐‑
mantischen Kontext seiner Anfrage, großes Potential hat, die Nutzerzufriedenheit zu verbessern.
Berger, Dittenbach und Merkl [Berger et al., 2004] zeigen, wie sie mit Hilfe assoziativer Verknüpfungen in Form eines Wissensrepräsentationsmodells semantische Relationen als Grundlage für ein mehrsprachiges Information Retrieval System verwenden. Adap-‐‑
tion findet hier auf zwei Ebenen statt: erstens in Form eines matching mit den Suchter-‐‑
men, das durch (gewichtete) semantische Relationen mit anderen Termen verbessert wird und dadurch zweitens eine sog. query-‐‑expansion (durch Einbeziehen der erweiter-‐‑
ten semantischen Beziehungen) bewirkt. [Berger et al., 2004] versuchen so vor allem, einen eher intuitiven Zugang zu den Informationen zu schaffen.
Wen, Zhou und Aggarwal [Wen et al., 2007] wendeten eine adaptive und adaptierbare Methode an, indem sie auf der einen Seite dem Nutzer die Möglichkeit gaben, selbst aktiv einen semantischen Suchkontext mitzugestalten und zweitens das System diesen Prozesse unterstützte. Auch diese Autoren konnten zeigen, dass die Maßnahmen die Relevanz der erhaltenen Ergebnisse für den Nutzer tatsächlich verbesserten.
Diane Kelly und Xin Fu [Kelly und Fu, 2007] präsentieren, dass mit Hilfe von konkre-‐‑
tem Nutzerfeedback die Retrieval Performance deutlich verbessert werden konnte. Sie benutzten dazu einen Fragebogen, in dem der Suchende nach zusätzlichen Informatio-‐‑
nen über sein Suchziel gefragt wurde. Auf Basis dieser, über die ursprüngliche Query hinausgehenden Informationen wurde der Dokumentenspeicher erneut durchsucht und die Ergebnisse angepasst. Es wurde in dieser Studie offensichtlich, dass zwar zu-‐‑
sätzliche Informationen notwendig sind (query expansion), dass aber mit deren Kenntnis die Ergebnisse des IR angepasst und verbessert werden können.
Zusammenfassend konzentriert sich die Forschung im Bereich des adaptiven Informa-‐‑
tion Retrieval bisher vor allem auf die Verbesserung der Suchanfragen z.B. durch Be-‐‑
rücksichtigung allgemeiner semantischer Relationen und/oder des Nutzerkontextes, im Sinne von vorangegangenen Suchanfragen und der Evaluation der Ergebnisse durch den Nutzer (in Form impliziten und/oder expliziten Feedback [Li, 2011]). Zum Einsatz kommen verschiedene Methoden und Techniken wie Entscheidungsbäume, Logik, Lernalgorithmen, Wissensrepräsentationsmodelle und andere.
Die Arbeiten zielen allesamt stark auf eine Verbesserung der Suchterme durch Berück-‐‑
sichtigung semantischer Relationen und/oder durch Anwendung von Logik und Lern-‐‑
verfahren ab. Kontext ist so vor allem auf den inhaltlichen Kontext einer Anfrage be-‐‑
zogen. Die genannten Untersuchungen belegen aber, dass die Bewertungen der Ergeb-‐‑
nisse durch den Nutzer im adaptiven Verfahren besser ausfallen als bei den nicht adaptiven Suchvorgängen. Es bleibt allerdings offen, ob und wie auch über die inhalt-‐‑
lich hinausgehenden Faktoren der Kontext17 des Nutzers konkret berücksichtigt wer-‐‑
den kann.
Außerdem wird in dieser Arbeit nicht die situative Rezeption respektive Präsentation von Dokumenten sondern die von Dokumentelementen untersucht. Da die Untersuchun-‐‑
gen dieser Arbeit vor allem auf die Verwendung verschiedener Inhaltstypen abzielen, wird also das als relevant ermittelte Dokument an sich in diese Elemente aufgebro-‐‑
chen. Das ist möglich, da zum einen in einem Wikipedia-‐‑Artikel die für das jeweilige Lemma semantisch relevanten Angaben enthalten sind (siehe dazu auch Kapitel 7.1.1) und zum zweiten immer der selbe Dokumenttyp zurückgeliefert wird (sowohl struk-‐‑
turell als auch intentionell), selbst wenn theoretisch mehr als ein relevanter Artikel zur Suchanfrage existiert. Ziel dieses Vorgehens ist es, über ein Re-‐‑Ranking von Dokumen-‐‑
ten hinaus Aussagen zu einer situativen Informationsrezeption machen zu können.