11 Nutzer-Präferenzen in Abhängigkeit vom Nutzungsszenario
11.3 Auswertung der Daten
Abbildung 11-11 Angaben der Nutzer, wie realistisch sie die Aufgabenstellung einschätzten
11.3 Auswertung der Daten
Die erfassten Daten wurden hinsichtlich der offenen Fragestellung nach den Einflüssen der Nutzerszenarien bei der Informationssuche in der deutschsprachigen Wikipedia ausgewertet.
Dazu wurden verschiedene statistische Verfahren verwendet. Zunächst wurden die Angaben der Probanden zu Vorkenntnis und Nutzung der Wikipedia sowie ihre de-‐‑
mographischen Angaben ausgewertet. Es folgt eine Verarbeitung der Eyetracking Vi-‐‑
deos und die Analyse des Rezeptionsverhaltens der Probanden bei der Lösung der Aufgaben. Dazu wurde die Verteilung der Nutzeraktionen bei den verschiedenen Aufgabentypen untersucht.
Der H-‐‑Test von Kruskal und Wallis kam dabei als Verfahren zum Vergleich der zentra-‐‑
len Tendenz von mindestens ordinal skalierten Variablen in mehr als zwei Stichproben als OMNIBUS-‐‑Test zum Einsatz [Leonhart, 2013, S. 249]. Das Erkenntnisziel war hier, ob die Nutzeraktionen auf die drei Aufgabentypen unterschiedlich verteilt sind und ob
auch auf eine unterschiedliche Verteilung in der Grundgesamtheit geschlossen werden kann.
Alle bei den jeweiligen Auswertungen berücksichtigten Variablen wurden auf Nor-‐‑
malverteilung (Vergleich mit der bei den jeweils vorliegenden Lageparametern entste-‐‑
henden Normalverteilung) und auf Varianzhomogenität zwischen den Stichproben geprüft, um so die entsprechend passenden statistischen Verfahren auswählen zu kön-‐‑
nen. Das alpha-‐‑Fehler-‐‑Niveau wurde festgelegt und bei den verschiedenen Tests nach Bonferoni [Leonhart, 2013] korrigiert. Zur Veranschaulichung der Daten und mancher Ergebnisse wurden zusätzliche graphische Darstellungen eingesetzt.
Wurden die zu vergleichenden Stichproben anders als den drei Aufgabentypen ent-‐‑
sprechend eingeteilt, sind jeweils bei der Einteilung Hinweise auf die Gründe angege-‐‑
ben (dies gilt v.a. für stetige Variablen aus dem Modell in 6.2).
Die Ergebnisse wurden nach Abschluss beider Studien auf das Modell übertragen.
11.3.1 Demographische Angaben
An der ersten Studie nahmen 26 Personen teil, davon waren 11 männlich und 15 weib-‐‑
lich. Die Personen waren zum Zeitpunkt der Erhebungen zwischen 18 und 27 Jahre alt, der Altersdurchschnitt betrug 22,7 Jahre. Jeder Proband erledigte sechs Suchaufgaben.
So ergab sich eine Summe von 156 ausgeführten Tasks. Bis auf zwei Personen waren alle Probanden Studierende an einer Hochschule. Die Teilnehmer schätzten ihre Erfah-‐‑
rung mit Wikipedia-‐‑Recherchen bis auf eine Ausnahme als gut bis sehr gut ein. Die Probanden gaben außerdem mit durchschnittlich 4,17 Punkten (0-‐‑5 Punkte möglich, siehe dazu Pre-‐‑Study Fragebogen im Anhang 4.1) an, dass sie die Wikipedia als Infor-‐‑
mationsquelle benutzen. Hier bestätigte sich der eingangs genannte hohe Bekannt-‐‑
heits-‐‑ und Verwendungsgrad der Wikipedia.
Die Probanden (n = 26) wurden weiter gebeten, mit 0 bis 5 Punkten zu bewerten, ob sie die Wikipedia sowohl in work-‐‑based als auch in Freizeitszenarien verwenden (siehe Abbildung 11-‐‑12). Es zeigte sich, dass beide Fälle vertreten sind, allerdings die work-‐‑
based Szenarien überwiegen (Durchschnittlich 4,12 von fünf Punkten, Freizeitszenarien durchschnittlich 3,08 von fünf Punkten, siehe Abbildung 11-‐‑12).
Abbildung 11-12 Nutzung der Wikipedia bei den Probanden
Die Datenerhebung erfolgte ca. von April – Juni 2012 an der Universität Regensburg.
11.3.2 Verarbeitung der Videos des Eyetrackers
Die mit Hilfe des Eyetrackers erstellten Videos wurden mit den speziell dafür entwor-‐‑
fenen Labels annotiert. Zu jedem Zeitpunkt erhielten die Videos ein Label betreffend das Inhaltselement, das in diesem Moment betrachtet wurde (zum Beispiel ein Textab-‐‑
schnitt) und die Aktion, die der Leser ausführte (zum Beispiel Lesen). Zur Annotation wurde die freie Software „Anvil“ verwendet.
Abbildung 11-13 Software "Anvil" zur Annotation der Videos
0 2 4 6 8 10 12
1 2 3 4 5 MiAel
Ich benutze die Wikipedia zum Arbeiten/Studieren
Ich benutze die Wikipedia, um mich in meiner Freizeit zu unterhalten
Die Videolabels wurden als .txt Datei extrahiert. Diese Dateien enthalten jeweils Start-‐‑
und Endzeitpunkt der Labels (Beispiel: Siehe Anhang 5.2). Für die weitere Verarbei-‐‑
tung wurden diese Zeitspannen der Labels in 50-‐‑ms-‐‑Frames unterteilt. So entstand für jeden Suchtask ein Datensatz, der aus n Frames à 50 ms besteht, von denen jeder ein-‐‑
deutig durch zwei Labels gekennzeichnet ist.
Ziel der Analyse der Videos ist es, Hinweise auf unterschiedliche Häufigkeiten der Videolabels (die die Nutzeraktionen bzw. Informationsrezeption repräsentieren) in den unterschiedlichen Suchaufgaben zu finden.
Nielsen [Nielsen, 1989] bemerkt zu diesem Punkt, dass die größten Unterschiede im Verhalten bei der Suche vor allem auf individuellen Unterschieden zwischen den Nut-‐‑
zern und der Art des Tasks basieren [Nielsen, 1989]. Deshalb wird hier weiterhin vor allem der Tasktyp berücksichtigt46, wobei dieser hier genauer spezifiziert ist als bei [Nielsen, 1989] und konkrete Auswirkungen auf die Verwendung der Inhaltselemente in der deutschsprachigen Wikipedia untersucht werden.
Zuerst wird die Verteilung der Label-‐‑Kombinationen zwischen den verschiedenen Tasktypen ausgewertet. Gezählt wird dabei die Häufigkeit der 50-‐‑ms-‐‑Frames einer Nutzeraktion pro Task. Für die Auswertungen verwendbar waren hier letztendlich insgesamt 90 Suchtasks, je 30 pro Klasse/Typ. Die anderen fielen durch verschiedene Probleme aus der Analyse (z.B. beschädigte oder nicht vorhandene Videodateien).
11.3.3 Kruskal-Wallis-Test zur Überprüfung von Unterschieden
Ein Kruskal-‐‑Wallis-‐‑Test für unabhängige Stichproben ist ein nichtparametrischer Test zur Überprüfung, ob die zentrale Tendenz von mehr als zwei verschiedenen Stichpro-‐‑
ben unterschiedlich ist. Der Test gibt auch Auskunft darüber, wie groß die Wahr-‐‑
scheinlichkeit ist, dass dieser Trend auch in der Grundgesamtheit zu finden ist.
Genau wie der Whitney-‐‑Mann-‐‑U-‐‑Test ist er rangplatzbasiert, allerdings gibt es bei den vorliegenden Daten drei unabhängige Stichproben (jede Gruppe entspricht einem Auf-‐‑
gabentyp), weshalb der Kruskal-‐‑Wallis-‐‑Test zum Einsatz kommt. Dieser Test setzt kei-‐‑
ne Normalverteilung der Daten voraus, allerdings müssen diese mindestens ordinals-‐‑
kaliert sein [Leonhart, 2013]. Deshalb werden die Datensätze der Tasks dementspre-‐‑
chend aufbereitet.
46 Als eine von mehreren Einflussvariablen auf das Nutzerverhalten.
Zunächst erhält man für jeden 50-‐‑ms-‐‑Frame eine Angabe, welche Aktion der Nutzer zu diesem Zeitpunkt durchführt (zu den Abkürzungen siehe Tabelle der Videolabels):
Tabelle 11-8 Datenbeispiel Videolabels/Nutzeraktionen
Im nächsten Schritt wurden die jeweiligen Häufigkeiten der Nutzeraktionen pro Task ermittelt. Für jede Aufgabe entstand so ein Datensatz, der metrische Angaben für die Häufigkeit des Auftretens jeder Nutzeraktion enthält.
47 Für die Abkürzungen der Videolabels siehe Kapitel 11.1.5.2.
VP8 LE2 VP8 LE1 VP7 LE2 VP7 LE1 VP6 LE2 VP6 LE1 VP3 L1 VP3 L2