• Keine Ergebnisse gefunden

11 Nutzer-Präferenzen in Abhängigkeit vom Nutzungsszenario

11.3 Auswertung der Daten

Abbildung 11-11 Angaben der Nutzer, wie realistisch sie die Aufgabenstellung einschätzten

11.3 Auswertung der Daten

Die  erfassten  Daten  wurden  hinsichtlich  der  offenen  Fragestellung  nach  den  Einflüssen   der   Nutzerszenarien   bei   der   Informationssuche   in   der   deutschsprachigen   Wikipedia   ausgewertet.  

Dazu   wurden   verschiedene   statistische   Verfahren   verwendet.   Zunächst   wurden   die   Angaben  der  Probanden  zu  Vorkenntnis  und  Nutzung  der  Wikipedia  sowie  ihre  de-­‐‑

mographischen  Angaben  ausgewertet.  Es  folgt  eine  Verarbeitung  der  Eyetracking  Vi-­‐‑

deos   und   die   Analyse   des   Rezeptionsverhaltens   der   Probanden   bei   der   Lösung   der   Aufgaben.   Dazu   wurde   die   Verteilung   der   Nutzeraktionen   bei   den   verschiedenen   Aufgabentypen  untersucht.    

 

Der  H-­‐‑Test  von  Kruskal  und  Wallis  kam  dabei  als  Verfahren  zum  Vergleich  der  zentra-­‐‑

len  Tendenz  von  mindestens  ordinal  skalierten  Variablen  in  mehr  als  zwei  Stichproben   als  OMNIBUS-­‐‑Test  zum  Einsatz  [Leonhart,  2013,  S.  249].  Das  Erkenntnisziel  war  hier,   ob  die  Nutzeraktionen  auf  die  drei  Aufgabentypen  unterschiedlich  verteilt  sind  und  ob  

auch  auf  eine  unterschiedliche  Verteilung  in  der  Grundgesamtheit  geschlossen  werden   kann.  

Alle   bei   den   jeweiligen   Auswertungen   berücksichtigten   Variablen   wurden   auf   Nor-­‐‑

malverteilung  (Vergleich  mit  der  bei  den  jeweils  vorliegenden  Lageparametern  entste-­‐‑

henden   Normalverteilung)   und   auf   Varianzhomogenität   zwischen   den   Stichproben   geprüft,  um  so  die  entsprechend  passenden  statistischen  Verfahren  auswählen  zu  kön-­‐‑

nen.  Das  alpha-­‐‑Fehler-­‐‑Niveau  wurde  festgelegt  und  bei  den  verschiedenen  Tests  nach   Bonferoni  [Leonhart,  2013]  korrigiert.  Zur  Veranschaulichung  der  Daten  und  mancher   Ergebnisse  wurden  zusätzliche  graphische  Darstellungen  eingesetzt.  

 

Wurden   die   zu   vergleichenden   Stichproben   anders   als   den   drei   Aufgabentypen   ent-­‐‑

sprechend  eingeteilt,  sind  jeweils  bei  der  Einteilung  Hinweise  auf  die  Gründe  angege-­‐‑

ben  (dies  gilt  v.a.  für  stetige  Variablen  aus  dem  Modell  in  6.2).  

Die  Ergebnisse  wurden  nach  Abschluss  beider  Studien  auf  das  Modell  übertragen.  

11.3.1 Demographische Angaben

An  der  ersten  Studie  nahmen  26  Personen  teil,  davon  waren  11  männlich  und  15  weib-­‐‑

lich.  Die  Personen  waren  zum  Zeitpunkt  der  Erhebungen  zwischen  18  und  27  Jahre  alt,   der  Altersdurchschnitt  betrug  22,7  Jahre.  Jeder  Proband  erledigte  sechs  Suchaufgaben.  

So  ergab  sich  eine  Summe  von  156  ausgeführten  Tasks.  Bis  auf  zwei  Personen  waren   alle  Probanden  Studierende  an  einer  Hochschule.  Die  Teilnehmer  schätzten  ihre  Erfah-­‐‑

rung   mit   Wikipedia-­‐‑Recherchen   bis   auf   eine   Ausnahme   als   gut   bis   sehr   gut   ein.   Die   Probanden   gaben   außerdem   mit   durchschnittlich   4,17   Punkten   (0-­‐‑5   Punkte   möglich,   siehe  dazu  Pre-­‐‑Study  Fragebogen  im  Anhang  4.1)  an,  dass  sie  die  Wikipedia  als  Infor-­‐‑

mationsquelle   benutzen.   Hier   bestätigte   sich   der   eingangs   genannte   hohe   Bekannt-­‐‑

heits-­‐‑  und  Verwendungsgrad  der  Wikipedia.  

 

Die  Probanden  (n  =  26)  wurden  weiter  gebeten,  mit  0  bis  5  Punkten  zu  bewerten,  ob  sie   die   Wikipedia   sowohl   in  work-­‐‑based   als   auch   in   Freizeitszenarien   verwenden   (siehe   Abbildung  11-­‐‑12).  Es  zeigte  sich,  dass  beide  Fälle  vertreten  sind,  allerdings  die  work-­‐‑

based  Szenarien  überwiegen  (Durchschnittlich  4,12  von  fünf  Punkten,  Freizeitszenarien   durchschnittlich  3,08  von  fünf  Punkten,  siehe  Abbildung  11-­‐‑12).    

 

  Abbildung 11-12 Nutzung der Wikipedia bei den Probanden

 

 Die  Datenerhebung  erfolgte  ca.  von  April  –  Juni  2012  an  der  Universität  Regensburg.    

11.3.2 Verarbeitung der Videos des Eyetrackers

Die  mit  Hilfe  des  Eyetrackers  erstellten  Videos  wurden  mit  den  speziell  dafür  entwor-­‐‑

fenen  Labels  annotiert.  Zu  jedem  Zeitpunkt  erhielten  die  Videos  ein  Label  betreffend   das  Inhaltselement,  das  in  diesem  Moment  betrachtet  wurde  (zum  Beispiel  ein  Textab-­‐‑

schnitt)  und  die  Aktion,  die  der  Leser  ausführte  (zum  Beispiel  Lesen).  Zur  Annotation   wurde  die  freie  Software  „Anvil“  verwendet.    

   

Abbildung 11-13 Software "Anvil" zur Annotation der Videos  

0   2   4   6   8   10   12  

1   2   3   4   5   MiAel  

Ich  benutze  die  Wikipedia   zum  Arbeiten/Studieren  

Ich  benutze  die  Wikipedia,   um  mich  in  meiner   Freizeit  zu  unterhalten  

Die  Videolabels  wurden  als  .txt  Datei  extrahiert.  Diese  Dateien  enthalten  jeweils  Start-­‐‑  

und   Endzeitpunkt   der   Labels   (Beispiel:   Siehe   Anhang   5.2).   Für   die   weitere   Verarbei-­‐‑

tung  wurden  diese  Zeitspannen  der  Labels  in  50-­‐‑ms-­‐‑Frames  unterteilt.  So  entstand  für   jeden  Suchtask  ein  Datensatz,  der  aus  n  Frames  à  50  ms  besteht,  von  denen  jeder  ein-­‐‑

deutig  durch  zwei  Labels  gekennzeichnet  ist.    

Ziel   der   Analyse   der   Videos   ist   es,   Hinweise   auf   unterschiedliche   Häufigkeiten   der   Videolabels  (die  die  Nutzeraktionen  bzw.  Informationsrezeption  repräsentieren)  in  den   unterschiedlichen  Suchaufgaben  zu  finden.    

Nielsen   [Nielsen,   1989]   bemerkt   zu   diesem   Punkt,   dass   die  größten   Unterschiede   im   Verhalten  bei  der  Suche  vor  allem  auf  individuellen  Unterschieden  zwischen  den  Nut-­‐‑

zern  und  der  Art  des  Tasks  basieren  [Nielsen,  1989].  Deshalb  wird  hier  weiterhin  vor   allem   der  Tasktyp   berücksichtigt46,   wobei   dieser   hier   genauer   spezifiziert   ist   als   bei   [Nielsen,  1989]  und  konkrete  Auswirkungen  auf  die  Verwendung  der  Inhaltselemente   in  der  deutschsprachigen  Wikipedia  untersucht  werden.    

Zuerst   wird   die   Verteilung   der   Label-­‐‑Kombinationen   zwischen   den   verschiedenen   Tasktypen   ausgewertet.   Gezählt   wird   dabei   die   Häufigkeit   der   50-­‐‑ms-­‐‑Frames   einer   Nutzeraktion   pro   Task.   Für   die   Auswertungen   verwendbar   waren   hier   letztendlich   insgesamt  90  Suchtasks,  je  30  pro  Klasse/Typ.  Die  anderen  fielen  durch  verschiedene   Probleme  aus  der  Analyse  (z.B.  beschädigte  oder  nicht  vorhandene  Videodateien).  

11.3.3 Kruskal-Wallis-Test zur Überprüfung von Unterschieden

Ein  Kruskal-­‐‑Wallis-­‐‑Test  für  unabhängige  Stichproben  ist  ein  nichtparametrischer  Test   zur  Überprüfung,  ob  die  zentrale  Tendenz  von  mehr  als  zwei  verschiedenen  Stichpro-­‐‑

ben   unterschiedlich   ist.   Der   Test   gibt   auch   Auskunft   darüber,   wie   groß   die   Wahr-­‐‑

scheinlichkeit  ist,  dass  dieser  Trend  auch  in  der  Grundgesamtheit  zu  finden  ist.  

Genau  wie  der  Whitney-­‐‑Mann-­‐‑U-­‐‑Test  ist  er  rangplatzbasiert,  allerdings  gibt  es  bei  den   vorliegenden  Daten  drei  unabhängige  Stichproben  (jede  Gruppe  entspricht  einem  Auf-­‐‑

gabentyp),  weshalb  der  Kruskal-­‐‑Wallis-­‐‑Test  zum  Einsatz  kommt.  Dieser  Test  setzt  kei-­‐‑

ne  Normalverteilung  der  Daten  voraus,  allerdings  müssen  diese  mindestens  ordinals-­‐‑

kaliert   sein   [Leonhart,   2013].   Deshalb   werden   die   Datensätze   der   Tasks   dementspre-­‐‑

chend  aufbereitet.  

     

46 Als eine von mehreren Einflussvariablen auf das Nutzerverhalten.

Zunächst  erhält  man  für  jeden  50-­‐‑ms-­‐‑Frame  eine  Angabe,  welche  Aktion  der  Nutzer  zu   diesem  Zeitpunkt  durchführt  (zu  den  Abkürzungen  siehe  Tabelle  der  Videolabels):  

 

Tabelle 11-8 Datenbeispiel Videolabels/Nutzeraktionen  

Im   nächsten   Schritt   wurden   die   jeweiligen  Häufigkeiten   der   Nutzeraktionen  pro   Task   ermittelt.  Für  jede  Aufgabe  entstand  so  ein  Datensatz,  der  metrische  Angaben  für  die   Häufigkeit  des  Auftretens  jeder  Nutzeraktion  enthält.    

 

47 Für die Abkürzungen der Videolabels siehe Kapitel 11.1.5.2.

  VP8  LE2   VP8  LE1   VP7  LE2   VP7  LE1   VP6  LE2   VP6  LE1   VP3  L1   VP3  L2